ФЕДЕРАЛЬНОЕ
АГЕНТСТВО
ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ
|
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ |
ГОСТ Р (ИСО 3301:1975) |
СТАТИСТИЧЕСКИЕ МЕТОДЫ
СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
СРАВНЕНИЕ ДВУХ СРЕДНИХ В ПАРНЫХ НАБЛЮДЕНИЯХ
ISO 3301:1975
Statistical
interpretation of data - Comparison of two means
in the case of paired observations
(MOD)
Москва
Стандартинформ
2005
Предисловие
Задачи, основные принципы и правила проведения работ по государственной стандартизации в Российской Федерации установлены ГОСТ Р 1.0-92 «Государственная система стандартизации Российской Федерации. Основные положения» и ГОСТ Р 1.2-92 «Государственная система стандартизации Российской Федерации. Порядок разработки государственных стандартов»
Сведения о стандарте
1 ПОДГОТОВЛЕН Техническим комитетом по стандартизации ТК 125 «Статистические методы в управлении качеством продукции» и Научно-исследовательским центром контроля и диагностики технических систем на основе собственного аутентичного перевода стандарта, указанного в пункте 4
2 ВНЕСЕН Управлением технического регулирования и стандартизации Федерального агентства по техническому регулированию и метрологии
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 31 мая 2005 г. № 112-ст
4 Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 3301:1975 «Статистическое представление данных. Сравнение двух средних в парных наблюдениях» (ISO 3301:1975 «Statistical interpretation of data - Comparison of two means in the case of paired observations», MOD) путем включения отдельных фраз, которые выделены в тексте курсивом, с целью гармонизации с национальными стандартами.
Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ 1.5 (подраздел 3.6)
5 ВВЕДЕН ВПЕРВЫЕ
Информация об изменениях к настоящему стандарту публикуется в указателе «Национальные стандарты», а текст изменений - в информационных указателях «Национальные стандарты». В случае пересмотра или отмены настоящего стандарта соответствующая информация будет опубликована в информационном указателе «Национальные стандарты»
ГОСТ Р 50779.23-2005
(ИСО 3301:1975)
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Статистические методы
СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
Сравнение двух средних в парных наблюдениях
Statistical methods. Statistical interpretation of
data. Comparison of two means
in the case of paired observations
Дата введения - 2005-07-01
Настоящий стандарт устанавливает метод проверки статистической гипотезы о равенстве среднего распределения (далее - среднее) разностей парных наблюдений нулю (предположение о несущественности расхождения между рядами наблюдений) или какому-либо другому заданному значению.
В настоящем стандарте использована нормативная ссылка на следующий стандарт:
ГОСТ Р 50779.10-2000 (ИСО 3534-1-93) Статистические методы. Вероятность и основы статистики. Термины и определения (ИСО 3534-1:1993, IDТ)
Примечания
1 Настоящий раздел является дополнительным по отношению к содержанию международного стандарта ИСО 3301:1975 (ISO 3301:1975) и включен для учета основополагающих национальных стандартов в области статистических методов.
2 При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов по указателю «Национальные стандарты», составленному по состоянию на 1 января текущего года, и по соответствующим информационным указателям, опубликованным в текущем году. Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться замененным (измененным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяют в части, не затрагивающей эту ссылку.
В настоящем стандарте применены термины по ГОСТ Р 50779.10, а также следующий термин с соответствующим определением:
парные наблюдения (paired observations): Два результата наблюдений определенных свойств или характеристик объекта хi и уi называются парными, если они получены:
- как результаты наблюдений над одним и тем же объектом i (из совокупности), причем данные наблюдения относятся к различным условиям получения этих наблюдений (например, сравнение двух методов анализа свойств одного и того же объекта);
- как результаты наблюдений над объектами, идентичными во всех отношениях, кроме предполагаемого систематического различия в некотором интересующем аспекте; в отношении значимости этого различия проводят проверку статистической гипотезы (например, сравнение урожайности двух соседних участков, засеянных семенами различных сортов).
Во втором случае эффективность проверки гипотез зависит от степени уверенности в отсутствии каких-либо других систематических различий между объектами, кроме некоторого возможного различия, в отношении которого проверяют гипотезу.
Установленный в настоящем стандарте метод проверки статистической гипотезы может быть применен с целью подтвердить различие двух способов обработки. В этом случае можно считать, что результаты наблюдений хi получены одним способом обработки, а результаты наблюдений yi - некоторым другим способом. Две серии результатов наблюдений не являются независимыми, поскольку каждому хi первой серии (первый способ обработки) ставится в соответствие вполне определенное yi второй серии (второй способ обработки). Термин «способ обработки» понимают в широком смысле. При выявлении возможного систематического расхождения два сравниваемых способа обработки могут относиться к двум методам испытаний, к двум измерительным устройствам или к двум лабораториям. Два способа обработки, выполненные над одним и тем же экспериментальным материалом, могут влиять друг на друга, и полученное значение может зависеть от последовательности обработки. Оптимальный план эксперимента должен устранять возможные систематические смещения. В качестве альтернативы сравнению способов обработки можно рассмотреть воздействие одного способа обработки по сравнению со случаем полного отсутствия обработки.
Для корректного применения метода необходимо выполнение следующих двух условий:
- последовательность разностей di = xi - yi является выборкой независимой случайной величины;
- распределение величин di = xi - yi является нормальным или близким к нормальному.
Если распределение разностей отклоняется от нормального, метод проверки гипотез применим при условии, что объем выборки достаточно велик. При больших отклонениях от нормальности требуется соответственно большая выборка. Однако даже в предельных случаях отклонения от нормальности выборки объемом 100 могут быть достаточными для корректного применения метода в большинстве прикладных задач.
Изучаемая проблема _______________________________________________________ |
|
Условия проведения эксперимента __________________________________________ |
|
Статистические данные |
Расчетные формулы |
Объем выборки |
|
п = |
|
Суммы результатов наблюдений: |
|
|
|
Сумма разностей: |
|
|
|
Сумма квадратов разностей: |
|
|
|
Заданное значение (среднее случайных разностей парных наблюдений): |
|
d0 = |
|
Число степеней свободы: |
|
|
|
Выбранный уровень значимости: |
|
a = |
|
Правило принятия решения 1 Двусторонняя критическая область: Гипотезу о том, что среднее совокупности разностей равно d0 (нулевая гипотеза Н0), отвергают, если
2 Односторонняя критическая область: а) Гипотезу о том, что среднее совокупности разностей равно d0 (нулевая гипотеза Н0), отвергают, если
б) Гипотезу о том, что среднее совокупности разностей равно d0 (нулевая гипотеза Н0), отвергают, если
|
Примечание - t1-a(n) - квантиль уровня 1 - a статистики Стьюдента с (n) степенями свободы. Значения t1-a(n) / приведены в таблице 1.
Таблица 1 - Значения отношения t1-a(n) / для n = n - 1
Двусторонняя гипотеза |
Односторонняя гипотеза |
|
Двусторонняя гипотеза |
Односторонняя гипотеза |
|||||
|
|
|
|
|
|
|
|
||
1 |
8,985 |
45,013 |
4,465 |
22,501 |
21 |
0,443 |
0,604 |
0,367 |
0,537 |
2 |
2,434 |
5,730 |
1,686 |
4,021 |
22 |
0,432 |
0,588 |
0,358 |
0,523 |
3 |
1,591 |
2,920 |
1,177 |
2,270 |
23 |
0,422 |
0,573 |
0,350 |
0,510 |
4 |
1,242 |
2,059 |
0,953 |
1,676 |
24 |
0,413 |
0,559 |
0,342 |
0,498 |
5 |
1,049 |
1,646 |
0,823 |
1,374 |
25 |
0,404 |
0,547 |
0,335 |
0,487 |
6 |
0,925 |
1,401 |
0,734 |
1,188 |
26 |
0,396 |
0,535 |
0,328 |
0,477 |
7 |
0,836 |
1,237 |
0,670 |
1,060 |
27 |
0,388 |
0,524 |
0,322 |
0,467 |
8 |
0,769 |
1,118 |
0,620 |
0,966 |
28 |
0,380 |
0,513 |
0,316 |
0,458 |
9 |
0,715 |
1,028 |
0,580 |
0,892 |
29 |
0,373 |
0,503 |
0,310 |
0,449 |
10 |
0,672 |
0,956 |
0,546 |
0,833 |
30 |
0,367 |
0,494 |
0,305 |
0,441 |
11 |
0,635 |
0,897 |
0,518 |
0,785 |
40 |
0,316 |
0,422 |
0,263 |
0,378 |
12 |
0,604 |
0,847 |
0,494 |
0,744 |
50 |
0,281 |
0,375 |
0,235 |
0,337 |
13 |
0,577 |
0,805 |
0,473 |
0,708 |
60 |
0,256 |
0,341 |
0,214 |
0,306 |
14 |
0,554 |
0,769 |
0,455 |
0,678 |
70 |
0,237 |
0,314 |
0,198 |
0,283 |
15 |
0,533 |
0,737 |
0,438 |
0,651 |
80 |
0,221 |
0,293 |
0,185 |
0,264 |
16 |
0,514 |
0,708 |
0,423 |
0,626 |
90 |
0,208 |
0,276 |
0,174 |
0,248 |
17 |
0,497 |
0,683 |
0,410 |
0,605 |
100 |
0,197 |
0,261 |
0,165 |
0,235 |
18 |
0,482 |
0,660 |
0,398 |
0,586 |
200 |
0,139 |
0,183 |
0,117 |
0,165 |
19 |
0,468 |
0,640 |
0,387 |
0,568 |
500 |
0,088 |
0,116 |
0,074 |
0,104 |
20 |
0,455 |
0,621 |
0,376 |
0,552 |
¥ |
0 |
0 |
0 |
0 |
Пример - Приведенные в таблице 2 данные собраны в процессе исследований, спланированных с целью определить, зависит ли скорость изнашивания шеек коленчатого вала двигателя внутреннего сгорания от типа материала металлических вкладышей подшипников скольжения этого вала.
Таблица 2 - Износ шеек коленчатых валов в течение заданной наработки, измеренный в стотысячных долях дюйма
Износ вала |
Разность di = xi - уi |
||
Медно-свинцовые вкладыши хi |
Алюминиевые вкладыши уi |
||
1 |
3,5 |
1,5 |
2,0 |
2 |
2,0 |
1,3 |
0,7 |
3 |
4,7 |
4,5 |
0,2 |
4 |
2,8 |
2,5 |
0,3 |
5 |
6,5 |
4,5 |
2,0 |
6 |
2,2 |
1,7 |
0,5 |
7 |
2,5 |
1,8 |
0,7 |
8 |
5,8 |
3,3 |
2,5 |
9 |
4,2 |
2,3 |
1,9 |
Сумма |
34,2 |
23,4 |
10,8 |
Технические характеристики _______________________________________________ |
|
Статистические данные |
Вычисления |
Объем выборки |
|
п = 9 |
|
Суммы результатов наблюдений: |
|
|
|
Сумма разностей: |
|
|
|
Сумма квадратов разностей: |
|
|
|
Заданное значение: |
t0,995 / = 1,118 |
d0 = 0 |
|
Число степеней свободы: |
A2 = 1,118´0,8846 = 0,99 |
|
|
Выбранный уровень значимости: |
|
a = 0,01 |
|
Выводы Сравнение среднего совокупности с заданным значением 0: Проверка двусторонней гипотезы:
Гипотезу равенства скоростей изнашивания шеек коленчатого вала двигателя в случае подшипников с различными вкладышами (медно-свинцовые и алюминиевые) отвергают на 1 %-м уровне значимости. |
Вероятность отклонения нулевой гипотезы, когда она верна, равна уровню значимости a. Отклонение нулевой гипотезы, когда она верна, называется ошибкой первого рода, и поэтому выбор значения a ограничивает риск такой ошибки.
С другой стороны, можно совершить ошибку второго рода, то есть проверить нулевую гипотезу, когда она неверна. Вероятность 1 - b отклонения нулевой гипотезы, когда она неверна, называется мощностью критерия статистической проверки гипотезы. Вероятность ошибки второго рода в таком случае равна b.
Для заданной выборки п и ошибки первого рода вероятность b зависит не только от истинного среднего D наблюдаемых разностей di = xi - yi, для которых устанавливают различные альтернативные гипотезы, но также и от стандартного отклонения sd этих разностей. Это стандартное отклонение неизвестно, и, если п мало, выборка может обеспечить только плохую оценку. В результате невозможно устанавливать верхний предел вероятности ошибки второго рода.
На графиках (рисунки 1 и 2) показаны зависимости между мощностью 1 - b критерия проверки гипотез и истинным средним совокупности, деленным на соответствующее стандартное отклонение (D/sd) для случая односторонней гипотезы Н0: D £ 0, различных значений n и уровней значимости 0,05 и 0,01 соответственно.
На основании этих графиков можно сделать следующие заключения:
1) Мощность критерия проверки гипотез однозначно определяется истинным средним D совокупности разностей, измеренных в единицах стандартного отклонения sd, уровнем значимости a и объемом выборки.
2) Функция мощности является монотонно возрастающей функцией истинного среднего совокупности разностей. Она также монотонно возрастает с ростом объема выборки и уровня значимости a при условии, что D > 0 и a отличается от 0 и 1.
3) Для уровня значимости 0,05 и при объеме выборки 50 достигается мощность 0,95, если истинное среднее разностей превышает половину стандартного отклонения разностей. Для n = 20 такая мощность достигается для D/sd = 0,78 и больших значений.
Рисунок 1 - Мощность критерия для одной выборки (односторонний критерий), a = 0,01
Рисунок 2 - Мощность критерия для одной выборки (односторонний критерий), a = 0,05
СОДЕРЖАНИЕ
4 Применение метода для сравнения двух способов обработки экспериментальных данных. 3 5 Условия применения метода. 3 |
Ключевые слова: проверка статистической гипотезы, результаты наблюдений, ошибка второго рода, стандартное отклонение, мощность критерия, случайный отбор, выборочное среднее