Statistical methods. Statistical interpretation of data. Comparison of two means in the case of paired observations

ФЕДЕРАЛЬНОЕ АГЕНТСТВО
ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

ГОСТ Р
50779.23-2005

(ИСО 3301:1975)

 

СТАТИСТИЧЕСКИЕ МЕТОДЫ

СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ

СРАВНЕНИЕ ДВУХ СРЕДНИХ В ПАРНЫХ НАБЛЮДЕНИЯХ

ISO 3301:1975

Statistical interpretation of data - Comparison of two means
in the case of paired observations
(MOD)

 

 

Москва

Стандартинформ

2005

 

Предисловие

Задачи, основные принципы и правила проведения работ по государственной стандартизации в Российской Федерации установлены ГОСТ Р 1.0-92 «Государственная система стандартизации Российской Федерации. Основные положения» и ГОСТ Р 1.2-92 «Государственная система стандартизации Российской Федерации. Порядок разработки государственных стандартов»

Сведения о стандарте

1 ПОДГОТОВЛЕН Техническим комитетом по стандартизации ТК 125 «Статистические методы в управлении качеством продукции» и Научно-исследовательским центром контроля и диагностики технических систем на основе собственного аутентичного перевода стандарта, указанного в пункте 4

2 ВНЕСЕН Управлением технического регулирования и стандартизации Федерального агентства по техническому регулированию и метрологии

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 31 мая 2005 г. № 112-ст

4 Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 3301:1975 «Статистическое представление данных. Сравнение двух средних в парных наблюдениях» (ISO 3301:1975 «Statistical interpretation of data - Comparison of two means in the case of paired observations», MOD) путем включения отдельных фраз, которые выделены в тексте курсивом, с целью гармонизации с национальными стандартами.

Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ 1.5 (подраздел 3.6)

5 ВВЕДЕН ВПЕРВЫЕ

Информация об изменениях к настоящему стандарту публикуется в указателе «Национальные стандарты», а текст изменений - в информационных указателях «Национальные стандарты». В случае пересмотра или отмены настоящего стандарта соответствующая информация будет опубликована в информационном указателе «Национальные стандарты»

 

ГОСТ Р 50779.23-2005

(ИСО 3301:1975)

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Статистические методы

СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ

Сравнение двух средних в парных наблюдениях

Statistical methods. Statistical interpretation of data. Comparison of two means
in the case of paired observations

Дата введения - 2005-07-01

1 Область применения

Настоящий стандарт устанавливает метод проверки статистической гипотезы о равенстве среднего распределения (далее - среднее) разностей парных наблюдений нулю (предположение о несущественности расхождения между рядами наблюдений) или какому-либо другому заданному значению.

2 Нормативные ссылки

В настоящем стандарте использована нормативная ссылка на следующий стандарт:

ГОСТ Р 50779.10-2000 (ИСО 3534-1-93) Статистические методы. Вероятность и основы статистики. Термины и определения (ИСО 3534-1:1993, IDТ)

Примечания

1 Настоящий раздел является дополнительным по отношению к содержанию международного стандарта ИСО 3301:1975 (ISO 3301:1975) и включен для учета основополагающих национальных стандартов в области статистических методов.

2 При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов по указателю «Национальные стандарты», составленному по состоянию на 1 января текущего года, и по соответствующим информационным указателям, опубликованным в текущем году. Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться замененным (измененным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяют в части, не затрагивающей эту ссылку.

3 Термины и определения

В настоящем стандарте применены термины по ГОСТ Р 50779.10, а также следующий термин с соответствующим определением:

парные наблюдения (paired observations): Два результата наблюдений определенных свойств или характеристик объекта хi и уi называются парными, если они получены:

- как результаты наблюдений над одним и тем же объектом i (из совокупности), причем данные наблюдения относятся к различным условиям получения этих наблюдений (например, сравнение двух методов анализа свойств одного и того же объекта);

- как результаты наблюдений над объектами, идентичными во всех отношениях, кроме предполагаемого систематического различия в некотором интересующем аспекте; в отношении значимости этого различия проводят проверку статистической гипотезы (например, сравнение урожайности двух соседних участков, засеянных семенами различных сортов).

Во втором случае эффективность проверки гипотез зависит от степени уверенности в отсутствии каких-либо других систематических различий между объектами, кроме некоторого возможного различия, в отношении которого проверяют гипотезу.

4 Применение метода для сравнения двух способов обработки экспериментальных данных

Установленный в настоящем стандарте метод проверки статистической гипотезы может быть применен с целью подтвердить различие двух способов обработки. В этом случае можно считать, что результаты наблюдений хi получены одним способом обработки, а результаты наблюдений yi - некоторым другим способом. Две серии результатов наблюдений не являются независимыми, поскольку каждому хi первой серии (первый способ обработки) ставится в соответствие вполне определенное yi второй серии (второй способ обработки). Термин «способ обработки» понимают в широком смысле. При выявлении возможного систематического расхождения два сравниваемых способа обработки могут относиться к двум методам испытаний, к двум измерительным устройствам или к двум лабораториям. Два способа обработки, выполненные над одним и тем же экспериментальным материалом, могут влиять друг на друга, и полученное значение может зависеть от последовательности обработки. Оптимальный план эксперимента должен устранять возможные систематические смещения. В качестве альтернативы сравнению способов обработки можно рассмотреть воздействие одного способа обработки по сравнению со случаем полного отсутствия обработки.

5 Условия применения метода

Для корректного применения метода необходимо выполнение следующих двух условий:

- последовательность разностей di = xi - yi является выборкой независимой случайной величины;

- распределение величин di = xi - yi является нормальным или близким к нормальному.

Если распределение разностей отклоняется от нормального, метод проверки гипотез применим при условии, что объем выборки достаточно велик. При больших отклонениях от нормальности требуется соответственно большая выборка. Однако даже в предельных случаях отклонения от нормальности выборки объемом 100 могут быть достаточными для корректного применения метода в большинстве прикладных задач.

6 Расчетные формулы и правила принятия решения

Изучаемая проблема _______________________________________________________

Условия проведения эксперимента __________________________________________

Статистические данные

Расчетные формулы

Объем выборки

п =

Суммы результатов наблюдений:

Сумма разностей:

Сумма квадратов разностей:

Заданное значение (среднее случайных разностей парных наблюдений):

d0 =

Число степеней свободы:

Выбранный уровень значимости:

a =

Правило принятия решения

1 Двусторонняя критическая область:

Гипотезу о том, что среднее совокупности разностей равно d0 (нулевая гипотеза Н0), отвергают, если

2 Односторонняя критическая область:

а) Гипотезу о том, что среднее совокупности разностей равно d0 (нулевая гипотеза Н0), отвергают, если

б) Гипотезу о том, что среднее совокупности разностей равно d0 (нулевая гипотеза Н0), отвергают, если

Примечание - t1-a(n) - квантиль уровня 1 - a статистики Стьюдента с (n) степенями свободы. Значения t1-a(n) /  приведены в таблице 1.

Таблица 1 - Значения отношения t1-a(n) /  для n = n - 1

Двусторонняя гипотеза

Односторонняя гипотеза

Двусторонняя гипотеза

Односторонняя гипотеза

1

8,985

45,013

4,465

22,501

21

0,443

0,604

0,367

0,537

2

2,434

5,730

1,686

4,021

22

0,432

0,588

0,358

0,523

3

1,591

2,920

1,177

2,270

23

0,422

0,573

0,350

0,510

4

1,242

2,059

0,953

1,676

24

0,413

0,559

0,342

0,498

5

1,049

1,646

0,823

1,374

25

0,404

0,547

0,335

0,487

6

0,925

1,401

0,734

1,188

26

0,396

0,535

0,328

0,477

7

0,836

1,237

0,670

1,060

27

0,388

0,524

0,322

0,467

8

0,769

1,118

0,620

0,966

28

0,380

0,513

0,316

0,458

9

0,715

1,028

0,580

0,892

29

0,373

0,503

0,310

0,449

10

0,672

0,956

0,546

0,833

30

0,367

0,494

0,305

0,441

11

0,635

0,897

0,518

0,785

40

0,316

0,422

0,263

0,378

12

0,604

0,847

0,494

0,744

50

0,281

0,375

0,235

0,337

13

0,577

0,805

0,473

0,708

60

0,256

0,341

0,214

0,306

14

0,554

0,769

0,455

0,678

70

0,237

0,314

0,198

0,283

15

0,533

0,737

0,438

0,651

80

0,221

0,293

0,185

0,264

16

0,514

0,708

0,423

0,626

90

0,208

0,276

0,174

0,248

17

0,497

0,683

0,410

0,605

100

0,197

0,261

0,165

0,235

18

0,482

0,660

0,398

0,586

200

0,139

0,183

0,117

0,165

19

0,468

0,640

0,387

0,568

500

0,088

0,116

0,074

0,104

20

0,455

0,621

0,376

0,552

¥

0

0

0

0

Пример - Приведенные в таблице 2 данные собраны в процессе исследований, спланированных с целью определить, зависит ли скорость изнашивания шеек коленчатого вала двигателя внутреннего сгорания от типа материала металлических вкладышей подшипников скольжения этого вала.

Таблица 2 - Износ шеек коленчатых валов в течение заданной наработки, измеренный в стотысячных долях дюйма

Номер вала i

Износ вала

Разность di = xi - уi

Медно-свинцовые вкладыши хi

Алюминиевые вкладыши уi

1

3,5

1,5

2,0

2

2,0

1,3

0,7

3

4,7

4,5

0,2

4

2,8

2,5

0,3

5

6,5

4,5

2,0

6

2,2

1,7

0,5

7

2,5

1,8

0,7

8

5,8

3,3

2,5

9

4,2

2,3

1,9

Сумма

34,2

23,4

10,8

 

Технические характеристики _______________________________________________

Статистические данные

Вычисления

Объем выборки

п = 9

Суммы результатов наблюдений:

Сумма разностей:

Сумма квадратов разностей:

Заданное значение:

t0,995 /  = 1,118

d0 = 0

Число степеней свободы:

A2 = 1,118´0,8846 = 0,99

Выбранный уровень значимости:

a = 0,01

Выводы

Сравнение среднего совокупности с заданным значением 0:

Проверка двусторонней гипотезы:

Гипотезу равенства скоростей изнашивания шеек коленчатого вала двигателя в случае подшипников с различными вкладышами (медно-свинцовые и алюминиевые) отвергают на 1 %-м уровне значимости.

7 Ошибка второго рода

Вероятность отклонения нулевой гипотезы, когда она верна, равна уровню значимости a. Отклонение нулевой гипотезы, когда она верна, называется ошибкой первого рода, и поэтому выбор значения a ограничивает риск такой ошибки.

С другой стороны, можно совершить ошибку второго рода, то есть проверить нулевую гипотезу, когда она неверна. Вероятность 1 - b отклонения нулевой гипотезы, когда она неверна, называется мощностью критерия статистической проверки гипотезы. Вероятность ошибки второго рода в таком случае равна b.

Для заданной выборки п и ошибки первого рода вероятность b зависит не только от истинного среднего D наблюдаемых разностей di = xi - yi, для которых устанавливают различные альтернативные гипотезы, но также и от стандартного отклонения sd этих разностей. Это стандартное отклонение неизвестно, и, если п мало, выборка может обеспечить только плохую оценку. В результате невозможно устанавливать верхний предел вероятности ошибки второго рода.

На графиках (рисунки 1 и 2) показаны зависимости между мощностью 1 - b критерия проверки гипотез и истинным средним совокупности, деленным на соответствующее стандартное отклонение (D/sd) для случая односторонней гипотезы Н0: D £ 0, различных значений n и уровней значимости 0,05 и 0,01 соответственно.

На основании этих графиков можно сделать следующие заключения:

1) Мощность критерия проверки гипотез однозначно определяется истинным средним D совокупности разностей, измеренных в единицах стандартного отклонения sd, уровнем значимости a и объемом выборки.

2) Функция мощности является монотонно возрастающей функцией истинного среднего совокупности разностей. Она также монотонно возрастает с ростом объема выборки и уровня значимости a при условии, что D > 0 и a отличается от 0 и 1.

3) Для уровня значимости 0,05 и при объеме выборки 50 достигается мощность 0,95, если истинное среднее разностей превышает половину стандартного отклонения разностей. Для n = 20 такая мощность достигается для D/sd = 0,78 и больших значений.

Рисунок 1 - Мощность критерия для одной выборки (односторонний критерий), a = 0,01

Рисунок 2 - Мощность критерия для одной выборки (односторонний критерий), a = 0,05

СОДЕРЖАНИЕ

1 Область применения. 2

2 Нормативные ссылки. 2

3 Термины и определения. 2

4 Применение метода для сравнения двух способов обработки экспериментальных данных. 3

5 Условия применения метода. 3

6 Расчетные формулы и правила принятия решения. 3

7 Ошибка второго рода. 5

 

Ключевые слова: проверка статистической гипотезы, результаты наблюдений, ошибка второго рода, стандартное отклонение, мощность критерия, случайный отбор, выборочное среднее