Критерии проверки гипотез о средних и дисперсиях (выдержки из описаний критериев)

 

Ссылки на результаты исследований:

Лемешко Б.Ю., Помадин С.С. Проверка гипотез о математических ожиданиях и дисперсиях в задачах метрологии и контроля качества при вероятностных законах, отличающихся от нормального // Метрология. 2004. – № 3.- С.3-15.

Лемешко Б.Ю., Лемешко С.Б. Об устойчивости и мощности критериев проверки однородности средних // Измерительная техника. 2008. № 9. – С.23-28.

Лемешко Б.Ю., Лемешко С.Б., Горбунова А.А. О применении и мощности критериев проверки однородности дисперсий. Ч. I. Параметрические критерии // Измерительная техника. 2010. № 3. – С.10-16.

Лемешко Б.Ю., Лемешко С.Б., Горбунова А.А. О применении и мощности критериев проверки однородности дисперсий. Ч. II. Непараметрические критерии // Измерительная техника. 2010. № 5. – С.11-18.

См. также: Прикладная математическая статистика (материалы к семинарам)

 

 

1. Критерии проверки гипотез о математических ожиданиях. 1

1.1. Классические критерии проверки гипотез о математических ожиданиях и дисперсиях по одной выборке. 1

1.2. Сравнение двух выборочных средних из нормальных совокупностей. 2

1.2.0. При известных  дисперсиях. 2

1.2.1. При неизвестных, но равных дисперсиях. 2

1.2.2. При неизвестных и неравных дисперсиях. 3

1.3. Сравнение средних значений двух малых выборок по Лорду. 4

1.4. Сравнение средних значений нескольких выборок равного объема по Диксону. 4

1.5. U-критерий Уилкоксона, Манна и Уитни. 4

1.6. H-критерий Краскела-Уаллиса. 5

2. Критерии проверки гипотез о дисперсиях. 6

2.1. Классические критерии проверки гипотез о математических ожиданиях и дисперсиях по одной выборке. 6

2.2. Сравнение двух выборочных дисперсий из нормальных совокупностей. 6

2.3. Проверка равенства нескольких дисперсий для выборок равного объема по Хартли. 7

2.4. Ранговый критерий рассеяния Зигеля и Тьюки. 7

2.5. Упрощенный критерий Тьюки. 8

2.6. Сравнение рассеяния двух малых выборок по Пиллаи и Бунавентуре. 8

2.7. Критерий Левене об однородности дисперсий   [Levene, 1960]. 9

 

1. Критерии проверки гипотез о математических ожиданиях

 

1.1. Классические критерии проверки гипотез о математических ожи­даниях и дисперсиях по одной выборке

 

Пусть мы имеем выборку  случайных величин, рас­пределенных по нормальному закону . В этом слу­чае задачи проверки гипотез о математических ожиданиях и дисперсиях формулируются следующим образом.

1. В критерии проверки гипотез вида  при известной диспер­сии  используется статистика , которая при справедли­вости гипотезы  подчиняется нормальному распределению: . Проверяемая гипотеза  отклоняется при боль­ших отклонениях  от .

2. Для проверки гипотезы  при неизвестной дисперсии  используется статистика , где , . При справедливости  статистика  распределена как  – распределение Стьюдента.

 

 

1.2. Сравнение двух выборочных средних из нормальных совокупностей

 

Проверяется гипотеза вида .

1.2.0. При известных  дисперсиях

Применение критерия сравнения двух выборочных средних при известных и равных дисперсиях предусматривает вычисление статистики

,   (5)

где , - объем -й выборки,

В случае принадлежности наблюдений нормальным законам статистика  подчиняется стандартному нормальному закону.

 

1.2.1. При неизвестных, но равных дисперсиях

 

При неравных объемах выборок  статистика критерия имеет вид

 

,

где

, ,  , или

.

 

В случае нормального закона эта статистика в случае справедливости  должна подчиняться распределению Стьюдента с числом степеней свободы , то есть .

При равных объемах выборок  статистика принимает вид

=,

а .

 

1.2.2. При неизвестных и неравных дисперсиях

 

Смотри [Закс Л., с.248-252]. Проверяется гипотеза вида  при условии, что . Такая задача получила название проблемы Беренса-Фишера

При неравных объемах выборок  статистика критерия имеет вид

,

а число степеней свободы

.

 

При равных объемах выборок  –

а

.

 

 

1.3. Сравнение средних значений двух малых выборок по Лорду

 

Смотри [Закс Л., с.254]. [Lord E., 1947]

Критерий предназначен для сравнения центров независимых рядов измерений равного объема (). Статистика критерия имеет вид

,

где ,  – размахи выборок. Предполагается принадлежность наблюдений нормальному закону и равенство дисперсий. Утверждается, что критерий имеет такую же мощность (в табулированной области объемов выборок), как и t-критерий.

Проверяемая гипотеза отклоняется, когда значение статистики оказывается больше критического.

 

 

1.4. Сравнение средних значений нескольких выборок равного объема по Диксону

 

Смотри [Закс Л., с.255-256].

[Dixon., 1953]. Критерий используется для проверки значимости отклонения среднего одной выборки  от  средних значений других выборок. Предполагается, что  является наименьшим или наибольшим в ряду средних значений ,  .  Ряд средних значений упорядочивается либо по возрастанию , либо по убыванию . Статистика критерия имеет вид

.

Проверяемая гипотеза о незначимости отклонения  от остальных  отклоняется при больших значениях статистики. Рассматриваются варианты данной статистики. Считается, что критерий устойчив к нарушению предположений о нормальности наблюдаемого закона.

 

 

 

1.5. U-критерий Уилкоксона, Манна и Уитни

 

Смотри [Закс Л., с.270-281].

Ранговый критерий Манна и Уитни [Mann, Whitney, 1947] основан на критерии Уилкоксона для независимых выборок. Он является непараметрическим аналогом t-критерия для сравнения двух средних значений непрерывных распределений.

Асимптотическая эффективность U-критерия равна  по сравнению с t-критерием [Закс Л., с.270]. 

U-критерий Уилкоксона, Манна и Уитни проверяет гипотезу о принадлежности двух выборок одной и той же генеральной совокупности : . Эта гипотеза включает также равенство значений медиан  и равенство средних значений .

Для вычисления статистики упорядочивают  значений объединенной выборки, определяют сумму рангов , соответствующую элементам первой выборки, и сумму рангов второй . Вычисляем

,

.

Для контроля правильности можно использовать равенство . Статистика критерия имеет вид

.

 Проверяемая гипотеза отклоняется, когда значение статистики оказывается меньше критического.

Считается, что U-критерий является самым строгим непараметрическим критерием.

Для достаточно больших выборок (), когда объемы выборок не слишком малы (), используется статистика

,

хорошо описываемая стандартным нормальным распределением [Mann H.B., Whitney D.R. On a test of whether one of two random variables is stochastically larger than the other // Ann. Math. Statist. 1947. V.18. – p. 50-60].

 

 

1.6. H-критерий Краскела-Уаллиса

 

Смотри [Закс Л., с.281-283], [Мардиа К., Земроч П., с. 24-27].

Данный критерий [Kruskal, Wallis, 1952] является развитием U-критерия для проверки гипотезы (о равенстве средних) по  выборкам.

Объединенную выборку  упорядочивают и вычисляют суммы рангов  для -й выборки, . Статистика для проверки нулевой гипотезы имеет вид

.

 

 представляет собой дисперсию ранговых сумм. При больших  и  (практически при , ) при справедливости проверяемой гипотезы  статистика подчиняется -распределению. Проверяемая гипотеза отклоняется при больших значениях статистики.

 

 

 

 

2. Критерии проверки гипотез о дисперсиях

 

2.1. Классические критерии проверки гипотез о математических ожи­даниях и дисперсиях по одной выборке

1. Для проверки гипотезы вида  при известном математиче­ском ожидании  вычисляется статистика , условным распределением которой является   распределение.

2. В критерии проверки гипотезы вида  при неизвестном математическом ожидании  используется статистика , подчиняющаяся  – распределению.

 

2.2. Сравнение двух выборочных дисперсий из нормальных совокупностей

 

Для определения того, относятся ли две выборки к одной и той же генеральной совокупности.

Проверяется гипотеза вида . Статистика для проверки гипотезы имеет вид

.

В случае принадлежности выборок нормальному закону и справедливости  эта статистика подчинятся -распределению Фишера с числом степеней свободы  и  (). В зависимости от альтернативы критерий может быть односторонним () или двусторонним (например,  ).

В многочисленных источниках подчеркивается, что результат проверки может сильно зависеть даже от небольших отклонений от нормального распределения.

 

Непараметрические критерии о дисперсиях [Cochran, 1947], [Box, 1953], [Box, Anderson, 1955], [Levene, 1960]: для сравниваемых рядов измерений образуют  и к ним применяют критерий суммы рангов; если ряды абсолютных отклонений можно рассматривать как выборки из распределений с равными средними значениями, при двух выборках применяется U-критерий, при большем числе выборок H-критерий Краскела-Уоллиса.

 

2.3. Проверка равенства нескольких дисперсий для выборок равного объема по Хартли

 

Проверяемая гипотеза о постоянстве дисперсии  выборок объема  имеет вид:

.                                                           (1)

а конкурирующая с ней гипотеза –

,                                                                           (2)

где неравенство выполняется, по крайней мере, для одной пары индексов  , .  

Статистика для проверки гипотезы имеет вид

.

Степенями свободы для распределения статистики являются число выборок  и . В [Закс Л.] приводятся таблицы процентных точек для статистик, заимствованные из [Pearson E.S., Hartley H.O.]

 

2.4. Ранговый критерий рассеяния Зигеля и Тьюки

 

Зигель и Тьюки [Siegel, Tukey, 1960] предложили непараметрический критерий, основанный на критерии Уилкоксона. Проверяемая гипотеза  заключается в том, что две независимые выборки принадлежат к общей генеральной совокупности с одинаковыми характеристиками рассеяния.

В [Закс Л., с.264-266] говорится, что в случае возрастания различия между средними значениями двух выборок возрастает вероятность ошибки второго рода для данного критерия. В то же время критерий чувствителен к разнице дисперсий при равных параметрах положения.

При использовании критерия объединенная выборка объемом  (при ) упорядочивается (строится вариационный ряд). Ранги элементам такой выборки присваиваются следующим образом: наименьшее значение получает ранг 1, два наибольших значения получают ранги 2 и 3, ранги 4 и 5 получают следующие наименьшие значения, 6 и 7 – следующие наибольшие значения и т.д. Если число наблюдений нечетно, то среднее наблюдение не получает никакого ранга, если четное – оно получает наивысший ранг.

Для каждой выборки определяют сумму рангов  и . При  проверяемой гипотезе  соответствует соотношение . Чем больше отличаются  и , тем больше выборки отличаются по своим дисперсиям.

Для оценки разности при малых выборках () авторы [Siegel, Tukey, 1960] дают точные критические значения.

Для не слишком малых выборок ( и  или  и ) используют статистику

,

где  – сумма рангов меньшей выборки, которая приближенно подчиняется нормальному закону. Если , то в выражении для статистики  заменяют на .

Следует иметь ввиду, что при сильно различающихся объемах выборок  и  предлагается использовать скорректированное выражение для статистики:

.

Другая коррекция для статистики предусматривается в случае присутствия в выборках большого числа одинаковых значений.

 

 

2.5. Упрощенный критерий Тьюки

 

Смотри [Закс Л., с.266-268].

Не стоит рассматривать.

 

 

2.6. Сравнение рассеяния двух малых выборок по Пиллаи и Бунавентуре

 

Смотри [Закс Л., с.253].

Предполагается, что распределения приближенно нормальные. Рассеяния двух независимых выборок сравниваются по величине размахов. Если  и  размахи выборок с объемами  и  и при этом >, то формируется статистика (аналог F-критерия). В [Pullai, Buenaventura A.R., 1961] получены верхние процентные точки для этой статистики при  и ≤10, которые приведены в [Закс Л., с.253].

 

 

2.7. Критерий Левене об однородности дисперсий   [Levene, 1960].

 

Критерий Левене (Levene 1960) используется для проверки того, что  выборок имеют равные дисперсии. Критерий Левене является альтернативой критерию Бартлетта. Считается, что критерий Левене менее чувствителен к отклонениям от нормальности.

Проверяемая гипотеза о постоянстве дисперсии  выборок имеет вид:

.                                                           (1)

а конкурирующая с ней гипотеза –

,                                                                           (2)

где неравенство выполняется, по крайней мере, для одной пары индексов  , .  

Пусть  − объем -й выборки, , -е наблюдение в -й выборке. Статистика критерия Левене имеет вид:

,

 

где  может определяться одним из следующих способов:

1.    

где  − есть среднее в -й выборке.

2.    

где  − есть медиана в -й выборке.

3.    

где  − есть усеченное среднее в -й выборке.

 − есть среднее  по -й выборке,  − есть среднее  по всем выборкам.

Эти три варианта выбора определяют устойчивость критерия Левене. В оригинальной работе Левене предусмотрено только использование выборочных средних. Brown and Forsythe (1974) расширили критерий Левене на случай использования выборочных медиан и усеченного среднего. Их исследования критерия методом Монте-Карло показало, что при использовании  усеченного среднего критерий устойчив к отклонениям в сторону распределения Коши, а в случае использования выборочных медиан − к асимметрии закона. Использование среднего обеспечивает лучшую мощность критерия в случае симметричных и умеренно отличающихся распределений.

В критерии Левене проверяемая гипотеза о равенстве дисперсий отклоняется, если

,

где  − верхнее критическое значение -распределения с  и  степенями свободы и уровнем значимости .

 

1.     Levene H. Robust tests for equality of variances. In I.Olkin and others (Eds): Contributions to probability and Statistics. Essays in Honor of Harold Hotelling. Stanford, 1960. – p. 278-292.

2.     Brown, M. B. and Forsythe, A. B. (1974), Journal of the American Statistical Association, 69, 364-367.

 

 

Литература

 

3.     Закс Л. Статистическое оценивание. М.: Статистика, 1976. – 598 с.

4.     Cochran W.G. Some consequences when the assumptions for the analysis or variance are not satisfied // Biometrics. 1947. V.3. – p. 22-38.

5.     Box G.E.P. Non-normality and tests on variances // Biometrika. 1953. V. 40. – p. 318-335.

6.     Box G.E.P., Anderson S.L. Permutation theory in the derivation of robust criteria and the study of departures from assumption. With discussion // J. Roy. Statist. Soc., Ser. B. V. 17. 1955. – p. 1-34.

7.     Pearson E.S., Hartley H.O. Biometrika Tables for Statisticians. Cambridge, 1958. V.1.

8.     Siegel S., Tukey J.W. A nonparametric sum of ranks procedure for relative spread in unpaired samples // J. Amer. Statist. Assoc. 1960. V. 55. – p. 429-455.

9.     Mann H.B., Whitney D.R. On a test of whether one of two random variables is stochastically larger than the other // Ann. Math. Statist. 1947. V.18. – p. 50-60.

10. Kruskal W.H., Wallis W.A. Use of ranks in one-criterion variance analysis // J. Amer. Statist. Assoc. 1952. V.47. – p. 583-621.

11. Kruskal W.H., Wallis W.A. Use of ranks in one-criterion variance analysis // J. Amer. Statist. Assoc. 1953. V.48. – p. 907-911.

12. Мардиа К., Земроч П. Таблицы F-распределений и распределений, связанных с ними. М.: Наука, 1984. - 255 с.

13. Lord E. The Use of the range in place of the standard deviation in the t-test // Biometrika. 1947. V. 34. – p. 41-67.

14. Dixon W.J. Processing data for outliers // Biometriks. 1953. V. 9. – p. 74-89.

15. Pullai K.C.S., Buenaventura A.R., Upper percentage points of a substitute F-ratio using ranges // Biometrika. 1961. V. 48. – p. 195-196.