Метрология. 2005. № 2. С.3-23

УДК 519.233.3: 006.91.001

Сравнительный анализ критериев проверки отклонения распределения от нормального закона

 

Б.Ю. Лемешко, С.Б. Лемешко

 

Исследованы распределения статистик и мощность ряда критериев про­верки отклонения от нормального закона, в том числе, не вошедших в ГОСТ Р ИСО 5479-2002. Показаны достоинства и недостатки различных критериев.

 

См. далее:

Лемешко Б.Ю., Рогожников А.П. Исследование особенностей и мощности некоторых критериев нормальности // Метрология. 2009. № 4. – С. 3-24.

Лемешко Б.Ю., Рогожников А.П. О нормальности погрешностей измерений в классических экспериментах и мощности критериев, применяемых для проверки отклонения от нормального закона // Метрология. 2012. № 5. – С. 3-26. 

См. также: Прикладная математическая статистика (материалы к семинарам)

 

Введение. Принадлежность наблюдаемых данных нормальному закону является необходимой предпосылкой для корректного применения большинства классических методов математической статистики, исполь­зуемых в задачах обработки измерений, стандартизации и контроля качества. По­этому проверка на отклонение от нормального закона является частой процедурой в ходе проведения измерений, контроля и испыта­ний.

Отечественный стандарт ГОСТ Р ИСО 5479-2002 “Статистические методы. Проверка отклонения распределения вероятностей от нормаль­ного распределения” [1], введенный в действие в 2002 г., представляет собой аутентичный текст международного стандарта ISO 5479-97. В стандарте рассматривается графический метод проверки на нормаль­ность с использованием вероятностной бумаги, критерии проверки на симметричность и на значение эксцесса, статистики которых представ­ляют собой функции от оценок моментов закона распределения, крите­рии Шапиро-Уилка, основанные на регрессионном анализе порядковых статистик, критерий Эппса-Палли, статистика которого измеряет некото­рое расстояние между выборочной характеристической функцией и ха­рактеристической функцией нормального закона.

На наш взгляд, введенный стандарт [1] не позволяет его пользова­телям ориентироваться в том, какой из критериев является предпочти­тельней, какой из них оказывается наиболее мощным, против каких аль­тернатив и при каких объемах выборок конкретный критерий обладает преимуществом или наоборот.

В стандарте отказываются от использования критериев типа  и не упоминается применение для проверки нормальности непараметриче­ских критериев согласия.

 В отечественной литературе можно найти много примеров, свя­занных с проверкой отклонений от нормального закона, но исследова­нию специальных критериев, предназначенных для этих целей, уделено достаточно мало внимания [2, 3]. Напротив, в зарубежных источниках исследованию критериев проверки отклонений от нормальности посвя­щено значительное число работ. Уделено внимание и анализу мощности критериев при проверке отклонений от нормального закона по отноше­нию к различным альтернативам [4, 5]. Подчеркивается, что критерии согласия при малых объемах выборок проигрывают по мощности специ­альным критериям проверки на отклонение от нормальности [4] и пред­почтение, как правило, отдается критерию Шапиро-Уилка. В то же время не складывается полной картины того, когда и каким критерием целесо­образней пользоваться при проверке отклонений распределения от нор­мального. 

В свете вышесказанного для заинтересованных специалистов оста­ется неясным, насколько обоснован выбор критериев в стандарте, каковы их достоинства и недостатки, какова их мощность, как меняются распре­деления статистик критериев с ростом объемов выборок? Всегда ли, на­пример, критерии Шапиро-Уилка и Эппса-Палли по мощности оказыва­ются предпочтительнее?

 В этой связи в данной работе методами статистического модели­рования исследованы свойства критериев, включенных в ГОСТ Р ИСО 5479-2002: исследованы распределения статистик, мощность критериев по отношению к близким альтернативам, показаны достоинства и недос­татки критериев, проведено сравнение по мощности этих критериев с крите­риями согласия. Исследован ряд критериев, не включенных в стандарт.

Критерий проверки на симметричность [6,7]. Критерий предназначен для проверки гипотез о симметричности наблюдаемого закона (против наличия асимметрии) при объемах выборки . Статистика крите­рия имеет вид

,                                                     (1)

при вычислении которой оценки используемых центральных моментов (в том числе  ) вычисляются в соответствии с соотноше­нием

,

где

.

Проверяется гипотеза =0 против альтернативы  >0  (поло­жительная асимметрия) или <0  (отрицательная асиммет­рия).

В стандарте и первоисточниках [6,7] приводятся только таблицы процентных точек. Ничего не говорится о виде распределения. Распреде­ление статистики (1) в случае нормального закона является сим­мет­ричным и зависит от числа наблю­дений. В [3] говорится, что распре­деление статистики (1) очень быстро приближается к нормальному с нулевым математическим ожиданием и асимптотической дисперсией .

В данной работе при исследовании распределений статистик про­веряемой гипотезе  всегда соответствует принадлежность наблюдае­мой выборки нормальному закону распределения

.

При исследовании зависимости распределений статистик от вида наблю­даемого закона нами рассматривалось целое множество конкурирующих распределений. Но в тексте работы основные свойства критериев демонстрируются на аль­тернативах, позволяющих показать как достоинства, так и некоторые ра­нее неизвестные недостатки отдельных критериев. В качестве таких конкури­рующих гипотез при исследовании мощности критериев рассмотрена принадлежность следующим зако­нам:  соответствует семейству распределений с плотностью

                       (2)

и параметром формы ;  – распределению Лапласа с плотностью

;

 – логистическому распределению

,

очень близкому к нормальному. При этом, как правило, выборки моде­лировались с параметром масштаба  и параметром сдвига . Гра­фики функций плотности данных распределений представлены на рис. 1.

Рис. 1. Плотности распределений, соответствующих рассматриваемым гипотезам

 

Критерий, использующий статистику (1), является только крите­рием проверки на симметричность. Его использование полезно при про­верке отклонений от нормального закона, но неотклонение гипотезы о симметричности на основании предположений о нормальности закона не может служить подтверждением нормальности (ус­ловие необходимое, но не достаточное), так как распределение статистики (1) зависит от вида наблюдаемого закона (см. рис. 2).

Нормальное распределение не единственное симметричное распределение. Поэтому проверяемая гипо­теза о симметричности может необоснованно и отклоняться, и не откло­няться. Например, в случае принадлежности наблюдаемых выборок распределению семейства (2) с параметром  формы  (при справедливости ) и использовании процент­ных точек для статистики (1), построенных в предположении нормально­сти закона, гипотеза о симметрич­ности не будет отклоняться с бόльшим дости­гаемым уровнем значи­мости.

Рис. 2. Распределения статистики критерия проверки на симметричность в зависимости от гипотез  при объеме выборок n=10

 

Критерий проверки на эксцесс [7,8]. В стандарте предусмотрено ис­пользование критерия проверки на эксцесс при объемах выборок . Статистика критерия проверки на значение эксцесса имеет вид

.                                                     (3)

Проверяется гипотеза вида : =3 против альтернативы >3  (больший эксцесс) или <3  (меньший эксцесс).

В стандарте и первоисточниках [7,8] приводятся лишь таблицы процентных точек. Распределение статистики зависит от объема рас­сматриваемых выборок. В [3] говорится, что распределение статистики (3) даже при больших объемах выборок  оказывается далеким от нор­мального. В этом можно убедиться по картине, представленной на рис. 3, где приведены графики полученных в результате моделирова­ния распределений статистики критерия проверки на эксцесс в зависимости от объема выборки n.

Распределения статистики (3) были исследованы при наблюдаемых законах, соот­ветствующих рассмотренным выше гипотезам . Резуль­таты исследований позволяют судить о мощности критерия проверки на эксцесс относительно различных альтернатив.

Рис. 3. Графики распределений статистики критерия проверки на эксцесс в зависимости от объема выборки при =10,20,40,30,50,100,150

 

Вместе с критерием симметричности данный критерий позволяет судить о степени отклонения наблюдаемой выборки от нормального за­кона. Недостатком критерия является сильная зависимость распределе­ния статистики (3) от объема выборок.

Совместный критерий проверки на симметричность и нулевой ко­эффициент эксцесса [9] в стандарте рассматривается при объемах выбо­рок 20££1000 (много­направленный критерий). Проверяемая гипотеза имеет вид =0 и =3 против  ≠0  и (или) ≠3. В стан­дарте приведены кривые, определяющие критическую область при уровне значимости  и .

В данном случае такой совместный критерий не исследовался. Результаты ис­следования различных вариантов критериев, построенных на основе (со­вместного) использования статистик (1) и (3), не вошедших в стандарт, рассмотрены ниже.

Критерий Шапиро-Уилка. Критерий Шапиро-Уилка [10,11], базиру­ется на анализе линейной комбинации разностей порядковых статистик. В стандарте применение критерия предусмотрено при объемах выборок 8££50. Сложность применения при больших объемах выборок затруд­нена вследствие отсутствия в документе соответствующих коэффициен­тов. При объемах выборок 51££99 коэффициенты и таблицы процент­ных точек можно найти в [11]. В стандарте критерий рекомендуют применять при отсутствии априорной информации о типе возможного отклонения от нормальности в тех случаях, когда в качестве альтернативы можно вы­брать гипотезу следующего вида: примерно симметричное распределе­ние с <1/2 и <3 или асимметричное распределение (например, >1/2). В противном случае рекомендуют критерий Эппса-Палли. Дан­ная рекомендация неочевидна и требует подтверждения.

При построении статистики для вариационного ряда , полученного по наблюдаемой выборке , вы­числяют величину

где индекс  изменяется от 1 до  или от 1 до  при четном и не­четном  соответственно. Коэффициенты  приведены в стандарте и первоисточниках [10,11]. Статистика критерия имеет вид

.                                         (4)

Гипотеза о нормальности отвергается при малых значениях статистики . В стандарте и литературе отсутствует информация об аналитическом виде распределения статистики, приводятся лишь процентные точки.

Как и в предыдущих случаях, распределения статистики (4) иссле­довались методами статистического моделирования. На рис. 4 показана зависимость вида распределения статистики критерия Шапиро-Уилка в зависимости от объема выборки, принадлежащей нормальному закону.

Рис. 4. Графики распределения статистики критерия Шапиро-Уилка в за­висимости от объема выборки при =10,20,40,30,50

 

Распределения статистики (4) исследовались при различных на­блюдаемых законах, исследовалась мощность критерия. В качестве гипо­тезы  рассмотрен нормальный закон распределения с параметром мас­штаба равным 1 и параметром сдвига равным 0. В качестве близких аль­тернатив рассмотрены гипотезы:  – выборка соответствует семейству распределений (2) с параметром формы рав­ным 4,  – распределению Лапласа с параметрами (0,1),  – логистиче­скому распределению с параметрами (0,1).

Рис. 5. Условные распределения  статистики (3) при справедливости гипотез  при объеме выборок n=10

 

В качестве примера на рис. 5 приведены полученные условные распределения  статистики (4) при справедливости гипотез , , ,  при объеме выборок =10. Результаты исследований пока­зали, что при малых объемах выборок (10-20 наблюдений) критерий Ша­пиро-Уилка не способен различать гипотезы  и  . Еще в худшей сте­пени критерий замечает различие между нормальным распределением и распределением семейства (2) с параметром формы . Более того по отношению к альтернативе  критерий оказывается смещенным. Но с ростом числа наблюдений мощность критерия по распознаванию аль­тернатив  и     растет.

Значения мощности критерия Шапиро-Уилка по отношению к конкурирующим гипотезам ,, при различных значениях уровня значимости  (вероятности ошибки первого рода) приведены соответст­венно в таблицах 1-3.

 

Таблица 1. Мощность критерия Шапиро-Уилка по отношению к распре­делению семейства (2) с параметром формы 4

n=10

n=20

n=30

n=40

n=50

0.01

0.007

0.007

0.016

0.036

0.075

0.05

0.048

0.061

0.104

0.168

0.256

0.075

0.080

0.102

0.162

0.244

0.333

0.1

0.107

0.142

0.213

0.296

0.406

 

Таблица 2. Мощность критерия Шапиро-Уилка по отношению к распре­делению Лапласа

n=10

n=20

n=30

n=40

n=50

0.01

0.064

0.134

0.187

0.237

0.277

0.05

0.152

0.266

0.334

0.375

0.418

0.075

0.192

0.316

0.386

0.431

0.469

0.1

0.225

0.351

0.429

0.464

0.509

 

Как показывают, в том числе, и наши исследования мощность кри­териев, специально построенных для проверки отклонения от нормаль­ности, таких как Шапиро-Уилка и Эппса-Палли, на объемах выборок ≤50 выше мощности непараметрических критериев согласия типа Колмо­горова, типа  Крамера-Мизеса-Смирнова и типа  Андерсона-Дарлинга при проверке сложных гипотез [12], которые в такой ситуации мощнее критериев типа  [13]. С применением критериев согласия при малых объемах выборок вообще трудно различать близкие альтерна­тивы. Однако критерии согласия не имеют выявленного в данной работе недостатка, присущего критериям Шапиро-Уилка и Эппса-Палли: неспо­собность отличать от нормального закона распределения семейства (2) с более плоскими плотностями распределений (с <3).

 

Таблица 3. Мощность критерия Шапиро-Уилка по отношению к логи­стическому закону

n=10

n=20

n=30

n=40

n=50

0.01

0.025

0.043

0.057

0.065

0.070

0.05

0.081

0.116

0.130

0.138

0.142

0.075

0.116

0.155

0.166

0.175

0.176

0.1

0.139

0.185

0.199

0.200

0.208

 

Критерий Эппса-Палли. Данный критерий [14-17] базируется на срав­нении эмпирической и теоретической характеристических функций. В стандарте предусмотрено его применение при 8££200. Процентные точки в данном диапазоне даны с пропусками.

Статистика критерия, вычисляемая по наблюдаемой выборке , имеет вид

, (5)

где . Выборка может быть неупорядо­чена, по­рядок наблюдений произволен, но он должен быть неизменным в те­чение всех проводимых вычислений.  Гипотезу о нормальности отвер­гают при больших значениях статистики.

Распределения статистики (5) исследовались методами статистиче­ского моделирования. На рис. 6 показана зависимость вида распределе­ния статистики критерия Эппса-Палли в зависимости от объема выборки, принадлежащей нормальному закону. На рисунке наблюдается “пучок” распределений. Распределения статистик критерия незначительно меня­ются с ростом объемов выборок  (в отличие от распределений других рас­смотренных здесь статистик) при нормальном законе распределения случайной величины. С ростом  наблюдается быстрая сходимость рас­пределения статистики к некоторому предельному.

Рис. 6. Графики распределений статистики критерия Эппса-Палли в зависимости от объема выборки при n=10,20,40,30,50,100,150

 

Процентные точки распределений статистики (5) при различных объемах выборок отличаются существенно, но вероятности вида , вычисленные по распределениям статистики (5) при различ­ных n, будут достаточно близкими. Здесь  –  значение статистики, полу­ченное по выборке. В частности, распределения статистики крите­рия Эппса-Палли при различных объемах выборок  достаточно хорошо аппроксимируются бета-распределениями III рода с функцией плотности

,

где . Если пренебречь зависимостью статистики (5) от объема выборки , то для приближенного вычисления достигаемого уровня значимости  можно использовать бета-распре­де­ление III рода с параметрами =1.8645, =2.5155, =5.8256, =0.9216, =0.0008. Соответствующая функция распределения представляет со­бой некоторую среднюю для  “пучка” распределений, приведенного на рис.6.

Исследования распределений статистики критерия Эппса-Палли при справедливости конкурирующих гипотез ,, и оценка мощно­сти критерия по отношению к данным альтернативам показали, что кри­терий имеет тот же недостаток, что и критерий Шапиро-Уилка: он ока­зывается смещенным относительно тех же альтернатив. Подтверждением этого является картина, приведенная на рис. 7, где представлены услов­ные функции распределения  статистики (5) при справедливости гипотез , , ,  при объеме выборок n=10.

При n=10 мощность критерия Эппса-Палли по отношению к гипо­тезе  меньше (!) уровня значимости (при ). Это означает, что при верной гипотезе  при проверке нормальности предпочтение всегда бу­дет отдаваться гипотезе .  При  n=20  распределения  и  в области значений функций распределения, больших 0.95 прак­тически неразличимы. А при n=50 критерий уже способен различать гипотезы  и  .

Значения мощности критерия Эппса-Палли по отношению к аль­тернативам ,,, которые можно сравнить с соответствующими зна­чениями для критерия Шапиро-Уилка, приведены в таблицах 4-6.

Рис. 7. Условные распределения  статистики (5) при справедливости гипотез  при объеме выборок n=10

 

По отношению к конкурирующей гипотезе  (логистическому за­кону) на объемах выборок ≤50 критерий Эппса-Палли мощнее крите­рия Шапиро-Уилка при больших уровнях значимости () и уступает критерию Шапиро-Уилка по мощности при малых уровнях значимости ().

 

Таблица 4. Мощность критерия Эппса-Палли по отношению к распреде­лению семейства (2) с параметром формы 4

n=10

n=20

n=30

n=40

n=50

0.1

0.091

0.126

0.183

0.222

0.281

0.05

0.041

0.052

0.078

0.108

0.150

0.025

0.017

0.021

0.032

0.051

0.074

0.01

0.006

0.007

0.010

0.015

0.025

 

Таблица 5. Мощность критерия Эппса-Палли по отношению к распреде­лению Лапласа

n=10

n=20

n=30

n=40

n=50

0.1

0.243

0.354

0.462

0.552

0.623

0.05

0.166

0.260

0.352

0.441

0.519

0.025

0.112

0.192

0.265

0.349

0.428

0.01

0.066

0.128

0.175

0.257

0.323

 

Таблица 6. Мощность критерия Эппса-Палли по отношению к логисти­ческому закону

n=10

n=20

n=30

n=40

n=50

0.1

0.146

0.176

0.204

0.228

0.249

0.05

0.089

0.108

0.125

0.147

0.167

0.025

0.052

0.070

0.083

0.097

0.112

0.01

0.026

0.039

0.042

0.055

0.067

 

Модифицированный критерий Шапиро-Уилкса. Необходимость про­верки отклонения от нормального распределения, используя несколько независимых выборок, возникает очень часто, поскольку каждая отдель­ная выборка оказывается слишком малой для обнаружения значимого отклонения от нормального распределения. В такой ситуации при вы­борках одинакового объема  стандарт [1] рекомендует применять модифицированный крите­рий Шапиро-Уилка.

При проверке для  последовательных выборок объемом  каж­дая, отобранных из одной совокупности, подсчитывается значение  в соответствии с выражением

.

Значения по соответствующей выборке вычисля­ются как и в критерии Шапиро-Уилка, где индекс  изменяется от 1 до  или от 1 до  при четном и нечетном  соот­веет­ственно. Коэф­фициенты  приведены в стандарте и первоисточниках [6,7].  Для совме­стного критерия вычисляют значения  по формуле:

,

где . Коэффициенты ,  и  для преоб­разования  и  табулированы [1, 18]  и приведены в стандарте.

         Утверждается, что если основное распределение вероятностей нор­мальное, то величины  приблизительно подчиняются нормальному рас­пределению. Статистика модифицированного критерия имеет вид

,                                              (6)

где , и должна подчиняться стандартному нормальному за­кону.

         Проверяемая гипотеза о принадлежности выборок нормальному за­кону отклоняется при уровне значимости , если , где ­­– -кван­тиль стандартного нормального распределения. Заметим, что в тек­сте стандарта [1] ошибка в формуле (19).

  Рис. 8. Условные распределения  статистики (6) при различных комбинациях и

 

К сожалению, наши исследования показали, что распределение статистики (6) лишь очень приближенно подчиняется стандартному нормальному закону и зависит от  и . При конкретных комбинациях  и  условное распределение статистики  может существенно отличаться от стандартного нормального закона, что является сущест­венным недостатком критерия. Как правило, функция распределения статистики оказывается сдвинутой влево от стандартного нормального распределения. Таким образом, принимая решение на основании про­центных точек стандартного нормального закона в соответствии с , мы можем несправедливо отклонить верную гипотезу . То есть, вероятность ошибки первого рода на самом деле оказывается больше задаваемого . На рис. 8 в качестве примера приведены распреде­ления статистики  при различных комбинациях  и . Здесь же для сравнения представлена функция распределения стандарт­ного нормального закона.

Исследования показали, что модифицированный критерий Ша­пиро-Уилка, как и другие, при малых n*h (20-30 наблюдений в совокуп­ности) не способен различить гипотезы   и   (отличить нор­мальный закон от семейства (2) с параметром ). Кроме того, моди­фицированный критерий Шапиро-Уилка при ма­лых n*h<100 уступает по мощности критериям Эппса-Палли и Шапиро-Уилка, уступает он и непараметрические критериям согласия. Совокуп­ность недостатков критерия позволяет не рекомендовать его для приме­нения.

Совместный критерий проверки на симметричность и нулевой коэффициент эксцесса. Далее рассмотрен ряд критериев, не имеющих отношения к стандарту [1], статистики которых измеряют отклонения от нормальности, как правило, с использованием отклонений статистик (1) и (3) от значений, соответствующих нормальному закону. В [9] и [19], где приводятся полезные сведения о ряде критериев проверки отклонения от нормального закона, рассмот­рена одномерная статистика на базе статистик (1) и (3)

,              (7)

которая асимптотически распределена как -распределение. В качестве нормирующих коэффициентов в ней взяты первые члены асимптотиче­ских дисперсий асимптотически нормальных распределений статистик (1) и (3) [3].

Наши исследования распределений статистики (7) при различных объемах выборок показали, что они настолько плохо сходятся к асимпто­тическому предельному -распределению, что последним обоснованно можно пользоваться лишь при объемах выборок, превышающих не­сколько тысяч наблюдений.

Модификация D’Agostino критерия проверки на симметричность. В работе [6] предложена модификация критерия проверки симметрично­сти. В данной модификации на основании следующих соотношений ста­тистика (1) преобразуется в статистику , приближенно подчиняю­щуюся стандартному нормальному закону:

,     ,

,           ,

.                                         (8)

Исследования распределений статистики (8) при различных объе­мах выборок показали, что они очень хорошо согласуются со стандарт­ным нормальным законом.

По мощности критерий со статистикой (8) идентичен критерию со статистикой (1), но он удобней, так как опирается на стандартное нор­мальное распределение.

Модификация D’Agostino критерия проверки на симметричность и значение эксцесса. В [6] с помощью следующих соотношений предло­жено преобразование статистик (3) и (1) к статистике , приближенно распределенной в соответствии со стандартным нормальным законом:

   

,  

      

 .                               (9)

Исследования распределений статистики (9) при справедливой ги­потезе  и различных объемах выборок показали, что  доста­точно хорошо согласуются со стандартным нормальным законом (не­сколько хуже, чем , но хорошо). Критерий двусторонний:  проверяемая гипотеза  отклоняется, если  или .

Исследование мощности критерия со статистикой (9) по отноше­нию к альтернативам , ,  (и ряду других) показало, что данный кри­терий оказывается мощнее всех рассмотренных критериев. Значения мощности критерия относительно альтернатив , ,  при различных объемах выборок представлены в таблицах 7-9.

 

Таблица 7. Мощность критерия со статистикой  по отношению к распре­делению семейства (2) с параметром формы  (по нижним процентным точкам)

n=10

n=20

n=30

n=40

n=50

n=100

n=300

0.1

0,184

0,251

0,350

0,438

0,520

0,835

1

0.05

0,097

0,124

0,181

0,245

0,315

0,666

0,998

0.025

0,051

0,059

0,084

0,116

0,166

0,469

0,991

0.01

0,023

0,019

0,025

0,036

0,058

0,245

0,960

 

Достоинством критерия со статистикой (9) является возможность использования в качестве предельного распределения стандартного нор­мального закона. Статистика критерия учитывает отклонения от симмет­ричности и от эксцесса нормального распределения.

Таблица 8. Мощность критерия со статистикой  по отношению к распре­делению Лапласа (по верхним процентным точкам)

n=10

n=20

n=30

n=40

n=50

n=100

n=300

0.1

0.193

0.312

0.411

0.488

0.574

0.815

0.995

0.05

0.113

0.223

0.311

0.389

0.469

0.742

0.992

0.025

0.068

0.163

0.240

0.309

0.391

0.671

0.987

0.01

0.035

0.106

0.174

0.230

0.307

0.588

0.978

 

Таблица 9. Мощность критерия со статистикой  по отношению к логистическому распределению (по верхним процентным точкам)

n=10

n=20

n=30

n=40

n=50

n=100

n=300

0.1

0.131

0.188

0.234

0.270

0.320

0.680

0.851

0.05

0.071

0.117

0.158

0.188

0.229

0.771

0.780

0.025

0.039

0.074

0.110

0.131

0.171

0.829

0.711

0.01

0.018

0.045

0.067

0.086

0.115

0.885

0.621

 

При малых  и близких альтернативах критерий превосходит по мощности критерии Шапиро-Уилка и Эппса-Палли. В отличие от всех рассмотренных данный критерий способен успешно отличать от нор­мального закона распределения семейства (2) с более плосковершинными по сравнению с нормальным законом плотностями.

Совместный критерия проверки на симметричность и нулевой ко­эффициент эксцесса D’Agostino. На базе статистик  и  в [6] рас­смот­рена одномерная статистика вида

,                                                          (10)

приближенно распределенная как -распределение. Проверяемая гипо­те­за о нормальности отклоняется при больших значениях стати­стики (10).

Исследование распределений данной статистики показало, что в отличие от статистики (7) распределение статистики (10) очень хорошо согласуется с -распределением уже при достаточно малых . По отно­шению к альтернативам  и  критерий не уступает по мощности крите­риям Шапиро-Уилка и Эппса-Палли. Однако он обладает и тем же са­мым недостатком: при малых  данный критерий не позволяет на­деж­но различать гипотезы  и  вследствие смещенности (см. рис. 9).

Рис. 9. Условные распределения  статистики (10) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=10

 

Заключение.

Использование критериев согласия для проверки отклонений от нормального закона при малых объемах выборок является бесперспек­тивным вследствие их очень низкой мощности в такой ситуации по от­ношению к близким альтернативам [3, 20, 21, 12]. Совсем другое дело, при больших n. При малых n предпочтение необходимо отдать специ­альным критериям проверки отклонений от нормальности.

Критерий Эппса-Палли при близких альтернативах по мощности не уступает критерию Шапиро-Уилка.

Недостатком критериев Шапиро-Уилка, Эппса-Палли и критерия со статистикой (10), который ранее никем не отмечался, является их сме­щенность при малых объемах выборок по отношению к альтернативам, более плосковершинным по сравнению с нормальным законом (со значением эксцесса меньшим 3), то есть неспособность отличить эти альтернативы от нормального закона.

Модифицированный критерий Шапиро-Уилка, рекомендованный стандартом [1], нецелесообразно использовать из-за очень плохой сходимости распределения статистики к предельному и повышенной вследствие этого ве­роятности ошибок первого рода.

Критерием, по крайней мере, не уступающим по мощности при близких альтернативах критериям Шапиро-Уилка и Эппса-Палли, у ко­торого отсутствует недостаток, свойственный последним, является кри­терий со статистикой (9), который целесообразно рекомендовать для применения.

Проверка отклонения распределения от нормального за­кона имеет особое значение. Далеко не всегда ошибки измерений, свя­занные с приборами, построенными на конкретных физических принци­пах, или ошибки наблюдений контролируемого пока­зателя подчиняются нормальному закону [22, 23]. В таких случаях применение класси­ческого аппарата, опирающегося на предположение о нормальности наблюдае­мого закона, оказывается некорректным и может приводить к неверным выводам.

В основе исследований, проведенных в данной работе, лежит разви­ваемый подход численного исследования рекомендаций математической статистики, опирающийся на развиваемое программное обеспечение стати­стического анализа, статистического моделирования и исследова­ния статистических закономерностей, хорошо зарекомендовавший себя в предшествующих работах [20, 21, 24]. В процессе исследований распреде­лений статистик закономерности строились (и проверялись) по десяткам и сотням тысяч экспериментов.

Работа выполнена при финансовой поддержке Минобразования РФ (проект  Т02-3.3-3356)

Более подробная информация о результатах данных исследований доступна по адресу http://www.ami.nstu.ru/~headrd/seminar/Kontrol_Q/ krit_zad.htm.

 

ЛИТЕРАТУРА

1.     ГОСТ Р ИСО 5479-2002. Статистические методы. Проверка отклоне­ния распределения вероятностей от нормального распределения. - М.: Изд-во стандартов. 2002. - 30 с.

2.     Золотухина Л.В., Винник Е.В. Эмпирическое исследование мощности крите­рия Саркади и его модификация // Заводская лаборатория. 1985. - Т. 51. - №1. – С. 51-55.

3.     Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. – М.: Наука, 1983. – 416 с.

4.     Shapiro S.S, Wilk M.B., Chem C.J.  J. Amer. Stat. Ass., 1968. December. – P.1343-1372.

5.     Pearson E.S.., D’Agostino R.B., Bowmann K.O. Test for departure from nor­mality: Comparison of powers // Biometrika, 64, 1977. – P.231-246.

6.     D’Agostino R.B. Transformation to normality of the null distribution of g1 // Biometrika, 57, 1970. – P.679-681.

7.     Pearson E.S., Hartley H.O. Biometrika tables for Statisticians. Vol. 1, edn. 3, Cambridge University Press, 1966. –  P.207-208.

8.     D’agostino R.B., Tietjen G.L. Simulation probability points of b2 for small samples // Biometrika, 58, 1971. – P.669-672.

9.     Bowmann K.O., Shenton L.R. ‘Omnibus’ test contours for departures from normality based on // Biometrika, 62, 1975. – P.243-250.

10. Shapiro S.S., Wilk M.B. An analysis of variance test for normality (com­plete samples) // Biometrika, 52, 1965. – P.591-611.

11. Shapiro S.S., Francia R.S. An appriximate analysis of variance test fo nor­mality // J. Amer. Statist. Assoc., 337, 1972. – P.215-216.

12. Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная стати­стика. Правила проверки согласия опытного распределения с теорети­ческим. Часть II. Непараметрические критерии. - М.: Изд-во стандар­тов. 2002. - 64 с.

13. Р 50.1.033-2001. Рекомендации по стандартизации. Прикладная стати­стика. Правила проверки согласия опытного распределения с теорети­ческим. Часть I. Критерии типа хи-квадрат. - М.: Изд-во стандартов. 2002. - 87 с.

14. Baringhaus L., Danschke R., Henze N. Recent and classical tests for normal­ity – A comparative study. Comm. Statistic. B, 18(1), 1989. – P.363-379.

15. Baringhaus L., Henze N. A consistent test for multivatiate normality based on the emperical characteristic function // Metrika. 35, 1988. – P.339-348.

16. Epps T.W., Pulley L.B. A test for normality based on the empirical charac­teristic function // Biometrika. 70, 1983. – P. 723-726.

17. Henze N. An approximation to the limit distribution of the Epps-Pulley test statistic for normality // Metrika. 37, 1990. – P.7-18.

18. Pearson E.S., Hartley H.O. Biometrika tables for Statisticians. Vol. 2, Cam­bridge University Press, 1976. –  P.221.

19. Doornik J.A., Hansen H. An Omnibus Test for Univariate and Multivariate Normality. 1994. (http://www.nuff.ox.ac.uk/users/Doornik/papers/ normal2.pdf)

20. Лемешко Б.Ю., Постовалов С.Н. О зависимости распределений стати­стик непараметрических критериев и их мощности от метода оцени­вания параметров // Заводская лаборатория. Диагностика материалов. 2001. - Т.67. - № 7. - С. 62-71.

21. Лемешко Б.Ю., Постовалов С.Н. Применение непараметрических крите­риев согласия при проверке сложных гипотез // Автометрия. 2001. - № 2. - С. 88-102.

22. Новицкий П.В., Зограф И.А. Оценка погрешностей результатов из­ме­ре­ний. - Л.: Энергоатомизд., 1991. - 303 с.

23. Орлов А.И. Часто ли распределение результатов наблюдений является нормальным // Заводская лаборатория. 1991. - Т. 57. - №7. – С. 64-66.

24. Лемешко Б.Ю., Чимитова Е.В. Оптимальные L-оценки параметров сдвига и масштаба распределений по выборочным квантилям // Заво­дская лаборатория. Диагностика материалов. 2004. – Т.70. – №1. – С. 54-66.