Сравнительный анализ критериев проверки нормальности одномерных величин (Часть 1)

(Переход к Части 2)

Введение

1. Критерий проверки на симметричность

1.1. Исследование распределений статистики критерия проверки на симметричность в зависимости от объема выборки, принадлежащей нормальному закону

1.2. Исследование зависимости распределений статистики критерия проверки на симметричность от вида наблюдаемого закона

1.3. Выводы

2. Критерий проверки на эксцесс

2.1. Исследование распределений статистики критерия проверки на эксцесс в зависимости от объема выборки, принадлежащей нормальному закону

2.2. Исследование зависимости распределений статистики критерия проверки на эксцесс от вида наблюдаемого закона

2.3. Выводы

3. Совместный критерий проверки на симметричность и нулевой коэффициент эксцесса

4. Критерий Шапиро-Уилка

4.1. Исследования распределений статистики критерия Шапиро-Уилка в зависимости от объема выборки, принадлежащей нормальному закону

4.2. Исследования зависимости распределений статистики критерия Шапиро-Уилка от вида наблюдаемого закона

4.3. Мощность критерия Шапиро-Уилка относительно различных альтернатив

4.4. Сравнение с мощностью непараметрических критериев согласия

4.5. Выводы

5. Критерий Эппса-Палли

5.1. Исследования распределений статистики критерия Эппса-Палли в зависимости от объема выборки, принадлежащей нормальному закону

5.2. Исследования зависимости распределений статистики критерия Эппса-Палли от вида наблюдаемого закона

5.3. Мощность критерия Эппса-Палли относительно различных альтернатив

5.4. Сравнение с мощностью непараметрических критериев согласия

5.5. Выводы

6. Модифицированный критерий Шапиро-Уилкса

6.1. Зависимость распределения статистики от объема и числа выборок

6.2. Мощность модифицированного критерия Шапиро-Уилка относительно различных альтернатив

6.3. Выводы

7. Исследование совместного критерия проверки на симметричность и нулевой коэффициент эксцесса

7.1. Выводы

8. Модификация D’Agostino критерия проверки на симметричность

8.1. Выводы

9. Модификация DAgostino критерия проверки на эксцесс

9.1. Выводы

10. Исследование совместного критерия проверки на симметричность и нулевой коэффициент эксцесса DAgostino

10.1. Выводы

Заключение

Приложение 1. Процентные точки  для статистики критерия проверки симметричности

Приложение 2.  Процентные точки  для статистики критерия проверки на эксцесс

Приложение 3. Процентные точки  для статистики критерия Эппса-Палли

Приложение 4.  Процентные точки  для статистики критерия Шапиро-Уилка

Приложение 5. Коэффициенты для вычисления статистики критерия Шапиро-Уилка

Приложение 6. Коэффициенты для вычисления статистики модифицированного критерия Шапиро-Уилка

Литература

 

Лемешко Б.Ю., Лемешко С.Б. Сравнительный анализ критериев проверки отклонения распределения от нормального закона // Метрология. 2005. № 2. – С. 3-24.

Лемешко Б.Ю., Рогожников А.П. Исследование особенностей и мощности некоторых критериев нормальности // Метрология. 2009. № 4. – С. 3-24.

Лемешко Б.Ю., Рогожников А.П. О нормальности погрешностей измерений в классических экспериментах и мощности критериев, применяемых для проверки отклонения от нормального закона // Метрология. 2012. № 5. – С. 3-26.

 

См. также: Прикладная математическая статистика (материалы к семинарам)

 

Введение

 

Применение простейших методов статистического анализа в производственных условиях или при экспериментальных исследованиях представляет собой выполнение достаточно рутинных операций, в результате которых на основании значений статистик критериев принимается решение об отклонении или принятии проверяемых гипотез. При этом человек, применяющий эти методы, как правило, является специалистом конкретной области и не очень озабочен тем, насколько надежны выводы проводимого статистического анализа, насколько вообще в данных конкретных условиях корректно применение используемых методов, действительно ли используемые методы являются наилучшими для достижения поставленных целей. Он заранее уверен в том, что в регламентирующих документах, стандартах и рекомендациях безошибочно отобраны наилучшие методы. С одной стороны, это правильно. С другой стороны, на основании результатов статистического анализа порой приходится принимать ответственные решения. В этом случае лицо, принимающее решение, должно быть уверено в объективности анализа, в используемых методах, должно четко представлять, какова достоверность результатов проводимого статистического анализа и границы применимости соответствующих процедур, должно быть уверено, что из всех возможных методов статистического анализа каждый раз выбирается наилучший.

Нормальность наблюдаемых данных является необходимой предпосылкой для корректного применения большинства классических методов математической статистики, используемых в задачах метрологии, стандартизации и контроля качества. Поэтому проверка на нормальность является обязательной процедурой в ходе проведения измерений, контроля и испытаний.

Отечественный стандарт ГОСТ Р ИСО 5479-2002 “Статистические методы. Проверка отклонения распределения вероятностей от нормального распределения” [1], введенный в действие в 2002 г., представляет собой аутентичный текст международного стандарта ISO 5479-97. В стандарте рассматривается графический метод проверки на нормальность с использованием вероятностной бумаги, критерии проверки на симметричность и на значение эксцесса, статистики которых представляют собой функции от оценок моментов закона распределения, критерии Шапиро-Уилка, основанные на регрессионном анализе порядковых статистик, критерий Эппса-Палли, статистика которого измеряет некоторое расстояние между выборочной характеристической функцией и характеристической функцией нормального закона.

В то же время введенный стандарт [1] не позволяет ориентироваться в том, какой из критериев является предпочтительней, какой из них оказывается наиболее мощным и против каких альтернатив, при каких объемах выборок конкретный критерий обладает преимуществом или наоборот.

 В отечественной литературе исследованию данных критериев практически не уделено внимания. В зарубежных источниках, на которых базировалась разработка международного стандарта, также не приводится анализа мощности критериев нормальности по отношению к близким альтернативам, нет сравнительного анализа этих критериев с критериями согласия. Это касается как критериев нормальности, включенных в стандарт, так и не вошедших в него. 

В стандарте отказываются от использования критериев типа , так как они “подходят только для сгруппированных данных и в связи с тем, что “группирование приводит к потере информации”. В стандарте совершенно не упоминается применение для проверки нормальности непараметрических критериев согласия.

В свете вышеизложенного для заинтересованных специалистов, отвечающих за качество и надежность статистических выводов, осознанно принимающих решение о выборе методов статистического анализа, остается ряд невыясненных вопросов. Например, насколько обоснован выбор критериев в стандарте; их преимущества и недостатки; какова их мощность; как меняются распределения статистик критериев с ростом объемов выборок; всегда ли, например, критерии Шапиро-Уилка и Эппса-Палли по мощности предпочтительнее критериев согласия?

 В этой связи в данной работе методами статистического моделирования исследованы свойства критериев, включенных в ГОСТ Р ИСО 5479-2002, исследованы распределения статистик критериев, мощность критериев по отношению к близким альтернативам, показаны достоинства и недостатки критериев, проведено сравнение критериев по мощности с критериями согласия. Исследован ряд критериев, не включенных в стандарт. Оказалось, что наиболее предпочтительным (по мощности) критерием проверки нормальности, у которого отсутствуют недостатки, свойственные ряду исследованных критериев, в том числе, критериям Шапиро-Уилка и Эппса-Палли, является критерий со статистикой , предложенный D’Agostino и не попавший ни в международный, ни в отечественный стандарты.

 

1. Критерий проверки на симметричность [2,3]

Критерий предназначен для проверки гипотез о симметричности наблюдаемого закона (против наличия асимметрии) при объемах выборки 8££5000. Для симметричных законов 3-й центральный момент . Нормированный коэффициент

                                                                   (1)

в случае симметричности закона также равен 0. Проверяется гипотеза =0 против альтернативы  : >0  (положительная асимметрия) или : <0  (отрицательная асимметрия).

При вычислении статистики данного критерия и критерия проверки на эксцесс оценки используемых центральных моментов (в том числе  ) вычисляются в соответствии с соотношением

,

где

.

 

1.1. Исследование распределений статистики критерия проверки на симметричность в зависимости от объема выборки, принадлежащей нормальному закону

В стандарте и первоисточниках [2,3] приводятся только таблицы процентных точек. Ничего не говорится о виде распределения. Очевидно, что распределение статистики (1) зависит от числа наблюдений. Также можно заметить, что распределение  является симметричным.

Исследование распределений статистики критерия проверки на симметричность методами статистического моделирования было проведено при различных объемах выборок, принадлежащих нормальному закону с параметрами масштаба 1 и сдвига 0, так как распределение статистики не зависит от их значений. На рис. 1 представлены условные  распределения статистики (1)  () критерия проверки на симметричность в зависимости от объема выборки. Как видим, распределения очень существенно зависят от объема выборок. При увеличении количества наблюдений в выборке график закона распределения становится более крутой.

 

 

Рис 1. Распределения статистики критерия проверки на симметричность в зависимости от объема выборки при n=10,20,40,30,50,100,150 в случае нормального закона

 

1.2. Исследование зависимости распределений статистики критерия проверки на симметричность от вида наблюдаемого закона

Естественно, что нормальное распределение не единственное симметричное распределение. И не факт, что гипотеза о симметричности будет наиболее часто приниматься только в случае нормального закона.  Для исследования зависимости распределения статистики (1) от вида наблюдаемого симметричного закона были исследованы распределения данной статистики при ряде альтернатив.

В качестве гипотезы  рассмотрен нормальный закон распределения

с параметром масштаба  и параметром сдвига  . В качестве альтернатив были взяты следующие гипотезы:  соответствует экспоненциальному семейству распределений с плотностью

параметром формы ,  – распределению Лапласа с плотностью

и параметрами (0,1),  – логистическому распределению с плотностью

также с параметрами (0,1).

Графики функций плотности данных распределений представлены на рис. 2. Эти же распределения рассматривались в качестве альтернатив при исследовании распределений статистик других критериев. Распределения статистики (1) в зависимости от наблюдаемого закона (от справедливой гипотезы ) представлены на рис. 3. Интересно, что в случае справедливости , то есть принадлежности наблюдаемой выборки экспоненциальному семейству с параметром формы равным 4, распределение статистики оказывается более “крутым”, что свидетельствует о том, что гипотеза о симметричности будет приниматься более уверенно, чем в случае нормального закона.

 

Рис. 2. Плотности распределений, соответствующих рассматриваемым гипотезам

 

Рис. 3. Распределения статистики критерия проверки на симметричность в зависимости от гипотез  при объеме выборок n=10

 

1.3. Выводы

Критерий, использующий статистику (1), является только критерием проверки на симметричность. Его использование полезно при проверке нормальности, но принятие гипотезы о симметричности не может служить подтверждением нормальности (условие необходимое, но не достаточное).

 

2. Критерий проверки на эксцесс [3,4]

Критерий проверки на эксцесс используется при объемах выборок 8££5000. Величина эксцесса представляет собой отношение центрального момента 4-го порядка  к квадрату дисперсии

.                                                                  (2)

В случае нормального закона . Проверяется гипотеза вида : =3 против альтернативы  : >3  (больший эксцесс) или : <3  (меньший эксцесс).

В стандарте и первоисточниках [3,4] приводятся лишь таблицы процентных точек. Распределение статистики зависит от объема рассматриваемых выборок.

 

2.1. Исследование распределений статистики критерия проверки на эксцесс в зависимости от объема выборки, принадлежащей нормальному закону

 

Распределения статистики критерия проверки на эксцесс были исследованы при различных объемах выборок, принадлежащих нормальному закону. На рис. 4 представлены полученные в результате моделирования графики распределений статистики критерия проверки на эксцесс в зависимости от объема выборки n.

 

Рис. 4. Графики распределений статистики критерия проверки на эксцесс в зависимости от объема выборки при n=10,20,40,30,50,100,150

 

2.2. Исследование зависимости распределений статистики критерия проверки на эксцесс от вида наблюдаемого закона

 

Распределения статистики (2) были исследованы при наблюдаемых законах, соответствующих рассмотренным выше гипотезами . На рис. 5 представлены распределения статистик при объемах выборок при n=10, на рис. 6 – при n=20, а на рис. 7 – при n=50.  Заметно, что, как и должно быть, при увеличении количества наблюдений в выборке мощность критерия растет.

 

 

Рис. 5. Распределения статистики (2) критерия проверки на эксцесс в зависимости от вида наблюдаемого закона, соответствующего различным , при n=10

 

Рис. 6. Распределения статистики (2) критерия проверки на эксцесс в зависимости от вида наблюдаемого закона, соответствующего различным , при n=20

 

Рис. 7. Распределения статистики (2) критерия проверки на эксцесс в зависимости от вида наблюдаемого закона, соответствующего различным , при n=50

 

Рисунки 5-7 позволяют судить о мощности критерия проверки на эксцесс относительно различных альтернатив : >3  (больший эксцесс) или : <3  (меньший эксцесс).

2.3. Выводы

Вместе с критерием симметричности данный критерий дает основания судить о принадлежности наблюдаемой выборки нормальному закону. Недостатком критерия является сильная зависимость распределения статистики (2) от объема выборок.

3. Совместный критерий проверки на симметричность и нулевой коэффициент эксцесса [5]

Совместный критерий проверки на симметричность и нулевой коэффициент эксцесса в стандарте рассматривается при объемах выборок 20££1000 (много­направленный критерий). Проверяемая гипотеза имеет вид =0 и =3 против  : ≠0  и (или) ≠3. В стандарте приведены кривые, определяющие критическую область при уровне значимости  и .

В данном случае этот критерий не исследовался. Различные варианты критериев, построенных на основе (совместного) использования статистик (1) и (2) исследованы в разделе 7.

 

4. Критерий Шапиро-Уилка

Критерий Шапиро-Уилка [6,7], базируется на анализе линейной комбинации разностей порядковых статистик. В стандарте применение критерия предусмотрено при объемах выборки 8££50. Сложность применения при больших объемах выборок затруднена вследствие отсутствия в документе соответствующих коэффициентов. При объемах выборок 51££99 коэффициенты и таблицы процентных точек можно найти в [7]. Критерий рекомендуют применять при отсутствии априорной информации о типе возможного отклонения от нормальности. Критерий Шапиро-Уилка используют в тех случаях, когда в качестве альтернативы можно выбрать гипотезу следующего вида: примерно симметричное распределение с <1/2 и <3 или асимметричное распределение (например, >1/2). В противном случае рекомендуют критерий Эппса-Палли. Данная рекомендация неочевидна и требует подтверждения.

Для вариационного ряда , построенного по наблюдаемой выборке , вычисляют величину

                                                    (3)

где индекс  изменяется от 1 до  или от 1 до  при четном и нечетном  соответственно. Коэффициенты  приведены в стандарте и первоисточниках [6,7]. Статистика критерия имеет вид

.

Гипотеза о нормальности отвергается при малых значениях статистики . В стандарте и литературе отсутствует информация об аналитическом виде распределения статистики, приводятся лишь процентные точки.

 

4.1. Исследования распределений статистики критерия Шапиро-Уилка в зависимости от объема выборки, принадлежащей нормальному закону

 

Как и в предыдущих случаях, распределения статистики (3) исследовались методами статистического моделирования. На рис. 8 показана зависимость вида распределения статистики критерия Шапиро-Уилка в зависимости от объема выборки, принадлежащей нормальному закону. С ростом числа наблюдений график функции распределения становиться более сжатым (параметр масштаба уменьшается).

 

Рис 8. Графики распределения статистики критерия Шапиро-Уилка в зависимости от объема выборки при n=10,20,40,30,50

 

 

4.2. Исследования зависимости распределений статистики критерия Шапиро-Уилка от вида наблюдаемого закона

 

Как и ранее, в качестве гипотезы  рассмотрен нормальный закон распределения с параметром масштаба равным 1 и параметром сдвига равным 0. В качестве близких альтернатив рассмотрены гипотезы:  – выборка соответствует экспоненциальному семейству распределений с параметром формы равным 4,  – распределению Лапласа с параметрами (0,1),  – логистическому распределению с параметрами (0,1).

На рис. 9 приведены полученные условные распределения  статистики (3) при справедливости гипотез , , ,  при объеме выборок n=10. На рис. 10 то же самое при n=20, а на рис. 11 – при n=50. Из графиков видно, что при малых объемах выборок (10-20 наблюдений) критерий Шапиро-Уилка не способен различать гипотезы  и  . Еще в худшей степени критерий замечает различие между нормальным распределением и экспоненциальным семейством с параметром формы . С ростом числа наблюдений мощность критерия по распознаванию альтернатив  и     растет.

 

Рис. 9. Условные распределения  статистики (3) при справедливости гипотез  при объеме выборок n=10

 

Рис. 10. Условные распределения  статистики (3) при справедливости гипотез  при объеме выборок n=20

 

Рис. 11. Условные распределения  статистики (3) при справедливости гипотез  при объеме выборок n=50

 

4.3. Мощность критерия Шапиро-Уилка относительно различных альтернатив

 

Критерий Шапиро-Уилка является критерием проверки на принадлежность наблюдаемой выборки нормальной генеральной совокупности. Поэтому интересно, насколько хорошо критерий может различать близкие законы, какова, например, мощность критерия относительно рассмотренных в данной работе альтернатив ,,.

Мощность критерия Шапиро-Уилка по отношению к конкурирующей гипотезе , соответствующей распределению экспоненциального семейства с параметром формы 4, при различных значениях уровня значимости (вероятности ошибки первого рода)  приведена в табл.1

 

 Таблица 1. Мощность критерия Шапиро-Уилка по отношению к распределению экспоненциального семейства с параметром формы 4

n=10

n=20

n=30

n=40

n=50

0.01

0.0069

0.0066

0.016

0.0357

0.0745

0.05

0.0477

0.061

0.104

0.1684

0.2559

0.075

0.0798

0.1025

0.1622

0.2435

0.3332

0.1

0.1067

0.1418

0.2128

0.2964

0.4065

 

Мощность критерия Шапиро-Уилка по отношению к конкурирующей гипотезе, соответствующей распределению Лапласа, приведена в табл.2.

 

Таблица 2. Мощность критерия Шапиро-Уилка по отношению к распределению Лапласа

n=10

n=20

n=30

n=40

n=50

0.01

0.064

0.1337

0.187

0.2372

0.2767

0.05

0.1515

0.2663

0.3343

0.3746

0.418

0.075

0.1919

0.3158

0.3856

0.4307

0.4692

0.1

0.2255

0.3511

0.4289

0.4641

0.5094

 

Мощность критерия Шапиро-Уилка по отношению к конкурирующей гипотезе , соответствующей логистическому закону, приведена в табл.3.

 

Таблица 3. Мощность критерия Шапиро-Уилка по отношению к логистическому закону

n=10

n=20

n=30

n=40

n=50

0.01

0.0249

0.0428

0.0573

0.0428

0.0697

0.05

0.0805

0.1159

0.1302

0.1159

0.1419

0.075

0.1156

0.1546

0.166

0.1546

0.1756

0.1

0.1386

0.1855

0.1986

0.1855

0.2077

 

4.4. Сравнение с мощностью непараметрических критериев согласия

Вообще говоря, с применением критериев согласия трудно различить такие близкие распределения, как нормальное и логистическое. В стандарте предусмотрено применение критерия Шапиро-Уилка для объемов выборок не выше =50. Как показали наши исследования, мощность критерия Шапиро-Уилка по отношению к конкурирующей гипотезе  (логистическому закону) на объемах выборок ≤50 выше мощности непараметрических критериев согласия типа Колмогорова, типа  Крамера-Мизеса-Смирнова и типа  Андерсона-Дарлинга при проверке сложных гипотез [8], которые, в свою очередь, в данном случае мощнее критериев типа  [9].

В то же время непараметрические критерии согласия позволяют хорошо отличать от нормального закона распределения экспоненциального семейства с более плоскими плотностями распределений (с <3).

4.5. Выводы

Критерий Шапиро-Уилка на объемах выборок ≤50 является хорошим средством проверки нормальности, обладает более высокой мощностью по сравнению с непараметрическими критериями согласия относительно таких близких альтернатив, как логистический закон.

Однако с помощью критерия Шапиро-Уилка неожиданно трудно отличить от нормального закона распределения экспоненциального семейства с более плоскими по сравнению с нормальным законом плотностями распределений. Это несколько противоречит рекомендации стандарта по его применению.

 

5. Критерий Эппса-Палли

Критерий Эппса-Палли [10,13] базируется на сравнении эмпирической и теоретической характеристических функций. В стандарте предусмотрено его применение при 8££200. По наблюдаемой выборке  вычисляют статистику критерия

,          (4)

где . Выборка может быть неупорядочена, порядок наблюдений произволен, но он должен быть неизменным в течение всех проводимых вычислений.  Гипотезу о нормальности отвергают при больших значениях статистики.

 

5.1. Исследования распределений статистики критерия Эппса-Палли в зависимости от объема выборки, принадлежащей нормальному закону

 

Распределения статистики (4) исследовались методами статистического моделирования. На рис. 12 показана зависимость вида распределения статистики критерия Эппса-Палли в зависимости от объема выборки, принадлежащей нормальному закону. Из графика видно, что при нормальном законе распределения случайной величины распределения статистик критерия визуально незначительно меняются с ростом объемов выборок  (в отличие от распределений других рассмотренных здесь статистик). На рисунке наблюдается пучок распределений. С ростом  наблюдается быстрая сходимость распределения статистики к некоторому предельному.

Конечно, процентные точки распределений статистики (4) при различных объемах выборок отличаются существенно, но вероятности вида , где  –  некоторое значение статистики, вычисленные по распределениям статистики (4) при различных n, будут достаточно близкими. Распределения статистики критерия Эппса-Палли при различных объемах выборок  достаточно хорошо аппроксимируется бета-распределениями III рода с функцией плотности

,

где . Если пренебречь зависимостью статистики (4) от объема выборки , то для приближенного вычисления достигаемого уровня значимости  можно использовать бета-распределение III рода с параметрами =1.8645, =2.5155, =5.8256, =0.9216, =0.0008. Соответствующая функция распределения представляет собой некоторую среднюю для  “пучка” распределений, приведенного на рис.12.

 

 

Рис 12. Графики распределений статистики критерия Эппса-Палли в зависимости от объема выборки при n=10,20,40,30,50,100,150

 

 

5.2. Исследования зависимости распределений статистики критерия Эппса-Палли от вида наблюдаемого закона

 

Как и в предыдущих случаях, в качестве гипотезы  рассмотрен нормальный закон распределения с параметром масштаба равным 1 и параметром сдвига равным 0. В качестве альтернатив рассмотрены гипотезы:  – выборка соответствует экспоненциальному семейству распределений с параметром формы равным 4,  – распределению Лапласа с параметрами (0,1),  – логистическому распределению с параметрами (0,1).

На рис. 13-15 представлены условные функции распределения  статистики (4) при справедливости гипотез , , ,  при объеме выборок n=10,  n=20 и n=50, соответственно.

Из графиков видно, что при малых (10-20 наблюдений) объемах выборки критерий Эппса-Палли не способен различить гипотезы   и   (отличить нормальный закон от экспоненциального семейства с параметром ). С ростом числа наблюдений мощность критерия при распознавании альтернатив  и    растет.

При n=10 мощность критерия Эппса-Палли по отношению к гипотезе  меньше (!) уровня значимости (при ), то есть при верной гипотезе  предпочтение будет всегда отдаваться гипотезе . А при  n=20  распределения  и  в области значений функций распределения, больших 0.95 практически неразличимы. При n=50 критерий уже хорошо различает гипотезы  и   .

 

Рис 13. Условные распределения  статистики (4) при справедливости гипотез  при объеме выборок n=10

 

Рис 14. Условные распределения  статистики (4) при справедливости гипотез  при объеме выборок n=20

 

Рис 15. Условные распределения  статистики (4) при справедливости гипотез  при объеме выборок n=50

 

5.3. Мощность критерия Эппса-Палли относительно различных альтернатив

Критерий Эппса-Палли также является критерием проверки на нормальность. Ниже в таблицах представлены значения мощности критерия относительно рассмотренных альтернатив ,,.

Мощность критерия Эппса-Палли по отношению к конкурирующей гипотезе , соответствующей распределению экспоненциального семейства с параметром формы 4, приведена в табл. 4

 

Таблица 4. Мощность критерия Эппса-Палли по отношению к распределению экспоненциального семейства с параметром формы 4

n=10

n=20

n=30

n=40

n=50

0.1

0.0911

0.1265

0.1826

0.2223

0.2811

0.05

0.041

0.0515

0.0785

0.1079

0.1495

0.025

0.0166

0.0213

0.0322

0.0509

0.0735

0.01

0.0055

0.0067

0.0097

0.0152

0.0248

 

Мощность критерия Эппса-Палли по отношению к конкурирующей гипотезе , соответствующей распределению Лапласа, приведена в табл. 5.

 

Таблица 5. Мощность критерия Эппса-Палли по отношению к распределению Лапласа

n=10

n=20

n=30

n=40

n=50

0.1

0.2427

0.3538

0.4619

0.5518

0.6233

0.05

0.1662

0.2599

0.3521

0.441

0.5191

0.025

0.1122

0.1919

0.2653

0.3485

0.4275

0.01

0.0663

0.1284

0.1746

0.2576

0.3232

 

 

Мощность критерия Эппса-Палли по отношению к конкурирующей гипотезе , соответствующей логистическому закону, приведена в табл. 6.

 

Таблица 6. Мощность критерия Эппса-Палли по отношению к логистическому закону

n=10

n=20

n=30

n=40

n=50

0.1

0.1459

0.1759

0.2036

0.228

0.2494

0.05

0.0891

0.1081

0.1252

0.1468

0.1673

0.025

0.0515

0.0697

0.0829

0.0972

0.1119

0.01

0.0255

0.0392

0.042

0.0546

0.0668

 

5.4. Сравнение с мощностью непараметрических критериев согласия

В стандарте даны процентные точки для диапазона =8÷200 (с пропусками).

Мощность критерия Эппса-Палли, как и критерия Шапиро-Уилка, по отношению к конкурирующей гипотезе  (логистическому закону) на объемах выборок ≤50 выше мощности непараметрических критериев согласия типа Колмогорова, типа  Крамера-Мизеса-Смирнова и типа  Андерсона-Дарлинга.  

В этой же ситуации критерий Эппса-Палли мощнее критерия Шапиро-Уилка при больших уровнях значимости () и уступает критерию Шапиро-Уилка по мощности при малых уровнях значимости ().

5.5. Выводы

Критерий Эппса-Палли на объемах выборок ≤200 является хорошим средством проверки нормальности. При ≤50 критерий обладает более высокой мощностью по сравнению с непараметрическими критериями согласия относительно таких близких альтернатив, как логистический закон.

Однако при ≤20 с помощью критерия Эппса-Палли, как и с помощью критерия Шапиро-Уилка, нельзя отличить от нормального закона распределения экспо­нен­ци­ального семейства с более плоскими по сравнению с нормальным законом плотностями распределений

 

6. Модифицированный критерий Шапиро-Уилкса

            Критерий применяется при нескольких выборках одинакового объема . Необходимость проверки отклонения от нормального распределения, используя несколько независимых выборок, возникает очень часто, поскольку каждая отдельная выборка оказывается слишком малой для обнаружения значимого отклонения от нормального распределения. В такой ситуации применяют модифицированный критерий Шапиро-Уилка.

Для  последовательных выборок объемом  каждая, отобранных из одной совокупности, подсчитывается значение  в соответствии с выражением

,

где вычисляются в соответствии с (3), индекс  изменяется от 1 до  или от 1 до  при четном и нечетном  соответственно. Коэффициенты  приведены в стандарте и первоисточниках [6,7].  Для совместного критерия вычисляют соответствующие значения  по формуле:

,

где . Коэффициенты , и  для преобразования  и  табулированы [1, 14] и содержатся приложение 6.

            Если основное распределение вероятностей нормальное, величины приблизительно подчиняются нормальному распределению. Среднее арифметическое значение переменное  равно

и статистикой критерия является величина

 ,                                                            (5)

которая должна подчиняться стандартному нормальному закону.

            Нулевая гипотеза о нормальности отклоняется при уровне значимости , если , где ­­– -квантиль стандартного нормального распределения. В стандарте [1] ошибка в формуле (19).

 

6.1. Зависимость распределения статистики от объема и числа выборок

 

Распределение статистики (5) лишь приближенно подчиняется стандартному нормальному закону, зависит от  и . При конкретных комбинациях  и  условное распределение статистики  может существенно отличаться от стандартного нормального закона, что является существенным недостатком критерия. Как правило, функция распределения статистики оказывается сдвинутой вправо от стандартного нормального распределения. Таким образом, принимая решение на основании процентных точек стандартного нормального закона в соответствии с , мы можем несправедливо отклонить верную гипотезу . То есть, вероятность ошибки первого рода на самом деле оказывается больше . На рис. 16 приведены распределения статистики  при различных комбинациях  и , а также для сравнения – функция распределения стандартного нормального закона.

 

  Рис. 16. Условные распределения  статистики (5) при различных комбинациях  и

 

6.2. Мощность модифицированного критерия Шапиро-Уилка относительно различных альтернатив

На рис. 17-18 представлены условные функции распределения  статистики (5) при справедливости гипотез , , ,  при n*h=10*10 и n*h=30*10, соответственно.

Исследование показало, что модифицированный критерий Шапиро-Уилка, как и другие, при малых n*h (20-30 наблюдений в совокупности) не способен различить гипотезы   и   (отличить нормальный закон от экспоненциального семейства с параметром ). Но с ростом общего числа наблюдений n*h мощность критерия при распознавании альтернатив  и    растет.

Относительно альтернатив ,  модифицированный критерий Шапиро-Уилка при малых n*h<100 уступает по мощности критериям Эппса-Палли и Шапиро-Уилка, уступает он и непараметрические критериям согласия.

 

Рис. 17. Условные распределения  статистики (5) при справедливости гипотез  при n*h=10*10

 

Рис. 18. Условные распределения  статистики (5) при справедливости гипотез  при n*h=30*10

 

6.3. Выводы

С помощью модифицированного критерия, как и в случае критерия Шапиро-Уилка,  трудно отличить от нормального закона распределения экспоненциального семейства с более плоскими по сравнению с нормальным законом плотностями распределений. Главным недостатком критерия является возможное существенное отклонение распределения статистики критерия при конкретных *h от стандартного нормального. Как правило, функция распределения статистики оказывается сдвинутой вправо от стандартного нормального распределения. Поэтому, принимая решение на основании процентных точек стандартного нормального закона в соответствии с , можно несправедливо отклонить верную гипотезу . Следовательно, на самом деле вероятность ошибки первого рода оказывается больше .

Кроме того, модифицированный критерий Шапиро-Уилка при малых n*h<100 уступает по мощности критериям Эппса-Палли и Шапиро-Уилка, уступает он и непараметрические критериям согласия.

 

7. Исследование совместного критерия проверки на симметричность и нулевой коэффициент эксцесса

В [5] рассмотрена одномерная статистика на базе статистик  и  

,                                       (6)

которая асимптотически распределена как -распределение. На рис. 19 показаны распределения статистики (6) при различных объемах выборок и асимптотически предельное -распределение. Как видим, статистика (6) достаточно медленно сходится -распределению.

Рис. 19. Распределения статистики (6) при различных объемах выборок и асимптотически предельное -распределение

 

На рис. 20-21 представлены условные функции распределения  статистики (6) при справедливости гипотез , , ,  при объеме выборок n=10 и n=50.

 

Рис. 20. Распределения статистики (6) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=10

 

 

Рис. 21. Распределения статистики (6) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=50

 

7.1. Выводы

            Достоинством критерия является одномерность статистики (6), что упрощает принятие решения. Однако распределение статистики критерия плохо сходится к предельному -распределению. Недостатком критерия является и то, что при малых объемах выборок критерий не различает нормальный закон и распределения экспоненциального семейства с параметром формы большим 2.

 

8. Модификация D’Agostino критерия проверки на симметричность

 

В работе [2] предложена модификация критерия проверки симметричности, где соответствующим преобразованием статистики (1) получается эквивалентная статистика, но распределенная в соответствии со стандартным нормальным законом. Преобразование коэффициента асимметрии  в стандартную нормальную величину  осуществляется с помощью следующих соотношений [2]:

,

,

,

,

.                                                   (7)

 

Исследования распределений статистики (7) при различных объемах выборок показало, что они очень хорошо согласуются со стандартным нормальным законом. На рис. 22-23 представлены условные функции распределения  статистики (7) при справедливости гипотез , , ,  при объеме выборок n=10 и n=100. Критерий со статистикой (7) по мощности идентичен критерию со статистикой (1). Но он удобней, так как опирается на стандартное нормальное распределение.

 

Рис. 22. Условные распределения  статистики (7) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=10

 

Рис. 23. Условные распределения  статистики (7) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=100

 

8.1. Выводы

Достоинством критерия со статистикой (7) является возможность использования в качестве предельного распределения стандартного нормального закона. Это упрощает процедуру проверки, так как при различных объемах выборок можно использовать процентные точки стандартного нормального распределения. Некоторое возрастание вычислительных затрат роли не играет. Однако критерий сохраняет и недостатки критерия со статистикой (1) и имеет такую же мощность.

 

9. Модификация DAgostino критерия проверки на эксцесс

В работе [2] предложена модификация критерия проверки на эксцесс, где статистика  (2) с использованием  (то есть, с использованием информации о симметричности) преобразуется в стандартную нормальную величину  с помощью следующих соотношений [2]:

 .                                                (8)

 

Исследования распределений статистики (8) при справедливой гипотезе  и различных объемах выборок показали, что  достаточно хорошо согласуются со стандартным нормальным законом (несколько хуже, чем , но хорошо).  Критерий двусторонний:  проверяемая гипотеза  отклоняется, если  или .

Исследование мощности критерия со статистикой (8) показало, что данный критерий оказывается предпочтительнее всех других рассмотренных критериев. На рис. 24-25 представлены условные функции распределения  статистики (8) при справедливости гипотез , , ,  при объемах выборок n=10 и n=100. Рисунки позволяют судить о мощности критерия со статистикой (8).  Найденные значения мощности критерия относительно альтернатив , ,  при различных объемах выборок представлены в таблицах 7-9.

 

Рис. 24. Условные распределения  статистики (8) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=10

 

Рис. 25. Условные распределения  статистики (8) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=100

 

 

Таблица 7. Мощность критерия со статистикой  по отношению к распределению экспоненциального семейства с параметром формы  (по нижним процентным точкам)

n=10

n=20

n=30

n=40

n=50

n=100

n=300

n=500

0.1

0,1836

0,251

0,3502

0,4384

0,52

0,8352

0,9996

1

0.05

0,0967

0,1238

0,1813

0,2449

0,3149

0,6665

0,9977

1

0.025

0,0508

0,0588

0,0843

0,1159

0,1664

0,469

0,9908

0,9999

0.01

0,0226

0,0194

0,0251

0,0363

0,058

0,2453

0,9603

0,9997

 

Таблица 8. Мощность критерия со статистикой  по отношению к распределению Лапласа (по верхним процентным точкам)

n=10

n=20

n=30

n=40

n=50

n=100

n=300

n=500

0.1

0.1927

0.3119

0.4113

0.4877

0.5743

0.815

0.9954

0.9997

0.05

0.1132

0.2234

0.3106

0.3893

0.4695

0.7419

0.992

0.9994

0.025

0.0683

0.163

0.2404

0.3094

0.3908

0.6711

0.9873

0.9992

0.01

0.0348

0.106

0.1737

0.2297

0.3066

0.5877

0.9775

0.9986

 

Таблица 9. Мощность критерия со статистикой  по отношению к логистическому распределению (по верхним процентным точкам)

n=10

n=20

n=30

n=40

n=50

n=100

n=300

n=500

0.1

0.1309

0.1877

0.2342

0.27

0.3203

0.6797

0.8509

0.9598

0.05

0.0705

0.1174

0.1584

0.1878

0.2290

0.7710

0.7799

0.9271

0.025

0.0389

0.0744

0.1096

0.1309

0.1711

0.8289

0.7106

0.8917

0.01

0.0182

0.0447

0.0668

0.0857

0.1151

0.8849

0.6214

0.8342

 

9.1. Выводы

Достоинством критерия со статистикой (8) является возможность использования в качестве предельного распределения стандартного нормального закона, следовательно, при различных объемах выборок можно использовать процентные точки стандартного нормального распределения. Это удобно для применения.

В статистике содержится информация, связанная со статистиками (1) и (2). Поэтому критерий является совместным: статистика учитывает отклонения от симметричности и от эксцесса нормального распределения. Критерий получается двусторонним: проверяемая гипотеза о нормальности должна отклоняться как при слишком больших, так и при слишком малых (отрицательных) значениях статистики.

Относительно близких альтернатив при малых  критерий превосходит по мощности критерии Шапиро-Уилка и Эппса-Палли. В отличие от всех других критериев проверки на нормальность данный критерий хорошо улавливает различие между нормальным законом и экспоненциальным семейством распределений с более плоскими вершинами по сравнению с нормальным законом. При малых  критерий превосходит по мощности критерии согласия, применяемые для проверки нормальности.

 

10. Исследование совместного критерия проверки на симметричность и нулевой коэффициент эксцесса DAgostino

В [2] рассмотрена одномерная статистика на базе статистик  и  

,                                                          (9)

которая приближенно распределена как -распределение. Проверяемая гипотеза о нормальности отклоняется при больших значениях статистики (9). В отличие от статистики (6) распределение данной статистики очень хорошо согласуется -распределением уже при достаточно малых .

На рис. 26-27 представлены условные функции распределения  статистики (9) при справедливости гипотез , , ,  при объеме выборок n=10 и n=50. Рисунки позволяют судить о мощности совместного критерия со статистикой (9). Как видно и из данных рисунков, при малых  данный критерий не позволяет надежно различать гипотезы  и  из-за низкой мощности.

 

Рис. 26. Условные распределения  статистики (9) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=10

 

Рис. 27. Условные распределения  статистики (9) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=50

 

10.1. Выводы

Достоинством критерия со статистикой (9) является возможность использования в качестве предельного -распределения. Как правило, критерий при малых объемах выборок оказывается мощнее критериев согласия при проверке нормальности, не уступает по мощности критериям Шапиро-Уилка и Эппса-Палли. Однако и в данном случае наблюдается общий недостаток большинства критериев проверки нормальности: при <50 мощность критерия по отношению распределениям экспоненциального семейства с плоскими вершинами мала.

 

Заключение

 

Проверка на нормальность имеет особое значение. Не секрет, что ошибки измерений, связанные с приборами, построенными на конкретных физических принципах, далеко не всегда описываются нормальным законом [15]. Поэтому следует ожидать, что не всегда измерения контролируемого показателя будут подчиняться нормальному закону. И если так окажется, то применение классического аппарата, используемого при статистическом анализе результатов измерений или при статистическом управлении качеством, может оказаться некорректным.

Реальные данные в приложениях (характеристики показателя процесса), как правило, фиксируются с ограниченной точностью, определяемой либо заданием технических условий, либо единицей шкалы измерительного прибора, либо условиями фиксации наблюдения, то есть данные оказываются поразрядно группированными. Это может оказывать серьезное влияние на оценки вычисляемых моментов и значения статистик, а, следовательно, приводить к неверным выводам даже при формировании оценок по выборкам достаточно большого объема.

Относительно большинства критериев, регламентированных стандартом, однозначно можно утверждать, что они весьма чувствительны к наличию аномальных наблюдений в связи с использованием оценок вторых, третьих и четвертых центральных моментов: оценки центральных моментов не являются робастными. Это означает, что отклонение гипотезы о нормальности может быть связано с наличием в рассматриваемой выборке аномальных наблюдений. Отсюда следует, что ограничение проверки нормальности использованием только перечня критериев, указанных в стандарте, не всегда обеспечивает корректности выводов о принадлежности (или  непринадлежности) выборки нормальному закону. Они не всегда оказываются наиболее мощными.

Недостатком критериев Шапиро-Уилка, Эппса-Палли и критерия со статистикой (9) при малых объемах выборок является то, что они обладают пониженной мощностью по отношению к законам, более плосковершинным по отношению к нормальному (не могут различить).

Для проверки нормальности целесообразно рекомендовать применение критерия со статистикой  (целесообразно его включение в ГОСТ). Абсолютно не вредно из практических соображений в дополнение использованию рассмотренных критериев проверить принадлежность наблюдаемых данных к нормальному закону с использованием непараметрических критериев согласия [9] и критериев согласия типа  [10].

 

 

[Содержание] [Начало]

 

 

Приложение 1. Процентные точки  для статистики критерия проверки симметричности ()

n

p

n

p

0.95

0.99

0.95

0.99

8

0.99

1.42

400

0.2

0.28

9

0.97

1.41

450

0.19

0.27

10

0.95

1.39

500

0.18

0.26

12

0.91

1.34

550

0.17

0.24

15

0.85

1.26

600

0.16

0.23

20

0.77

1.15

650

0.16

0.22

25

0.71

1.06

700

0.15

0.22

30

0.66

0.98

750

0.15

0.21

35

0.62

0.92

800

0.14

0.2

40

0.59

0.87

850

0.14

0.2

45

0.56

0.82

900

0.13

0.19

50

0.53

0.79

950

0.13

0.18

60

0.49

0.72

1000

0.13

0.18

70

0.46

0.67

1200

0.12

0.16

80

0.43

0.63

1400

0.11

0.15

90

0.41

0.6

1600

0.1

0.14

100

0.39

0.57

1800

0.1

0.13

125

0.35

0.51

2000

0.09

0.13

150

0.32

0.46

2500

0.08

0.11

175

0.3

0.43

3000

0.07

0.1

200

0.28

0.4

3500

0.07

0.1

250

0.25

0.36

4000

0.06

0.09

300

0.23

0.33

4500

0.06

0.08

350

0.21

0.3

5000

0.06

0.08

 

Приложение 2.  Процентные точки  для статистики критерия проверки на эксцесс ( и )

n

p

n

p

0.01

0.05

0.95

0.99

0.01

0.05

0.95

0.99

8

1.31

1.46

3.7

4.53

500

2.57

2.67

3.37

3.6

9

1.35

1.53

3.86

4.82

550

2.58

2.69

3.38

3.57

10

1.39

1.56

3.95

5

600

2.6

2.71

3.34

3.54

12

1.46

1.64

4.05

5.2

650

2.61

2.71

3.33

3.52

15

1.55

1.72

4.13

5.3

700

2.62

2.72

3.31

350

20

1.65

1.82

4.17

5.36

750

2.64

2.73

3.3

3.48

25

1.72

1.91

4.18

5.3

800

2.65

2.74

3.29

3.46

30

1.79

1.98

4.11

5.21

850

2.66

2.74

3.28

3.45

35

1.84

2.03

4.1

5.13

900

2.66

2.75

3.28

3.43

40

1.89

2.07

4.05

5.04

950

2.67

2.76

3.27

3.42

45

1.93

2.11

4

4.94

1000

2.68

2.76

3.26

3.41

50

1.95

2.15

3.99

4.88

1200

2.71

2.78

3.24

3.37

75

2.08

2.27

3.87

4.59

1400

2.72

2.8

3.22

3.34

100

2.18

2.35

3.77

4.39

1600

2.74

2.81

3.21

3.32

125

2.24

2.4

3.71

4.24

1800

2.76

2.82

3.2

3.3

150

2.29

2.45

3.65

4.13

2000

2.77

2.83

3.18

3.28

200

2.37

2.51

3.57

3.98

2500

2.79

2.85

3.16

3.25

250

2.42

2.55

3.52

3.87

3000

2.81

2.86

3.15

3.22

300

2.46

2.59

3.47

3.79

3500

2.82

2.87

3.14

3.21

350

2.5

2.62

3.44

3.72

4000

2.83

2.88

3.13

3.19

400

2.25

2.64

3.41

3.67

4500

2.84

2.88

3.12

3.18

450

2.55

2.66

3.39

3.63

5000

2.85

2.89

3.12

3.17

 

Приложение 3.  Процентные точки  для статистики критерия Эппса-Палли ()

n

p

0.90

0.95

0.975

0.99

8

0.271

0.347

0.426

0.526

9

0.275

0.35

0.428

0.537

10

0.279

0.357

0.437

0.545

15

0.284

0.366

0.447

0.56

20

0.287

0.368

0.45

0.564

30

0.288

0.371

0.459

0.569

50

0.29

0.374

0.463

0.574

100

0.291

0.376

0.464

0.583

200

0.29

0.379

0.467

0.59

 

 

Приложение 4. Процентные точки  для статистики критерия Шапиро-Уилка ()

n

p

n

p

0.01

0.05

0.01

0.05

8

0.749

0.818

30

0.9

0.927

9

0.764

0.829

31

0.902

0.929

10

0.781

0.842

32

0.904

0.93

11

0.792

0.85

33

0.906

0.931

12

0.805

0.859

34

0.908

0.933

13

0.814

0.866

35

0.91

0.934

14

0.825

0.874

36

0.912

0.935

15

0.835

0.881

37

0.914

0.936

16

0.844

0.887

38

0.916

0.938

17

0.851

0.892

39

0.917

0.939

18

0.858

0.897

40

0.919

0.94

19

0.863

0.901

41

0.93

0.941

20

0.868

0.905

42

0.922

0.942

21

0.873

0.908

43

0.923

0.943

22

0.878

0.911

44

0.924

0.944

23

0.881

0.914

45

0.926

0.945

24

0.884

0.916

46

0.927

0.945

25

0.888

0.918

47

0.928

0.946

26

0.891

0.92

48

0.929

0.947

27

0.894

0.92

49

0.929

0.947

28

0.896

0.924

50

0.93

0.947

29

0.898

0.926

 

 


Приложение 5. Коэффициенты для вычисления статистики критерия Шапиро-Уилка

n

Коэффициенты  для вычисления статистики критерия Шапиро-Уилка (k)

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

 

8

0.6052

0.3164

0.1743

0.0561

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

9

0.5888

0.3244

0.1976

0.0947

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

10

0.5739

0.3291

0.2141

0.1224

0.0399

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

11

0.5601

0.3315

0.226

0.1429

0.0695

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

12

0.5475

0.3325

0.2347

0.1586

0.0922

0.0303

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

13

0.5359

0.3325

0.2412

0.1707

0.1099

0.0539

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13

14

0.5251

0.3318

0.243

0.1802

0.124

0.0727

0.024

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

14

15

0.515

0.3306

0.2495

0.1878

0.1353

0.098

0.0433

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

16

0.5056

0.329

0.2521

0.1939

0.1447

0.1005

0.0593

0.0196

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16

17

0.4968

0.3273

0.254

0.1988

0.1524

0.1109

0.0725

0.0359

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17

18

0.4886

0.3253

0.2553

0.2027

0.1587

0.1197

0.0837

0.0496

0.0163

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18

19

0.4808

0.3232

0.2561

0.2059

0.1641

0.1271

0.0932

0.0612

0.0303

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

19

20

0.4734

0.3211

0.2565

0.2085

0.1686

0.1334

0.1013

0.0711

0.0422

0.014

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

21

0.4643

0.3185

0.2578

0.2119

0.1736

0.1399

0.1092

0.0804

0.053

0.0263

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

21

22

0.459

0.3156

0.2571

0.2131

0.1764

0.1443

0.115

0.0878

0.0618

0.0368

0.012

 

 

 

 

 

 

 

 

 

 

 

 

 

 

22

23

0.4542

0.3126

0.2563

0.2139

0.1787

0.148

0.1201

0.0941

0.0696

0.0459

0.0228

 

 

 

 

 

 

 

 

 

 

 

 

 

 

23

24

0.4493

0.3098

0.2554

0.2145

0.1807

0.1512

0.1245

0.0997

0.0764

0.0539

0.0321

0.0107

 

 

 

 

 

 

 

 

 

 

 

 

 

24

25

0.445

0.3069

0.2543

0.2148

0.1822

0.1539

0.1283

0.1046

0.0823

0.061

0.0403

0.02

 

 

 

 

 

 

 

 

 

 

 

 

 

25

26

0.4407

0.3043

0.2533

0.2151

0.1836

0.1563

0.1316

0.1089

0.0876

0.0672

0.0476

0.0284

0.0094

 

 

 

 

 

 

 

 

 

 

 

 

26

27

0.4366

0.3018

0.2522

0.2152

0.1848

0.1584

0.1346

0.1128

0.0923

0.0728

0.054

0.0358

0.0178

 

 

 

 

 

 

 

 

 

 

 

 

27

28

0.4328

0.2992

0.251

0.2151

0.1857

0.1601

0.1372

0.1162

0.0965

0.0778

0.0598

0.0424

0.0253

0.0084

 

 

 

 

 

 

 

 

 

 

 

28

29

0.4291

0.2968

0.2499

0.215

0.1864

0.1616

0.1395

0.1192

0.1002

0.0822

0.065

0.0483

0.032

0.0159

 

 

 

 

 

 

 

 

 

 

 

29

30

0.4254

0.2944

0.2487

0.2148

0.187

0.163

0.1415

0.1219

0.1036

0.0862

0.0697

0.0537

0.0381

0.0227

0.0076

 

 

 

 

 

 

 

 

 

 

30

31

0.422

0.2921

0.2475

0.2145

0.1874

0.1641

0.1433

0.1243

0.1066

0.0899

0.0739

0.0585

0.0435

0.0289

0.0144

 

 

 

 

 

 

 

 

 

 

31

32

0.4188

0.2898

0.2463

0.2141

0.1878

0.1651

0.1449

0.1265

0.1093

0.0931

0.0777

0.0629

0.0485

0.0344

0.0206

0.0068

 

 

 

 

 

 

 

 

 

32

33

0.4156

0.2876

0.2451

0.2137

0.188

0.166

0.1463

0.1284

0.1118

0.0961

0.0812

0.0669

0.053

0.0395

0.0262

0.0131

 

 

 

 

 

 

 

 

 

33

34

0.4127

0.2854

0.2439

0.2132

0.1882

0.1667

0.1475

0.1301

0.114

0.0988

0.0844

0.0706

0.0572

0.0441

0.0314

0.0187

0.0062

 

 

 

 

 

 

 

 

34

35

0.4098

0.2834

0.2427

0.2127

0.1883

0.1673

0.1487

0.1317

0.116

0.1013

0.0873

0.0739

0.061

0.0484

0.0361

0.0239

0.0119

 

 

 

 

 

 

 

 

35

36

0.4068

0.2813

0.2415

0.2121

0.1883

0.1678

0.1496

0.1331

0.1179

0.1036

0.09

0.077

0.0645

0.0523

0.0404

0.0287

0.0172

0.0057

 

 

 

 

 

 

 

36

37

0.404

0.2794

0.2403

0.2116

0.1883

0.1683

0.1505

0.1344

0.1196

0.1056

0.0924

0.0798

0.0677

0.0559

0.0444

0.0331

0.022

0.011

 

 

 

 

 

 

 

37

38

0.4015

0.2774

0.2391

0.211

0.1881

0.1686

0.1513

0.1356

0.1211

0.1075

0.0947

0.0824

0.0706

0.0592

0.0481

0.0372

0.0264

0.0158

0.0053

 

 

 

 

 

 

38

39

0.3989

0.2755

0.238

0.2104

0.188

0.1689

0.152

0.1366

0.1225

0.1092

0.0967

0.0848

0.0733

0.0622

0.0515

0.0409

0.0305

0.0203

0.0101

 

 

 

 

 

 

39

40

0.3964

0.2737

0.2368

0.2098

0.1878

0.1691

0.1526

0.1376

0.1237

0.1108

0.0986

0.087

0.0759

0.0651

0.0546

0.0444

0.0343

0.0244

0.0146

0.0049

 

 

 

 

 

40

41

0.3949

0.2719

0.2357

0.2091

0.1876

0.1693

0.1531

0.1384

0.1249

0.1123

0.1004

0.0891

0.0782

0.0677

0.0575

0.0476

0.0379

0.0283

0.0188

0.0094

 

 

 

 

 

41

42

0.3917

0.2701

0.2345

0.2085

0.1874

0.1694

0.1535

0.1392

0.1259

0.1136

0.102

0.0909

0.0804

0.0701

0.0602

0.0506

0.0411

0.0318

0.0227

0.0136

0.0045

 

 

 

 

42

43

0.3894

0.2684

0.2334

0.2078

0.1871

0.1695

0.1539

0.1398

0.1269

0.1149

0.1035

0.0927

0.0824

0.0724

0.0628

0.0534

0.0442

0.0352

0.0263

0.0175

0.0087

 

 

 

 

43

44

0.3872

0.2667

0.2323

0.2072

0.1868

0.1695

0.1542

0.1405

0.1278

0.116

0.1049

0.0943

0.0842

0.0745

0.0651

0.056

0.0471

0.0383

0.0296

0.0211

0.0126

0.0042

 

 

 

44

45

0.385

0.2651

0.2313

0.2065

0.1868

0.1695

0.1545

0.141

0.1286

0.117

0.1062

0.0959

0.086

0.0765

0.0673

0.0584

0.0497

0.0412

0.0328

0.0245

0.0163

0.0081

 

 

 

45

46

0.383

0.2635

0.2302

0.2058

0.1862

0.1695

0.1548

0.1415

0.1293

0.118

0.1073

0.0972

0.0876

0.0783

0.0694

0.0607

0.0522

0.0439

0.0357

0.0277

0.0197

0.0118

0.0039

 

 

46

47

0.3808

0.262

0.2291

0.2052

0.1869

0.1695

0.155

0.142

0.13

0.1189

0.1085

0.0986

0.0892

0.0801

0.0713

0.0628

0.0546

0.0465

0.0385

0.0307

0.0229

0.0153

0.0076

 

 

47

48

0.3789

0.2604

0.2281

0.2045

0.1855

0.1693

0.1551

0.1423

0.1306

0.1197

0.1095

0.0998

0.0906

0.0817

0.0731

0.0648

0.0568

0.0489

0.0411

0.0335

0.0259

0.0185

0.0111

0.0037

 

48

49

0.377

0.2589

0.2271

0.2038

0.1851

0.1692

0.1553

0.1427

0.1312

0.1205

0.1105

0.101

0.0919

0.0832

0.0748

0.0667

0.0588

0.0511

0.0436

0.0361

0.0288

0.0215

0.0143

0.0071

 

49

50

0.3751

0.2574

0.226

0.2032

0.1847

0.1691

0.1554

0.143

0.1317

0.1212

0.1113

0.102

0.0932

0.0846

0.0764

0.0685

0.0608

0.0532

0.0459

0.0386

0.0314

0.0244

0.0174

0.0104

0.0035

50

n

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

 

 

 

Приложение 6. Коэффициенты для вычисления статистики модифицированного критерия Шапиро-Уилка

n

n

8

-2,696

1,333

0,4186

30

-6,150

1,949

0,1872

9

-2,968

1,400

0,3900

31

-6,248

1,965

0,1840

10

-3,262

1,471

0,3660

32

-6,324

1,976

0,1811

11

-3,485

1,515

0,3451

33

-6,402

1,988

0,1781

12

-3,731

1,571

0,3270

34

-6,480

2,000

0,1755

13

-3,936

1,613

0,3111

35

-6,559

2,012

0,1727

14

-4,155

1,655

0,2969

36

-6,640

2,024

0,1702

15

-4,373

1,695

0,2842

37

-6,721

2,037

0,1677

16

-4,567

1,724

0,2727

38

-6,803

2,049

0,1656

17

-4,713

1,739

0,2622

39

-6,887

2,062

0,1633

18

-4,885

1,770

0,2528

40

-6,961

2,075

0,1612

19

-5,018

1,786

0,2440

41

-7,035

2,088

0,1591

20

-5,153

1,802

0,2359

42

-7,111

2,101

0,1572

21

-5,291

1,818

0,2264

43

-7,188

2,114

0,1552

22

-5,413

1,835

0,2207

44

-7,266

2,128

0,1534

23

-5,508

1,848

0,2157

45

-7,345

2,141

0,1516

24

-5,605

1,862

0,2106

46

-7,414

2,155

0,1499

25

-5,704

1,876

0,2063

47

-7,484

2,169

0,1482

26

-5,803

1,890

0,2020

48

-7,555

2,183

0,1466

27

-5,905

1,905

0,1980

49

-7,615

2,198

0,1451

28

-5,988

1,919

0,1943

50

-7,677

2,212

0,1436

29

-6,074

1,934

0,1907

 

 

 

[Содержание] [Начало]

 

Литература

 

1.      ГОСТ Р ИСО 5479-2002. Статистические методы. Проверка отклонения распределения вероятностей от нормального распределения. - М.: Изд-во стандартов. 2002. - 30 с.

2.      D’Agostino R.B. Transformation to normality of the null distribution of g1 // Biometrika, 57, 1970. – P.679-681.

3.      Pearson E.S., Hartley H.O. Biometrika tables for Statisticians. Vol. 1, edn. 3, Cambridge University Press, 1966. –  P.207-208.

4.      D’agostino R.B., Tietjen G.L. Simulation probability points of b2 for small samples // Biometrika, 58, 1971. – P.669-672.

5.      Bowmann K.O., Shenton L.R. ‘Omnibus’ test contours for departures from normality based on // Biometrika, 62, 1975. – P.243-250.

6.      Shapiro S.S., Wilk M.B. An analysis of variance test for normality (complete samples) // Biometrika, 52, 1965. – P.591-611.

7.      Shapiro S.S., Francia R.S. An appriximate analysis of variance test fo normality // J. Amer. Statist. Assoc., 337, 1972. – P.215-216.

8.      Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть II. Непараметрические критерии. - М.: Изд-во стандартов. 2002. - 64 с.

9.      Р 50.1.033-2001. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат. - М.: Изд-во стандартов. 2002. - 87 с.

10.  Baringhaus L., Danschke R., Henze N. Recent and classical tests for normality – A comparative study. Comm. Statistic. B, 18(1), 1989. – P.363-379.

11.  Baringhaus L., Henze N. A consistent test for multivatiate normality based on the emperical characteristic function // Metrika. 35, 1988. – P.339-348.

12.  Epps T.W., Pulley L.B. A test for normality based on the empirical characteristic function // Biometrika. 70, 1983. – P. 723-726.

13.  Henze N. An approximation to the limit distribution of the Epps-Pulley test statistic for normality // Metrika. 37, 1990. – P.7-18.

14.  Pearson E.S., Hartley H.O. Biometrika tables for Statisticians. Vol. 2, Cambridge University Press, 1976. –  P.221.

15.  Новицкий П.В., Зограф И.А. Оценка погрешностей результатов из­ме­рений. - Л.: Энергоатомизд., 1991. - 303 с.