1. Критерий проверки на симметричность
2. Критерий проверки на эксцесс
3. Совместный критерий проверки на симметричность и нулевой коэффициент эксцесса
4.3. Мощность критерия Шапиро-Уилка относительно различных альтернатив
4.4. Сравнение с мощностью непараметрических критериев согласия
5.3. Мощность критерия Эппса-Палли относительно различных альтернатив
5.4. Сравнение с мощностью непараметрических критериев согласия
6. Модифицированный критерий Шапиро-Уилкса
6.1. Зависимость распределения статистики от объема и числа выборок
6.2. Мощность модифицированного критерия Шапиро-Уилка относительно различных альтернатив
7. Исследование совместного критерия проверки на симметричность и нулевой коэффициент эксцесса
8. Модификация D’Agostino критерия проверки на симметричность
9. Модификация D’Agostino критерия проверки на эксцесс
Приложение 1. Процентные точки для статистики критерия проверки симметричности
Приложение 2. Процентные точки для статистики критерия проверки на эксцесс
Приложение 3. Процентные точки для статистики критерия Эппса-Палли
Приложение 4. Процентные точки для статистики критерия Шапиро-Уилка
Приложение 5. Коэффициенты для вычисления статистики критерия Шапиро-Уилка
Лемешко Б.Ю., Лемешко С.Б. Сравнительный анализ критериев проверки отклонения распределения от нормального закона // Метрология. 2005. № 2. – С. 3-24.
Лемешко Б.Ю., Рогожников А.П. Исследование особенностей и мощности некоторых критериев нормальности // Метрология. 2009. № 4. – С. 3-24.
Лемешко Б.Ю., Рогожников А.П. О нормальности погрешностей измерений в классических экспериментах и мощности критериев, применяемых для проверки отклонения от нормального закона // Метрология. 2012. № 5. – С. 3-26.
См. также: Прикладная математическая статистика (материалы к семинарам)
Применение простейших методов статистического анализа в производственных условиях или при экспериментальных исследованиях представляет собой выполнение достаточно рутинных операций, в результате которых на основании значений статистик критериев принимается решение об отклонении или принятии проверяемых гипотез. При этом человек, применяющий эти методы, как правило, является специалистом конкретной области и не очень озабочен тем, насколько надежны выводы проводимого статистического анализа, насколько вообще в данных конкретных условиях корректно применение используемых методов, действительно ли используемые методы являются наилучшими для достижения поставленных целей. Он заранее уверен в том, что в регламентирующих документах, стандартах и рекомендациях безошибочно отобраны наилучшие методы. С одной стороны, это правильно. С другой стороны, на основании результатов статистического анализа порой приходится принимать ответственные решения. В этом случае лицо, принимающее решение, должно быть уверено в объективности анализа, в используемых методах, должно четко представлять, какова достоверность результатов проводимого статистического анализа и границы применимости соответствующих процедур, должно быть уверено, что из всех возможных методов статистического анализа каждый раз выбирается наилучший.
Нормальность наблюдаемых данных является необходимой предпосылкой для корректного применения большинства классических методов математической статистики, используемых в задачах метрологии, стандартизации и контроля качества. Поэтому проверка на нормальность является обязательной процедурой в ходе проведения измерений, контроля и испытаний.
Отечественный стандарт ГОСТ Р ИСО 5479-2002 “Статистические методы. Проверка отклонения распределения вероятностей от нормального распределения” [1], введенный в действие в 2002 г., представляет собой аутентичный текст международного стандарта ISO 5479-97. В стандарте рассматривается графический метод проверки на нормальность с использованием вероятностной бумаги, критерии проверки на симметричность и на значение эксцесса, статистики которых представляют собой функции от оценок моментов закона распределения, критерии Шапиро-Уилка, основанные на регрессионном анализе порядковых статистик, критерий Эппса-Палли, статистика которого измеряет некоторое расстояние между выборочной характеристической функцией и характеристической функцией нормального закона.
В то же время введенный стандарт [1] не позволяет ориентироваться в том, какой из критериев является предпочтительней, какой из них оказывается наиболее мощным и против каких альтернатив, при каких объемах выборок конкретный критерий обладает преимуществом или наоборот.
В отечественной литературе исследованию данных критериев практически не уделено внимания. В зарубежных источниках, на которых базировалась разработка международного стандарта, также не приводится анализа мощности критериев нормальности по отношению к близким альтернативам, нет сравнительного анализа этих критериев с критериями согласия. Это касается как критериев нормальности, включенных в стандарт, так и не вошедших в него.
В стандарте отказываются от использования критериев типа , так как они “подходят только для сгруппированных данных” и в связи с тем, что “группирование приводит к потере информации”. В стандарте совершенно не упоминается применение для проверки нормальности непараметрических критериев согласия.
В свете вышеизложенного для заинтересованных специалистов, отвечающих за качество и надежность статистических выводов, осознанно принимающих решение о выборе методов статистического анализа, остается ряд невыясненных вопросов. Например, насколько обоснован выбор критериев в стандарте; их преимущества и недостатки; какова их мощность; как меняются распределения статистик критериев с ростом объемов выборок; всегда ли, например, критерии Шапиро-Уилка и Эппса-Палли по мощности предпочтительнее критериев согласия?
В этой связи в данной работе методами статистического моделирования исследованы свойства критериев, включенных в ГОСТ Р ИСО 5479-2002, исследованы распределения статистик критериев, мощность критериев по отношению к близким альтернативам, показаны достоинства и недостатки критериев, проведено сравнение критериев по мощности с критериями согласия. Исследован ряд критериев, не включенных в стандарт. Оказалось, что наиболее предпочтительным (по мощности) критерием проверки нормальности, у которого отсутствуют недостатки, свойственные ряду исследованных критериев, в том числе, критериям Шапиро-Уилка и Эппса-Палли, является критерий со статистикой , предложенный D’Agostino и не попавший ни в международный, ни в отечественный стандарты.
Критерий предназначен для проверки гипотез о симметричности наблюдаемого закона (против наличия асимметрии) при объемах выборки 8££5000. Для симметричных законов 3-й центральный момент . Нормированный коэффициент
(1)
в случае симметричности закона также равен 0. Проверяется гипотеза : =0 против альтернативы : >0 (положительная асимметрия) или : <0 (отрицательная асимметрия).
При вычислении статистики данного критерия и критерия проверки на эксцесс оценки используемых центральных моментов (в том числе ) вычисляются в соответствии с соотношением
,
где
.
В стандарте и первоисточниках [2,3] приводятся только таблицы процентных точек. Ничего не говорится о виде распределения. Очевидно, что распределение статистики (1) зависит от числа наблюдений. Также можно заметить, что распределение является симметричным.
Исследование распределений статистики критерия проверки на симметричность методами статистического моделирования было проведено при различных объемах выборок, принадлежащих нормальному закону с параметрами масштаба 1 и сдвига 0, так как распределение статистики не зависит от их значений. На рис. 1 представлены условные распределения статистики (1) () критерия проверки на симметричность в зависимости от объема выборки. Как видим, распределения очень существенно зависят от объема выборок. При увеличении количества наблюдений в выборке график закона распределения становится более крутой.
Рис 1. Распределения статистики критерия проверки на симметричность в зависимости от объема выборки при n=10,20,40,30,50,100,150 в случае нормального закона
Естественно, что нормальное распределение не единственное симметричное распределение. И не факт, что гипотеза о симметричности будет наиболее часто приниматься только в случае нормального закона. Для исследования зависимости распределения статистики (1) от вида наблюдаемого симметричного закона были исследованы распределения данной статистики при ряде альтернатив.
В качестве гипотезы рассмотрен нормальный закон распределения
с параметром масштаба и параметром сдвига . В качестве альтернатив были взяты следующие гипотезы: соответствует экспоненциальному семейству распределений с плотностью
параметром формы , – распределению Лапласа с плотностью
и параметрами (0,1), – логистическому распределению с плотностью
также с параметрами (0,1).
Графики функций плотности данных распределений представлены на рис. 2. Эти же распределения рассматривались в качестве альтернатив при исследовании распределений статистик других критериев. Распределения статистики (1) в зависимости от наблюдаемого закона (от справедливой гипотезы ) представлены на рис. 3. Интересно, что в случае справедливости , то есть принадлежности наблюдаемой выборки экспоненциальному семейству с параметром формы равным 4, распределение статистики оказывается более “крутым”, что свидетельствует о том, что гипотеза о симметричности будет приниматься более уверенно, чем в случае нормального закона.
Рис. 2. Плотности распределений, соответствующих рассматриваемым гипотезам
Рис. 3. Распределения статистики критерия проверки на симметричность в зависимости от гипотез при объеме выборок n=10
Критерий, использующий статистику (1), является только критерием проверки на симметричность. Его использование полезно при проверке нормальности, но принятие гипотезы о симметричности не может служить подтверждением нормальности (условие необходимое, но не достаточное).
Критерий проверки на эксцесс используется при объемах выборок 8££5000. Величина эксцесса представляет собой отношение центрального момента 4-го порядка к квадрату дисперсии
. (2)
В случае нормального закона . Проверяется гипотеза вида : =3 против альтернативы : >3 (больший эксцесс) или : <3 (меньший эксцесс).
В стандарте и первоисточниках [3,4] приводятся лишь таблицы процентных точек. Распределение статистики зависит от объема рассматриваемых выборок.
Распределения статистики критерия проверки на эксцесс были исследованы при различных объемах выборок, принадлежащих нормальному закону. На рис. 4 представлены полученные в результате моделирования графики распределений статистики критерия проверки на эксцесс в зависимости от объема выборки n.
Рис. 4. Графики распределений статистики критерия проверки на эксцесс в зависимости от объема выборки при n=10,20,40,30,50,100,150
Распределения статистики (2) были исследованы при наблюдаемых законах, соответствующих рассмотренным выше гипотезами . На рис. 5 представлены распределения статистик при объемах выборок при n=10, на рис. 6 – при n=20, а на рис. 7 – при n=50. Заметно, что, как и должно быть, при увеличении количества наблюдений в выборке мощность критерия растет.
Рис. 5. Распределения статистики (2) критерия проверки на эксцесс в зависимости от вида наблюдаемого закона, соответствующего различным , при n=10
Рис. 6. Распределения статистики (2) критерия проверки на эксцесс в зависимости от вида наблюдаемого закона, соответствующего различным , при n=20
Рис. 7. Распределения статистики (2) критерия проверки на эксцесс в зависимости от вида наблюдаемого закона, соответствующего различным , при n=50
Рисунки 5-7 позволяют судить о мощности критерия проверки на эксцесс относительно различных альтернатив : >3 (больший эксцесс) или : <3 (меньший эксцесс).
Вместе с критерием симметричности данный критерий дает основания судить о принадлежности наблюдаемой выборки нормальному закону. Недостатком критерия является сильная зависимость распределения статистики (2) от объема выборок.
Совместный критерий проверки на симметричность и нулевой коэффициент эксцесса в стандарте рассматривается при объемах выборок 20££1000 (многонаправленный критерий). Проверяемая гипотеза имеет вид : =0 и =3 против : ≠0 и (или) ≠3. В стандарте приведены кривые, определяющие критическую область при уровне значимости и .
В данном случае этот критерий не исследовался. Различные варианты критериев, построенных на основе (совместного) использования статистик (1) и (2) исследованы в разделе 7.
Критерий Шапиро-Уилка [6,7], базируется на анализе линейной комбинации разностей порядковых статистик. В стандарте применение критерия предусмотрено при объемах выборки 8££50. Сложность применения при больших объемах выборок затруднена вследствие отсутствия в документе соответствующих коэффициентов. При объемах выборок 51££99 коэффициенты и таблицы процентных точек можно найти в [7]. Критерий рекомендуют применять при отсутствии априорной информации о типе возможного отклонения от нормальности. Критерий Шапиро-Уилка используют в тех случаях, когда в качестве альтернативы можно выбрать гипотезу следующего вида: примерно симметричное распределение с <1/2 и <3 или асимметричное распределение (например, >1/2). В противном случае рекомендуют критерий Эппса-Палли. Данная рекомендация неочевидна и требует подтверждения.
Для вариационного ряда , построенного по наблюдаемой выборке , вычисляют величину
(3)
где индекс изменяется от 1 до или от 1 до при четном и нечетном соответственно. Коэффициенты приведены в стандарте и первоисточниках [6,7]. Статистика критерия имеет вид
.
Гипотеза о нормальности отвергается при малых значениях статистики . В стандарте и литературе отсутствует информация об аналитическом виде распределения статистики, приводятся лишь процентные точки.
Как и в предыдущих случаях, распределения статистики (3) исследовались методами статистического моделирования. На рис. 8 показана зависимость вида распределения статистики критерия Шапиро-Уилка в зависимости от объема выборки, принадлежащей нормальному закону. С ростом числа наблюдений график функции распределения становиться более сжатым (параметр масштаба уменьшается).
Рис 8. Графики распределения статистики критерия Шапиро-Уилка в зависимости от объема выборки при n=10,20,40,30,50
Как и ранее, в качестве гипотезы рассмотрен нормальный закон распределения с параметром масштаба равным 1 и параметром сдвига равным 0. В качестве близких альтернатив рассмотрены гипотезы: – выборка соответствует экспоненциальному семейству распределений с параметром формы равным 4, – распределению Лапласа с параметрами (0,1), – логистическому распределению с параметрами (0,1).
На рис. 9 приведены полученные условные распределения статистики (3) при справедливости гипотез , , , при объеме выборок n=10. На рис. 10 то же самое при n=20, а на рис. 11 – при n=50. Из графиков видно, что при малых объемах выборок (10-20 наблюдений) критерий Шапиро-Уилка не способен различать гипотезы и . Еще в худшей степени критерий замечает различие между нормальным распределением и экспоненциальным семейством с параметром формы . С ростом числа наблюдений мощность критерия по распознаванию альтернатив и растет.
Рис. 9. Условные распределения статистики (3) при справедливости гипотез при объеме выборок n=10
Рис. 10. Условные распределения статистики (3) при справедливости гипотез при объеме выборок n=20
Рис. 11. Условные распределения статистики (3) при справедливости гипотез при объеме выборок n=50
Критерий Шапиро-Уилка является критерием проверки на принадлежность наблюдаемой выборки нормальной генеральной совокупности. Поэтому интересно, насколько хорошо критерий может различать близкие законы, какова, например, мощность критерия относительно рассмотренных в данной работе альтернатив ,,.
Мощность критерия Шапиро-Уилка по отношению к конкурирующей гипотезе , соответствующей распределению экспоненциального семейства с параметром формы 4, при различных значениях уровня значимости (вероятности ошибки первого рода) приведена в табл.1
Таблица 1. Мощность критерия Шапиро-Уилка по отношению к распределению экспоненциального семейства с параметром формы 4
|
n=10 |
n=20 |
n=30 |
n=40 |
n=50 |
0.01 |
0.0069 |
0.0066 |
0.016 |
0.0357 |
0.0745 |
0.05 |
0.0477 |
0.061 |
0.104 |
0.1684 |
0.2559 |
0.075 |
0.0798 |
0.1025 |
0.1622 |
0.2435 |
0.3332 |
0.1 |
0.1067 |
0.1418 |
0.2128 |
0.2964 |
0.4065 |
Мощность критерия Шапиро-Уилка по отношению к конкурирующей гипотезе, соответствующей распределению Лапласа, приведена в табл.2.
Таблица 2. Мощность критерия Шапиро-Уилка по отношению к распределению Лапласа
|
n=10 |
n=20 |
n=30 |
n=40 |
n=50 |
0.01 |
0.064 |
0.1337 |
0.187 |
0.2372 |
0.2767 |
0.05 |
0.1515 |
0.2663 |
0.3343 |
0.3746 |
0.418 |
0.075 |
0.1919 |
0.3158 |
0.3856 |
0.4307 |
0.4692 |
0.1 |
0.2255 |
0.3511 |
0.4289 |
0.4641 |
0.5094 |
Мощность критерия Шапиро-Уилка по отношению к конкурирующей гипотезе , соответствующей логистическому закону, приведена в табл.3.
Таблица 3. Мощность критерия Шапиро-Уилка по отношению к логистическому закону
|
n=10 |
n=20 |
n=30 |
n=40 |
n=50 |
0.01 |
0.0249 |
0.0428 |
0.0573 |
0.0428 |
0.0697 |
0.05 |
0.0805 |
0.1159 |
0.1302 |
0.1159 |
0.1419 |
0.075 |
0.1156 |
0.1546 |
0.166 |
0.1546 |
0.1756 |
0.1 |
0.1386 |
0.1855 |
0.1986 |
0.1855 |
0.2077 |
Вообще говоря, с применением критериев согласия трудно различить такие близкие распределения, как нормальное и логистическое. В стандарте предусмотрено применение критерия Шапиро-Уилка для объемов выборок не выше =50. Как показали наши исследования, мощность критерия Шапиро-Уилка по отношению к конкурирующей гипотезе (логистическому закону) на объемах выборок ≤50 выше мощности непараметрических критериев согласия типа Колмогорова, типа Крамера-Мизеса-Смирнова и типа Андерсона-Дарлинга при проверке сложных гипотез [8], которые, в свою очередь, в данном случае мощнее критериев типа [9].
В то же время непараметрические критерии согласия позволяют хорошо отличать от нормального закона распределения экспоненциального семейства с более плоскими плотностями распределений (с <3).
Критерий Шапиро-Уилка на объемах выборок ≤50 является хорошим средством проверки нормальности, обладает более высокой мощностью по сравнению с непараметрическими критериями согласия относительно таких близких альтернатив, как логистический закон.
Однако с помощью критерия Шапиро-Уилка неожиданно трудно отличить от нормального закона распределения экспоненциального семейства с более плоскими по сравнению с нормальным законом плотностями распределений. Это несколько противоречит рекомендации стандарта по его применению.
Критерий Эппса-Палли [10,13] базируется на сравнении эмпирической и теоретической характеристических функций. В стандарте предусмотрено его применение при 8££200. По наблюдаемой выборке вычисляют статистику критерия
, (4)
где , . Выборка может быть неупорядочена, порядок наблюдений произволен, но он должен быть неизменным в течение всех проводимых вычислений. Гипотезу о нормальности отвергают при больших значениях статистики.
Распределения статистики (4) исследовались методами статистического моделирования. На рис. 12 показана зависимость вида распределения статистики критерия Эппса-Палли в зависимости от объема выборки, принадлежащей нормальному закону. Из графика видно, что при нормальном законе распределения случайной величины распределения статистик критерия визуально незначительно меняются с ростом объемов выборок (в отличие от распределений других рассмотренных здесь статистик). На рисунке наблюдается пучок распределений. С ростом наблюдается быстрая сходимость распределения статистики к некоторому предельному.
Конечно, процентные точки распределений статистики (4) при различных объемах выборок отличаются существенно, но вероятности вида , где – некоторое значение статистики, вычисленные по распределениям статистики (4) при различных n, будут достаточно близкими. Распределения статистики критерия Эппса-Палли при различных объемах выборок достаточно хорошо аппроксимируется бета-распределениями III рода с функцией плотности
,
где . Если пренебречь зависимостью статистики (4) от объема выборки , то для приближенного вычисления достигаемого уровня значимости можно использовать бета-распределение III рода с параметрами =1.8645, =2.5155, =5.8256, =0.9216, =0.0008. Соответствующая функция распределения представляет собой некоторую среднюю для “пучка” распределений, приведенного на рис.12.
Рис 12. Графики распределений статистики критерия Эппса-Палли в зависимости от объема выборки при n=10,20,40,30,50,100,150
Как и в предыдущих случаях, в качестве гипотезы рассмотрен нормальный закон распределения с параметром масштаба равным 1 и параметром сдвига равным 0. В качестве альтернатив рассмотрены гипотезы: – выборка соответствует экспоненциальному семейству распределений с параметром формы равным 4, – распределению Лапласа с параметрами (0,1), – логистическому распределению с параметрами (0,1).
На рис. 13-15 представлены условные функции распределения статистики (4) при справедливости гипотез , , , при объеме выборок n=10, n=20 и n=50, соответственно.
Из графиков видно, что при малых (10-20 наблюдений) объемах выборки критерий Эппса-Палли не способен различить гипотезы и (отличить нормальный закон от экспоненциального семейства с параметром ). С ростом числа наблюдений мощность критерия при распознавании альтернатив и растет.
При n=10 мощность критерия Эппса-Палли по отношению к гипотезе меньше (!) уровня значимости (при ), то есть при верной гипотезе предпочтение будет всегда отдаваться гипотезе . А при n=20 распределения и в области значений функций распределения, больших 0.95 практически неразличимы. При n=50 критерий уже хорошо различает гипотезы и .
Рис 13. Условные распределения статистики (4) при справедливости гипотез при объеме выборок n=10
Рис 14. Условные распределения статистики (4) при справедливости гипотез при объеме выборок n=20
Рис 15. Условные распределения статистики (4) при справедливости гипотез при объеме выборок n=50
Критерий Эппса-Палли также является критерием проверки на нормальность. Ниже в таблицах представлены значения мощности критерия относительно рассмотренных альтернатив ,,.
Мощность критерия Эппса-Палли по отношению к конкурирующей гипотезе , соответствующей распределению экспоненциального семейства с параметром формы 4, приведена в табл. 4
Таблица 4. Мощность критерия Эппса-Палли по отношению к распределению экспоненциального семейства с параметром формы 4
|
n=10 |
n=20 |
n=30 |
n=40 |
n=50 |
0.1 |
0.0911 |
0.1265 |
0.1826 |
0.2223 |
0.2811 |
0.05 |
0.041 |
0.0515 |
0.0785 |
0.1079 |
0.1495 |
0.025 |
0.0166 |
0.0213 |
0.0322 |
0.0509 |
0.0735 |
0.01 |
0.0055 |
0.0067 |
0.0097 |
0.0152 |
0.0248 |
Мощность критерия Эппса-Палли по отношению к конкурирующей гипотезе , соответствующей распределению Лапласа, приведена в табл. 5.
Таблица 5. Мощность критерия Эппса-Палли по отношению к распределению Лапласа
|
n=10 |
n=20 |
n=30 |
n=40 |
n=50 |
0.1 |
0.2427 |
0.3538 |
0.4619 |
0.5518 |
0.6233 |
0.05 |
0.1662 |
0.2599 |
0.3521 |
0.441 |
0.5191 |
0.025 |
0.1122 |
0.1919 |
0.2653 |
0.3485 |
0.4275 |
0.01 |
0.0663 |
0.1284 |
0.1746 |
0.2576 |
0.3232 |
Мощность критерия Эппса-Палли по отношению к конкурирующей гипотезе , соответствующей логистическому закону, приведена в табл. 6.
Таблица 6. Мощность критерия Эппса-Палли по отношению к логистическому закону
|
n=10 |
n=20 |
n=30 |
n=40 |
n=50 |
0.1 |
0.1459 |
0.1759 |
0.2036 |
0.228 |
0.2494 |
0.05 |
0.0891 |
0.1081 |
0.1252 |
0.1468 |
0.1673 |
0.025 |
0.0515 |
0.0697 |
0.0829 |
0.0972 |
0.1119 |
0.01 |
0.0255 |
0.0392 |
0.042 |
0.0546 |
0.0668 |
В стандарте даны процентные точки для диапазона =8÷200 (с пропусками).
Мощность критерия Эппса-Палли, как и критерия Шапиро-Уилка, по отношению к конкурирующей гипотезе (логистическому закону) на объемах выборок ≤50 выше мощности непараметрических критериев согласия типа Колмогорова, типа Крамера-Мизеса-Смирнова и типа Андерсона-Дарлинга.
В этой же ситуации критерий Эппса-Палли мощнее критерия Шапиро-Уилка при больших уровнях значимости () и уступает критерию Шапиро-Уилка по мощности при малых уровнях значимости ().
Критерий Эппса-Палли на объемах выборок ≤200 является хорошим средством проверки нормальности. При ≤50 критерий обладает более высокой мощностью по сравнению с непараметрическими критериями согласия относительно таких близких альтернатив, как логистический закон.
Однако при ≤20 с помощью критерия Эппса-Палли, как и с помощью критерия Шапиро-Уилка, нельзя отличить от нормального закона распределения экспоненциального семейства с более плоскими по сравнению с нормальным законом плотностями распределений
Критерий применяется при нескольких выборках одинакового объема . Необходимость проверки отклонения от нормального распределения, используя несколько независимых выборок, возникает очень часто, поскольку каждая отдельная выборка оказывается слишком малой для обнаружения значимого отклонения от нормального распределения. В такой ситуации применяют модифицированный критерий Шапиро-Уилка.
Для последовательных выборок объемом каждая, отобранных из одной совокупности, подсчитывается значение в соответствии с выражением
,
где вычисляются в соответствии с (3), индекс изменяется от 1 до или от 1 до при четном и нечетном соответственно. Коэффициенты приведены в стандарте и первоисточниках [6,7]. Для совместного критерия вычисляют соответствующие значения по формуле:
,
где . Коэффициенты , и для преобразования и табулированы [1, 14] и содержатся приложение 6.
Если основное распределение вероятностей нормальное, величины приблизительно подчиняются нормальному распределению. Среднее арифметическое значение переменное равно
и статистикой критерия является величина
, (5)
которая должна подчиняться стандартному нормальному закону.
Нулевая гипотеза о нормальности отклоняется при уровне значимости , если , где – -квантиль стандартного нормального распределения. В стандарте [1] ошибка в формуле (19).
Распределение статистики (5) лишь приближенно подчиняется стандартному нормальному закону, зависит от и . При конкретных комбинациях и условное распределение статистики может существенно отличаться от стандартного нормального закона, что является существенным недостатком критерия. Как правило, функция распределения статистики оказывается сдвинутой вправо от стандартного нормального распределения. Таким образом, принимая решение на основании процентных точек стандартного нормального закона в соответствии с , мы можем несправедливо отклонить верную гипотезу . То есть, вероятность ошибки первого рода на самом деле оказывается больше . На рис. 16 приведены распределения статистики при различных комбинациях и , а также для сравнения – функция распределения стандартного нормального закона.
Рис. 16. Условные распределения статистики (5) при различных комбинациях и
На рис. 17-18 представлены условные функции распределения статистики (5) при справедливости гипотез , , , при n*h=10*10 и n*h=30*10, соответственно.
Исследование показало, что модифицированный критерий Шапиро-Уилка, как и другие, при малых n*h (20-30 наблюдений в совокупности) не способен различить гипотезы и (отличить нормальный закон от экспоненциального семейства с параметром ). Но с ростом общего числа наблюдений n*h мощность критерия при распознавании альтернатив и растет.
Относительно альтернатив , , модифицированный критерий Шапиро-Уилка при малых n*h<100 уступает по мощности критериям Эппса-Палли и Шапиро-Уилка, уступает он и непараметрические критериям согласия.
Рис. 17. Условные распределения статистики (5) при справедливости гипотез при n*h=10*10
Рис. 18. Условные распределения статистики (5) при справедливости гипотез при n*h=30*10
С помощью модифицированного критерия, как и в случае критерия Шапиро-Уилка, трудно отличить от нормального закона распределения экспоненциального семейства с более плоскими по сравнению с нормальным законом плотностями распределений. Главным недостатком критерия является возможное существенное отклонение распределения статистики критерия при конкретных *h от стандартного нормального. Как правило, функция распределения статистики оказывается сдвинутой вправо от стандартного нормального распределения. Поэтому, принимая решение на основании процентных точек стандартного нормального закона в соответствии с , можно несправедливо отклонить верную гипотезу . Следовательно, на самом деле вероятность ошибки первого рода оказывается больше .
Кроме того, модифицированный критерий Шапиро-Уилка при малых n*h<100 уступает по мощности критериям Эппса-Палли и Шапиро-Уилка, уступает он и непараметрические критериям согласия.
В [5] рассмотрена одномерная статистика на базе статистик и
, (6)
которая асимптотически распределена как -распределение. На рис. 19 показаны распределения статистики (6) при различных объемах выборок и асимптотически предельное -распределение. Как видим, статистика (6) достаточно медленно сходится -распределению.
Рис. 19. Распределения статистики (6) при различных объемах выборок и асимптотически предельное -распределение
На рис. 20-21 представлены условные функции распределения статистики (6) при справедливости гипотез , , , при объеме выборок n=10 и n=50.
Рис. 20. Распределения статистики (6) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=10
Рис. 21. Распределения статистики (6) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=50
Достоинством критерия является одномерность статистики (6), что упрощает принятие решения. Однако распределение статистики критерия плохо сходится к предельному -распределению. Недостатком критерия является и то, что при малых объемах выборок критерий не различает нормальный закон и распределения экспоненциального семейства с параметром формы большим 2.
В работе [2] предложена модификация критерия проверки симметричности, где соответствующим преобразованием статистики (1) получается эквивалентная статистика, но распределенная в соответствии со стандартным нормальным законом. Преобразование коэффициента асимметрии в стандартную нормальную величину осуществляется с помощью следующих соотношений [2]:
,
,
,
,
. (7)
Исследования распределений статистики (7) при различных объемах выборок показало, что они очень хорошо согласуются со стандартным нормальным законом. На рис. 22-23 представлены условные функции распределения статистики (7) при справедливости гипотез , , , при объеме выборок n=10 и n=100. Критерий со статистикой (7) по мощности идентичен критерию со статистикой (1). Но он удобней, так как опирается на стандартное нормальное распределение.
Рис. 22. Условные распределения статистики (7) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=10
Рис. 23. Условные распределения статистики (7) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=100
Достоинством критерия со статистикой (7) является возможность использования в качестве предельного распределения стандартного нормального закона. Это упрощает процедуру проверки, так как при различных объемах выборок можно использовать процентные точки стандартного нормального распределения. Некоторое возрастание вычислительных затрат роли не играет. Однако критерий сохраняет и недостатки критерия со статистикой (1) и имеет такую же мощность.
В работе [2] предложена модификация критерия проверки на эксцесс, где статистика (2) с использованием (то есть, с использованием информации о симметричности) преобразуется в стандартную нормальную величину с помощью следующих соотношений [2]:
. (8)
Исследования распределений статистики (8) при справедливой гипотезе и различных объемах выборок показали, что достаточно хорошо согласуются со стандартным нормальным законом (несколько хуже, чем , но хорошо). Критерий двусторонний: проверяемая гипотеза отклоняется, если или .
Исследование мощности критерия со статистикой (8) показало, что данный критерий оказывается предпочтительнее всех других рассмотренных критериев. На рис. 24-25 представлены условные функции распределения статистики (8) при справедливости гипотез , , , при объемах выборок n=10 и n=100. Рисунки позволяют судить о мощности критерия со статистикой (8). Найденные значения мощности критерия относительно альтернатив , , при различных объемах выборок представлены в таблицах 7-9.
Рис. 24. Условные распределения статистики (8) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=10
Рис. 25. Условные распределения статистики (8) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=100
Таблица 7. Мощность критерия со статистикой по отношению к распределению экспоненциального семейства с параметром формы (по нижним процентным точкам)
|
n=10 |
n=20 |
n=30 |
n=40 |
n=50 |
n=100 |
n=300 |
n=500 |
0.1 |
0,1836 |
0,251 |
0,3502 |
0,4384 |
0,52 |
0,8352 |
0,9996 |
1 |
0.05 |
0,0967 |
0,1238 |
0,1813 |
0,2449 |
0,3149 |
0,6665 |
0,9977 |
1 |
0.025 |
0,0508 |
0,0588 |
0,0843 |
0,1159 |
0,1664 |
0,469 |
0,9908 |
0,9999 |
0.01 |
0,0226 |
0,0194 |
0,0251 |
0,0363 |
0,058 |
0,2453 |
0,9603 |
0,9997 |
Таблица 8. Мощность критерия со статистикой по отношению к распределению Лапласа (по верхним процентным точкам)
|
n=10 |
n=20 |
n=30 |
n=40 |
n=50 |
n=100 |
n=300 |
n=500 |
0.1 |
0.1927 |
0.3119 |
0.4113 |
0.4877 |
0.5743 |
0.815 |
0.9954 |
0.9997 |
0.05 |
0.1132 |
0.2234 |
0.3106 |
0.3893 |
0.4695 |
0.7419 |
0.992 |
0.9994 |
0.025 |
0.0683 |
0.163 |
0.2404 |
0.3094 |
0.3908 |
0.6711 |
0.9873 |
0.9992 |
0.01 |
0.0348 |
0.106 |
0.1737 |
0.2297 |
0.3066 |
0.5877 |
0.9775 |
0.9986 |
Таблица 9. Мощность критерия со статистикой по отношению к логистическому распределению (по верхним процентным точкам)
|
n=10 |
n=20 |
n=30 |
n=40 |
n=50 |
n=100 |
n=300 |
n=500 |
0.1 |
0.1309 |
0.1877 |
0.2342 |
0.27 |
0.3203 |
0.6797 |
0.8509 |
0.9598 |
0.05 |
0.0705 |
0.1174 |
0.1584 |
0.1878 |
0.2290 |
0.7710 |
0.7799 |
0.9271 |
0.025 |
0.0389 |
0.0744 |
0.1096 |
0.1309 |
0.1711 |
0.8289 |
0.7106 |
0.8917 |
0.01 |
0.0182 |
0.0447 |
0.0668 |
0.0857 |
0.1151 |
0.8849 |
0.6214 |
0.8342 |
Достоинством критерия со статистикой (8) является возможность использования в качестве предельного распределения стандартного нормального закона, следовательно, при различных объемах выборок можно использовать процентные точки стандартного нормального распределения. Это удобно для применения.
В статистике содержится информация, связанная со статистиками (1) и (2). Поэтому критерий является совместным: статистика учитывает отклонения от симметричности и от эксцесса нормального распределения. Критерий получается двусторонним: проверяемая гипотеза о нормальности должна отклоняться как при слишком больших, так и при слишком малых (отрицательных) значениях статистики.
Относительно близких альтернатив при малых критерий превосходит по мощности критерии Шапиро-Уилка и Эппса-Палли. В отличие от всех других критериев проверки на нормальность данный критерий хорошо улавливает различие между нормальным законом и экспоненциальным семейством распределений с более плоскими вершинами по сравнению с нормальным законом. При малых критерий превосходит по мощности критерии согласия, применяемые для проверки нормальности.
В [2] рассмотрена одномерная статистика на базе статистик и
, (9)
которая приближенно распределена как -распределение. Проверяемая гипотеза о нормальности отклоняется при больших значениях статистики (9). В отличие от статистики (6) распределение данной статистики очень хорошо согласуется -распределением уже при достаточно малых .
На рис. 26-27 представлены условные функции распределения статистики (9) при справедливости гипотез , , , при объеме выборок n=10 и n=50. Рисунки позволяют судить о мощности совместного критерия со статистикой (9). Как видно и из данных рисунков, при малых данный критерий не позволяет надежно различать гипотезы и из-за низкой мощности.
Рис. 26. Условные распределения статистики (9) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=10
Рис. 27. Условные распределения статистики (9) в зависимости от вида наблюдаемого закона, соответствующего различным , при n=50
Достоинством критерия со статистикой (9) является возможность использования в качестве предельного -распределения. Как правило, критерий при малых объемах выборок оказывается мощнее критериев согласия при проверке нормальности, не уступает по мощности критериям Шапиро-Уилка и Эппса-Палли. Однако и в данном случае наблюдается общий недостаток большинства критериев проверки нормальности: при <50 мощность критерия по отношению распределениям экспоненциального семейства с плоскими вершинами мала.
Проверка на нормальность имеет особое значение. Не секрет, что ошибки измерений, связанные с приборами, построенными на конкретных физических принципах, далеко не всегда описываются нормальным законом [15]. Поэтому следует ожидать, что не всегда измерения контролируемого показателя будут подчиняться нормальному закону. И если так окажется, то применение классического аппарата, используемого при статистическом анализе результатов измерений или при статистическом управлении качеством, может оказаться некорректным.
Реальные данные в приложениях (характеристики показателя процесса), как правило, фиксируются с ограниченной точностью, определяемой либо заданием технических условий, либо единицей шкалы измерительного прибора, либо условиями фиксации наблюдения, то есть данные оказываются поразрядно группированными. Это может оказывать серьезное влияние на оценки вычисляемых моментов и значения статистик, а, следовательно, приводить к неверным выводам даже при формировании оценок по выборкам достаточно большого объема.
Относительно большинства критериев, регламентированных стандартом, однозначно можно утверждать, что они весьма чувствительны к наличию аномальных наблюдений в связи с использованием оценок вторых, третьих и четвертых центральных моментов: оценки центральных моментов не являются робастными. Это означает, что отклонение гипотезы о нормальности может быть связано с наличием в рассматриваемой выборке аномальных наблюдений. Отсюда следует, что ограничение проверки нормальности использованием только перечня критериев, указанных в стандарте, не всегда обеспечивает корректности выводов о принадлежности (или непринадлежности) выборки нормальному закону. Они не всегда оказываются наиболее мощными.
Недостатком критериев Шапиро-Уилка, Эппса-Палли и критерия со статистикой (9) при малых объемах выборок является то, что они обладают пониженной мощностью по отношению к законам, более плосковершинным по отношению к нормальному (не могут различить).
Для проверки нормальности целесообразно рекомендовать применение критерия со статистикой (целесообразно его включение в ГОСТ). Абсолютно не вредно из практических соображений в дополнение использованию рассмотренных критериев проверить принадлежность наблюдаемых данных к нормальному закону с использованием непараметрических критериев согласия [9] и критериев согласия типа [10].
[Содержание] [Начало]
n |
p |
n |
p |
||
0.95 |
0.99 |
0.95 |
0.99 |
||
8 |
0.99 |
1.42 |
400 |
0.2 |
0.28 |
9 |
0.97 |
1.41 |
450 |
0.19 |
0.27 |
10 |
0.95 |
1.39 |
500 |
0.18 |
0.26 |
12 |
0.91 |
1.34 |
550 |
0.17 |
0.24 |
15 |
0.85 |
1.26 |
600 |
0.16 |
0.23 |
20 |
0.77 |
1.15 |
650 |
0.16 |
0.22 |
25 |
0.71 |
1.06 |
700 |
0.15 |
0.22 |
30 |
0.66 |
0.98 |
750 |
0.15 |
0.21 |
35 |
0.62 |
0.92 |
800 |
0.14 |
0.2 |
40 |
0.59 |
0.87 |
850 |
0.14 |
0.2 |
45 |
0.56 |
0.82 |
900 |
0.13 |
0.19 |
50 |
0.53 |
0.79 |
950 |
0.13 |
0.18 |
60 |
0.49 |
0.72 |
1000 |
0.13 |
0.18 |
70 |
0.46 |
0.67 |
1200 |
0.12 |
0.16 |
80 |
0.43 |
0.63 |
1400 |
0.11 |
0.15 |
90 |
0.41 |
0.6 |
1600 |
0.1 |
0.14 |
100 |
0.39 |
0.57 |
1800 |
0.1 |
0.13 |
125 |
0.35 |
0.51 |
2000 |
0.09 |
0.13 |
150 |
0.32 |
0.46 |
2500 |
0.08 |
0.11 |
175 |
0.3 |
0.43 |
3000 |
0.07 |
0.1 |
200 |
0.28 |
0.4 |
3500 |
0.07 |
0.1 |
250 |
0.25 |
0.36 |
4000 |
0.06 |
0.09 |
300 |
0.23 |
0.33 |
4500 |
0.06 |
0.08 |
350 |
0.21 |
0.3 |
5000 |
0.06 |
0.08 |
n |
p |
n |
p |
||||||
0.01 |
0.05 |
0.95 |
0.99 |
0.01 |
0.05 |
0.95 |
0.99 |
||
8 |
1.31 |
1.46 |
3.7 |
4.53 |
500 |
2.57 |
2.67 |
3.37 |
3.6 |
9 |
1.35 |
1.53 |
3.86 |
4.82 |
550 |
2.58 |
2.69 |
3.38 |
3.57 |
10 |
1.39 |
1.56 |
3.95 |
5 |
600 |
2.6 |
2.71 |
3.34 |
3.54 |
12 |
1.46 |
1.64 |
4.05 |
5.2 |
650 |
2.61 |
2.71 |
3.33 |
3.52 |
15 |
1.55 |
1.72 |
4.13 |
5.3 |
700 |
2.62 |
2.72 |
3.31 |
350 |
20 |
1.65 |
1.82 |
4.17 |
5.36 |
750 |
2.64 |
2.73 |
3.3 |
3.48 |
25 |
1.72 |
1.91 |
4.18 |
5.3 |
800 |
2.65 |
2.74 |
3.29 |
3.46 |
30 |
1.79 |
1.98 |
4.11 |
5.21 |
850 |
2.66 |
2.74 |
3.28 |
3.45 |
35 |
1.84 |
2.03 |
4.1 |
5.13 |
900 |
2.66 |
2.75 |
3.28 |
3.43 |
40 |
1.89 |
2.07 |
4.05 |
5.04 |
950 |
2.67 |
2.76 |
3.27 |
3.42 |
45 |
1.93 |
2.11 |
4 |
4.94 |
1000 |
2.68 |
2.76 |
3.26 |
3.41 |
50 |
1.95 |
2.15 |
3.99 |
4.88 |
1200 |
2.71 |
2.78 |
3.24 |
3.37 |
75 |
2.08 |
2.27 |
3.87 |
4.59 |
1400 |
2.72 |
2.8 |
3.22 |
3.34 |
100 |
2.18 |
2.35 |
3.77 |
4.39 |
1600 |
2.74 |
2.81 |
3.21 |
3.32 |
125 |
2.24 |
2.4 |
3.71 |
4.24 |
1800 |
2.76 |
2.82 |
3.2 |
3.3 |
150 |
2.29 |
2.45 |
3.65 |
4.13 |
2000 |
2.77 |
2.83 |
3.18 |
3.28 |
200 |
2.37 |
2.51 |
3.57 |
3.98 |
2500 |
2.79 |
2.85 |
3.16 |
3.25 |
250 |
2.42 |
2.55 |
3.52 |
3.87 |
3000 |
2.81 |
2.86 |
3.15 |
3.22 |
300 |
2.46 |
2.59 |
3.47 |
3.79 |
3500 |
2.82 |
2.87 |
3.14 |
3.21 |
350 |
2.5 |
2.62 |
3.44 |
3.72 |
4000 |
2.83 |
2.88 |
3.13 |
3.19 |
400 |
2.25 |
2.64 |
3.41 |
3.67 |
4500 |
2.84 |
2.88 |
3.12 |
3.18 |
450 |
2.55 |
2.66 |
3.39 |
3.63 |
5000 |
2.85 |
2.89 |
3.12 |
3.17 |
n |
p |
|||
0.90 |
0.95 |
0.975 |
0.99 |
|
8 |
0.271 |
0.347 |
0.426 |
0.526 |
9 |
0.275 |
0.35 |
0.428 |
0.537 |
10 |
0.279 |
0.357 |
0.437 |
0.545 |
15 |
0.284 |
0.366 |
0.447 |
0.56 |
20 |
0.287 |
0.368 |
0.45 |
0.564 |
30 |
0.288 |
0.371 |
0.459 |
0.569 |
50 |
0.29 |
0.374 |
0.463 |
0.574 |
100 |
0.291 |
0.376 |
0.464 |
0.583 |
200 |
0.29 |
0.379 |
0.467 |
0.59 |
n |
p |
n |
p |
||
0.01 |
0.05 |
0.01 |
0.05 |
||
8 |
0.749 |
0.818 |
30 |
0.9 |
0.927 |
9 |
0.764 |
0.829 |
31 |
0.902 |
0.929 |
10 |
0.781 |
0.842 |
32 |
0.904 |
0.93 |
11 |
0.792 |
0.85 |
33 |
0.906 |
0.931 |
12 |
0.805 |
0.859 |
34 |
0.908 |
0.933 |
13 |
0.814 |
0.866 |
35 |
0.91 |
0.934 |
14 |
0.825 |
0.874 |
36 |
0.912 |
0.935 |
15 |
0.835 |
0.881 |
37 |
0.914 |
0.936 |
16 |
0.844 |
0.887 |
38 |
0.916 |
0.938 |
17 |
0.851 |
0.892 |
39 |
0.917 |
0.939 |
18 |
0.858 |
0.897 |
40 |
0.919 |
0.94 |
19 |
0.863 |
0.901 |
41 |
0.93 |
0.941 |
20 |
0.868 |
0.905 |
42 |
0.922 |
0.942 |
21 |
0.873 |
0.908 |
43 |
0.923 |
0.943 |
22 |
0.878 |
0.911 |
44 |
0.924 |
0.944 |
23 |
0.881 |
0.914 |
45 |
0.926 |
0.945 |
24 |
0.884 |
0.916 |
46 |
0.927 |
0.945 |
25 |
0.888 |
0.918 |
47 |
0.928 |
0.946 |
26 |
0.891 |
0.92 |
48 |
0.929 |
0.947 |
27 |
0.894 |
0.92 |
49 |
0.929 |
0.947 |
28 |
0.896 |
0.924 |
50 |
0.93 |
0.947 |
29 |
0.898 |
0.926 |
|
n |
Коэффициенты для вычисления статистики критерия Шапиро-Уилка (k) |
|
||||||||||||||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
|
|
8 |
0.6052 |
0.3164 |
0.1743 |
0.0561 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
9 |
0.5888 |
0.3244 |
0.1976 |
0.0947 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
9 |
10 |
0.5739 |
0.3291 |
0.2141 |
0.1224 |
0.0399 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
11 |
0.5601 |
0.3315 |
0.226 |
0.1429 |
0.0695 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11 |
12 |
0.5475 |
0.3325 |
0.2347 |
0.1586 |
0.0922 |
0.0303 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
13 |
0.5359 |
0.3325 |
0.2412 |
0.1707 |
0.1099 |
0.0539 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
13 |
14 |
0.5251 |
0.3318 |
0.243 |
0.1802 |
0.124 |
0.0727 |
0.024 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
14 |
15 |
0.515 |
0.3306 |
0.2495 |
0.1878 |
0.1353 |
0.098 |
0.0433 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
15 |
16 |
0.5056 |
0.329 |
0.2521 |
0.1939 |
0.1447 |
0.1005 |
0.0593 |
0.0196 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
16 |
17 |
0.4968 |
0.3273 |
0.254 |
0.1988 |
0.1524 |
0.1109 |
0.0725 |
0.0359 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
17 |
18 |
0.4886 |
0.3253 |
0.2553 |
0.2027 |
0.1587 |
0.1197 |
0.0837 |
0.0496 |
0.0163 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
18 |
19 |
0.4808 |
0.3232 |
0.2561 |
0.2059 |
0.1641 |
0.1271 |
0.0932 |
0.0612 |
0.0303 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
19 |
20 |
0.4734 |
0.3211 |
0.2565 |
0.2085 |
0.1686 |
0.1334 |
0.1013 |
0.0711 |
0.0422 |
0.014 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20 |
21 |
0.4643 |
0.3185 |
0.2578 |
0.2119 |
0.1736 |
0.1399 |
0.1092 |
0.0804 |
0.053 |
0.0263 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
21 |
22 |
0.459 |
0.3156 |
0.2571 |
0.2131 |
0.1764 |
0.1443 |
0.115 |
0.0878 |
0.0618 |
0.0368 |
0.012 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
22 |
23 |
0.4542 |
0.3126 |
0.2563 |
0.2139 |
0.1787 |
0.148 |
0.1201 |
0.0941 |
0.0696 |
0.0459 |
0.0228 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
23 |
24 |
0.4493 |
0.3098 |
0.2554 |
0.2145 |
0.1807 |
0.1512 |
0.1245 |
0.0997 |
0.0764 |
0.0539 |
0.0321 |
0.0107 |
|
|
|
|
|
|
|
|
|
|
|
|
|
24 |
25 |
0.445 |
0.3069 |
0.2543 |
0.2148 |
0.1822 |
0.1539 |
0.1283 |
0.1046 |
0.0823 |
0.061 |
0.0403 |
0.02 |
|
|
|
|
|
|
|
|
|
|
|
|
|
25 |
26 |
0.4407 |
0.3043 |
0.2533 |
0.2151 |
0.1836 |
0.1563 |
0.1316 |
0.1089 |
0.0876 |
0.0672 |
0.0476 |
0.0284 |
0.0094 |
|
|
|
|
|
|
|
|
|
|
|
|
26 |
27 |
0.4366 |
0.3018 |
0.2522 |
0.2152 |
0.1848 |
0.1584 |
0.1346 |
0.1128 |
0.0923 |
0.0728 |
0.054 |
0.0358 |
0.0178 |
|
|
|
|
|
|
|
|
|
|
|
|
27 |
28 |
0.4328 |
0.2992 |
0.251 |
0.2151 |
0.1857 |
0.1601 |
0.1372 |
0.1162 |
0.0965 |
0.0778 |
0.0598 |
0.0424 |
0.0253 |
0.0084 |
|
|
|
|
|
|
|
|
|
|
|
28 |
29 |
0.4291 |
0.2968 |
0.2499 |
0.215 |
0.1864 |
0.1616 |
0.1395 |
0.1192 |
0.1002 |
0.0822 |
0.065 |
0.0483 |
0.032 |
0.0159 |
|
|
|
|
|
|
|
|
|
|
|
29 |
30 |
0.4254 |
0.2944 |
0.2487 |
0.2148 |
0.187 |
0.163 |
0.1415 |
0.1219 |
0.1036 |
0.0862 |
0.0697 |
0.0537 |
0.0381 |
0.0227 |
0.0076 |
|
|
|
|
|
|
|
|
|
|
30 |
31 |
0.422 |
0.2921 |
0.2475 |
0.2145 |
0.1874 |
0.1641 |
0.1433 |
0.1243 |
0.1066 |
0.0899 |
0.0739 |
0.0585 |
0.0435 |
0.0289 |
0.0144 |
|
|
|
|
|
|
|
|
|
|
31 |
32 |
0.4188 |
0.2898 |
0.2463 |
0.2141 |
0.1878 |
0.1651 |
0.1449 |
0.1265 |
0.1093 |
0.0931 |
0.0777 |
0.0629 |
0.0485 |
0.0344 |
0.0206 |
0.0068 |
|
|
|
|
|
|
|
|
|
32 |
33 |
0.4156 |
0.2876 |
0.2451 |
0.2137 |
0.188 |
0.166 |
0.1463 |
0.1284 |
0.1118 |
0.0961 |
0.0812 |
0.0669 |
0.053 |
0.0395 |
0.0262 |
0.0131 |
|
|
|
|
|
|
|
|
|
33 |
34 |
0.4127 |
0.2854 |
0.2439 |
0.2132 |
0.1882 |
0.1667 |
0.1475 |
0.1301 |
0.114 |
0.0988 |
0.0844 |
0.0706 |
0.0572 |
0.0441 |
0.0314 |
0.0187 |
0.0062 |
|
|
|
|
|
|
|
|
34 |
35 |
0.4098 |
0.2834 |
0.2427 |
0.2127 |
0.1883 |
0.1673 |
0.1487 |
0.1317 |
0.116 |
0.1013 |
0.0873 |
0.0739 |
0.061 |
0.0484 |
0.0361 |
0.0239 |
0.0119 |
|
|
|
|
|
|
|
|
35 |
36 |
0.4068 |
0.2813 |
0.2415 |
0.2121 |
0.1883 |
0.1678 |
0.1496 |
0.1331 |
0.1179 |
0.1036 |
0.09 |
0.077 |
0.0645 |
0.0523 |
0.0404 |
0.0287 |
0.0172 |
0.0057 |
|
|
|
|
|
|
|
36 |
37 |
0.404 |
0.2794 |
0.2403 |
0.2116 |
0.1883 |
0.1683 |
0.1505 |
0.1344 |
0.1196 |
0.1056 |
0.0924 |
0.0798 |
0.0677 |
0.0559 |
0.0444 |
0.0331 |
0.022 |
0.011 |
|
|
|
|
|
|
|
37 |
38 |
0.4015 |
0.2774 |
0.2391 |
0.211 |
0.1881 |
0.1686 |
0.1513 |
0.1356 |
0.1211 |
0.1075 |
0.0947 |
0.0824 |
0.0706 |
0.0592 |
0.0481 |
0.0372 |
0.0264 |
0.0158 |
0.0053 |
|
|
|
|
|
|
38 |
39 |
0.3989 |
0.2755 |
0.238 |
0.2104 |
0.188 |
0.1689 |
0.152 |
0.1366 |
0.1225 |
0.1092 |
0.0967 |
0.0848 |
0.0733 |
0.0622 |
0.0515 |
0.0409 |
0.0305 |
0.0203 |
0.0101 |
|
|
|
|
|
|
39 |
40 |
0.3964 |
0.2737 |
0.2368 |
0.2098 |
0.1878 |
0.1691 |
0.1526 |
0.1376 |
0.1237 |
0.1108 |
0.0986 |
0.087 |
0.0759 |
0.0651 |
0.0546 |
0.0444 |
0.0343 |
0.0244 |
0.0146 |
0.0049 |
|
|
|
|
|
40 |
41 |
0.3949 |
0.2719 |
0.2357 |
0.2091 |
0.1876 |
0.1693 |
0.1531 |
0.1384 |
0.1249 |
0.1123 |
0.1004 |
0.0891 |
0.0782 |
0.0677 |
0.0575 |
0.0476 |
0.0379 |
0.0283 |
0.0188 |
0.0094 |
|
|
|
|
|
41 |
42 |
0.3917 |
0.2701 |
0.2345 |
0.2085 |
0.1874 |
0.1694 |
0.1535 |
0.1392 |
0.1259 |
0.1136 |
0.102 |
0.0909 |
0.0804 |
0.0701 |
0.0602 |
0.0506 |
0.0411 |
0.0318 |
0.0227 |
0.0136 |
0.0045 |
|
|
|
|
42 |
43 |
0.3894 |
0.2684 |
0.2334 |
0.2078 |
0.1871 |
0.1695 |
0.1539 |
0.1398 |
0.1269 |
0.1149 |
0.1035 |
0.0927 |
0.0824 |
0.0724 |
0.0628 |
0.0534 |
0.0442 |
0.0352 |
0.0263 |
0.0175 |
0.0087 |
|
|
|
|
43 |
44 |
0.3872 |
0.2667 |
0.2323 |
0.2072 |
0.1868 |
0.1695 |
0.1542 |
0.1405 |
0.1278 |
0.116 |
0.1049 |
0.0943 |
0.0842 |
0.0745 |
0.0651 |
0.056 |
0.0471 |
0.0383 |
0.0296 |
0.0211 |
0.0126 |
0.0042 |
|
|
|
44 |
45 |
0.385 |
0.2651 |
0.2313 |
0.2065 |
0.1868 |
0.1695 |
0.1545 |
0.141 |
0.1286 |
0.117 |
0.1062 |
0.0959 |
0.086 |
0.0765 |
0.0673 |
0.0584 |
0.0497 |
0.0412 |
0.0328 |
0.0245 |
0.0163 |
0.0081 |
|
|
|
45 |
46 |
0.383 |
0.2635 |
0.2302 |
0.2058 |
0.1862 |
0.1695 |
0.1548 |
0.1415 |
0.1293 |
0.118 |
0.1073 |
0.0972 |
0.0876 |
0.0783 |
0.0694 |
0.0607 |
0.0522 |
0.0439 |
0.0357 |
0.0277 |
0.0197 |
0.0118 |
0.0039 |
|
|
46 |
47 |
0.3808 |
0.262 |
0.2291 |
0.2052 |
0.1869 |
0.1695 |
0.155 |
0.142 |
0.13 |
0.1189 |
0.1085 |
0.0986 |
0.0892 |
0.0801 |
0.0713 |
0.0628 |
0.0546 |
0.0465 |
0.0385 |
0.0307 |
0.0229 |
0.0153 |
0.0076 |
|
|
47 |
48 |
0.3789 |
0.2604 |
0.2281 |
0.2045 |
0.1855 |
0.1693 |
0.1551 |
0.1423 |
0.1306 |
0.1197 |
0.1095 |
0.0998 |
0.0906 |
0.0817 |
0.0731 |
0.0648 |
0.0568 |
0.0489 |
0.0411 |
0.0335 |
0.0259 |
0.0185 |
0.0111 |
0.0037 |
|
48 |
49 |
0.377 |
0.2589 |
0.2271 |
0.2038 |
0.1851 |
0.1692 |
0.1553 |
0.1427 |
0.1312 |
0.1205 |
0.1105 |
0.101 |
0.0919 |
0.0832 |
0.0748 |
0.0667 |
0.0588 |
0.0511 |
0.0436 |
0.0361 |
0.0288 |
0.0215 |
0.0143 |
0.0071 |
|
49 |
50 |
0.3751 |
0.2574 |
0.226 |
0.2032 |
0.1847 |
0.1691 |
0.1554 |
0.143 |
0.1317 |
0.1212 |
0.1113 |
0.102 |
0.0932 |
0.0846 |
0.0764 |
0.0685 |
0.0608 |
0.0532 |
0.0459 |
0.0386 |
0.0314 |
0.0244 |
0.0174 |
0.0104 |
0.0035 |
50 |
n |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
|
n |
|
|
|
n |
|
|
|
8 |
-2,696 |
1,333 |
0,4186 |
30 |
-6,150 |
1,949 |
0,1872 |
9 |
-2,968 |
1,400 |
0,3900 |
31 |
-6,248 |
1,965 |
0,1840 |
10 |
-3,262 |
1,471 |
0,3660 |
32 |
-6,324 |
1,976 |
0,1811 |
11 |
-3,485 |
1,515 |
0,3451 |
33 |
-6,402 |
1,988 |
0,1781 |
12 |
-3,731 |
1,571 |
0,3270 |
34 |
-6,480 |
2,000 |
0,1755 |
13 |
-3,936 |
1,613 |
0,3111 |
35 |
-6,559 |
2,012 |
0,1727 |
14 |
-4,155 |
1,655 |
0,2969 |
36 |
-6,640 |
2,024 |
0,1702 |
15 |
-4,373 |
1,695 |
0,2842 |
37 |
-6,721 |
2,037 |
0,1677 |
16 |
-4,567 |
1,724 |
0,2727 |
38 |
-6,803 |
2,049 |
0,1656 |
17 |
-4,713 |
1,739 |
0,2622 |
39 |
-6,887 |
2,062 |
0,1633 |
18 |
-4,885 |
1,770 |
0,2528 |
40 |
-6,961 |
2,075 |
0,1612 |
19 |
-5,018 |
1,786 |
0,2440 |
41 |
-7,035 |
2,088 |
0,1591 |
20 |
-5,153 |
1,802 |
0,2359 |
42 |
-7,111 |
2,101 |
0,1572 |
21 |
-5,291 |
1,818 |
0,2264 |
43 |
-7,188 |
2,114 |
0,1552 |
22 |
-5,413 |
1,835 |
0,2207 |
44 |
-7,266 |
2,128 |
0,1534 |
23 |
-5,508 |
1,848 |
0,2157 |
45 |
-7,345 |
2,141 |
0,1516 |
24 |
-5,605 |
1,862 |
0,2106 |
46 |
-7,414 |
2,155 |
0,1499 |
25 |
-5,704 |
1,876 |
0,2063 |
47 |
-7,484 |
2,169 |
0,1482 |
26 |
-5,803 |
1,890 |
0,2020 |
48 |
-7,555 |
2,183 |
0,1466 |
27 |
-5,905 |
1,905 |
0,1980 |
49 |
-7,615 |
2,198 |
0,1451 |
28 |
-5,988 |
1,919 |
0,1943 |
50 |
-7,677 |
2,212 |
0,1436 |
29 |
-6,074 |
1,934 |
0,1907 |
|
[Содержание] [Начало]
1. ГОСТ Р ИСО
5479-2002. Статистические методы. Проверка отклонения распределения
вероятностей от нормального распределения. - М.: Изд-во стандартов. 2002.
- 30 с.
2.
D’Agostino R.B. Transformation to normality of
the null distribution of g1 // Biometrika, 57, 1970. – P.679-681.
3. Pearson E.S., Hartley H.O. Biometrika tables
for Statisticians. Vol. 1, edn. 3, Cambridge University Press, 1966. –
P.207-208.
4. D’agostino R.B., Tietjen
G.L. Simulation probability points of b2 for small samples //
Biometrika, 58, 1971. – P.669-672.
5. Bowmann K.O., Shenton L.R.
‘Omnibus’ test contours for departures from normality based on //
Biometrika, 62, 1975. – P.243-250.
6. Shapiro S.S., Wilk M.B. An
analysis of variance test for normality (complete samples) // Biometrika, 52,
1965. – P.591-611.
7. Shapiro S.S., Francia R.S. An appriximate analysis of variance test fo normality // J. Amer. Statist. Assoc., 337, 1972. – P.215-216.
8. Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть II. Непараметрические критерии. - М.: Изд-во стандартов. 2002. - 64 с.
9. Р 50.1.033-2001.
Рекомендации по стандартизации. Прикладная статистика. Правила проверки
согласия опытного распределения с теоретическим. Часть I. Критерии типа
хи-квадрат. - М.: Изд-во стандартов. 2002. - 87 с.
10. Baringhaus L., Danschke R., Henze N. Recent and classical tests for
normality – A comparative study. Comm. Statistic. B, 18(1), 1989. – P.363-379.
11. Baringhaus L., Henze N. A consistent test for multivatiate normality
based on the emperical characteristic function // Metrika. 35, 1988. –
P.339-348.
12. Epps T.W., Pulley L.B. A test for normality based on the empirical
characteristic function // Biometrika. 70, 1983. – P. 723-726.
13. Henze N. An approximation to the limit distribution of the Epps-Pulley
test statistic for normality // Metrika. 37, 1990. – P.7-18.
14. Pearson E.S., Hartley H.O. Biometrika tables
for Statisticians. Vol. 2, Cambridge University Press, 1976. – P.221.
15. Новицкий П.В., Зограф И.А. Оценка погрешностей результатов измерений. - Л.: Энергоатомизд., 1991. - 303 с.