В случае проверки простых гипотез предельными распределениями статистик
критериев Колмогорова и Смирнова можно пользоваться при n>20 [3]. Исследование методами статистического
моделирования зависимости распределений статистик всех рассматриваемых здесь
непараметрических критериев от объема выборки при проверке различных как
простых, так и сложных гипотез показывает, что это справедливо во всех
случаях.
Например, рисунок 1 иллюстрирует, как при увеличении объема
выборки (n =5, 10, 20)
меняется распределение G(Sn|H0) статистики Колмогорова SK в случае проверки простой гипотезы о
принадлежности выборки нормальному закону. На этом рисунке отражено также
предельное распределение статистики – функция распределения Колмогорова
K(S). Эмпирические распределения GN(Sn|H0) при
больших n практически сливаются с K(S), и на рисунке они не показаны. Как видно, при малых n распределение
существенно отличается от предельного, но уже при n ³ 15–20 ошибка при вычислении вероятности “согласия” P{S> S*} оказывается
достаточно малой.
Рисунок 1 – Зависимость от n распределений G(Sn|H0) статистики SK Колмогорова при простой гипотезе (H0 -
нормальное распределение): n = 5, 10, 20. K(S) –
функция предельного распределения Колмогорова
Та
же самая картина наблюдается в случае проверки сложных гипотез о согласии. На рисунке 2 при n = 5,
10, 20, 1000 представлены распределения G(Sn|H0) статистики SK в случае проверки аналогичной, но уже сложной,
гипотезы о нормальности, когда по выборке вычисляют оценки максимального
правдоподобия (ОМП) параметров нормального закона.
При малых n наибольшие отклонения от предельных
распределений наблюдаются на “хвостах”. И при простых, и при сложных гипотезах
с ростом n распределения G(Sn|H0) равномерно сходятся к предельному. Но если в
случае простых гипотез с ростом n увеличивается вероятность больших значений статистик,
то в случае сложных возрастают вероятности и больших, и малых значений
статистик. Последнее замечание справедливо для распределений статистик SK,
Sw , SW.
Рисунок 2 – Зависимость от n распределений G(Sn|H0) статистики SK Колмогорова при сложной гипотезе (H0 -
нормальное распределение, ОМП): n = 5,
10, 20, 1000
Рисунок 3 иллюстрирует изменения с ростом n распределений
G(Sn|H0) статистики
Крамера-Мизеса-Смирнова Sw при проверке сложной гипотезы о нормальности и
использовании при оценивании параметров метода максимального правдоподобия. Чтобы
подчеркнуть разницу в распределениях статистик при простых и сложных гипотезах,
на указанном рисунке приведены G(Sn|H0) для n = 5,
20, 1000 и a1(S) –
предельная функция распределения статистики Sw при проверке простой гипотезы.
Таким образом, распределения G(Sn|H0) статистик непараметрических критериев при
простых и сложных гипотезах с ростом n очень быстро сходятся к предельным, и уже при n ³15-20
можно, не опасаясь больших ошибок, пользоваться этими предельными законами при
анализе данных.
Однако последний вывод
не означает, что при малых объемах выборок с помощью этих критериев можно
успешно различать близкие гипотезы. Для надежного различения близких законов
распределения, в частности с помощью критерия согласия Колмогорова, может потребоваться
выборка достаточно большого объема [30].
Рисунок 3 – Зависимость от n распределений G(Sn|H0) статистики Sw Крамера-Мизеса-Смирнова при сложной гипотезе (H0 -
нормальное распределение, ОМП): n = 5,
20, 1000
[Предыдущая][Содержание][Следующая]