На основании соотношений (16), (17) можно утверждать, что чем меньше потери информации, связанные с группированием наблюдений, тем выше мощность соответствующих критериев согласия при близких конкурирующих гипотезах.
Потери от группирования можно уменьшить, решая задачу асимптотически оптимального группирования и подбирая граничные точки так, чтобы JG(q) стремилась к информационной матрице по негруппированным данным J(q). В случае скалярного параметра эта задача сводится к максимизации количества информации Фишера о параметре по группированной выборке
. (18)
А в случае вектора параметров в качестве критериев оптимальности могут быть выбраны различные функционалы от информационной матрицы Фишера. Наиболее естественно максимизировать определитель информационной матрицы, т.е. решать задачу
. (19)
Применяя на практике критерии типа c2, наиболее часто используют интервалы равной длины или, в лучшем случае, интервалы равной вероятности. Выбор равновероятного группирования обоснован определённостью этой процедуры разбиения и ее оптимальностью при отсутствии конкретных альтернатив [9]. Однако при использовании и равновероятного и равномерного группирования мощность критериев c2 Пирсона и отношения правдоподобия обычно далека от максимально возможной.
В общем случае информационная матрица Фишера зависит не только от граничных точек xi, но и от параметров исследуемого распределения. Однако для достаточно широкого ряда распределений при решении задач асимптотически оптимального группирования граничные точки интервалов удается получить в виде, инвариантном относительно параметров распределений, и на их основе формировать таблицы асимптотически оптимального группирования.
Применение асимптотически оптимального группирования в критериях согласия типа c2 впервые было предложено в работе [10]. Совокупность таблиц асимптотически оптимального группирования, построенная в результате решения задач (18) и (19) в [11]–[16] для распределений экспоненциального, полунормального, Рэлея, Максвелла, модуля многомерного нормального вектора, Парето, Эрланга, Лапласа, нормального, логарифмически-нормальных (ln и lg), Коши, Вейбулла, распределений минимального и максимального значения, двойного показательного, гамма-распределения, представлена в приложении А. Таблицы А.1–А.58 могут быть использованы как при проверке гипотез, так и при оценивании. Полученные таблицы используют в программной системе [17] при проверке согласия по критериям c2 Пирсона и отношения правдоподобия и при вычислении робастных оценок.
Для многих законов распределений граничные точки интервалов не могут быть выражены в виде, инвариантном относительно параметров распределений, т.е. они остаются функциями этих параметров. Это касается, например, таких законов, как гамма- и бета-распределения [11], [15], экспоненциального семейства распределений. В этом случае формирование таблиц асимптотически оптимального группирования теряет смысл. Однако возможно решение задачи асимптотически оптимального группирования при конкретных значениях параметров в процессе проверки гипотез о согласии, как это реализуется в таких ситуациях в программной системе [17].
Положительный эффект применения асимптотически оптимального группирования на результатах статистического анализа проявляется при малых отклонениях выборки от предположений.
При проверке простых гипотез и использовании
асимптотически оптимального группирования критерии c2 Пирсона и отношения правдоподобия оказываются мощнее
непараметрических критериев Колмогорова, Смирнова, w2 и W2 Мизеса
против близких конкурирующих гипотез, лучше улавливают малые отклонения от
предположений в наблюдаемых данных [18], [19].
[Предыдущая][Содержание][Следующая]