2.6 Асимптотически оптимальное группирование

На основании соотношений (16), (17) можно утверждать, что чем меньше потери информации, связанные с группированием наблюдений, тем выше мощность соответствующих критериев согласия при близких конкурирующих гипотезах.

Потери от группирования можно уменьшить, решая задачу асимпто­тиче­ски оптимального группирования и подбирая граничные точки так, чтобы JG(q) стремилась к информационной матрице по негруппированным данным J(q). В случае скалярного параметра эта задача сводится к максимизации ко­личества информации Фишера о параметре по группированной выборке

.                        (18)

А в случае вектора параметров в качестве критериев оптимальности могут быть выбраны различные функционалы от информационной матрицы Фишера. Наи­более естественно максимизировать определитель информационной матрицы, т.е. решать задачу

.                                           (19)

Применяя на практике критерии типа c2, наиболее часто используют ин­тервалы равной длины или, в лучшем случае, интервалы равной вероятности. Выбор равновероятного группирования обоснован определённостью этой про­цедуры разбиения и ее оптимальностью при отсутствии конкретных альтерна­тив [9]. Однако при использовании и равновероятного и равномерного группи­рования мощность критериев c2 Пирсона и отношения правдоподобия обычно далека от максимально возможной.

В общем случае информационная матрица Фишера зависит не только от граничных точек xi, но и от параметров исследуемого распределения. Однако для достаточно широкого ряда распределений при решении задач асимптоти­чески оптимального группирования граничные точки интервалов удается полу­чить в виде, инвариантном относительно параметров рас­пределений, и на их основе формировать таблицы асимптотически опти­мального группирования.

Применение асимптотически оптимального группирования в критериях согласия типа c2 впервые было предложено в работе [10]. Совокупность таб­лиц асимптотически оптимального группирования, построенная в резуль­тате решения задач (18) и (19) в [11]–[16] для распределений экспо­ненциального, полунормального, Рэлея, Максвелла, модуля многомерного нормального век­тора, Парето, Эрланга, Лапласа, нормального, логарифми­чески-нормальных (ln и lg), Коши, Вейбулла, распределений минимального и максимального значе­ния, двойного показательного, гамма-распределения, представлена в приложе­нии А. Таблицы А.1–А.58 могут быть использованы как при проверке гипотез, так и при оценивании. Полученные таблицы используют в программной сис­теме [17] при проверке согласия по критериям c2 Пирсона и отношения прав­доподобия и при вычислении робастных оценок.

Для многих законов распределений граничные точки интервалов не мо­гут быть выражены в виде, инвариантном относительно параметров распре­де­лений, т.е. они остаются функциями этих параметров. Это касается, например, таких законов, как гамма- и бета-распределения [11], [15], экспо­ненциального семейства распределений. В этом случае формирование таблиц асимптотиче­ски оптимального группирования теряет смысл. Однако воз­можно решение за­дачи асимптотически оптимального группирования при конкретных значениях параметров в процессе проверки гипотез о согласии, как это реализуется в та­ких ситуациях в программной системе [17].

Положительный эффект применения асимптотически оптимального группирования на результатах статистического анализа проявляется при малых отклонениях выборки от предположений.

При проверке простых гипотез и использовании асимптотически опти­мального группирования критерии c2 Пирсона и отношения правдопо­добия оказываются мощнее непараметрических критериев Колмогорова, Смирнова, w2 и W2 Мизеса против близких конкурирующих гипотез, лучше улавливают малые отклонения от предположений в наблюдаемых данных [18], [19].

 

[Предыдущая][Содержание][Следующая]