2.5 Связь мощности критериев со способом группирования наблюдений

Очевидно, что группирование наблюдений приводит к потере инфор­ма­ции, и эти потери зависят от выбора способа группирования данных. Следуя рекомендациям различных литературных источников, на практике обычно строят интервалы равной длины или, в лучшем случае, интервалы равной веро­ятности. Потери информации о законе распределения в этих ситуациях раз­личны, раз­лична и способность критериев распознавать близкие гипотезы.

Мерой внутренней близости распределений случайных величин служит фишеровская информация, что связано с мощностью различения между близ­кими значениями параметра. Так как в любой статистике не больше информа­ции, чем в исходной выборке, то мощность различения с помощью статистики не больше, чем с помощью всей выборки. Следовательно, если нужно выбирать между несколькими статистиками, следует предпочесть ту, для которой потери фишеровской информации минимальны [8].

Предполагают, что конкурирующей гипотезе H1 соответствует распре­деление того же типа, что и H0, но с параметром q1. Можно показать, разлагая Pi(q1) в соотношении (3) в ряд Тейлора при малых dq=q1-q и пренебрегая членами высшего по­рядка, что

,               (16)

где

– информационная матрица Фишера по группированным данным. Мощность критерия c2  Пирсона представляет собой неубывающую функцию от v. Мат­рица потерь информации, вызванных группированием, DJ=J(q)-JG(q), где J(q) – информационная матрица Фишера по негрупированным наблюдениям, является неотрицательно определенной, и, следовательно, dqT DJ dq ³0. Так как dqT JG(q) dq=dqT J(q) dq- dqT DJ dq, то очевидно, что с ростом потерь информации падает и мощность критерия при близких конкурирующих гипо­тезах.

Аналогично, с ростом правой части соотношения (7) увеличивается мощ­ность критерия отношения правдоподобия. Действуя как и в предыдущем слу­чае и пренебрегая членами высшего порядка, можно будет иметь

.

Далее, раскладывая ln(1+x) по формуле Тейлора и вновь пренебрегая члена­ми выше 2-го порядка, можно получить

.                 (17)

Это соотношение аналогично соотношению (16).

Выражение (14) показывает, что свойства критерия, задаваемого стати­стикой (11), также зависят от потерь информации при группировании.

 

[Предыдущая][Содержание][Следующая]