См. также: Прикладная математическая статистика (материалы к семинарам)

 

Заводская лаборатория. Диагностика материалов. 2003. Т. 69. – С..61–67.

 

УДК 519.2

 

О ВЫБОРЕ ЧИСЛА ИНТЕРВАЛОВ В КРИТЕРИЯХ СОГЛАСИЯ ТИПА [1]

 

Лемешко Б.Ю., Чимитова Е.В.

 

            Статистические свойства критериев типа  зависят как от того, каким образом область определения случайной величины разбивается на интервалы, так и от выбора числа интервалов группирования.

            Рекомендуемое в различных источниках количество интервалов груп­пирования, используемое при вычислении оценок параметров, построении гистограмм, а также при проверке статистических гипотез с помощью критерия  Пирсона, колеблется в очень широких пределах. Большинство из рекомендуемых формул для оценки числа интервалов  носит эмпирический характер и обычно дает завы­шенные величины. Практически все рекомендации по выбору числа интервалов исходят из того, чтобы при данном объеме выборки  как можно лучше приблизить плотность распределения ее непараметрической оценкой (гистограммой). В данной работе выбор числа интервалов рассматривается с позиций построения наиболее мощного критерия согласия при близких конкурирующих гипотезах.

Естественно, что определение количества интервалов связывается с объемом выборки. В [1] на основании различных источников приводится целый ряд рекомендаций по выбору числа интервалов .

При выборе интер­валов равной длины определяющим является требование, чтобы количество наблюдений, попавших в интервалы, было не слишком малым и сравнимым. При этом наиболее часто рекомендуется, чтобы количество наблюдений, попавших в интервал, было не менее 10. В [2] отмечается, что на практике допустимо, чтобы количество наблюдений в крайних интервалах было менее 5. В работах [3,4], в которых изучалась мощность критерия  Пирсона, говорится, что в случае унимодального распределения допус­кается уменьшение ожидаемых частот попадания наблюдений для одного или двух интервалов до 1 и даже ниже.

            Во многих источниках можно найти упоминание эвристической формулы Старджесса для определения “оптимального” числа интервалов [5]

.

            В [6] для определения “оптимального” числа интервалов рекомен­дуется формула Брукса и Каррузера

.

            В [7] рекомендуют соотношение

.

            В [4] для равновероятных интервалов их количество устанавлива­ется порядка

,

где  - квантиль стандартного нормального распределения для заданного уровня значимости. В ряде работ приводятся модификации данной фор­мулы. В [8] предлагается значение

,

а в [9] дальнейшее развитие этого соотношения

.

            В исследовании [10] получено соотношение

,

где  - значение контрэксцесса ().

            При больших объемах выборок  разброс значений , задаваемых различными формулами, достаточно велик. Поэтому на практике при выборе числа интервалов больше руководствуются разумными соображениями, выбирая число интер­валов так, чтобы в интервалы попадало число наблюдений не менее 5-10. Так, например, в рекомендациях ВНИИМетрологии [11] в зависимости от  предлагаются следующие величины :

 

40–100

7–9

100–500

8–12

500–1000

10–16

1000–10000

12–22

 

            В [12] показано, что величина уклонения гистограммы от плотности распределения в лучшем случае имеет порядок , который достигается при числе интервалов  порядка . Но этот вывод сделан с позиций близости непрерывной функции плотности и гистограммы, а совсем не с позиций мощности критерия  Пирсона.

            В данном случае мы постараемся посмотреть, как отражается на мощности критериев типа  выбираемое число интервалов группирования .

            При справед­ливости простой проверяемой гипотезы  предельным распределением  стандартной статистики критерия согласия Пирсона , где  - объем выборки,  - количество наблюдений, попавших в -й интервал,  - вероятность попадания наблюдения в интервал,  - извест­ный вектор параметров закона с плотностью , относительно которого проверяется гипотеза, - граничные точки интервалов, является -распределение. При проверке сложных гипотез и оценивании по этой же выборке в результате мини­мизации этой же ста­тистики  компонент вектора пара­метров за­кона статистика  подчиняется -распределению. Статистика  подчиняется -распределению и в том случае, если используются оценки максимального правдоподобия по группирован­ным наблюдениям (см. стр. 563-567 в [13], стр. 460-470 в [14] и [15]). Наши исследования методами статистического моделиро­вания распределений данной статистики при проверке сложных гипотез и использовании оценок максимального правдоподобия по группированным наблюдениям (при конечных объемах выборок) также показали хорошее согласие получаемых эмпирических распределений статистики с -распределениями. При справедли­вой альтер­нативной гипотезе , соответствующей гипотетическому распре­де­лению с плотностью , пре­дельное рас­пределение  пред­ставляет собой нецентральное -распределение с тем же числом степеней свободы  или  и параметром нецентральности

,                                                                   (1)

где . При использовании в процессе проверки сложных гипо­тез оценок максимального правдоподобия (ОМП) по исходным негруппированным наблю­дениям распределения  и  отличаются от соответствующих -распределений. В частности, близость  к -распределению зависит от принятого способа разбиения выборки на интервалы [16].

            То, каким образом выбраны интервалы группирования, в основном отражается и отражается существенно на распределении . В [17-20] показано, что при фиксированном числе интервалов  и близких конкурирующих гипотезах  и  мощность критерия  Пирсона тем выше, чем меньше потери в информации Фишера, связанные с группированием наблюдений. Там же приводятся построенные таблицы, с инвариантными относительно параметров наблюдаемых законов асимптотически оптимальными границами интервалов для различных законов случайных величин.

            В [21] и последующих работах [22-24] Никулиным предложено такое видоизменение стандартной статистики , при котором предельное распределение есть обыч­ное рас­пре­деление  (количество степеней свободы не зависит от числа оцениваемых параметров). Неизвестные параметры распределения  в этом случае должны оцениваться методом максимального правдоподобия по негруппированным данным. При этом вектор вероят­ностей попадания в интервалы  предпо­ла­га­ется заданным, и гра­ничные точки ин­тер­валов определяются соот­­ноше­ниями , . Предло­женная статис­тика  отличается от  только при сложных ги­потезах. Элементы и размерность матрицы  опреде­ля­ются оценива­емыми компонен­тами вектора параметров ,  - эле­менты информационной матри­цы Фишера ,  - элементы вектора , величины  оп­ределяются соотношением . При вер­ной аль­тер­нативе предельное распределение  представляет собой не­центральное -распределение с параметром нецентральности

,                                             (2)

где  - элементы вектора .

            Проведенные в [25] методами статистического моделирования исследования рас­пределений статистики Никулина показали, что как , так и  слабо зависят от выбранного способа группирования и хорошо согласуются с соответствующими -распределениями. При этом критерий со статистикой Никулина при фиксированном числе интервалов  и фиксированном варианте группирования всегда мощнее критерия  Пирсона. Там же было отмечено, что если при разбиении области определения случайной величины на интервалы равной вероятности при близких конкурирующих гипотезах  и  с ростом  мощность критерия  Пирсона падает, то для критерия со статистикой Никулина при заданном объеме выборки  может существовать оптимальная величина числа интервалов , при котором критерий будет иметь максимальную мощность. Этот вывод относительно критерия  Пирсона хорошо согласуется с результатами работ [26-27].

            В данной работе мы более подробно исследовали зависимость мощности от величины . Зная предельные распределения  и  статистики , для любого заданного уровня значимости  можно оценить мощность соответствующего критерия, рассматривая её как функцию от числа интервалов  при заданном объеме выборки . Исследование мощности критериев Пирсона и Никулина как функции  и  проводилось как аналитически, так и методами статистического моделирования. Причем приводимые результаты аналитических вычислений полностью подтверждаются оценками мощности, полученными на основании моделирования.

Мощность критериев типа  является функцией параметра нецентральности , задаваемого выражениями (1) или (2) соответственно. В свою очередь, параметр нецентральности  зависит от пары конкурирующих гипотез, числа интервалов , способа группирования и объема выборки .  При заданных вероятности ошибки первого рода  и числе степеней свободы  ( или ) величина мощности вычисляется в соответствии с выражением (см. стр. 63 в [28])

,                (3)

где  есть -процентная точка -распределения с  степенями свободы,  - вероятность ошибки второго рода. Все приводимые ниже функции мощности строились при уровне значимости .

            На рис. 1 в зависимости от числа  равновероятных интервалов при различных  представлены функции мощности критерия  Пирсона при проверке простой гипотезы о согласии с экспоненциальным законом (:  при ; :  при ). На рис. 2 приведены аналогичные функции при исполь­зовании асимптотически оптимального группирования [17,20]. Асимптотически опти­мальные граничные точки, минимизирующие потери в информации Фишера, представлены в табл. 1. И в том и в другом случае с ростом  мощность падает, но в случае асимптотически оптимального группирования она выше, чем при равновероятном.

 

Рис. 1. Функции мощности критерия  Пирсона при проверке простой гипотезы

о согласии с экспоненциальным законом при равновероятном группировании

 

 

Рис. 2. Функции мощности критерия  Пирсона при проверке простой гипотезы

о согласии с экспоненциальным законом при асимптотически оптимальном группировании

 

           


 

Таблица 1

Оптимальные граничные точки интервалов группирования в виде  при проверке простых и сложных гипотез о согласии с экспоненциальным распределением по критериям типа и соответствующие значения относительной асимптотической информации

2

1.5936

 

 

 

 

 

 

 

 

 

0.6476

3

1.0176

2.6112

 

 

 

 

 

 

 

 

0.8203

4

0.7541

1.7716

3.3652

 

 

 

 

 

 

 

0.8910

5

0.6004

1.3545

2.3720

3.9657

 

 

 

 

 

 

0.9269

6

0.4993

1.0997

1.8538

2.8714

4.4650

 

 

 

 

 

0.9606

7

0.4276

0.9269

1.5273

2.2813

3.2989

4.8925

 

 

 

 

0.9606

8

0.3739

0.8015

1.3008

1.9012

2.6553

3.6729

5.2665

 

 

 

0.9693

9

0.3323

0.7063

1.1338

1.6331

2.2336

2.9876

4.0052

5.5988

 

 

0.9754

10

0.2990

0.6314

1.0053

1.4329

1.9322

2.5326

3.2866

4.3042

5.8979

 

0.9798

11

0.2716

0.5695

0.9014

1.2746

1.7015

2.1989

2.7955

3.5429

4.5480

6.1176

0.9832

 

Таблица 2

Оптимальные граничные точки интервалов группирования в виде  при проверке простых и сложных (при одновременном оценивании двух параметров) гипотез о согласии с нормальным распределением по критериям типа и соответствующие значения относительной асимптотической информации

3

-1.1106

1.1106

 

 

 

 

 

 

 

 

 

 

 

 

0.4065

4

-1.3834

0.0

1.3834

 

 

 

 

 

 

 

 

 

 

 

0.5527

5

-1.6961

-0.6894

0.6894

1.6961

 

 

 

 

 

 

 

 

 

 

0.6826

6

-1.8817

-0.9970

0.0

0.9970

1.8817

 

 

 

 

 

 

 

 

 

0.7557

7

-2.0600

-1.2647

-0.4918

0.4918

1.2647

2.0600

 

 

 

 

 

 

 

 

0.8103

8

-2.1954

-1.4552

-0.7863

0.0

0.7863

1.4552

2.1954

 

 

 

 

 

 

 

0.8474

9

-2.3188

-1.6218

-1.0223

-0.3828

0.3828

1.0223

1.6218

2.3188

 

 

 

 

 

 

0.8753

10

-2.4225

-1.7578

-1.2046

-0.6497

0.0

0.6497

1.2046

1.7578

2.4225

 

 

 

 

 

0.8960

11

-2.5167

-1.8784

-1.3602

-0.8621

-0.3143

0.3143

0.8621

1.3602

1.8784

2.5167

 

 

 

 

0.9121

12

-2.5993

-1.9028

-1.4914

-1.0331

-0.5334

0.0

0.5334

1.0331

1.4914

1.9028

2.5993

 

 

 

0.9247

13

-2.6746

-2.0762

-1.6068

-1.1784

-0.7465

-0.2669

0.2669

0.7465

1.1784

1.6068

2.0762

2.6746

 

 

0.9348

14

-2.7436

-2.1609

-1.7092

-1.3042

-0.9065

-0.4818

0.0

0.4818

0.9065

1.3042

1.7092

2.1609

2.7436

 

0.9430

15

-2.8069

-2.2378

-1.8011

-1.4150

-1.0435

-0.6590

-0.2325

0.2325

0.6590

1.0435

1.4150

1.8011

2.2378

2.8069

0.9498

 


На рис. 3 приведены функции мощности критерия  Пирсона в случае разбиения области определения случайной величины на интервалы равной вероятности при проверке простой гипотезы о согласии с нормальным законом :  при ,  против : нормальный закон при , . На рис. 4 аналогичные функции мощности в случае использования асимптотически оптимального группирования [15,18]. Асимптотически опти­мальные граничные точки, минимизирующие потери в информации Фишера, представлены в табл. 2.

 

Рис. 3. Функции мощности критерия  Пирсона при проверке простой гипотезы

о согласии с нормальным законом при равновероятном группировании

Рис. 4. Функции мощности критерия  Пирсона при проверке простой гипотезы

о согласии с нормальным законом при асимптотически оптимальном группировании

 

            На рис. 5-8 представлены функции мощности критерия  Пирсона при проверке простых и сложных гипотез о согласии с нормальным законом : , когда в качестве альтернативы рассматривается логисти­чес­кий закон : при значениях пара­мет­ров , . На рис. 5 представлены функции мощности для случая равновероятного группирования и проверки простой гипотезы, соответствующей нормальному закону с параметрами , . На рис. 6 то же, но при проверке сложной гипотезы. Как видим, и здесь с ростом  мощность падает. При проверке простой гипотезы функция мощности критерия Пирсона для  принимает максимальное значение при , и при дальнейшем увеличении объема выборки это оптимальное число интервалов не изменяется.

 

Рис. 5. Функции мощности критерия  Пирсона при проверке простой гипотезы

о согласии с нормальным законом при равновероятном группировании

и альтернативе, соответствующей логистическому закону

 

Рис. 6. Функции мощности критерия  Пирсона при проверке сложной гипотезы

 о согласии с нормальным законом при равновероятном группировании

и альтернативе, соответствующей логистическому закону

 

            В случае проверки сложной гипотезы и оценивании по выборке параметров гипотетического распределения функция мощности критерия Пирсона принимает наибольшее значение при минимально возможном числе интервалов  и далее монотонно убывает с ростом  (рис. 6).

            На рис. 7 отражены функции мощности критерия  Пирсона для вышеприведенной пары альтернатив при проверке простой гипотезы, а на рис. 8 при проверке сложной в случае применения асимптотически оптимального группирования. Здесь функции мощности представляют собой более интересную картину с провалами при  и . Эти провалы свидетельствуют о том, что при таких комбинациях граничных точек, не смотря на минимальные потери в информации Фишера, две рассматриваемые конкури­рующие гипотезы плохо различаются. При дальнейшем росте  происходит увеличение мощности критерия.

Рис. 7. Функции мощности критерия  Пирсона при проверке простой гипотезы

о согласии с нормальным законом при асимптотически оптимальном группировании

и альтернативе, соответствующей логистическому закону

 

Рис. 8. Функции мощности критерия  Пирсона при проверке сложной гипотезы

 о согласии с нормальным законом при асимптотически оптимальном группировании

и альтернативе, соответствующей логистическому закону

 

            Функция мощности критерия типа  Никулина, как следует из рис. 9, на области значений , содержащей максимальное значение мощности, является выпуклой вверх функцией.

 

Рис. 9. Функции мощности критерия типа  Никулина при проверке

сложной гипотезы о согласии с нормальным законом при равновероятном

группировании и альтернативе, соответствующей логистическому закону

 

            Отметим, что статистическое моделирование распределений статистик, которое проводилось нами в целях контроля результатов, полностью подтверждает аналитические расчеты, проиллюстрированные на приводимых рисунках.

Выводы   

            При проверке согласия опытного распределения с теоретической моделью нас в первую очередь должна интересовать возможность с помощью критерия уловить отклонения в наблюдаемых данных, которые говорят о предпочтительности некоторой другой доста­точно близкой к проверяемой модели, то есть возможность различать близкие гипотезы. Это означает, что мы должны использовать критерии, которые обладают наи­большей мощностью против близких альтернатив.

            Максимизировать мощность критериев  Пирсона и отношения правдоподобия [13] можно за счет двух факторов: выбирая в качестве способа разбиения на интервалы асимптотически оптимальное группирование [17-20] и подбирая “оптимальное” число интервалов .

            Мощность критерия Никулина можно максимизировать только за счет выбора “оптимального” числа интервалов, так как наиболее предпочтительным способом группирования, по-видимому, является разбиение на интервалы равной вероятности [25].

            Найти “оптимальное” число интервалов  для соответствующего критерия можно, максимизировав по  соотношение (3). При этом фиксируется пара конкурирующих гипотез, способ группирования, объем выборки  и вероятность ошибки первого рода .

            Мощность критериев  Пирсона и отношения правдоподобия часто оказывается максимальной против близких конкурирующих гипотез, если выборку раз­бивать на ми­нимально возможное число интервалов группирования. С ростом же числа ин­тервалов мощность критериев падает. Этот факт ускользает от внимания большинства иссле­дова­те­лей, использующих данный критерий, и совсем не упомина­ется в рекомендациях различного уровня.

            В некоторых ситуациях, то есть при конкретных парах конкурирующих гипотез, функции мощности критериев  Пирсона и отношения правдоподобия оказываются выпуклыми вверх по , и существует “оптимальное” значение числа интервалов. Однако это “оптимальное” значение обычно достаточно мало отличается от минимально возможного и незначительно изменяется в сторону увеличения при значительном росте объема выборки . Прослеживается зависимость “оптимальной” величины  не только от объёма выборки, пары конкурирующих гипотез, но и от способа группирования.

            Функция мощности критерия Никулина обычно оказывается выпуклой вверх по . Поэтому “оп­тимальное” число интервалов обычно существует. Это “оптимальное” значение растет с увеличением объема выборки. Но его величина также меньше значений, рекомендуемых любыми действующими регламенти­рующими документами и справочными источниками.

            И еще одно замечание. В последние годы в сознании многих исследователей сформировалось устоявшееся мнение о критериях типа  как о плохих критериях согласия. В этой связи естественным оказывается вопрос, зачем использовать критерии типа , если есть критерии Колмогорова и  Мизеса? Имеется, как минимум, две причины обосновывающие рекомендации применения критериев типа . Во-первых, с позиций наибольшей мощности против близких альтернатив в случае проверки простых гипотез и использовании в критериях типа  асимптотически оптимального группирования критерии типа  оказываются предпочти­тельнее критериев Колмогорова и  Мизеса [25]. При проверке простых гипотез наблюдается следующий порядок предпочтения (по мощности):

типа   Колмогорова   Мизеса.

При проверке сложных гипотез порядок предпочтения меняется:

типа  Мизеса  типа Колмогорова  Никулина   Пирсона.

Однако отсюда и вытекает вторая причина: критерии типа Колмогорова и типа  Мизеса при проверке сложных гипотез теряют “свободу от распределения”. В то время как для критериев Никулина и  Пирсона предельные распределения статистик при проверке сложных гипотез известны. Конечно, для некоторых частных случаев различными способами получены модели предельных распределений статистик критериев типа Колмогорова, типа  и  Мизеса. Наиболее широко, по-видимому, они представлены в [29,30]. Однако это далеко не снимает остроту проблемы. Есть и третий довод. Критерии согласия используют различные меры близости распределений, по-разному улавливают различные отклонения в наблюдаемых данных от предполагаемых законов распределений. Поэтому не следует обеднять методику статистического анализа, отказываясь от какого-либо из зареко­мендо­вавших себя критериев. Лучше всего использовать их совокупность.

 

ЛИТЕРАТУРА

1.      Новицкий П.В., Зограф И.А. Оценка погрешностей результатов из­ме­рений. - Л.: Энергоатомиздат, 1991. - 303 с.

2.      Cochran W.G. Some Methods of Strengthening the Common  Tests // Biometrics, 1954. V. 10. - P. 417.

3.      Mann H.B., Wald A. On the choice of the number of intervals in the application of the chi-square test // Ann. Math. Stat., 1942. V. 13. - P. 478-479.

4.      Mann H.B., Wald A. On the choice of the number of class intervals in the application of the chi square test // Ann. Math. Stat., 1942. V. 13. - P. 306-317.

5.      Sturgess H.A. The choice of classic intervals // J. Am. Statist. Assoc. - march 1926. - 47 p.

6.      Шторм Р. Теория вероятностей. Математическая статистика. Статис­тический контроль качества. - М.: Мир, 1970. - 368 с.

7.      Heinhold I., Gaede K.W. Ingeniur statistic. - München; Wien, Springler Verlag, 1964. - 352 s.

8.      Таушанов З., Тонева Е., Пенова Р. Вычисление энтропийного коэф­фи­циента при малых выборках // Изобретательство, стандартизация и качество, 1973. № 5. - София.

9.      Тонева Е. Аппроксимация распределений погрешности средств из­ме­рений // Измерительная техника, 1981. № 6. - С. 15-16.

10.  Алексеева И.У. Теоретическое и экспериментальное исследование за­конов распределения погрешностей, их классификация и методы оценки их параметров: Автореф. дис. на соиск. учен. степени кан. техн. наук. - Л., 1975. - 20 с.

11.  Бурдун Г.Д., Марков Б.Н. Основы метрологии. - М.: Изд-во стандартов, 1985. - 120 с.

12.  Ченцов Н.Н. Статистические решающие правила и оптимальные выводы. - М.: Наука, 1972. - 520 с.

13.  Кендалл М., Стьюарт А. Статистические выводы и связи. - М.: Нау­ка, 1973. - 900 с.

14.  Крамер Г. Математические методы статистики. - М.: Мир, 1975. - 648 с.

15.  Birch M.W. A new proof of the Pearson–Fisher theorem // Ann. Math. Statist. – 1964. V. 35. – P. 817.

16.  Лемешко Б.Ю., Постовалов С.Н. О зависимости предельных распреде­ле­ний ста­тистик  Пирсона и отношения правдоподобия от способа группи­рования данных // Заводская лаборатория. 1998. Т. 64. – № 5. – С.56-63.

17.  Денисов В.И., Лемешко Б.Ю., Цой Е.Б. Оптимальное груп­пи­рование, оценка параметров и планирование регрессионных экспериментов: В 2 ч. / Новосиб. гос. техн. ун-т. - Новосибирск, 1993. – 346 с.

18.  Лемешко Б.Ю. Асимптотически оптимальное группирование наблю­де­ний - это обеспечение максимальной мощности критериев // Надеж­ность и контроль качества. – 1997. – № 8. – С. 3-14.

19.  Лемешко Б.Ю. Асимптотически оптимальное группирование наблю­де­ний в критериях согласия // Заводская лаборатория, 1998. Т. 64. – №1. – С.56-64.

20.  Денисов В.И., Лемешко Б.Ю., Постовалов С.Н. Прикладная статис­тика. Правила проверки согласия опытного распределения с тео­ретическим. Мето­­дические реко­мен­дации. Часть I. Критерии типа  . – Новоси­бирск: Изд-во НГТУ, 1998. – С. 126.

21.  Никулин М.С. О критерии хи-квадрат для непрерывных распределений // Теория вероятностей и её применение. 1973. Т.XVIII. – № 3. – С.675-676.

22.  Никулин М.С. Критерий хи-квадрат для непрерывных распределений с параметрами сдвига и масштаба // Теория вероятностей и ее приме­нение. 1973. Т. XVIII. – № 3. – С.583-591.

23.  Мирвалиев М., Никулин М.С. Критерии согласия типа хи-квадрат // За­водская лаборатория. 1992. Т. 58. – № 3. – С.52-58.

24.  Aguirre N., Nikulin M. Chi-squared goodness-of-fit test for the family of logistic distributions // Kybernetika. 1994. V. 30. – № 3. – P.214-222.

25.  Лемешко Б.Ю., Постовалов С.Н., Чимитова Е.В. О распределениях статистики и мощности критерия типа  Никулина // “Заводская лаборатория. Диагностика материалов”, 2001. Т. 67. – №5. (в печати).

26.  Чибисов Д.М., Гванцеладзе Л.Г. О критериях согласия, основанных на группированных данных // III советско-японский симпозиум по теории вероятностей. Ташкент: изд-во “Фан”, 1975. – С. 183-185.

27.  Боровков А.А. О мощности критерия  при увеличении числа групп // Теория вероятностей и ее применение. 1977. Т. XXII. – № 2. – С.375-378.

28.  Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. - М.: Наука, 1983. - 416 с.

29.  Лемешко Б.Ю., Постовалов С.Н. О распределениях статистик непара­метрических крите­риев согласия при оценивании по выборкам параметров наблюдаемых законов // Заво­дская лаборатория. 1998. – № 3. – С. 61-72.

30.  Лемешко Б.Ю., Постовалов С.Н. Прикладная статис­тика. Правила проверки согласия опытного распределения с тео­ретическим. Мето­ди­ческие рекомендации. Часть II. Непараметрические критерии. – Новосибирск: Изд-во НГТУ, 1999. –  85 c.

 


Таблица 3

Теоретические значения мощности критерия  Пирсона в случае проверки простой гипотезы о согласии с нормальным законом  при равновероятном группировании и альтернативе, соответствующей логистическому закону

 

k

n=50

n=100

n=200

n=300

n=400

n=500

n=600

n=700

n=800

n=900

n=1000

n=2000

3

0,1389

0,1784

0,2577

0,3353

0,4095

0,4793

0,5438

0,6026

0,6558

0,7033

0,7455

0,9548

4

0,1384

0,1781

0,2595

0,3409

0,4196

0,4939

0,5625

0,6248

0,6806

0,7299

0,7730

0,9693

5

0,1346

0,1709

0,2465

0,3236

0,3995

0,4723

0,5405

0,6032

0,6601

0,7109

0,7557

0,9659

6

0,1313

0,1643

0,2339

0,3059

0,3779

0,4480

0,5146

0,5768

0,6339

0,6856

0,7319

0,9593

7

0,1286

0,1590

0,2235

0,2911

0,3595

0,4268

0,4916

0,5528

0,6097

0,6618

0,7090

0,9519

8

0,1266

0,1549

0,2153

0,2791

0,3443

0,4092

0,4722

0,5324

0,5888

0,6411

0,6888

0,9446

9

0,1250

0,1516

0,2088

0,2695

0,3320

0,3947

0,4561

0,5152

0,5712

0,6233

0,6714

0,9379

10

0,1237

0,1490

0,2035

0,2617

0,3219

0,3827

0,4427

0,5009

0,5562

0,6083

0,6565

0,9318

11

0,1227

0,1469

0,1991

0,2552

0,3135

0,3727

0,4315

0,4887

0,5435

0,5954

0,6437

0,9262

12

0,1218

0,1451

0,1955

0,2498

0,3065

0,3642

0,4219

0,4783

0,5326

0,5842

0,6326

0,9213

13

0,1211

0,1436

0,1924

0,2451

0,3004

0,3570

0,4136

0,4693

0,5232

0,5745

0,6229

0,9168

14

0,1204

0,1423

0,1898

0,2411

0,2952

0,3507

0,4064

0,4615

0,5149

0,5660

0,6143

0,9128

15

0,1199

0,1412

0,1874

0,2377

0,2906

0,3452

0,4001

0,4546

0,5076

0,5585

0,6067

0,9091

16

0,1194

0,1402

0,1854

0,2346

0,2866

0,3403

0,3945

0,4484

0,5010

0,5517

0,5999

0,9058

17

0,1190

0,1393

0,1836

0,2319

0,2830

0,3359

0,3895

0,4429

0,4951

0,5456

0,5937

0,9027

18

0,1186

0,1386

0,1820

0,2294

0,2797

0,3319

0,3849

0,4378

0,4898

0,5401

0,5881

0,8998

19

0,1183

0,1379

0,1806

0,2272

0,2768

0,3283

0,3808

0,4333

0,4849

0,5350

0,5830

0,8972

20

0,1180

0,1372

0,1792

0,2252

0,2741

0,3251

0,3770

0,4291

0,4804

0,5303

0,5782

0,8947

21

0,1177

0,1366

0,1780

0,2233

0,2717

0,3220

0,3735

0,4252

0,4763

0,5260

0,5738

0,8924

22

0,1174

0,1361

0,1769

0,2216

0,2694

0,3192

0,3703

0,4216

0,4724

0,5219

0,5696

0,8902

23

0,1172

0,1356

0,1759

0,2200

0,2673

0,3166

0,3673

0,4182

0,4688

0,5182

0,5658

0,8881

24

0,1170

0,1352

0,1749

0,2186

0,2653

0,3142

0,3644

0,4151

0,4654

0,5146

0,5621

0,8861

25

0,1168

0,1347

0,1740

0,2172

0,2634

0,3119

0,3618

0,4121

0,4622

0,5112

0,5587

0,8842

26

0,1166

0,1343

0,1732

0,2159

0,2617

0,3098

0,3593

0,4093

0,4591

0,5080

0,5554

0,8824

27

0,1164

0,1339

0,1724

0,2147

0,2601

0,3077

0,3569

0,4066

0,4563

0,5050

0,5523

0,8806

28

0,1162

0,1336

0,1716

0,2135

0,2585

0,3058

0,3546

0,4041

0,4535

0,5021

0,5493

0,8789

29

0,1160

0,1333

0,1709

0,2124

0,2570

0,3040

0,3525

0,4017

0,4509

0,4993

0,5465

0,8772

30

0,1159

0,1329

0,1703

0,2114

0,2556

0,3023

0,3504

0,3994

0,4484

0,4967

0,5437

0,8756

 

Таблица 4

Теоретические значения мощности критерия  Пирсона в случае проверки сложной гипотезы о согласии с нормальным законом при равновероятном группировании и альтернативе, соответствующей логистическому закону

 

k

n=50

n=100

n=200

n=300

n=400

n=500

n=600

n=700

n=800

n=900

n=1000

n=2000

4

0,1688

0,2355

0,3600

0,4708

0,5669

0,6488

0,7175

0,7744

0,8209

0,8587

0,8890

0,9920

5

0,1507

0,2021

0,3043

0,4019

0,4921

0,5734

0,6451

0,7072

0,7604

0,8053

0,8427

0,9858

6

0,1416

0,1847

0,2730

0,3607

0,4446

0,5228

0,5941

0,6577

0,7138

0,7624

0,8041

0,9787

7

0,1360

0,1737

0,2524

0,3324

0,4109

0,4857

0,5554

0,6190

0,6762

0,7269

0,7713

0,9712

8

0,1322

0,1661

0,2378

0,3119

0,3858

0,4574

0,5252

0,5882

0,6458

0,6976

0,7436

0,9637

9

0,1294

0,1606

0,2270

0,2964

0,3665

0,4353

0,5013

0,5634

0,6209

0,6732

0,7204

0,9567

10

0,1273

0,1564

0,2186

0,2843

0,3513

0,4177

0,4820

0,5431

0,6003

0,6529

0,7007

0,9501

11

0,1257

0,1531

0,2120

0,2747

0,3390

0,4033

0,4661

0,5263

0,5830

0,6357

0,6839

0,9441

12

0,1244

0,1505

0,2067

0,2668

0,3289

0,3913

0,4528

0,5121

0,5684

0,6210

0,6695

0,9386

13

0,1233

0,1483

0,2023

0,2602

0,3204

0,3813

0,4415

0,5000

0,5558

0,6083

0,6570

0,9336

14

0,1225

0,1465

0,1986

0,2546

0,3132

0,3727

0,4318

0,4896

0,5449

0,5972

0,6460

0,9291

15

0,1217

0,1449

0,1954

0,2499

0,3069

0,3652

0,4234

0,4804

0,5353

0,5875

0,6363

0,9249

16

0,1210

0,1436

0,1926

0,2457

0,3015

0,3587

0,4160

0,4724

0,5269

0,5788

0,6276

0,9210

17

0,1205

0,1424

0,1902

0,2421

0,2967

0,3529

0,4094

0,4652

0,5193

0,5710

0,6198

0,9175

18

0,1200

0,1414

0,1880

0,2388

0,2925

0,3477

0,4035

0,4587

0,5124

0,5639

0,6127

0,9142

19

0,1195

0,1405

0,1861

0,2359

0,2886

0,3431

0,3982

0,4528

0,5062

0,5575

0,6062

0,9111

20

0,1191

0,1396

0,1844

0,2333

0,2852

0,3389

0,3933

0,4475

0,5005

0,5517

0,6003

0,9083

21

0,1188

0,1389

0,1829

0,2309

0,2820

0,3350

0,3889

0,4426

0,4953

0,5462

0,5948

0,9056

22

0,1184

0,1382

0,1814

0,2287

0,2791

0,3315

0,3848

0,4381

0,4905

0,5412

0,5897

0,9030

23

0,1181

0,1376

0,1801

0,2267

0,2764

0,3282

0,3810

0,4339

0,4860

0,5365

0,5850

0,9006

24

0,1178

0,1370

0,1789

0,2249

0,2740

0,3252

0,3775

0,4300

0,4818

0,5322

0,5805

0,8983

25

0,1176

0,1365

0,1778

0,2232

0,2717

0,3223

0,3742

0,4263

0,4779

0,5281

0,5763

0,8961

26

0,1173

0,1360

0,1768

0,2216

0,2695

0,3197

0,3711

0,4229

0,4742

0,5242

0,5723

0,8939

27

0,1171

0,1355

0,1758

0,2201

0,2675

0,3172

0,3682

0,4197

0,4707

0,5205

0,5686

0,8919

28

0,1169

0,1351

0,1749

0,2187

0,2656

0,3149

0,3655

0,4166

0,4673

0,5170

0,5650

0,8899

29

0,1167

0,1347

0,1740

0,2173

0,2638

0,3127

0,3629

0,4137

0,4642

0,5137

0,5616

0,8880

30

0,1165

0,1343

0,1732

0,2161

0,2621

0,3106

0,3604

0,4109

0,4612

0,5106

0,5584

0,8862

 

 

Таблица 5

Теоретические значения мощности критерия  Пирсона в случае проверки простой гипотезы о согласии с нормальным законом  при асимптотически оптимальном группировании и альтернативе, соответствующей логистическому закону

 

k

n=50

n=100

n=200

n=300

n=400

n=500

n=600

n=700

n=800

n=900

n=1000

n=2000

3

0,12916

0,15868

0,21819

0,27740

0,33541

0,39151

0,44520

0,49610

0,54397

0,58868

0,63016

0,88864

4

0,10858

0,11726

0,13486

0,15275

0,17088

0,18920

0,20767

0,22624

0,24486

0,26351

0,28215

0,46133

5

0,13512

0,17194

0,24874

0,32696

0,40386

0,47741

0,54618

0,60929

0,66629

0,71705

0,76172

0,96801

6

0,13081

0,16331

0,23185

0,30284

0,37390

0,44315

0,50915

0,57089

0,62774

0,67936

0,72565

0,95678

7

0,13873

0,18034

0,26907

0,36049

0,45003

0,53438

0,61137

0,67981

0,73932

0,79008

0,83266

0,98867

8

0,13919

0,18166

0,27297

0,36760

0,46037

0,54751

0,62657

0,69627

0,75623

0,80674

0,84850

0,99176

9

0,14210

0,18820

0,28803

0,39138

0,49167

0,58429

0,66647

0,73703

0,79594

0,84394

0,88225

0,99598

10

0,14307

0,19058

0,29411

0,40154

0,50549

0,60079

0,68448

0,75538

0,81366

0,86033

0,89685

0,99732

11

0,14443

0,19380

0,30198

0,41428

0,52234

0,62042

0,70536

0,77614

0,83320

0,87791

0,91210

0,99833

12

0,14495

0,19519

0,30581

0,42090

0,53143

0,63123

0,71700

0,78775

0,84411

0,88767

0,92048

0,99879

13

0,14591

0,19753

0,31168

0,43049

0,54407

0,64579

0,73221

0,80250

0,85760

0,89943

0,93030

0,99919

14

0,14645

0,19892

0,31545

0,43688

0,55267

0,65578

0,74268

0,81264

0,86681

0,90738

0,93687

0,99941

15

0,14692

0,20016

0,31882

0,44262

0,56039

0,66471

0,75197

0,82154

0,87481

0,91420

0,94243

0,99956

 


Таблица 6

Теоретические значения мощности критерия  Пирсона в случае проверки сложной гипотезы о согласии с нормальным законом  при асимптотически оптимальном группировании и альтернативе, соответствующей логистическому закону

 

k

n=50

n=100

n=200

n=300

n=400

n=500

n=600

n=700

n=800

n=900

n=1000

n=2000

4

0,11583

0,13157

0,16276

0,19351

0,22376

0,25344

0,28252

0,31095

0,33870

0,36575

0,39208

0,61395

5

0,15143

0,20361

0,30721

0,40603

0,49713

0,57894

0,65088

0,71306

0,76601

0,81056

0,84763

0,98679

6

0,14098

0,18345

0,27049

0,35701

0,44003

0,51754

0,58832

0,65178

0,70780

0,75659

0,79860

0,97715

7

0,14856

0,19996

0,30658

0,41205

0,51096

0,60007

0,67785

0,74399

0,79903

0,84397

0,88009

0,99431

8

0,14732

0,19805

0,30478

0,41168

0,51263

0,60382

0,68334

0,75072

0,80644

0,85157

0,88747

0,99558

9

0,14946

0,20318

0,31728

0,43169

0,53884

0,63416

0,71557

0,78284

0,83689

0,87929

0,91187

0,99782

10

0,14960

0,20397

0,32048

0,43796

0,54797

0,64540

0,72795

0,79542

0,84892

0,89024

0,92145

0,99850

11

0,15037

0,20607

0,32630

0,44783

0,56122

0,66080

0,74417

0,81127

0,86354

0,90310

0,93233

0,99905

12

0,15033

0,20637

0,32815

0,45178

0,56715

0,66816

0,75221

0,81932

0,87105

0,90975

0,93794

0,99929

13

0,15089

0,20793

0,33256

0,45933

0,57726

0,67979

0,76425

0,83082

0,88137

0,91855

0,94514

0,99952

14

0,15105

0,20859

0,33496

0,46385

0,58362

0,68731

0,77214

0,83841

0,88819

0,92434

0,94984

0,99964

15

0,15120

0,20918

0,33714

0,46797

0,58940

0,69410

0,77923

0,84516

0,89419

0,92937

0,95386

0,99973

 

 



[1] Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 00-01-00913)

 

 

[Содержание]