2.8 Выбор числа интервалов

 

Число интервалов группирования, используемое при вычислении оценок параметров, построении гистограмм, вычислении статистик типа отношения правдоподобия или c2 Пирсона колеблется в очень широких пределах. Боль­шинство рекомендуемых формул для оценки числа интервалов k носит эмпи­рический характер и обычно дает завышенные значения.

Определение числа интервалов связано с объемом выборки. Целый ряд рекомендаций из различных источников по выбору числа интервалов k дан в [25].

При выборе интервалов равной длины определяющим является требова­ние, чтобы число наблюдений, попавших в интервалы, было не слишком ма­лым и сравнимым. Такое требование выдвигают в связи с опасением, что в противном случае распределение статистики типа c2 не будет являться c2r –распределением. При этом наиболее часто рекомендуют, чтобы число наблюде­ний, попавших в интервал, было не менее 10. В [26] отмечено, что на практике допустимо, чтобы число наблюдений в крайних интервалах было менее пяти. В работах [21], [27], посвященных изучению мощности критерия c2 Пирсона, в случае унимодального распределения допускается уменьшение ожидаемых частот попадания наблюдений для одного или двух интервалов до 1 и даже ниже. Статистическое моделирование подтверждает, что и в такой ситуации распределения статистик типа c2 хорошо согласуются с соответствующими c2r –распределениями.

Во многих источниках, например в [28], можно найти упоминание эври­стической формулы Старджесса для определения “оптимального” числа ин­тервалов

k=log2 N+1=3,3lgN+1.

В [29] для определения “оптимального” числа интервалов рекомендуют формулу Брукса и Каррузера

k=5lgN

В [30] рекомендуют соотношение

.

В [27] для равновероятных интервалов их число устанавливают порядка

,

где t – квантиль стандартного нормального распределения для заданного уровня значимости. В ряде работ приводят модификации данной формулы. В [31] предлагают значение

k=4lgN,

а в [32] – дальнейшее развитие этого соотношения

k=5lgN-5.

В исследовании [33] получено соотношение

,

где À - значение контрэксцесса ().

При больших объемах выборок N разброс значений k, задаваемых раз­личными формулами, достаточно велик. Поэтому на практике при выборе числа интервалов больше руководствуются тем, чтобы в интервалы попадало число наблюдений не менее 5-10. Так, например, в рекомендациях ВНИИМет­рологии [34] в зависимости от  N предлагают следующие значения k:

N

k

40–100

7–9

100–500

8–12

500–1000

10–16

1000–10000

12–22

Все вышеперечисленные рекомендации опирались на предположение, что k следует выбирать таким образом, чтобы вид гистограммы был как можно ближе к плавной кривой плотности распределения генеральной сово­купности. В [35] показано, что уклонение гистограммы от плотности распре­деления в лучшем случае имеет порядок , достигаемый при числе ин­тервалов k порядка .

Очевидно, что “оптимальное” значение k зависит не только от объема выборки, но и от вида закона распределения и от способа группирования.

При асимптотически оптимальном группировании относительно скаляр­ного параметра при 10-11 интервалах в группированной выборке сохраняется около 98% информации, при оптимальном группировании относительно век­тора параметров (два параметра) для 15 интервалов – около 95%. Даль­нейшее увеличение числа интервалов существенного значения не имеет.

Конкретное число интервалов при асимптотически оптимальном груп­пировании выбирают, исходя из следующих соображений. При оптимальном группировании вероятности попадания в интервалы в общем случае не равны. Обычно минимальны вероятности попадания в крайние интервалы. Поэтому k желательно выбирать из условия NPi(q) ³5-10 для любого интервала при опти­мальном группировании. По крайней мере, мини­мальная ожидаемая час­тота должна быть больше 1. В случае использования равновероятного груп­пирования порядок k должен быть примерно таким же, как и при асимптоти­чески оптимальном группировании.

Все наиболее разумные рекомендации по выбору числа интервалов, в том числе по выбору числа интервалов в случае асимптотически оптималь­ного группирования, исходят из того, чтобы при данном N приблизить плот­ность распределения ее непараметрической оценкой (гистограммой) как можно лучше. Но ни одни из рекомендаций, за исключением [21], [27], не под­ходят к выбору k с позиций мощности критерия согласия! Не опираются на требование построения наиболее мощного критерия при близких конкури­рующих гипотезах.

Хотя известно, что при заданном объеме выборки, заданных конкури­рующих гипотезах H0 и H1, выбранном способе группирования и фиксиро­ванном уровне значимости a с ростом числа интервалов k мощ­ность крите­риев c2 Пирсона и отношения правдоподобия падает [36], [37].

Об изменении мощности критерия c2 Пирсона с ростом числа интерва­лов при проверке простой гипотезы можно судить по рисунку 10. Через X2N обозначена статистика, вычисляемая в соответствии с формулой (1). На ри­сунке 10 представлены полученные экспериментально распределения стати­стики Gk(X2N|H0) и Gk(X2N|H1) при числе интервалов k=7,10,15,20 и объ­еме выборки N=500, когда гипотеза H0 соответствует нормальному закону, а H1 – логистическому (два очень близких закона). Для k=7  на рисунке при­ведены распределения при равновероятном G7РВГ(X2N|H1) и асимптотически оптимальном G7АОГ(X2N|H1)  группировании. Ордината нижнего конца соответ­ствующей вертикальной черты определяет значение b (вероятность ошибки 2-го рода) при уровне значимости a=0,1 для соответствующего числа интер­валов. Мощность равна 1- b. Как видно, в полном соответствии с результа­тами работ [36], [37] при увеличении числа интервалов мощность критерия па­дает.

Рисунок 10 – Распределения статистики X2N  при проверке простой гипотезы

(H0 – нормальный закон, H1 – логистический закон, k=7,10,15,20)

 

Рисунок 11 – Распределения статистики X2N при проверке сложной гипотезы 

(H0 – нормальный закон, H1 – логистический закон, k=7,10,15,20)

 

Рисунок 12 – Распределения статистики Y2N  при проверке сложной гипотезы

(H0 – нормальный закон, H1 – логистический закон, k=7,10,15,20)

 

Аналогичные изменения мощности критерия для статистики X2N в за­ви­симости от числа интервалов при проверке сложной гипотезы иллюстрирует рисунок 11. Здесь также с ростом k мощность критерия падает.

Мощность критерия Никулина с использованием статистики Y2N с рос­том k уменьшается существенно медленней (рисунок 12) и она выше, чем мощность критерия c2 Пирсона.

В таблице 2 представлены значения мощности критериев c2 Пирсона и типа c2 Никулина при рассматриваемой паре альтернатив (H0 – нормальный закон, H1 – логистический закон) при различном числе интервалов k в случае простых и сложных гипотез. В колонке 2 приведены значения мощности кри­терия c2 Пирсона при проверке простой гипотезы, полученные по результа­там моделирования (экспериментально). В колонке 3 приведены теоретические значения мощности, вычисленные при условии, что G(X2N|H0) представляет собой c2k-1 –распределение, а G(X2N|H1) – соответствующее нецентральное распределение. Колонка 4 содержит значения мощности критерия c2 Пирсона при проверке сложной гипотезы, полученные по результатам моделирования при использовании ОМП по негруппированным наблюдениям. В колонке 5 приведены теоретические значения мощности критерия c2 Пирсона при про­верке сложной гипотезы, вычисленные при условии, что G(X2N|H0)  представ­ляет собой c2k-3 -распределение (оценки параметров вычисляют при миними­зации статистики X2N), а G(X2N|H1)  – соответствующее нецентральное рас­пределение. В колонке 6 приведены значения мощности критерия Никулина, полученные в результате моделиро­вания распределений статистики Y2N, а в колонке 7 – расчетные значения мощности этой статистики при рассматри­ваемой паре гипотез H0  и H1.

В таблице 2 приведены значения мощности критериев для k от 6 до 30. Проследив изменение мощности критериев при k <6, можно убедиться, что, если мощность критерия c2 Пирсона с уменьшением числа интервалов про­должает возрастать, то мощность критерия Никулина со статистикой Y2N при k £6  начинает падать. Это свидетельствует о том, что для критерия Никулина существует оптимальное число интервалов, при котором его мощность мак­симальна.

В [38] мощность критериев типа c2 в зависимости от выбираемого числа интервалов k была исследована при различных проверяемых гипотезах H0 и различных альтернативах H1 при различных объемах выборок. Величина мощности для критериев типа c2 может быть вычислена в соответствии с формулой [39]:

,         (20)

где v – параметр нецентральности, определяемый формулами (3), (7) или (15), c2r,a – представляет собой (1-a) -процентную точку c2r -распределения с r степенями свободы (b – заданная вероятность ошибки первого рода, b – вероятность ошибки второго рода). Максимальную мощность критерии c2 Пирсона и отношения правдопо­добия зачастую имеют или при минимально возможном числе интервалов, определяемом условием r= k-m-1 ³1 , или при оптимальном числе интервалов, близком к минимально возможному. Оптимальное число интервалов для критерия Никулина обычно больше, чем для критериев c2 Пирсона и отношения правдопо­добия, и не пре­вышает значения .

 

Таблица 2 – Значения мощности критериев c2 Пирсона и типа c2 Нику­лина при уровне значимости a=0,1 (H0 – нормальный закон, H1 – логистический закон)

 

 

 

 

k

В случае простой

 Гипотезы

В случае сложной гипотезы

Для статистики X2N = Y2N

Для статистики X2N

Для статистики Y2N

 

По результатам моделиро­ва­ния

 

 

Теорети­че­ская

По результатам моделиро­вания (при использова­нии ОМП)

Теорети­че­ская (при ис­пользова­нии оценок  minX2N)

 

По результатам моделиро­вания

 

 

Теорети­че­ская

1

2

3

4

5

6

7

6

0.46

0.449

0.53

0.526

0.70

0.739

7

0.43

0.427

0.49

0.488

0.71

0.750

8

0.42

0.409

0.45

0.459

0.71

0.755

9

0.38

0.395

0.43

0.436

0.71

0.756

10

0.38

0.383

0.43

0.418

0.71

0.756

11

0.37

0.373

0.41

0.403

0.71

0.754

12

0.35

0.364

0.41

0.391

0.70

0.752

13

0.35

0.357

0.38

0.381

0.70

0.749

14

0.34

0.351

0.38

0.373

0.69

0.746

15

0.33

0.345

0.38

0.365

0.69

0.742

16

0.33

0.340

0.38

0.359

0.69

0.738

17

0.32

0.336

0.37

0.353

0.69

0.734

18

0.32

0.332

0.37

0.348

0.69

0.730

19

0.32

0.328

0.35

0.343

0.68

0.726

20

0.31

0.325

0.35

0.339

0.68

0.722

21

0.31

0.322

0.34

0.335

0.67

0.718

22

0.31

0.319

0.34

0.331

0.67

0.714

23

0.31

0.317

0.34

0.328

0.66

0.710

24

0.30

0.314

0.34

0.325

0.66

0.707

25

0.30

0.312

0.34

0.322

0.66

0.703

26

0.30

0.310

0.33

0.320

0.65

0.699

27

0.30

0.308

0.33

0.317

0.65

0.695

28

0.30

0.306

0.32

0.315

0.65

0.692

29

0.30

0.304

0.32

0.313

0.65

0.688

30

0.30

0.302

0.32

0.310

0.65

0.684

 

Таким образом, выбирая число интервалов в критериях типа c2, следует осознавать, что увеличение их числа не приводит к росту мощности критерия. Рекомендуется выбирать число интервалов k так, чтобы для любого интервала при оптимальном группировании выполнялось условие NPi(q)³5¸10. По крайней мере, минимальная ожидаемая  частота должна быть больше 1. При этом следует опираться на соответствующую таблицу асимптотически опти­мального группирования из приложения А. Указания на соответствующую таблицу асимптотически оптимального группирования даны в таблице 3. Снизу значение k ограничено условием k³m+2.

Если заданы конкретная альтернатива и объем выборки N, можно выбрать оптимальное число интервалов k так, чтобы максимизировать соотношение (20).

 

[Предыдущая][Содержание][Следующая]