3. РОБАСТНОЕ ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ

3.1. Способы вычисления робастных оценок

3.2. Группирование наблюдений как способ получения робастных оценок

Выводы

3.3. Функции влияния и робастность оценок

Выводы

 

См. также: Прикладная математическая статистика (материалы к семинарам)

 

3. РОБАСТНОЕ ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ

 

3.1. Способы вычисления робастных оценок

 

          В статистике под робастностью понимают нечувствительность к малым отклонениям от предположений [178]. Естественно, что при условии сохранения хороших качеств оценок лучше всего использовать робастные методы оценивания.

          В выборке могут присутствовать отклонения от предположений двух видов. Допус­тим, что наблюдаемая выборка действительно принадлежит тому закону распределения, оценки которого мы пытаемся найти. В этом случае от­клонения могут быть связаны с наличием аномальных наблю­дений, появ­ление которых в выборке определяется самыми различными при­чинами, в том числе засорением значениями, принадлежащими другому закону. Если не учитывать наличие аномальных наблюдений, попытки оценивания параметров распределения могут привести к самым плачевным резуль­татам. Что же делать? Естественно, надо отбраковать аномальные изме­рения, а затем искать оценки параметров. К сожалению, реализовать от­браковку наблюдений в общем случае оказывается совсем не просто. Наблюдения, аномальные с позиций одного закона распределения, явля­ются естественным проявлением закономерностей второго. Если нет на­дежной процедуры отбраковки или практических соображений, связанных с физикой наблюдаемой величины, пытаются выйти из по­ло­жения одним из следующих способов. В первом случае усекают выборку, отбрасывая определенную часть минимальных и/или максимальных на­блюдений, и по оставшейся части оценивают параметры распределения, то есть используют так называемые -урезанные оценки (отбрасывается  наименьших и  наиболь­ших значений выборки [184]). Во втором - перед процедурой оценивания вин­зорируют выборку [178]: всем наблюдениям левее и/или правее опре­деленных значений присваивают одинаковые значения. Эти два подхода используются при обработке наблюдений ещё с XIX века и связаны с именами Пуанкаре [51] и Винзора [272]. Обе эти процедуры далеко не всегда приводят к положительным резуль­татам. Кроме того, в обоих случаях мы имеем дело с новой гене­раль­ной совокупностью, которой принадлежит видоизмененная выборка. Более пра­вильным следует считать третий подход, когда выборку цензурируют. Для наблюдений, попавших левее и/или правее опреде­ленных значений, фик­сируют лишь факт по­па­дания в соответствующий интервал, опуская кон­кретные значения этих наблю­дений. По такой цензу­рированной вы­борке оценивают параметры закона.

          Другая ситуация. В выборке нет аномальных наблюдений, но наблю­даемый закон распределения отличается от предполагаемого. Такая ситу­ация присутствует практически всегда, так как множество законов рас­пределения вероят­ностей бесконечно, а количество моделей, используемых на практике для описания наблюдаемых случайных величин, очень огра­ничено. Чем сущес­твенней вид предполагаемой модели отличается от реально наблюдаемого закона, тем сильнее это отражается на оценках параметров.

          Очевидно, что в наблюдаемых на практике выборках и за­кон, пусть мало, но отличается от используемой модели, и обычно налицо аномальные наблюдения. Поэтому при­ме­нение цензурирования, одно­сторонннего или двустороннего, далеко не всегда приносит желаемый эффект.

          Вопросам построения и исследования робастных оценок посвящено очень много работ (см., например [178,147]). В данном случае не пре­сле­довалась цель анализа всей совокупности подходов и методов построения робастных методов оценивания. Анализируются только свойства робаст­ности оценок максимального правдоподобия по группированным и негруп­пированным наблюдениям.

 

3.2. Группирование наблюдений как способ получения робастных оценок

 

          В работах [76,81,85] подчеркивается высокая устойчивость оценок мак­си­мального правдоподобия по группированным наблюдениям к нали­чию в выборке аномальных измерений, к отклонению реально наблю­даемого за­кона от предполагаемого, к засорению выборки данными, при­надлежащими другому закону. Это подтверждается опытом эксплу­атации программной системы [76] и многочисленными результатами модель­ных экспериментов.

          Метод максимального правдоподобия является одним из наиболее популярных и эффективных методов оценивания параметров распре­де­ле­ний. Достаточно часто приходится сталкиваться с необоснованными утвер­жде­ниями, что оцен­ки максимального правдоподобия являются ро­бастными и, именно поэтому, предпочтительно использовать именно их. Автор является сторонником широкого использования метода максималь­ного правдо­подо­бия, но вместе с тем, основываясь на достаточно большом практическом опыте и результатах этого и следующего параграфа, обязан подчеркнуть, возможно очевидное для многих, что в общем случае ОМП параметров распределений не являются робастными.

          Проиллюстрируем сказанное следующими примерами. Это мож­но бы­ло бы сделать с одинаковым эффектом на различных законах рас­пре­деления, но, учитывая роль нормального распределения в теории и при­ложениях математической статистики, приведем примеры именно с нор­мальным законом. В первом примере иллюстрируется влияние аномальных ошибок на ОМП параметров нор­мального распре­де­ления, а во втором параметры нормального закона оце­ниваются по вы­борке, принадлежащей другому закону распределения. Для чистоты экспе­римента выборки моделируются в соответствии с заданными законами.

Пример 3.2.1.   Выборка по нор­мальному закону моделировалась с матема­тическим ожиданием  и среднеквад­рати­чес­ким отклонением . На рис. 3.2.1 приведены результаты статистического анализа смодели­ро­ванной выборки. Вычисленные значения ОМП  и . На этом и последующем аналогичных рисунках приведены значения ста­тистик отношения правдоподобия,  Пирсона, Колмогорова, Смирнова,  и  Мизеса, вычисляемые при проверке гипотез о согласии, и соот­вет­ствующие вероятности вида , где  - вычис­лен­ное значение соответствующей статистики,  - предельное распределе­ние вероятностей для статистики. Гипотеза о согласии не отвергается, если , где  - заданный уровень значимости. Для ста­тистик отношения правдоподобия и  Пирсона значения вероятностей при­во­дятся при двух различных степенях свободы. Разность степеней свободы определяется количеством параметров, оцененных по выборке. При вычис­лении вероятностей вида  для непараметрических критериев ти­па Колмогорова, Смирнова,  и  Мизеса учитывается факт потери ими свойства “свободы от распре­деления” [97]. Как видим, согласие с нор­мальным законом очень хорошее.

 

 

Рис.3.2.1. Результаты статистического анализа исходной выборки по негруппированным данным

 

          Теперь допустим, что в выборку “вкралось” всего 3 аномальных наблю­дения (в результате замены трех первых наблюдений:  на ,  на ,  на ). Результаты ана­лиза с теоретической и эмпиричекой функциями распределения приведены на рис. 3.2.2. Полученные ОМП параметров нормального распределения  и . Особенно существенно наличие аномальных наблюдений повлияло на оценку среднеквадратичного отклонения. По всем критериям согласие с нормальным законом распределения будет отклонено при уровене значимости  > 0.0008.

Пример 3.2.2. Этот пример связан с использованием нормального закона распределения в ситуации, когда на самом деле выборка принадлежит рас­пределению Лапласа. Распределение Лапласа с более “тяже­лыми” хвос­тами, чем у нормального. На рис. 3.3.3 приведены эмпирическая и теоре­ти­ческие функ­ции нормаль­ного распределения, когда по выборке, смоде­ли­рованной в соответствии с распределением Лапласа, оценивались парамет­ры нор­маль­ного закона (). Как видно из значений статистик и соответствующих вероятностей, ни о какой близости эмпири­ческой и теоретической функций распределения говорить не приходится.

         Естественно, что использование получившихся в этих 2-х примерах нормальных законов в качестве моделей наблюдаемых выборок ни к чему хорошему не приведет.

Рис.3.2.2. Эмпирическая функция распределения (1) и теоретическая

 функция нормального распределения (2), полученная по выборке с аномальными наблюдениями

 

          Что же можно сделать, чтобы снизить влияние аномальных ошибок и отклонений наблюдаемых выборок от предполагаемого закона на оценки вычисляемых параметров? Мы настоятельно рекомендуем использовать пе­ред вычислением оценок параметров процедуру предварительного группи­рования наблюдений. Группирование выборки позволяет резко снизить влияние аномальных наблюдений, а иногда практически исключить по­следствия присутствия их в выборке. Резко снижается влияние на оцен­ки параметров и отклонений вида наблюдаемого закона от предпо­лагаемого. Продемонстрируем это на выборках приведенных примеров.

          На рис. 3.2.4 представлены результаты оценивания параметров нор­маль­ного распределения и последующего анализа по сгруппированной вы­борке из примера 3.2.1, содержащей 3 аномальных наблюдения (сравните зна­чения статистик и соответствующих вероятностей с представленными на рис. 3.2.2). Полученные ОМП параметров нормального распределения по группи­ро­ванным данным  и . Визуального раз­личия меж­ду эмпирической и теоретической функ­цией нормального закона в данном случае нет, поэтому соответ­ствующие графики не при­водятся.

         На рис. 3.2.5 представлены результаты оценивания по сгруппи­рованным данным параметров нор­мального закона по вы­борке из примера 3.2.2, при­надлежащей распределению Лапласа (сравните результаты ана­лиза с ре­зультатами, представленными на рис. 3.2.3). ОМП параметров нормального рас­пределения по группированным данным  и . В данном случае в центре области определения случайной величины наблю­дается некоторая близость эмпирической функции распре­деления и функ­ции распределения нор­маль­ного закона.

 

Рис.3.2.3. Эмпирическая функция распределения (1) и функция

распределения нормального закона (2), найденного по выборке,

принадлежащей распределению Лапласа

 

Рис. 3.2.4. Результаты оценивания по сгруппирован­ной выборке и последующего статистического анализа при наличии в выборке аномальных измерений

 

Пример 3.2.3. Выборка объёмом 1000 наблюдений была смодели­рована в соответствии с распределе­нием Вейбулла с плотностью

.

 

Рис. 3.2.5. Эмпирическая функция, построенная по выборке, принадлежащей распределению Лапласа (1), и теоретическая функция нормального закона (2), найденная по сгруппированной выборке

 

При моделировании были заданы параметры:  В процессе регистрации 8 наблюдений “подверглись” сильным искажениям.

          На рис. 3.2.6-3.2.7 приведены результаты статистического анализа полу­ченной выборки. В данном случае получили закон распределения Вейбулла с параметрами  Как видим из рис. 3.2.6, со­гла­сие по всем критериям отвергается: наличие аномальных наблюдений сыграло свою роль. На рис. 3.2.7 хорошо заметна разница между эмпи­рической и теоре­ти­­ческой функциями распределения.

          На рис. 3.2.8 приведены результаты статистического анализа, когда перед оцениванием выборка была разбита на интервалы равной частоты, затем по получившейся группированной выборке были найдены оценки пара­метров распределения , после чего про­ве­­рены гипотезы о согласии исходной выборки с полученным законом распределения. При проверке гипотез о согласии исходная выборка раз­бивалась на интервалы равной вероятности. Как видим, результаты про­верки гипотез о согласии по всем критериям очень хорошие.

          Отличие результатов на рис. 3.2.9 определяется тем, что при про­верке гипотез о согласии исходная выборка разбивалась на интервалы в соот­ветствии с асимптотически оптимальным группированием. В данном случае критерии отношения правдоподобия и  Пирсона оказываются более чувствительными, чем остальные: улавливают наличие аномальных измерений. Гипотезы о согласии при  по этим критериям должны быть отвергнуты.

 

Рис. 3.2.6. Результаты статистического анализа исходной выборки по негруппированным данным

 

Рис. 3.2.7. Теоретическая и эмпирическая функции распределения

 

Рис. 3.2.8. Оценивание с предварительным равночастотным груп­пированием и проверкой гипотез о согласии с разбиением на равночастотные интервалы.

 

Рис. 3.2.9. Оценивание с предварительным равночастотным груп­пированием и проверкой гипотез о согласии с разбие­нием на асимптотически оптимальные интервалы

 

          Приведенные на рис. 3.2.10-3.2.11 результаты анализа, анало­гичны тем, что представлены на рис. 3.2.8-3.2.9, но перед оцениванием выборка была разбита на асимптотически оптимальные интервалы. Получены оценки пара­метров . Если при проверке гипотез исходная выборка разбивалась на интервалы равной вероятности (рис. 3.2.10), то гипотеза о согласии по всем критериям прини­мается. При использовании асимптотически оптимального группирования гипотеза о со­гласии по критериям отношения правдоподобия и  Пирсона должна быть отверг­нута (рис. 3.2.11). Если мы сравним эти результаты, с резуль­татами, представ­ленными на рис. 3.2.8-3.2.9, то увидим, что уровень согласия в данном случае ниже. То есть, полученные оценки оказались хуже, а способ их опре­деления более чувствителен к аномальным наблюдениям.

          Приведем ещё один пример, подчеркивающий устойчивость оценок максимального правдоподобия по группированным данным. Он связан с использованием нормального закона распределения в ситуации, когда на самом деле выборка принадлежит распределению Коши.

 

Рис. 3.2.10. Оценивание с предварительным асимптотически опти­мальным группированием. При проверке согласия использо­ваны равночастотные интервалы.

 

Пример 3.2.4. Распределение Коши это распреде­ление с “тяжелыми” хвос­тами, а такое отклонение от нормаль­ности особенно сильно отражается на оценках параметров нормаль­ного закона. На рис. 3.2.12-3.2.13 при­ве­дены эмпиричес­кая и теоре­тические функ­ции нормаль­ного распределения при использо­вании обычных оценок мак­си­мального правдоподобия (рис. 3.2.12, оценки параметров нормального рас­пределения: , ) и оце­нок макси­мального правдо­по­до­бия по группированным дан­ным (рис. 3.2.13, оценки: , ). Качес­­твенная картина, хорошо просле­живаемая на графиках, говорит сама за себя: во втором случае можно даже говорить об определенной близости эмпи­рической и теоретической функций распре­деления. Выборка объё­мом 100 наблюдений модели­ровалась по закону Коши с функцией плотности  и параметрами , .

 

Рис. 3.2.11. Оценивание с предварительным группированием с разбиением на асимптотически оптимальные интервалы. При проверке согласия также использовано асимптотически  оптимальное группирование.

 

         Подведем итоги вышесказанному. Группи­рование наблюдений перед оцениванием и последующее оценивание параметров по группи­рованной выборке позволяет получать устойчивые оценки. Когда мы говорим об оценках по группированным данным, то имеем ввиду ОМП, которые определяются в результате максимизации функции правдоподобия вида

,

где  - вероятность попа­дания на­­блю­дения в -й интер­вал значений, k - число интервалов, но только не оценки по методу моментов с последующим использованием поправок типа Шеп­парда.

 

 

Рис. 3.2.12. Эмпирическая функция распределения и теоре­ти­­ческая

функция нормального закона распределения, найден­ная по выборке, принадлежащей распределению Коши.

 

Рис. 3.2.13. Эмпирическая функция распределения и теоре­ти­­ческая функция нормального закона распределения, най­ден­ная по сгруппированной выборке, принадлежащей распределе­нию Коши.

 

          Естественно, мы предлагаем использовать оценки по группированным данным не вместо, а вместе с оценками по негруппированным наблю­де­ниям. Качество тех и других зависит от степени засоренности выборки ано­мальными наблюдениями или близости к предполагаемому закону рас­пределения.

          Остаётся вопрос, как группировать? Можно различным образом. Не стоит, конечно, рассматривать крайние случаи: сгруппировать можно и так, что в группированной выборке не останется никакой информации о законе и его параметрах. Реально на интервалы разбивают область, определяемую размахом выборки. Это могут быть или интервалы равной длины, или ин­тервалы равной вероятности (равной частоты), или асимптотически опти­мальные интервалы, или интервалы, сформированные по какому-то дру­го­му принципу. Обычно наиболее устойчивыми к отклонениям ока­зы­ваются оценки при разбиении выборки на интервалы равной вероятности. В то же время в случае асимп­тотически оптимального группирования потери инфор­мации о пара­метрах закона распределения, связанные с группированием, существенно меньше, чем при равновероятном. Если мы знаем, что отклонения от наших пред­положений в выборке минимальны, то исполь­зование полученных таблиц асимпто­ти­чески оптимального группирования по­зво­ляет резко сократить объемы храни­мых данных без сущес­т­вен­ной потери информации о законе распределения. Но всё-таки в общем случае здесь следует ожи­дать большей чувствительности оценок к откло­не­ниям от предпо­ло­жений.

          С другой стороны, достаточно часто мешающая информация, связан­ная с за­сорением выборки, оказывает меньшее влияние на оценки, чем потери ин­формации от группирования при асимп­тотически оптимальном группиро­вании. В некоторых случаях оценки с использованием асимп­то­тически оптимального группирования оказываются так же устойчивыми, как и при равно­веро­ят­ном, и при этом показывают лучшие результаты. Поэтому рекомендуется вы­числять две оценки по группированным данным с использованием как оптимального, так и равновероятного группирования, и остановиться на той оценке, которая дает лучшее согласие с исходной выборкой.

          Группирование наблюдений приводит к потере в количестве ин­фор­мации Фишера о параметре (параметрах) распределения. При асимп­то­тически оптимальном группи­ро­ва­нии, как показывают таблицы асимпто­тически оптимального группи­рования, эти потери составляют в среднем порядка 2% при оценивании одного параметра и 10-11 интервалах груп­пирования и порядка 5% при оценивании двух параметров и 15 интервалах группирования [42]. Это вызывает соответствующий рост асимп­тотической дис­персии эффективных оценок. В то же время, так как ОМП по не­груп­пированным наблюдениям (и многие другие оценки) в общем случае чрез­вычайно чувствительны к наличию аномальных наблюдений или откло­нению наблюдаемой выборки от предполагаемого закона распределения, то дис­персия таких оценок может быть существенно больше асимп­тотической. Напротив ОМП по группи­ро­ванным данным являются устойчивыми к та­ким отклонениям в наблю­дениях. Реально, при наличии в выборке неодно­кратно упоминаемых отклонений, дис­персия оценок по группированным данным оказывается меньше, чем по негруп­пированным. Т.е. вклад в дис­персию от потерь в асимптотике ока­зывается несоизмеримо мал по срав­нению со вкладом, свя­занным с нали­чием отклонений.

          Существенное различие в оценках, вычисляемых по негруп­пи­ро­ванным и сгруппированным данным, может служить сигналом о том, что между имеющимися данными и нашими предположениями (знаниями о виде закона распределения) имеются некоторые разногласия: либо налицо засо­рение выборки, либо в измерения вкрались ошибки, либо наши пред­по­ложения о виде закона распределения (модели) неверны.

 

Выводы

 

1.     Предварительное группирование исходной выборки и последующее вы­числение ОМП по группированным данным приводит к робастным оцен­кам, устойчивым как к наличию в исходной выборке аномальных измере­ний, так и к отклонениям закона распределения выборки от пред­по­ла­гаемого.

2.     Процедура предварительного группирования реализована в программном обеспечении. Возможно использование равномерного, равновероятного и асимптотически оптимального группирования. На основании исходной негруппированной выборки может создаваться соответствующая группи­рованная выборка. Реализован режим предварительного группирования при оценивании, в том числе при идентификации закона распределения.

3.     Высокая устойчивость к присутствию в выборке гру­бых искажений или принадлежности выборки к другому закону распреде­ления оценок максимального правдоподобия по группирован­ной выборке позволяет использовать их в процедурах отбраковки аномальных на­блю­дений.

 

 

3.3. Функции влияния и робастность оценок

 

         В работах [76,81,85,100] и предыдущих разделах подчеркивается вы­сокая устой­чивость оценок мак­си­мального правдоподобия (ОМП) по группи­рованным наблюдениям к нали­чию в выборке аномальных изме­рений, к отклонению реально наблю­даемого закона от предполагаемого, к засорению выборки данными, при­надлежащими другому закону. Всё это под­твер­ждается опытом эксплу­атации программной системы [76] и много­численными результатами модель­ных экспериментов. В данном разделе, основные результаты которого изложены в [93], свойство робастности ОМП исследуется с позиций функции влияния, предложенной Хэмпелом [221,222]. Именно анализ функций влияния ОМП параметров различных распре­делений, в том числе того множества распределений, которое включено в программную систему [76], позволяет утверждать, что ОМП по негруп­пированным данным, вопреки порой бытующему заблуждению, в боль­шинстве своём являются неробастными. В то же время ОМП по груп­пированным данным всегда оказываются робастными.

         Влияние ещё одного наблюдения на очень большую выборку может характеризоваться функцией (кривой) влияния, которая опре­де­ляется сле­ду­ющим образом [178]

,

где  - единичная масса в точке ,  - функция распределения, к которому принадлежит выборка,  - вычисляемая статистика.

         Функция влияния позволяет оценить относительное влияние от­дель­ного наблюдения на значение статистики критерия или оценку параметров. Если функция влияния неограничена, то резко выделяющиеся наблюдения могут приводить к существенным изменениям оценок или статистик. Чув­ствительность к большой ошибке может характеризоваться величи­ной

.

         Для асимптотически эффективных оценок, к которым относятся оцен­ки максимального правдоподобия по негруппированным дан­ным, функ­ция влияния удовлетворяет ра­венству [178]

,                    (3.3.1)

где  - количество информации Фишера.

         Для оценок типа максимального правдоподобия (М-оценок), где вся­кая оценка  определяется как решение экстремальной задачи на мини­мум вида

или как решение неявного уравнения

,

где  - произвольная функция, , функция влияния имеет вид [184]

,

где

.

         В случае ОМП по группированным данным

,

и функция влияния будет иметь вид

.        (3.3.2)

         Для оценок, использующих квантили, соответствующие асимпто­ти­чески оптимальному группированию [88], и являющихся одним из частных слу­чаев L-оценок, функция влияния имеет вид [184]

,      (3.3.3)

где  - коэффициенты при выборочных квантилях в формуле для вы­числения L-оценок, ,

         Были рассмотрены функции влияния для оценок параметров мно­жества распределений, включенных в программную систему [76].

         Приводимые ниже функции влияния построены при конкретных зна­чениях параметров и характеризуют качественную картину их поведения на области определения случайных величин. На рис. 3.3.1-3.3.2 представлены функ­ции влияния для оценок параметров сдвига и масштаба нормального рас­пределения, определяемых методом мак­­симального правдоподобия по не­группи­рован­ным и сгруппированным дан­ным. Функция влияния для ОМП параметра сдвига по негруппированным данным имеет вид

,

для ОМП параметра масштаба -

.

Функции влияния неогра­ничены, и этим определяется чув­ствительность данных оценок к ошибкам измерения и засорению выборки. Напротив, функ­­ции влияния оценок пара­метров нормального распределения по груп­пи­ро­ванным данным ограни­чены. Это ещё раз подчеркивает высо­кую устойчивость получаемых по группированным наблюдениям оценок, под­тверждаемую практикой. На этих и последующих рисунках функции вли­яния для ОМП по груп­пированным данным соответствуют случаю исполь­зования асимптотически оптимального группирования.

         Анало­гично, на рис. 3.3.3-3.3.4 приведены функции влияния для па­раметров рас­пределения Вейбулла. Функция влияния для ОМП основного пара­метра по негруп­пированным данным имеет вид

,

где  - постоянная Эйлера и , для ОМП параметра масштаба -

.

Для основного параметра функция влияния по негруппи­рован­ным данным неограничена снизу на левой и правой границе области опре­деления случайной величины, для масштабного параметра - неограничена сверху на правой границе. В то же время для груп­пиро­ванных наблюдений функции влияния являются сту­пенчатыми ограничен­ными функциями.

 

Рис. 3.3.1. Функции влияния для параметра сдвига

нор­мального распределения по негруппированным (прямая)

и сгруппированным данным (ступенчатая линия)

 

Рис. 3.3.2. Функции влияния для параметра масштаба

нормального распределения по негруппированным

и сгруппированным данным (ступенчатая линия)

 

         Совершенно другую картину мы наблюдаем для ОМП по негруп­пированным наблюдениям для параметров распределения Коши (см. рис. 3.3.5-3.3.6). Функция влияния для ОМП параметра сдвига по негруп­пированным данным имеет вид

,

где .

 

Рис. 3.3.3. Функции влияния для основного параметра

распределения Вейбулла по негруппированным

и сгруппированным данным (ступенчатая линия)

 

Рис. 3.3.4. Функции влияния для параметра масштаба распределения

 Вейбулла по негруппированным и сгруппированным данным

 

Для ОМП параметра масштаба -

.

Их функции влияния ограничены на области определения случайной величины, что говорит о робастности этих оценок, их устойчивости к гру­бым ошибкам измерений.

 

Рис. 3.3.5. Функции влияния для параметра масштаба

распределения Коши по негруппированным (непрерывная)

и сгруппированным данным (ступенчатая линия)

 

Рис. 3.3.6. Функции влияния для параметра сдвига распределения

Коши по негруппированным и сгруппированным данным

 

         Для логистического распределения функция влияния ОМП пара­метра масштаба по негруппированным данным имеет вид

,

где , (см. рис. 3.3.7). Из её неограниченности следует, что соот­вет­ствующая оценка неробастна. В то же время функция влияния ОМП параметра сдвига

ограничена сверху и снизу, А это свидетельствует о робастности ОМП этого параметра.

 

Рис. 3.3.7. Функции влияния для параметра масштаба

логистического распределения по негруппированным

и сгруппированным данным (ступенчатая линия)

 

         Ситуация, которую мы наблюдаем для функций влияния ОМП по негруппированным наблюдениям параметров распределений Коши и логис­тического (параметр сдвига), оказывается явно нетипичной. Для ОМП параметров остальных законов распределения, включенных в программную систему [76], а в совокупности это 26 законов и семейств непрерывных распределений, функции влияния неограничены, откуда следует неро­баст­ность этих оценок. С другой стороны, фунции влияния для ОМП по группированным данным всегда представляют собой ограниченные сту­пенчатые зависимости, что свидетельствует о робаст­ности этих оценок.

         Функции влияния L-оценок с использованием оптимальных по­ряд­ковых статистик, как следует из вида соотношения (3.3.3), также пред­став­ляют собой ступенчатые ограниченные зависимости, что говорит о ро­баст­ности этих оценок. Это же подтверждают и проведенные экспери­менты по моделированию выборок, их засорению, оцениванию параметров и анализу.

 

Рис. 3.3.8 Функции влияния для параметра масштаба

логистического распределения по негруппированным

и сгруппированным данным (ступенчатая линия)

 

Выводы

 

         Таким образом, анализ функций влияния оценок по негруп­пиро­ван­ным и группированным выборкам ещё раз позволяет сделать следующие выводы.

1.   За редким исключением ОМП по негруппированным наблюдениям являются неро­бастными.

2.   Напротив, ОМП по группированным данным и оптимальные оценки параметров сдвига и масштаба по выборочным квантилям для больших выборок устойчивы как к аномальным ошибкам измерений, так и к отклонениям наблюдаемого закона от предполагаемого.

 

[Возврат к вопросам

]