2.4. Исследование вопросов оценивания параметров и проверки гипотез по сильно

цензурированным выборкам.

С задачей обработки цензури­рованных выборок, когда наблюдению оказы­вается до­ступной только часть области определения случайной величины, а для вы­борочных значений, попавших левее и/или правее этой области, фикси­руется лишь сам факт этого попадания, приходится сталкиваться в различных приложениях. Особенно часто с цензурированными выборками встречаются в задачах надежности при оценивании продолжительности жизни. В такой неполной (цензурированной) выборке содер­жится меньше информации, чем в полной. Потеря части информации отражается на точности оценивания параметров аппроксимирующего закона распределения. При цензурировании наблюдений снижается способность критериев согласия раз­личать близкие законы распределения. В среде специалистов по надежности, которым наиболее часто приходится сталкиваться с проблемами обработки сильно цензурированных выборок, сложилось даже мнение о бесперспективности различения моделей законов распределений, используемых в задачах надежности и контроля качества, с помощью критериев согласия[1].

В работе [16] нами были исследованы потери в информации Фишера в зависимости от степени цензурирования для различных законов распределения. Было показано, что в некоторых случаях, когда доступной наблюдению оказывается лишь незначительная область определения случайной величины, в цензурированной выборке сохраняется достаточно много информации. Например, в случае экспоненциального закона распределения при цензурировании слева, когда доступной наблюдению оказывается область справа, вероятность попадания в которую равна 0.05, сохраняется более 52% (!) от информации, имеющейся в полной выборке. Наличие подобных фактов позволяет надеяться, что по таким выборкам можно как находить хорошие оценки параметров, так и достаточно уверенно проверять гипотезы о согласии эмпирического распределения с теоретическим.

ОМП параметров распределений по цензурированным наблюдениям являются асимптотически эффективными. Однако при ограниченных объемах выборок и значительной степени цензурирования законы распределения ОМП весьма далеки от асимптотически нормального и, более того, оказываются асимметричными, а сами оценки смещенными [16]. С уменьшением объемов выборок  и увеличением степени цензурирования увеличивается асимметрия закона распределения оценок.

Плотности распределения оценок масштабного параметра нормального

распределения при цензурировании слева (справа) при различной величине (%) наблюдаемой области определения случайной величины и объеме выборки =100.

 

            С использованием методики компьютерного моделирования и анализа статистических закономерностей были исследованы величины смещения ОМП параметров некоторых законов в зависимости от объема всей выборки  и величины наблюдаемой её части. В результате исследования были получены оценки математических ожиданий смещений ОМП как эмпирические функции от объема выборки и степени цензурирования. Использование полученных величин в качестве поправок, ликвидирующих смещение при оценивании параметров экспоненциального и нормального законов, показало, что такие оценки с поправками оказываются несмещенными .

Для проверки согласия при цензурированных наблюдениях и простых гипотезах могут использоваться критерии типа Реньи[2], которые в этой ситуации являются “свободными от распределения”. Но даже при проверке простых гипотез не все оказывается гладко. Отмечена сильная зависимость распределений статистик типа Реньи от объема выборки , что резко ограничивает возможность применения критерия при конечных объемах выборок.  Оказалось, что распределения статистик критериев хорошо сходятся к предельным (см. Большев Л.Н., Смирнов Н.В.) при степени цензурирования в 50% и очень плохо при других значениях. Рассматриваются модификации статистики, для которых зависимость от объема выборки выражена в меньшей степени.

Очевидно, что при проверке сложных гипотез критерии типа Реньи теряют свойство “свободы от распределения”. Поэтому необходимы исследования распределений данных статистик при проверке различных сложных гипотез с целью построения моделей предельных распределений.

Проверка сложных гипотез тесно взаимосвязана с проблемой оценивания параметров. Наибольшая неприятность связана со смещенностью ОМП пара­метров, вычисляемых по цензурированным выборкам. Показанная возможность построения несмещенных оценок параметров по цензурированным выборкам, позволяет исследовать распределения статистик критериев согласия при проверке соответствующих сложных гипотез, что, в свою очередь, даст возможность корректно проверять сложные гипотезы относительно законов распределения по цензурированным наблюдениям.

 

[Назад][Содержание][Вперед]


[1] Демидович О.Н. // Методы менеджмента качества. – 1999. – № 11. – С. 29-33

[2] Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. – М.: Наука, 1983. – 416 с.

Goro Ishii. On the exact probabilities of Renyi`s tests // Ann.Inst. Statist. Math., 1959. № 2. – P. 17-24.

Смирнов Н.В. Вероятности больших значений непараметрических односторонних критериев согласия // Труды Матем. Ин-та АН СССР, 1961. 64. – С. 185-210.