2.4. Исследование вопросов оценивания параметров и проверки гипотез по сильно
цензурированным выборкам.
С задачей обработки цензурированных выборок, когда наблюдению оказывается доступной только часть области определения случайной величины, а для выборочных значений, попавших левее и/или правее этой области, фиксируется лишь сам факт этого попадания, приходится сталкиваться в различных приложениях. Особенно часто с цензурированными выборками встречаются в задачах надежности при оценивании продолжительности жизни. В такой неполной (цензурированной) выборке содержится меньше информации, чем в полной. Потеря части информации отражается на точности оценивания параметров аппроксимирующего закона распределения. При цензурировании наблюдений снижается способность критериев согласия различать близкие законы распределения. В среде специалистов по надежности, которым наиболее часто приходится сталкиваться с проблемами обработки сильно цензурированных выборок, сложилось даже мнение о бесперспективности различения моделей законов распределений, используемых в задачах надежности и контроля качества, с помощью критериев согласия[1].
В работе [16] нами были исследованы потери в информации Фишера в зависимости от степени цензурирования для различных законов распределения. Было показано, что в некоторых случаях, когда доступной наблюдению оказывается лишь незначительная область определения случайной величины, в цензурированной выборке сохраняется достаточно много информации. Например, в случае экспоненциального закона распределения при цензурировании слева, когда доступной наблюдению оказывается область справа, вероятность попадания в которую равна 0.05, сохраняется более 52% (!) от информации, имеющейся в полной выборке. Наличие подобных фактов позволяет надеяться, что по таким выборкам можно как находить хорошие оценки параметров, так и достаточно уверенно проверять гипотезы о согласии эмпирического распределения с теоретическим.
ОМП параметров распределений по цензурированным
наблюдениям являются асимптотически эффективными. Однако при ограниченных
объемах выборок и значительной степени цензурирования законы распределения ОМП
весьма далеки от асимптотически нормального и, более того, оказываются асимметричными,
а сами оценки смещенными [16].
С уменьшением объемов выборок и увеличением
степени цензурирования увеличивается асимметрия закона распределения оценок.
Плотности распределения оценок масштабного параметра нормального
распределения при цензурировании слева (справа) при
различной величине (%) наблюдаемой области определения случайной величины и
объеме выборки =100.
С использованием методики компьютерного моделирования и анализа статистических
закономерностей были исследованы величины смещения ОМП параметров некоторых
законов в зависимости от объема всей выборки и величины
наблюдаемой её части. В результате исследования были получены оценки
математических ожиданий смещений ОМП как эмпирические функции от объема выборки
и степени цензурирования. Использование полученных величин в качестве поправок,
ликвидирующих смещение при оценивании параметров экспоненциального и
нормального законов, показало, что такие оценки с поправками оказываются
несмещенными .
Для проверки
согласия при цензурированных наблюдениях и простых гипотезах могут
использоваться критерии типа Реньи[2],
которые в этой ситуации являются “свободными от распределения”. Но даже при
проверке простых гипотез не все оказывается гладко. Отмечена сильная
зависимость распределений статистик типа Реньи от объема выборки ,
что резко ограничивает возможность применения критерия при конечных объемах
выборок. Оказалось, что распределения статистик критериев хорошо сходятся
к предельным (см. Большев Л.Н., Смирнов
Н.В.) при степени цензурирования в 50% и очень плохо при других значениях.
Рассматриваются модификации статистики, для которых зависимость от объема
выборки выражена в меньшей степени.
Очевидно, что при проверке сложных гипотез критерии типа Реньи теряют свойство “свободы от распределения”. Поэтому необходимы исследования распределений данных статистик при проверке различных сложных гипотез с целью построения моделей предельных распределений.
Проверка сложных гипотез тесно взаимосвязана с проблемой оценивания параметров. Наибольшая неприятность связана со смещенностью ОМП параметров, вычисляемых по цензурированным выборкам. Показанная возможность построения несмещенных оценок параметров по цензурированным выборкам, позволяет исследовать распределения статистик критериев согласия при проверке соответствующих сложных гипотез, что, в свою очередь, даст возможность корректно проверять сложные гипотезы относительно законов распределения по цензурированным наблюдениям.
[Назад][Содержание][Вперед]
[1] Демидович О.Н. // Методы менеджмента качества. – 1999. – № 11. – С. 29-33
[2] Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. – М.: Наука, 1983. – 416 с.
Goro Ishii. On the exact probabilities of Renyi`s tests // Ann.Inst. Statist. Math., 1959. № 2. – P. 17-24.
Смирнов Н.В. Вероятности больших значений непараметрических односторонних критериев согласия // Труды Матем. Ин-та АН СССР, 1961. 64. – С. 185-210.