Оценка Ходжеса

В статистике оценка Ходжеса[1] (также оценщик Ходжеса или оценка/оценщик Ходжеса — Ле Кама[2]), названная в честь Джозефа Ходжеса (англ. Joseph Hodges), — знаменитый контрпример, доказывающий существование суперэффективной оценки[3], т.е. оценки, достигающей меньшую асимптотическую дисперсию, чем обычные эффективные оценки. Существование такого контрпримера послужило причиной ввода понятия регулярных оценок.

Оценка Ходжеса улучшает регулярную оценку в единственной точке. В общем, любая суперэффективная оценка может превзойти регулярную оценку не более чем на множестве нулевой меры Лебега[4].

Хотя Ходжес ввёл эту оценку, он её не публиковал; первая публикация была в докторской диссертации Люсьена Ле Кама (англ. Lucien Le Cam)[5].

Построение

Предположим, что — это обычная оценка некоторого параметра : она состоятельна и сходится к некоторому асимптотическому распределению (как правило, это нормальное распределение с мат ожиданием и дисперсией, зависящей от ) при нормировке на :

Тогда оценка Ходжеса определяется как[6]:

.

Она совпадает с везде, кроме маленького интервала , где она равен нулю. Несложно увидеть, что оценка состоятельна для и её асимптотическое распределение следующее[7]:

,

для любого . Отсюда эта оценка имеет такое же асимптотическое распределение как для всех , а для скорость схождения становится сколь угодно быстрой. Эта оценка суперэффективная и превосходит асимптотическое поведение эффективной оценки хотя бы в одной точке .

Неверно, что оценка Ходжеса равна выборочному среднему, но которая становится намного лучше выборочного среднего, когда истинное среднее равно . Верно, что для конечного усечение может привести к худшей квадратичной ошибке, чем оценка на выборочном среднем, когда близко к , как показано на примере в следующем разделе[8].

Ле Кам показал, что такое поведение типично: суперэффективность в точке подразумевает существование последовательности , такой что строго больше границы Крамера — Рао. Для особых случаев, где асимптотический риск в равен нулю, предел бесконечный для последовательности [9].

В общем случае, суперэффективность может быть достигнута на подмножестве меры Лебега ноль параметрического пространства [8].

Пример

Предположим независимо и одинаково распределённая выборка из нормального распределения с неизвестным среднем, но известной дисперсии. Тогда обычная оценка генерального среднего — это арифметическое среднее всех наблюдений . Соответствующая оценка Ходжеса тогда: , где индикаторная функция.

Среднеквадратичная ошибка (умноженная на ) на основе регулярной оценки постоянна и равна для всех . В то же время среднеквадратичная ошибка для оценки Ходжеса ведёт себя хаотично в окрестности нуля и даже становится неограниченной при . Это показывает, что оценка не является регулярной и её асимптотические свойства неадекватно описываются пределами формы (при фиксированном , ).

См. также

  • Оценка Джеймса — Штейна

Примечания

  1. Vaart (1998, p. 109)
  2. Kale (1985)
  3. Bickel (1998, p. 21)
  4. Vaart (1998, p. 116)
  5. Le Cam L. M. On some asymptotic properties of maximum likelihood estimates and related Bayes' estimates (англ.). — Berkeley: University of California Press, 1953. — (University of California Publications in Statistics; v. 1, no. 11).
  6. Stoica, Ottersten, 1996, p. 135.
  7. Vaart, 1998, p. 109.
  8. 1 2 van der Vaart, A. W. Asymptotic Statistics (англ.). — Cambridge University Press, 1998.
  9. van der Vaart, A. W.; Wellner, J. A. Weak Convergence and Empirical Processes (англ.). — New York: Springer, 1996. — (Springer Series in Statistics). — doi:10.1007/978-1-4757-2545-2.
  10. Vaart (1998, p. 110)

Литература

  • Peter J. Bickel. Efficient and Adaptive Estimation for Semiparametric Models (англ.). — New York: Springer, 1998. — ISBN 0-387-98473-9.
  • B. K. Kale. A note on the super efficient estimator (англ.). — 1985. — Vol. 12. — P. 259–263. — doi:10.1016/0378-3758(85)90074-6.
  • P. Stoica. The evil of superefficiency (англ.). — 1996. — Vol. 55. — P. 133–136. — doi:10.1016/S0165-1684(96)00159-4.
  • A. W. van der Vaart. Asymptotic Statistics (англ.). — Cambridge University Press, 1998. — ISBN 978-0-521-78450-4.