НОВОСТИ    БИБЛИОТЕКА    ЭНЦИКЛОПЕДИЯ    БИОГРАФИИ    КАРТА САЙТА    ССЫЛКИ    О ПРОЕКТЕ  

ДОСТАТОЧНАЯ СТАТИСТИКА

ДОСТАТОЧНАЯ СТАТИСТИКА для семейства распределений вероятностей {Pθ; θ ∈ Θ} или для параметра θ ∈ Θ - статистика (векторная случайная величина) такая, что для любого события А существует вариант условной вероятности Pθ(A|X = x), не зависящий от θ. Это эквивалентно требованию, что условное распределение любой другой статистики Y при условии Х = х не зависит от θ.

Знание Д. с. X дает исчерпывающий материал для статистич. выводов о параметре θ, поскольку любые дополнительные статистич. данные ничего не добавляют к той информации о параметре, к-рая содержится в распределении X. Математич. выражением этого свойства является один из результатов теории статистич. решений, утверждающий, что множество решающих правил, основанных на Д. с, образует существенно полный класс. Переход от исходного семейства распределений к семейству распределений Д. с. наз. редукцией статистической задачи. Смысл редукции заключается в уменьшении (часто весьма значительном) размерности пространства наблюдений.

Практический способ нахождения Д. с. основан на следующей теореме факторизации. Пусть семейство {Pθ} доминировано σ-конечной мерой μ и пусть рθ = dPθ/dμ - плотность распределения Рθ относительно меры μ. Статистика X достаточна для семейства {Pθ} в том и только в том случае, когда

pθ(ω) = gθ(X(ω)) h(ω), (*)

где gθ, h - неотрицательные измеримые функции (h не зависит от θ). Для дискретных распределений в качестве р можно взять «считающую» меру: в этом случае pθ(ω) в соотношении (*) имеет смысл вероятности элементарного события {ω}.

Пусть, напр., X1, ..., Xn - последовательность независимых случайных величин, принимающих значение 1 с неизвестной вероятностью ν и значение 0 с вероятностью 1 - ν (схема Бернулли). Тогда

Равенство (*) выполняется, если положить

Таким образом, эмпирическая частота

является Д. с. для неизвестной вероятности ν в схеме Бернулли.

Пусть X1, ..., Хn - последовательность независимых нормально распределенных величин с неизвестными средним значением μ и дисперсией σ2. Совместная плотность распределения X1, ..., Хn по мере Лебега дается выражением

зависящим от x1, ..., xn только через величины

Поэтому векторная статистика

является Д. с. для двумерного параметра θ = (μ, σ2). Д. с. здесь будет и совокупность выборочного среднего

и выборочной дисперсии

поскольку величины

могут быть выражены через μ̂ и σ̂2.

Для одного и того же семейства распределений может существовать много Д. с. В частности, тривиальной Д. с. является совокупность всех наблюдений [в рассмотренных выше примерах (X1, ..., Хn)]. Однако основной интерес представляют статистики, позволяющие осуществить действительную редукцию статистич. задачи. Д. с. наз. минимальной, или необходимой, если она есть функция от любой другой Д. с. Необходимая Д. с. осуществляет максимально возможную редукцию статистич. задачи. В рассмотренных примерах найденные Д. с. являются необходимыми.

Важное применение понятия достаточности - метод улучшения несмещенных оценок, основанный на теореме Рао - Блэкуэлла-Колмогорова: если X - Д. с. для семейства {Рθ}, X1 - произвольная статистика, принимающая значения в векторном пространстве ℝd, то для действительной непрерывной выпуклой функции g на ℝd

Eθg(X1 - Eθ(X1)) Eθg(X1 - Eθ(X̂1)), θ ∈ Θ,

где X̂1Eθ(X1|X) - условное математич. ожидание статистики X1 относительно X (к-рое фактически не зависит от θ в силу достаточности X). В качестве функции потерь g здесь часто берется положительно определенная квадратичная форма на ℝd.

Статистика X наз. полной, если равенство Eθ f(X) ≡ = 0, θ ∈ Θ, влечет f(X) = 0 почти наверное относительно Рθ, θ ∈ Θ. Одно из следствий теоремы Рао - Блэкуэлла - Колмогорова утверждает, что если существует полная Д. с. X, то она является равномерно по θ наилучшей несмещенной оценкой своего математич. ожидания е(#&952;) = Eθ X. Подобная ситуация имеет место в приведенных примерах. Так, эмпирическая частота ν̂ является равномерно наилучшей несмещенной оценкой вероятности ν в схеме Бернулли, а выборочные среднее μ̂ и дисперсия σ2 - равномерно наилучшие несмещенные оценки параметров нормального распределения μ и σ2.

В теоретическом плане иногда удобнее иметь дело не с Д. с, а с достаточными а-алгебрами. Если {Pθ; θ ∈ Θ} - семейство распределений на вероятностном пространстве (Ω, A), то σ-подалгебра ℬ ⊂ A наз. достаточной для {Рθ}, если для любого события А ∈ A существует вариант условной вероятности Pθ(А|ℬ), не зависящий от θ. Статистика X достаточна тогда и только тогда, когда достаточна порождаемая ею σ-подалгебра A = Х-1(ℬ).

Лит.: [1] Наlmоs P. R., Savage L. I., «Аnn. Math. Statistics», 1949, v. 20, p. 225-41; [2] Колмогоров А. Н., «Изв. АН СССР. Сер. матем.», 1950, т. 14, № 4, с. 303-26; [3] Рао С. Р., Линейные статистические методы и их применения, пер. с англ., М., 1968.

А. С. Холево.


Источники:

  1. Математическая энциклопедия: Гл. ред. И. М. Виноградов, т. 2 Д - Коо.-М.: «Советская Энциклопедия», 1979.-1104 стб., ил.











© MATHEMLIB.RU, 2001-2021
При копировании материалов проекта обязательно ставить ссылку на страницу источник:
http://mathemlib.ru/ 'Математическая библиотека'
Рейтинг@Mail.ru