Критерий согласия Пирсона
Критерий согласия Пирсона или критерий согласия (хи-квадрат) — непараметрический метод, который позволяет оценить значимость различий между фактическим (выявленным в результате исследования) количеством исходов или качественных характеристик выборки, попадающих в каждую категорию, и теоретическим количеством, которое можно ожидать в изучаемых группах при справедливости нулевой гипотезы. Выражаясь проще, метод позволяет оценить статистическую значимость различий двух или нескольких относительных показателей (частот, долей).
Является наиболее часто употребляемым критерием для проверки гипотезы о принадлежности наблюдаемой выборки объёмом некоторому теоретическому закону распределения .
Критерий хи-квадрат для анализа таблиц сопряжённости был разработан и предложен в 1900 году основателем математической статистики английским учёным Карлом Пирсоном.
Критерий может использоваться при проверке простых гипотез вида
где — известный вектор параметров теоретического закона, и при проверке сложных гипотез вида
когда оценка скалярного или векторного параметра распределения вычисляется по той же самой выборке.
Статистика критерия
Процедура проверки гипотез с использованием критериев типа предусматривает группирование наблюдений. Область определения случайной величины разбивают на непересекающихся интервалов необязательно одинаковой длины, которые задаются граничными точками
где — нижняя грань области определения случайной величины; — верхняя грань.
- количество интервалов должно быть не менее 8 (если число параметров больше 7, то требуется большее количество интервалов . Однако, чаще всего , когда распределение определяется двумя параметрами - средним значением и параметром разброса );
- в каждый интервал должно попасть не менее 7-8 значений, желательно одинаковое количество;
- если область определения бесконечна, то в качестве крайних интервалов берутся полупрямые.
В соответствии с заданным разбиением подсчитывают число выборочных значений, попавших в -й интервал, и вероятности попадания в интервал
соответствующие теоретическому закону с функцией распределения
При этом
- и
При проверке простой гипотезы известны как вид закона , так и все его параметры (известен скалярный или векторный параметр ).
В основе статистик, используемых в критериях согласия типа , лежит измерение отклонений от .
Статистика критерия согласия Пирсона определяется соотношением
В случае проверки простой гипотезы, в пределе при эта статистика подчиняется -распределению с степенями свободы, если верна проверяемая гипотеза . Плотность -распределения, которое является частным случаем гамма-распределения, описывается формулой
Проверяемая гипотеза отклоняется при больших значениях статистики, когда вычисленное по выборке значение статистики больше критического значения
или достигнутый уровень значимости (p-значение) меньше заданного уровня значимости (заданной вероятности ошибки 1-го рода) .
Проверка сложных гипотез
При проверке сложных гипотез, если параметры закона по этой же выборке оцениваются в результате минимизации статистики или по сгруппированной выборке методом максимального правдоподобия, то статистика при справедливости проверяемой гипотезы подчиняется -распределению с степенями свободы, где — количество оценённых по выборке параметров.
Если параметры оцениваются по исходной негруппированной выборке, то распределение статистики не будет являться -распределением[1]. Более того, распределения статистики при справедливости гипотезы будут зависеть от способа группирования, то есть от того, как область определения разбивается на интервалы[2].
При оценивании методом максимального правдоподобия параметров по негруппированной выборке можно воспользоваться модифицированными критериями типа [3][4][5][6].
О мощности критерия
При использовании критериев согласия, как правило, не задают конкурирующих гипотез: рассматривается принадлежность выборки конкретному закону, а в качестве конкурирующей гипотезы — принадлежность любому другому. Естественно, что критерий по-разному будет способен отличать от закона, соответствующего , близкие или далёкие от него законы. Если задать конкурирующую гипотезу и соответствующий ей некоторый конкурирующий закон , то можно рассуждать уже об ошибках двух видов: не только об ошибке 1-го рода (отклонении проверяемой гипотезы при её справедливости) и вероятности этой ошибки , но и об ошибке 2-го рода (неотклонении при справедливости ) и вероятности этой ошибки .
Мощность критерия по отношению к конкурирующей гипотезе характеризуется величиной . Критерий тем лучше распознаёт пару конкурирующих гипотез и , чем выше его мощность.
Мощность критерия согласия Пирсона существенно зависит от способа группирования[7][8] и от выбранного числа интервалов[8][9].
При асимптотически оптимальном группировании, при котором максимизируются различные функционалы от информационной матрицы Фишера по группированным данным (минимизируются потери, связанные с группированием), критерий согласия Пирсона обладает максимальной мощностью относительно «(очень) близких» конкурирующих гипотез[10][8][9].
При проверке простых гипотез и использовании асимптотически оптимального группирования критерий согласия Пирсона имеет преимущество в мощности по сравнению с непараметрическими критериями согласия. При проверке сложных гипотез мощность непараметрических критериев возрастает и такого преимущества нет[11][12]. Однако для любой пары конкурирующих гипотез (конкурирующих законов) за счёт выбора числа интервалов и способа разбиения области определения случайной величины на интервалы можно максимизировать мощность критерия[13].
Ограничения критерия
Критерий хи-квадрат Пирсона, хотя и является одним из наиболее распространённых методов для проверки связи между категориальными переменными или оценки соответствия наблюдаемых и ожидаемых частот, имеет ряд существенных ограничений. Во-первых, он требует достаточно большой выборки для получения надёжных результатов[14][15] — ожидаемое количество наблюдений в каждой ячейке таблицы сопряжённости должно быть не менее 5[16]. При малых объёмах выборки или наличии редких категорий приближение к распределению хи-квадрат становится неточным, что может привести к ошибочным выводам. Кроме того, тест предполагает независимость наблюдений.
Ещё одним ограничением критерия хи-квадрат является то, что он не показывает силу или направление связи, а лишь указывает на наличие статистически значимого различия. Также тест чувствителен к размеру выборки: при очень больших данных даже незначительные отклонения могут оказаться статистически значимыми.
Например, в тесте однородности Пирсона (Pearson's test of homogeneity), если все элементы таблицы сопряжённости умножаются на положительную константу , то статистика хи-квадрат Пирсона также умножается на :
Следовательно, если все строки матрицы строго пропорциональны, то
для любого и любого уровня значимости . В противном случае значение может становиться сколь угодно большим или малым при увеличении или уменьшении . Таким образом, при фиксированном уровне значимости нулевая гипотеза будет отклонена с доверительной вероятностью , если достаточно велико, и не будет отклонена, если достаточно мало[15]. Иными словами, статистика хи-квадрат растёт линейно при умножении всей таблицы сопряжённости на постоянный множитель, что отражает пропорциональное масштабирование наблюдаемых и ожидаемых частот.
Наконец, метод неприменим напрямую к непрерывным данным — их необходимо предварительно категоризировать, что приводит к потере информации и снижению статистической мощности.
См. также
Примечания
- ↑ Chernoff H., Lehmann E. L. The use of maximum likelihood estimates in test for goodness of fit (англ.) // The Annals of Mathematical Statistics. — 1954. — Vol. 25. — P. 579—586.
- ↑ Лемешко Б. Ю., Постовалов С. Н. О зависимости предельных распределений статистик Пирсона и отношения правдоподобия от способа группирования данных // Заводская лаборатория. — 1998. — Т. 64, вып. 5. — С. 56-63. Архивировано 24 мая 2015 года.
- ↑ Никулин М. С. Критерий хи-квадрат для непрерывных распределений с параметрами сдвига и масштаба // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 583—591.
- ↑ Никулин М. С. О критерии хи-квадрат для непрерывных распределений // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 675—676.
- ↑ Rao K. C., Robson D. S. A chi-squared statistic for goodness-of-fit tests within the exponential family (англ.) // Commun. Statist. — 1974. — Vol. 3. — P. 1139—1153.
- ↑ Greenwood P. E., Nikulin M. S. A guide to chi-squared testing (англ.). — New York: John Wiley & Sons, 1996. — 280 p.
- ↑ Лемешко Б. Ю. Асимптотически оптимальное группирование наблюдений в критериях согласия // Заводская лаборатория. — 1998. — Т. 64, вып. 1. — С. 56—64. Архивировано 29 октября 2013 года.
- ↑ 1 2 3 Р 50.1.033-2001. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат. — М.: Изд-во стандартов, 2006. — 87 с. — [Архивировано 30 сентября 2021 года.]
- ↑ 1 2 Лемешко Б. Ю., Чимитова Е. В. О выборе числа интервалов в критериях согласия типа // Заводская лаборатория. Диагностика материалов. — 2003. — Т. 69, вып. 1. — С. 61—67. Архивировано 6 сентября 2007 года.
- ↑ Денисов В. И., Лемешко Б. Ю. Оптимальное группирование при обработке экспериментальных данных // Измерительные информационные системы. — Новосибирск, 1979. — С. 5—14.
- ↑ Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких конкурирующих гипотезах. I. Проверка простых гипотез // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 2(34). — С. 96—111. Архивировано 29 октября 2013 года.
- ↑ Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких альтернативах. II. Проверка сложных гипотез // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 4(36). — С. 78—93. Архивировано 29 октября 2013 года.
- ↑ Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н., Чимитова Е. В. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход. — Новосибирск: Изд-во НГТУ, 2011. — 888 с. — (Монографии НГТУ). — ISBN 978-5-7782-1590-0. — [Архивировано 29 октября 2013 года.] — Раздел 4.9.
- ↑ Franke, T.M.; Ho, T; Christie, C.A. (2012). The chi-square test: Often used and more often misinterpreted. American Journal of Evaluation. 33 (3): 448—458.
- ↑ 1 2 Gurvich, V.; Naumova, M. (2025). Critical issues with the Pearson's chi-square test. Modern Mathematical Methods. 3 (2): 101—109. doi:10.64700/mmm.75.
- ↑ McHugh, Mary (15 июня 2013). The chi-square test of independence. Biochemia Medica. 23 (2): 143—149. doi:10.11613/BM.2013.018. PMC 3900058. PMID 23894860.
Литература
- Кендалл М., Стьюарт А. Статистические выводы и связи. — М.: Наука, 1973.