Критерий согласия Пирсона

Критерий согласия Пирсона или критерий согласия $\chi ^{2}$ (хи-квадрат) — непараметрический метод, который позволяет оценить значимость различий между фактическим (выявленным в результате исследования) количеством исходов или качественных характеристик выборки, попадающих в каждую категорию, и теоретическим количеством, которое можно ожидать в изучаемых группах при справедливости нулевой гипотезы. Выражаясь проще, метод позволяет оценить статистическую значимость различий двух или нескольких относительных показателей (частот, долей).

Является наиболее часто употребляемым критерием для проверки гипотезы о принадлежности наблюдаемой выборки $x_{1},x_{2},...,x_{n}$ объёмом $n$ некоторому теоретическому закону распределения $F(x,\theta )$ .

Критерий хи-квадрат для анализа таблиц сопряжённости был разработан и предложен в 1900 году основателем математической статистики английским учёным Карлом Пирсоном.

Критерий может использоваться при проверке простых гипотез вида

H_{0}:F_{n}(x)=F(x,\theta ),

где $\theta$ — известный вектор параметров теоретического закона, и при проверке сложных гипотез вида

H_{0}:F_{n}(x)\in \left\{F(x,\theta ),\theta \in \Theta \right\},

когда оценка ${\hat {\theta }}$ скалярного или векторного параметра распределения $F(x,\theta )$ вычисляется по той же самой выборке.

Статистика критерия

Процедура проверки гипотез с использованием критериев типа $\chi ^{2}$ предусматривает группирование наблюдений. Область определения случайной величины разбивают на $k$ непересекающихся интервалов $\Delta _{1},\Delta _{2},...,\Delta _{k}$ необязательно одинаковой длины, которые задаются граничными точками

x_{(0)},x_{(1)},...,x_{(k-1)},x_{(k)},

где $x_{(0)}$ — нижняя грань области определения случайной величины; $x_{(k)}$ — верхняя грань.

количество интервалов $k$ должно быть не менее 8 (если число параметров $\theta$ больше 7, то требуется большее количество интервалов $k\geqslant max(8,s+1)$ . Однако, чаще всего $s=2$ , когда распределение определяется двумя параметрами - средним значением и параметром разброса );
в каждый интервал $\Delta _{i}$ должно попасть не менее 7-8 значений, желательно одинаковое количество;
если область определения бесконечна, то в качестве крайних интервалов берутся полупрямые.

В соответствии с заданным разбиением подсчитывают число $n_{i}$ выборочных значений, попавших в $i$ -й интервал, и вероятности попадания в интервал

P_{i}(\theta )=F(x_{(i)},\theta )-F(x_{(i-1)},\theta ),

соответствующие теоретическому закону с функцией распределения $F(x,\theta ).$

При этом

n=\sum _{i=1}^{k}n_{i}

и

\sum _{i=1}^{k}P_{i}(\theta )=1.

При проверке простой гипотезы известны как вид закона $F(x,\theta )$ , так и все его параметры (известен скалярный или векторный параметр $\theta$ ).

В основе статистик, используемых в критериях согласия типа $\chi ^{2}$ , лежит измерение отклонений $n_{i}/n$ от $P_{i}(\theta )$ .

Статистика критерия согласия $\chi ^{2}$ Пирсона определяется соотношением

\chi ^{2}=n\sum _{i=1}^{k}{\frac {\left(n_{i}/n-P_{i}(\theta )\right)^{2}}{P_{i}(\theta )}}.

В случае проверки простой гипотезы, в пределе при $n\to \infty$ эта статистика подчиняется $\chi _{r}^{2}$ -распределению с $r=k-1$ степенями свободы, если верна проверяемая гипотеза $H_{0}$ . Плотность $\chi _{r}^{2}$ -распределения, которое является частным случаем гамма-распределения, описывается формулой

g(s)={\frac {1}{2^{r/2}\Gamma (r/2)}}s^{r/2-1}e^{-s/2}.

Проверяемая гипотеза $H_{0}$ отклоняется при больших значениях статистики, когда вычисленное по выборке значение статистики $\chi _{n}^{2}$ больше критического значения $\chi _{r,\alpha }^{2},$

P\left(\chi _{n}^{2}>\chi _{r,\alpha }^{2}\right)={\frac {1}{2^{r/2}\Gamma (r/2)}}\int _{\chi _{r,\alpha }^{2}}^{\infty }s^{r/2-1}e^{-s/2}ds

или достигнутый уровень значимости (p-значение) меньше заданного уровня значимости (заданной вероятности ошибки 1-го рода) $\alpha$ .

Проверка сложных гипотез

При проверке сложных гипотез, если параметры закона $F(x,\theta )$ по этой же выборке оцениваются в результате минимизации статистики $\chi _{n}^{2}$ или по сгруппированной выборке методом максимального правдоподобия, то статистика $\chi _{n}^{2}$ при справедливости проверяемой гипотезы подчиняется $\chi _{r}^{2}$ -распределению с $r=k-m-1$ степенями свободы, где $m$ — количество оценённых по выборке параметров.

Если параметры оцениваются по исходной негруппированной выборке, то распределение статистики не будет являться $\chi _{k-m-1}^{2}$ -распределением^[1]. Более того, распределения статистики при справедливости гипотезы $H_{0}$ будут зависеть от способа группирования, то есть от того, как область определения разбивается на интервалы^[2].

При оценивании методом максимального правдоподобия параметров по негруппированной выборке можно воспользоваться модифицированными критериями типа $\chi ^{2}$ ^[3]^[4]^[5]^[6].

О мощности критерия

При использовании критериев согласия, как правило, не задают конкурирующих гипотез: рассматривается принадлежность выборки конкретному закону, а в качестве конкурирующей гипотезы — принадлежность любому другому. Естественно, что критерий по-разному будет способен отличать от закона, соответствующего $H_{0}$ , близкие или далёкие от него законы. Если задать конкурирующую гипотезу $H_{1}$ и соответствующий ей некоторый конкурирующий закон $F_{1}(x,\theta )$ , то можно рассуждать уже об ошибках двух видов: не только об ошибке 1-го рода (отклонении проверяемой гипотезы $H_{0}$ при её справедливости) и вероятности этой ошибки $\alpha$ , но и об ошибке 2-го рода (неотклонении $H_{0}$ при справедливости $H_{1}$ ) и вероятности этой ошибки $\beta$ .

Мощность критерия по отношению к конкурирующей гипотезе $H_{1}$ характеризуется величиной $1-\beta$ . Критерий тем лучше распознаёт пару конкурирующих гипотез $H_{0}$ и $H_{1}$ , чем выше его мощность.

Мощность критерия согласия $\chi ^{2}$ Пирсона существенно зависит от способа группирования^[7]^[8] и от выбранного числа интервалов^[8]^[9].

При асимптотически оптимальном группировании, при котором максимизируются различные функционалы от информационной матрицы Фишера по группированным данным (минимизируются потери, связанные с группированием), критерий согласия $\chi ^{2}$ Пирсона обладает максимальной мощностью относительно «(очень) близких» конкурирующих гипотез^[10]^[8]^[9].

При проверке простых гипотез и использовании асимптотически оптимального группирования критерий согласия $\chi ^{2}$ Пирсона имеет преимущество в мощности по сравнению с непараметрическими критериями согласия. При проверке сложных гипотез мощность непараметрических критериев возрастает и такого преимущества нет^[11]^[12]. Однако для любой пары конкурирующих гипотез (конкурирующих законов) за счёт выбора числа интервалов и способа разбиения области определения случайной величины на интервалы можно максимизировать мощность критерия^[13].

Ограничения критерия

Критерий хи-квадрат Пирсона, хотя и является одним из наиболее распространённых методов для проверки связи между категориальными переменными или оценки соответствия наблюдаемых и ожидаемых частот, имеет ряд существенных ограничений. Во-первых, он требует достаточно большой выборки для получения надёжных результатов^[14]^[15] — ожидаемое количество наблюдений в каждой ячейке таблицы сопряжённости должно быть не менее 5^[16]. При малых объёмах выборки или наличии редких категорий приближение к распределению хи-квадрат становится неточным, что может привести к ошибочным выводам. Кроме того, тест предполагает независимость наблюдений.

Ещё одним ограничением критерия хи-квадрат является то, что он не показывает силу или направление связи, а лишь указывает на наличие статистически значимого различия. Также тест чувствителен к размеру выборки: при очень больших данных даже незначительные отклонения могут оказаться статистически значимыми.

Например, в тесте однородности Пирсона (Pearson's test of homogeneity), если все элементы таблицы сопряжённости $A$ умножаются на положительную константу $c$ , то статистика хи-квадрат Пирсона также умножается на $c$ :

$\chi _{\text{stat}}^{2}(cA)=c\chi _{\text{stat}}^{2}(A).$

Следовательно, если все строки матрицы $A$ строго пропорциональны, то

$\chi _{\text{stat}}^{2}(cA)=c\chi _{\text{stat}}^{2}(A)=0$

для любого $c$ и любого уровня значимости $\alpha$ . В противном случае значение $\chi _{\text{stat}}^{2}(cA)$ может становиться сколь угодно большим или малым при увеличении или уменьшении $c$ . Таким образом, при фиксированном уровне значимости $\alpha$ нулевая гипотеза $H_{0}$ будет отклонена с доверительной вероятностью $1-\alpha$ , если $c$ достаточно велико, и не будет отклонена, если $c$ достаточно мало^[15]. Иными словами, статистика хи-квадрат растёт линейно при умножении всей таблицы сопряжённости на постоянный множитель, что отражает пропорциональное масштабирование наблюдаемых и ожидаемых частот.

Наконец, метод неприменим напрямую к непрерывным данным — их необходимо предварительно категоризировать, что приводит к потере информации и снижению статистической мощности.

См. также

Точный критерий Фишера

Примечания

↑ Chernoff H., Lehmann E. L. The use of maximum likelihood estimates in $\chi ^{2}$ test for goodness of fit (англ.) // The Annals of Mathematical Statistics. — 1954. — Vol. 25. — P. 579—586.
↑ Лемешко Б. Ю., Постовалов С. Н. О зависимости предельных распределений статистик $\chi ^{2}$ Пирсона и отношения правдоподобия от способа группирования данных (рус.) // Заводская лаборатория. — 1998. — Т. 64, вып. 5. — С. 56-63. Архивировано 24 мая 2015 года.
↑ Никулин М. С. Критерий хи-квадрат для непрерывных распределений с параметрами сдвига и масштаба (рус.) // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 583—591.
↑ Никулин М. С. О критерии хи-квадрат для непрерывных распределений (рус.) // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 675—676.
↑ Rao K. C., Robson D. S. A chi-squared statistic for goodness-of-fit tests within the exponential family (англ.) // Commun. Statist. — 1974. — Vol. 3. — P. 1139—1153.
↑ Greenwood P. E., Nikulin M. S. A guide to chi-squared testing (англ.). — New York: John Wiley & Sons, 1996. — 280 p.
↑ Лемешко Б. Ю. Асимптотически оптимальное группирование наблюдений в критериях согласия (рус.) // Заводская лаборатория. — 1998. — Т. 64, вып. 1. — С. 56—64. Архивировано 29 октября 2013 года.
↑ ¹ ² ³ Р 50.1.033-2001. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат. — М.: Изд-во стандартов, 2006. — 87 с. — [Архивировано 30 сентября 2021 года.]
↑ ¹ ² Лемешко Б. Ю., Чимитова Е. В. О выборе числа интервалов в критериях согласия типа $\chi ^{2}$ (рус.) // Заводская лаборатория. Диагностика материалов. — 2003. — Т. 69, вып. 1. — С. 61—67. Архивировано 6 сентября 2007 года.
↑ Денисов В. И., Лемешко Б. Ю. Оптимальное группирование при обработке экспериментальных данных // Измерительные информационные системы. — Новосибирск, 1979. — С. 5—14.
↑ Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких конкурирующих гипотезах. I. Проверка простых гипотез (рус.) // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 2(34). — С. 96—111. Архивировано 29 октября 2013 года.
↑ Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких альтернативах. II. Проверка сложных гипотез (рус.) // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 4(36). — С. 78—93. Архивировано 29 октября 2013 года.
↑ Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н., Чимитова Е. В. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход (рус.). — Новосибирск: Изд-во НГТУ, 2011. — 888 с. — (Монографии НГТУ). — ISBN 978-5-7782-1590-0. — [Архивировано 29 октября 2013 года.] — Раздел 4.9.
↑ Franke, T.M.; Ho, T; Christie, C.A. (2012). The chi-square test: Often used and more often misinterpreted. American Journal of Evaluation. 33 (3): 448—458.
↑ ¹ ² Gurvich, V.; Naumova, M. (2025). Critical issues with the Pearson's chi-square test. Modern Mathematical Methods. 3 (2): 101—109. doi:10.64700/mmm.75.
↑ McHugh, Mary (15 июня 2013). The chi-square test of independence. Biochemia Medica. 23 (2): 143—149. doi:10.11613/BM.2013.018. PMC 3900058. PMID 23894860.

Литература

Кендалл М., Стьюарт А. Статистические выводы и связи. — М.: Наука, 1973.

См. также

Ссылки

[1] Chernoff H., Lehmann E. L. The use of maximum likelihood estimates in $\chi ^{2}$ test for goodness of fit (англ.) // The Annals of Mathematical Statistics. — 1954. — Vol. 25. — P. 579—586.

[2] Лемешко Б. Ю., Постовалов С. Н. О зависимости предельных распределений статистик $\chi ^{2}$ Пирсона и отношения правдоподобия от способа группирования данных (рус.) // Заводская лаборатория. — 1998. — Т. 64, вып. 5. — С. 56-63. Архивировано 24 мая 2015 года.

[3] Никулин М. С. Критерий хи-квадрат для непрерывных распределений с параметрами сдвига и масштаба (рус.) // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 583—591.

[4] Никулин М. С. О критерии хи-квадрат для непрерывных распределений (рус.) // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 675—676.

[5] Rao K. C., Robson D. S. A chi-squared statistic for goodness-of-fit tests within the exponential family (англ.) // Commun. Statist. — 1974. — Vol. 3. — P. 1139—1153.

[6] Greenwood P. E., Nikulin M. S. A guide to chi-squared testing (англ.). — New York: John Wiley & Sons, 1996. — 280 p.

[7] Лемешко Б. Ю. Асимптотически оптимальное группирование наблюдений в критериях согласия (рус.) // Заводская лаборатория. — 1998. — Т. 64, вып. 1. — С. 56—64. Архивировано 29 октября 2013 года.

[R50_1_033-8] ¹ ² ³ Р 50.1.033-2001. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат. — М.: Изд-во стандартов, 2006. — 87 с. — [Архивировано 30 сентября 2021 года.]

[Z_lab_8-9] ¹ ² Лемешко Б. Ю., Чимитова Е. В. О выборе числа интервалов в критериях согласия типа $\chi ^{2}$ (рус.) // Заводская лаборатория. Диагностика материалов. — 2003. — Т. 69, вып. 1. — С. 61—67. Архивировано 6 сентября 2007 года.

[10] Денисов В. И., Лемешко Б. Ю. Оптимальное группирование при обработке экспериментальных данных // Измерительные информационные системы. — Новосибирск, 1979. — С. 5—14.

[11] Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких конкурирующих гипотезах. I. Проверка простых гипотез (рус.) // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 2(34). — С. 96—111. Архивировано 29 октября 2013 года.

[12] Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких альтернативах. II. Проверка сложных гипотез (рус.) // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 4(36). — С. 78—93. Архивировано 29 октября 2013 года.

[13] Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н., Чимитова Е. В. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход (рус.). — Новосибирск: Изд-во НГТУ, 2011. — 888 с. — (Монографии НГТУ). — ISBN 978-5-7782-1590-0. — [Архивировано 29 октября 2013 года.] — Раздел 4.9.

[14] Franke, T.M.; Ho, T; Christie, C.A. (2012). The chi-square test: Often used and more often misinterpreted. American Journal of Evaluation. 33 (3): 448—458.

[Gurvich-15] ¹ ² Gurvich, V.; Naumova, M. (2025). Critical issues with the Pearson's chi-square test. Modern Mathematical Methods. 3 (2): 101—109. doi:10.64700/mmm.75.

[Mary-16] McHugh, Mary (15 июня 2013). The chi-square test of independence. Biochemia Medica. 23 (2): 143—149. doi:10.11613/BM.2013.018. PMC 3900058. PMID 23894860.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]