Критерий хи-квадрат для анализа таблиц сопряженности был разработан и предложен в 1900 году английским математиком, статистиком, биологом и философом, основателем математической статистики и одним из основоположников биометрики Карлом Пирсоном (1857–1936).
Критерий χ² Пирсона – это непараметрический метод, который позволяет оценить значимость различий между фактическим количеством исходов и теоретическим количеством, ожидаемым при справедливости нулевой гипотезы.
Проще говоря, метод позволяет оценить статистическую значимость различий двух или нескольких относительных показателей (частот, долей).
Условия и ограничения применения
Данный метод позволяет проводить анализ не только четырехпольных таблиц (2×2), когда и фактор, и исход являются бинарными переменными.
Критерий хи-квадрат Пирсона может применяться и в случае анализа многопольных таблиц, когда фактор и (или) исход принимают три и более значений.
Сопоставляемые группы должны быть независимыми. Критерий хи-квадрат не должен применяться при сравнении наблюдений «до»–«после». В этих случаях проводится:
- Тест Мак-Немара – при сравнении двух связанных совокупностей.
- Q-критерий Кохрена – в случае сравнения трех и более групп.
Желательно, чтобы общее количество наблюдений было более 20.
Для четырехпольных таблиц (2×2): если ожидаемое значение принимает значение менее 10 (а именно 5 < x < 10), необходим расчет поправки Йетса.
Поправка Йейтса – это модификация критерия хи-квадрат, которая используется для сравнения небольших выборок с ожидаемой частотой меньше 5. Она помогает уменьшить риск ошибки, упрощая расчет по сравнению с критерием Фишера.
В случае анализа многопольных таблиц ожидаемое число наблюдений не должно принимать значения менее 5 более чем в 20% ячеек. Если условие не выполняется, следует объединить соседние строки или колонки, сохраняя смысл данных, и пересчитать ожидаемые частоты.
Что такое таблица сопряженности
Таблица сопряженности – средство представления совместного распределения двух переменных, предназначенное для исследования связи между ними. Это наиболее универсальное средство изучения статистических связей.
Строки таблицы соответствуют значениям одной переменной.
Столбцы – значениям другой переменной (количественные шкалы предварительно группируются в интервалы).
На пересечении указывается частота совместного появления соответствующих значений двух признаков.
Таблицы сопряженности используются для: - Проверки гипотезы о наличии связи между двумя признаками. - Измерения тесноты связи.
Примеры анализа
Пример 1: Предпочтения мороженого
Средняя школа провела исследование, чтобы узнать, зависит ли вкус мороженого от пола. Данные:
| Пол | Шоколад | Ваниль | Вишня |
| М | 70 | 23 | 45 |
| Ж | 55 | 16 | 66 |
Гипотезы: - Нулевая (H₀): различия между мужчинами и женщинами по предпочтениям статистически незначимы. - Альтернативная (H₁): различия статистически значимы. - Уровень значимости: α = 0,05.
Расчет: - Степени свободы = (2-1)*(3-1) = 2. - Критическое значение χ² для 2 степеней свободы = 5,991. - Тестовая статистика χ² = 7,02584.
Вывод: значение 7,02584 не входит в область принятия 95% [-∞ : 5,991465], поэтому различия статистически значимы. Связь между полом и предпочтением слабая (по коэффициентам сопряженности).
Пример 2: Любовь к шоколаду
Таблица 2×2 (пол – любовь к шоколаду):
| Пол | Люблю шоколад | Не люблю шоколад |
| М | 20 | 15 |
| Ж | 35 | 20 |
Гипотезы: - H₀: связи между признаками нет. - H₁: связь есть. - Уровень значимости: 5%.
Расчет: - Число степеней свободы для таблицы 2×2 всегда 1. - χ²крит = 3,841. - χ²эмп = 0,3795.
Вывод: 0,3795 находится в области приемлемости [-∞ : 3,8415], поэтому нет оснований отвергнуть нулевую гипотезу. Любовь к шоколаду не связана с полом.
Пример 3: Мнение о решении
Данные:
| Пол | Согласны | Не согласны | Сомневаются |
| М | 10 | 8 | 2 |
| Ж | 5 | 12 | 3 |
Гипотезы: - H₀: мнение не зависит от пола. - H₁: мнение зависит от пола.
Вывод: расчетное значение 2,67 меньше критического 5,991, нулевая гипотеза принимается. Мнение не зависит от пола.
Пример 4: Влияние прививки на заболеваемость
Исследование 500 детей:
| Болел | Не болел |
| Прививка | 30 | 270 |
| Нет | 120 | 80 |
Гипотезы: - H₀: заболеваемость не зависит от прививок. - H₁: прививки влияют на заболеваемость. - Уровень значимости: 0,05.
Расчет: - χ²эмп = 142,85. - χ²крит = 3,84.
Вывод: 142,85 > 3,84, основная гипотеза отклоняется. Данные позволяют утверждать, что прививки снижают заболеваемость гриппом.
Измерение тесноты связи
Для четырехпольных таблиц используются: - Коэффициент ассоциации. - Коэффициент контингенции. - Коэффициент взаимной сопряженности Пирсона. - Коэффициент взаимной сопряженности Чупрова.
Качественная оценка силы связи по шкале Чеддока:
| 0,1 – 0,3 | Слабая
| 0,3 – 0,5 | Умеренная
| 0,5 – 0,7 | Заметная
| 0,7 – 0,9 | Высокая
| 0,9 – 0,99 | Весьма высокая
Другие критерии
Критерий Фишера
Предназначен для сопоставления двух выборок по частоте встречаемости эффекта. Оценивает достоверность различий между процентными долями.
Условия применения: - Верхний предел отсутствует. - Нижний предел – 2 наблюдения в одной из выборок, с соотношениями: - Если n₁=2 → n₂≥30. - Если n₁=3 → n₂≥7. - Если n₁=4 → n₂≥5. - При n₁, n₂≥5 возможны любые сопоставления.
Критерий Мак-Немара
Применяется для анализа таблиц 2×2, когда учет признака выполняется на одних и тех же субъектах. Используется для определения, произошли ли существенные изменения в номинальных данных до и после события.
Тест Макнемара проверяет согласованность результатов, в отличие от критерия χ², который проверяет независимость.
Q-критерий Кохрена
Непараметрический тест, используемый для проверки, оказывают ли два или более воздействий одинаковый эффект. Определяет, является ли доля успеха одинаковой в разных группах.
Подходит для данных с повторяющимися измерениями, где значения дихотомические (успех/неудача). Это расширенный тест Мак-Немара для случая с несколькими зависимыми выборками.
Автоматический расчет
Критерий хи-квадрат: - https://www.statskingdom.com/310GoodnessChi.html - https://medstatistic.ru/calculators/calchit.html - https://medstatistic.ru/calculators/calchi.html - https://www.socscistatistics.com/tests/goodnessoffit/default2.aspx - https://www.socscistatistics.com/tests/chisquare2/default2.aspx - https://www.socscistatistics.com/tests/chisquare/default2.aspx - https://www.statology.org/chi-square-test-of-independence-calculator/
Критерий Фишера: - https://www.psychol-ok.ru/statistics/fisher/index.html - https://www.socscistatistics.com/tests/fisher/default2.aspx - https://www.statology.org/fishers-exact-test-calculator/
Критерий Мак-Немара: - https://medstatistic.ru/calculators/calcmac.html - https://www.omnicalculator.com/statistics/mcnemars-test - https://www.statskingdom.com/310GoodnessChi.html
Q-критерий Кохрена: - https://real-statistics.com/anova-repeated-measures/cochrans-q-test/




Комментариев пока нет — может, вы будете первым?