Тег #статистика сбросить

В этой рубрике: сначала популярные за сутки (лайки, комментарии, реакции). Уведомления — колокольчик справа.

Войти для уведомлений
Александра Пуляевская Математик
03.05.2026

Введение в статистику на примере банка: среднее, медиана, мода, размах и диаграммы

Статистика – это наука о сборе, анализе и интерпретации данных. В банковской сфере статистика помогает:

  • Анализировать доходы и расходы клиентов.

  • Прогнозировать спрос на кредиты и вклады.

  • Оценивать риски.

Пример: Банк собирает данные о возрасте клиентов, чтобы понять, кто чаще открывает вклады – молодые люди или пенсионеры.

Задача 1. Средний размер вклада

Среднее арифметическое – сумма всех значений, делённая на их количество.

Комментарий:
Среднее арифметическое показывает типичный размер вклада. Но если бы один клиент положил 100 000 ₽, среднее сильно выросло бы – это недостаток этой меры.

Доп. вопрос:
Как изменится среднее, если шестой клиент положит 50 000 ₽?

Задача 2. Медиана кредитов

Медиана – серединное значение в упорядоченном ряду.
Правило:

  • Если чисел нечётное количество – берём среднее.

  • Если чётное – среднее двух центральных.

Условие:
Банк выдал кредиты (в тыс. ₽): 15, 20, 10, 25, 30, 40, 5.
Найдите медиану.

Решение:

Медиана = 20 (четвёртое число).

Упорядочим: 5, 10, 15, 20, 25, 30, 40.

Комментарий:
Медиана устойчива к выбросам. Если бы самый большой кредит был 1000, медиана не изменилась бы.

Доп. вопрос:
Как найти медиану, если данных чётное количество (например, добавим кредит 35)?

Задача 3. Мода расходов

Мода – число, которое встречается чаще всего.

Условие:
Банк анализирует ежемесячные траты клиентов (в ₽): 5000, 10000, 10000, 15000, 20000, 20000, 20000.
Найдите моду.

Решение:
Чаще всего встречается 20 000 ₽ (3 раза).

Комментарий:
Если бы все числа встречались по одному разу, моды бы не было.

Доп. вопрос:
Может ли в данных быть две моды? Приведите пример.

Задача 4. Размах зарплат

Условие:
Зарплаты клиентов банка (в тыс. ₽): 30, 40, 50, 60, 70.
Найдите размах.

Решение: Размах=70−30=40 тыс. ₽.

Комментарий:
Размах показывает разброс данных, но не учитывает распределение.

Доп. вопрос:
Как изменится размах, если добавить зарплату 100?

Задача 5. Построение столбчатой диаграммы

Столбчатая диаграмма – показывает сравнение величин.
Условие:
Количество новых вкладов по месяцам:

  • Январь: 50

  • Февраль: 70

  • Март: 90

Задание:
Постройте столбчатую диаграмму.

Комментарий:
Диаграммы помогают визуализировать тренды (например, рост вкладов).

Доп. вопрос:
Какой месяц показывает наибольший рост?

Задача 6. Круговая диаграмма долей кредитов

Круговая диаграмма – показывает доли.
Условие:
Банк выдал кредиты:

  • Потребительские: 60%

  • Ипотека: 30%

  • Автокредиты: 10%

Задание:
Нарисуйте круговую диаграмму.

Комментарий:
Круговые диаграммы показывают доли целого.

Доп. вопрос:
Если общая сумма кредитов 1 млн ₽, сколько составит ипотека?

Показать полностью
0
Александра Пуляевская Математик
03.05.2026

Введение в статистику на примере спорта: основные понятия и примеры

Статистика – это наука о сборе, анализе и интерпретации данных. В спорте статистика помогает сравнивать игроков, предсказывать результаты и улучшать стратегии.

Основные понятия:

  • Данные  – информация, которую мы собираем (например, количество голов футболиста).

  • Выборка  – часть данных, которую мы изучаем (например, результаты 10 матчей).

  • Генеральная совокупность  – все возможные данные (например, все матчи сезона).


Виды данных

Данные бывают:

  1. Количественные  – можно измерить (голы, секунды, метры).

    • Пример:

       В баскетболе игрок набрал 25 очков.

  2. Качественные  – описывают свойство (цвет формы, название команды).

    • Пример:

       Футбольная команда играет в синей форме.


Средние значения

Средние значения помогают понять "типичный" результат.

А) Среднее арифметическое

Сумма всех значений, делённая на их количество.

Б) Медиана

Число, которое стоит в середине упорядоченного ряда.

Пример:
Результаты бегуна (в секундах): 12, 13, 14, 15, 16.
Медиана = 14 (третье число).

Если чисел чётное количество, медиана – среднее двух центральных.

В) Мода

Число, которое встречается чаще всего.

Пример:
Количество голов хоккеиста: 1, 2, 2, 3, 2, 4.
Мода = 2 (встречается три раза).

Размах

Разница между наибольшим и наименьшим значением.

Пример:
Результаты прыжков в длину (м): 3.5, 4.0, 4.2, 3.8.
Размах = 4.2 – 3.5 = 0.7 м.

Задачи с комментариями

Дополнительные задания

Показать полностью
0
nitforyou.com Эксперт
18.04.2026

Статистика: таблицы сопряженности и критерий хи-квадрат Пирсона с примерами анализа

Критерий хи-квадрат для анализа таблиц сопряженности был разработан и предложен в 1900 году английским математиком, статистиком, биологом и философом, основателем математической статистики и одним из основоположников биометрики Карлом Пирсоном (1857–1936).

Критерий χ² Пирсона – это непараметрический метод, который позволяет оценить значимость различий между фактическим количеством исходов и теоретическим количеством, ожидаемым при справедливости нулевой гипотезы.

Проще говоря, метод позволяет оценить статистическую значимость различий двух или нескольких относительных показателей (частот, долей).

Условия и ограничения применения

Данный метод позволяет проводить анализ не только четырехпольных таблиц (2×2), когда и фактор, и исход являются бинарными переменными.

Критерий хи-квадрат Пирсона может применяться и в случае анализа многопольных таблиц, когда фактор и (или) исход принимают три и более значений.

Сопоставляемые группы должны быть независимыми. Критерий хи-квадрат не должен применяться при сравнении наблюдений «до»–«после». В этих случаях проводится:
- Тест Мак-Немара – при сравнении двух связанных совокупностей.
- Q-критерий Кохрена – в случае сравнения трех и более групп.

Желательно, чтобы общее количество наблюдений было более 20.

Для четырехпольных таблиц (2×2): если ожидаемое значение принимает значение менее 10 (а именно 5 < x < 10), необходим расчет поправки Йетса.

Поправка Йейтса – это модификация критерия хи-квадрат, которая используется для сравнения небольших выборок с ожидаемой частотой меньше 5. Она помогает уменьшить риск ошибки, упрощая расчет по сравнению с критерием Фишера.

В случае анализа многопольных таблиц ожидаемое число наблюдений не должно принимать значения менее 5 более чем в 20% ячеек. Если условие не выполняется, следует объединить соседние строки или колонки, сохраняя смысл данных, и пересчитать ожидаемые частоты.

Что такое таблица сопряженности

Таблица сопряженности – средство представления совместного распределения двух переменных, предназначенное для исследования связи между ними. Это наиболее универсальное средство изучения статистических связей.

  • Строки таблицы соответствуют значениям одной переменной.

  • Столбцы – значениям другой переменной (количественные шкалы предварительно группируются в интервалы).

  • На пересечении указывается частота совместного появления соответствующих значений двух признаков.

Таблицы сопряженности используются для: - Проверки гипотезы о наличии связи между двумя признаками. - Измерения тесноты связи.

Примеры анализа

Пример 1: Предпочтения мороженого

Средняя школа провела исследование, чтобы узнать, зависит ли вкус мороженого от пола. Данные:

| Пол | Шоколад | Ваниль | Вишня |
| М | 70 | 23 | 45 |
| Ж | 55 | 16 | 66 |

Гипотезы: - Нулевая (H₀): различия между мужчинами и женщинами по предпочтениям статистически незначимы. - Альтернативная (H₁): различия статистически значимы. - Уровень значимости: α = 0,05.

Расчет: - Степени свободы = (2-1)*(3-1) = 2. - Критическое значение χ² для 2 степеней свободы = 5,991. - Тестовая статистика χ² = 7,02584.

Вывод: значение 7,02584 не входит в область принятия 95% [-∞ : 5,991465], поэтому различия статистически значимы. Связь между полом и предпочтением слабая (по коэффициентам сопряженности).

Пример 2: Любовь к шоколаду

Таблица 2×2 (пол – любовь к шоколаду):

| Пол | Люблю шоколад | Не люблю шоколад |
| М | 20 | 15 |
| Ж | 35 | 20 |

Гипотезы: - H₀: связи между признаками нет. - H₁: связь есть. - Уровень значимости: 5%.

Расчет: - Число степеней свободы для таблицы 2×2 всегда 1. - χ²крит = 3,841. - χ²эмп = 0,3795.

Вывод: 0,3795 находится в области приемлемости [-∞ : 3,8415], поэтому нет оснований отвергнуть нулевую гипотезу. Любовь к шоколаду не связана с полом.

Пример 3: Мнение о решении

Данные:

| Пол | Согласны | Не согласны | Сомневаются |
| М | 10 | 8 | 2 |
| Ж | 5 | 12 | 3 |

Гипотезы: - H₀: мнение не зависит от пола. - H₁: мнение зависит от пола.

Вывод: расчетное значение 2,67 меньше критического 5,991, нулевая гипотеза принимается. Мнение не зависит от пола.

Пример 4: Влияние прививки на заболеваемость

Исследование 500 детей:

| Болел | Не болел |
| Прививка | 30 | 270 |
| Нет | 120 | 80 |

Гипотезы: - H₀: заболеваемость не зависит от прививок. - H₁: прививки влияют на заболеваемость. - Уровень значимости: 0,05.

Расчет: - χ²эмп = 142,85. - χ²крит = 3,84.

Вывод: 142,85 > 3,84, основная гипотеза отклоняется. Данные позволяют утверждать, что прививки снижают заболеваемость гриппом.

Измерение тесноты связи

Для четырехпольных таблиц используются: - Коэффициент ассоциации. - Коэффициент контингенции. - Коэффициент взаимной сопряженности Пирсона. - Коэффициент взаимной сопряженности Чупрова.

Качественная оценка силы связи по шкале Чеддока:

| 0,1 – 0,3 | Слабая
| 0,3 – 0,5 | Умеренная
| 0,5 – 0,7 | Заметная
| 0,7 – 0,9 | Высокая
| 0,9 – 0,99 | Весьма высокая

Другие критерии

Критерий Фишера

Предназначен для сопоставления двух выборок по частоте встречаемости эффекта. Оценивает достоверность различий между процентными долями.

Условия применения: - Верхний предел отсутствует. - Нижний предел – 2 наблюдения в одной из выборок, с соотношениями: - Если n₁=2 → n₂≥30. - Если n₁=3 → n₂≥7. - Если n₁=4 → n₂≥5. - При n₁, n₂≥5 возможны любые сопоставления.

Критерий Мак-Немара

Применяется для анализа таблиц 2×2, когда учет признака выполняется на одних и тех же субъектах. Используется для определения, произошли ли существенные изменения в номинальных данных до и после события.

Тест Макнемара проверяет согласованность результатов, в отличие от критерия χ², который проверяет независимость.

Q-критерий Кохрена

Непараметрический тест, используемый для проверки, оказывают ли два или более воздействий одинаковый эффект. Определяет, является ли доля успеха одинаковой в разных группах.

Подходит для данных с повторяющимися измерениями, где значения дихотомические (успех/неудача). Это расширенный тест Мак-Немара для случая с несколькими зависимыми выборками.

Автоматический расчет

Критерий хи-квадрат: - https://www.statskingdom.com/310GoodnessChi.html - https://medstatistic.ru/calculators/calchit.html - https://medstatistic.ru/calculators/calchi.html - https://www.socscistatistics.com/tests/goodnessoffit/default2.aspx - https://www.socscistatistics.com/tests/chisquare2/default2.aspx - https://www.socscistatistics.com/tests/chisquare/default2.aspx - https://www.statology.org/chi-square-test-of-independence-calculator/

Критерий Фишера: - https://www.psychol-ok.ru/statistics/fisher/index.html - https://www.socscistatistics.com/tests/fisher/default2.aspx - https://www.statology.org/fishers-exact-test-calculator/

Критерий Мак-Немара: - https://medstatistic.ru/calculators/calcmac.html - https://www.omnicalculator.com/statistics/mcnemars-test - https://www.statskingdom.com/310GoodnessChi.html

Q-критерий Кохрена: - https://real-statistics.com/anova-repeated-measures/cochrans-q-test/

Показать полностью
0
nitforyou.com Эксперт
18.04.2026

Критерий Манна-Уитни: что это такое, формула и применение в статистике

U-критерий Манна-Уитни – это непараметрический статистический критерий, используемый для сравнения двух независимых выборок по уровню какого-либо количественно измеренного признака.

Метод был предложен в 1945 году американским химиком и статистиком Фрэнком Вилкоксоном. В 1947 году он был существенно переработан и расширен математиками Х.Б. Манном (H.B. Mann) и Д.Р. Уитни (D.R. Whitney), по именам которых сегодня обычно и называется.

Ограничения критерия

  • В каждой выборке должно быть не менее 3 наблюдений (n1, n2 ≥ 3). Допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

  • В каждой выборке должно быть не более 60 наблюдений (n1, n2 ≤ 60).

Условием для применения U-критерия Манна-Уитни является отсутствие в сравниваемых группах совпадающих значений признака (все числа – разные) или очень малое число таких совпадений.

Формулировка гипотез

  • H0: Уровень признака в группе 2 не ниже уровня признака в группе 1.

  • H1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Помним, что 1-й выборкой (группой) называют тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-й выборкой (группой) – предположительно ниже.

Алгоритм расчёта

1. Объединить все данные в единый ряд, пометив данные, принадлежащие разным выборкам. 2. Проранжировать значения, приписывая меньшему значению меньший ранг (значению 21 приписываем ранг 1). В случае равных значений признака у нескольких единиц каждой из них присваивается среднее арифметическое последовательных значений рангов. - Например, три числа 31 занимают в едином ранжированном ряду 5, 6 и 7 место (ранг). Следовательно, каждой из них присваивается ранг, равный (5+6+7) / 3 = 6. - Всего рангов получится (n1 + n2) = 15+15 = 30. 3. Подсчитать сумму рангов отдельно для каждой выборки. 4. Определить большую из двух ранговых сумм. 5. Определить эмпирическое значение Uэмп по формуле: Uэмп = n1·n2 + nx·(nx + 1)/2 – Tx, где Uэмп – это численное значение критерия, n1 – объём выборки №1; n2 – объём выборки №2; Tx – большая из двух ранговых сумм; nx – объём максимальной выборки: nx = max(n1, n2). Uэмп = 15·15 + 15·(15 + 1)/2 – 299 = 46 6. Определить критическое значение из специальной таблицыUкр. Для определения Uкр нужно учесть объёмы выборок (n1, n2) и уровень статистической значимости (р), который отражает степень точности вывода о наличии различий. - В психолого-педагогических исследованиях приняты два уровня точности: р ≤ 0,01 – вероятность ошибки 1%; р ≤ 0,05 – вероятность ошибки 5%. 7. Сравнить полученное эмпирическое значение Uэмп с критическим значением Uкр. - Если Uэмп > Uкр(0,05), H0 принимается. - Если Uэмп ≤ Uкр(0,05), H0 отвергается. - Чем меньше значения U, тем достоверность различий выше.

Автоматический расчёт

Для автоматического расчёта U-критерия Манна-Уитни можно использовать следующие онлайн-ресурсы:

  • https://www.psychol-ok.ru/statistics/mann-whitney/index.html

  • https://medstatistic.ru/calculators/calcmann.html

  • https://www.socscistatistics.com/tests/mannwhitney/default2.aspx

  • https://www.statskingdom.com/170median_mann_whitney.html

  • https://planetcalc.com/7858/

  • https://statziki.com/Mannwhitneyu

  • https://math.semestr.ru/corel/mann-whitney.php

  • https://www.omnicalculator.com/statistics/u-test

Применение в экспериментах

Для анализа результатов тестирования в ходе эксперимента критерий применяется дважды:

  • Входное тестирование в контрольной (КГ) и экспериментальной (ЭГ) группах, где должны показать отсутствие различий в группах по изучаемому признаку.

  • Итоговое тестирование в этих группах должно продемонстрировать различие по изучаемому признаку.

Поскольку U-критерий Манна-Уитни является непараметрическим критерием, то в отличие от t-критерия Стьюдента, он не требует наличия нормального распределения сравниваемых выборок.

Связанные критерии

Критерий Краскела-Уоллиса

Аналогом U-критерия Манна-Уитни для сравнения трёх и более групп является Критерий Краскела-Уоллиса.

Критерий Краскела-Уоллиса(https://datatab.net/tutorial/kruskal-wallis-test) – непараметрический статистический критерий, используемый для сравнения 3-х и более независимых выборок по количественному или порядковому признаку.

Критерий был разработан американскими математиками Уильямом Краскелом и Алленом Уоллисом и представлен в их работе «Use of ranks in one-criterion variance analysis» в 1952 году.

Критерий Краскела-Уоллиса подходит для сравнения небольших выборок. Желательно, чтобы в каждой выборке было не менее 5 наблюдений.

Гипотезы для теста Краскела-Уоллиса:

  • H0: Между выборками 1, 2, 3 и т. д. существуют лишь случайные различия по уровню исследуемого признака.

  • H1: Между выборками 1, 2, 3 и т. д. существуют неслучайные различия по уровню исследуемого признака.

Если тест Краскела-Уоллиса значим, это указывает на то, что по крайней мере одна из групп отличается от других. Однако сам тест не сообщает, какие группы отличаются друг от друга – для этого необходимы последовательные попарные сравнения.

Онлайн-ресурсы для расчёта:

  • https://statziki.com/Kruskal

  • https://www.statskingdom.com/kruskal-wallis-calculator.html

  • https://www.socscistatistics.com/tests/kruskal/default.aspx

  • https://datatab.net/statistics-calculator/hypothesis-test/kruskal-wallis-test-calculator

Тест Фридмана для повторных измерений

Тест Фридмана(https://datatab.net/tutorial/friedman-test) является непараметрическим аналогом однофакторного дисперсионного анализа для повторных измерений. Данный критерий является распространением критерия Т Вилкоксона (Уилкоксона) на большее, чем 2, количество условий измерения. Разработан американским экономистом, нобелевским лауреатом Милтоном Фридманом (Milton Friedman).

Он позволяет проверять гипотезы о различии более чем двух (т.е. от 3-х и до 100) повторных измерений по уровню выраженности изучаемой переменной.

Критерий более эффективен, чем дисперсионный анализ в случае малых выборок (до 30 объектов в выборке) и распределений, отличных от нормального. Он основан на ранжировании повторных измерений для каждого объекта выборки.

Критерий применяется для сопоставления показателей, измеренных в разных условиях (c >= 3) на одной и той же выборке из n испытуемых. Критерий Фридмана позволяет установить, что величины показателей от условия к условию изменяются, но при этом не указывает на направление изменений – в этом смысле он похож на критерий знаков.

Гипотезы:

  • Нулевая гипотеза H0 = {между полученными в разных условиях показателями (т.е. между проверяемыми выборками) существуют лишь случайные различия}.

  • Альтернативная гипотеза H1 = {между полученными в разных условиях показателями (т.е. между проверяемыми выборками) имеются существенные неслучайные различия}.

Онлайн-ресурсы для расчёта:

  • https://www.socscistatistics.com/tests/friedman/default.aspx

  • https://datatab.net/statistics-calculator/hypothesis-test/friedman-test-calculator

  • https://www.statskingdom.com/friedman-calculator.html

Показать полностью
0