Калькулятор статистики (среднее, медиана, СКО, квартили)
Вставьте список чисел (разделённых запятыми, пробелами или новыми строками). Калькулятор возвращает описательную статистику, включая меры центральной тенденции, рассеяния и квартили — всё в одном экране.
- Количество (n)
- 9
- Сумма
- 222
- Среднее
- 24,6667
- Медиана
- 25
- Мода
- 25
- Размах
- 28
- Минимум
- 12
- Максимум
- 40
- Q1 (25-й процентиль)
- 16,5
- Q3 (75-й процентиль)
- 32,5
- Стандартное отклонение
- 9,1924
- Дисперсия
- 84,5
Как это работает
Что измеряет каждая статистика
Среднее: сумма, делённая на количество. Чувствительно к выбросам — одно очень большое значение может сильно сдвинуть среднее от типичного. Лучше всего подходит для примерно симметричных данных.
Медиана: центральное значение после сортировки. Устойчива к выбросам — несколько экстремальных значений её не сдвигают. Лучше среднего для скошенных данных, таких как доходы или цены на жильё.
Мода: наиболее часто встречающееся значение. Наиболее полезна для дискретных данных (ответы опросов, результаты бросков кубика). Для непрерывных данных мода часто не несёт смысла — возвращается «нет», если ни одно значение не повторяется.
Стандартное отклонение: типичное расстояние от среднего. Имеет те же единицы, что и ваши данные. Для нормального распределения примерно две трети значений попадают в диапазон ±1 стандартное отклонение от среднего.
Выборка и генеральная совокупность
Если ваши числа — это вся совокупность (все сотрудники компании, все дни месяца), используйте стандартное отклонение совокупности: делите на n. Это включается снятием флага «Выборочное стандартное отклонение».
Если ваши числа — выборка из большой совокупности (опрос 100 из 10 000 клиентов), используйте выборочное стандартное отклонение: делите на n−1 (поправка Бесселя). Это значение по умолчанию и используется в большинстве учебников и программ статистики.
Разница уменьшается с ростом n. При n=100 они отличаются на 0,5%; при n=10 — на 5%. Для очень маленьких выборок выбор имеет значение.
Квартили и МКР
Q1 (первый квартиль, 25-й процентиль) — медиана нижней половины. Q3 (третий квартиль, 75-й процентиль) — медиана верхней половины. Межквартильный размах (МКР = Q3 − Q1) описывает средние 50% данных и устойчив к выбросам.
На ящичковых диаграммах (box plot) ящик охватывает от Q1 до Q3, медиана — линия внутри. Усы протягиваются до наиболее крайних значений в пределах 1,5 × МКР; всё за этим порогом отображается как выбросы.
Частые вопросы
›Сколько чисел можно вставить?
Разумно — до ~100 000. При бо́льших объёмах браузер может замедлиться. Для массивных наборов данных используйте языки программирования (Python, R, Excel).
›Что делать с десятичными числами?
Используйте точку (.) в качестве разделителя независимо от региональных настроек: 3.14, а не 3,14.
›Почему мода отображается как «нет»?
Потому что ни одно значение не повторяется. Мода значима только тогда, когда хотя бы одно значение встречается два раза и более.
›Для данных класса использовать выборку или совокупность?
Если класс рассматривается как выборка из всей школы — выборку (n−1). Если класс и есть вся совокупность — совокупность (n).
›В чём разница между стандартным отклонением и дисперсией?
Дисперсия — среднеквадратическое расстояние от среднего; стандартное отклонение — её квадратный корень. Стандартное отклонение имеет те же единицы, что и данные — поэтому оно обычно более понятно.
›Почему Q1 отличается от результата моего калькулятора?
Существуют разные методы вычисления квартилей (метод включения/исключения медианы, методы Excel и R). Здесь используется метод медианы нижней/верхней половины. Функция КВАРТИЛЬ() в Excel может немного отличаться.
›Поддерживаются ли отрицательные числа?
Да. Отрицательные числа полностью поддерживаются.
›Данные отправляются на сервер?
Нет. Все вычисления выполняются локально в браузере.
Похожие инструменты
Обновлено: