У меня есть графический калькулятор HP 50g, и я использую его для расчета стандартного отклонения некоторых данных. В расчете статистики есть тип, который может иметь два значения:
Образец населения
Я не изменил его, но продолжал получать неправильные результаты для стандартного отклонения. Когда я изменил его на тип «Население», я начал получать правильные результаты!
Почему это? Насколько мне известно, существует только один тип стандартного отклонения, который заключается в вычислении среднеквадратичного значения!
Я что-то пропустил?
На самом деле здесь есть две разные формулы для стандартного отклонения: Стандартное отклонение генеральной совокупности и стандартное отклонение выборки .
Если обозначить все значения из совокупности, то стандартное отклонение (популяции) равно
Если обозначать значения из выборки, то стандартное отклонение (выборки) составляет
Причина изменения формулы с образцом такова: когда вы вычисляете вы обычно используете (выборочная дисперсия) для оценки (дисперсия населения). Проблема, однако, в том, что если вы не знаете вы вообще не знаете население значит , либо, поэтому вы должны использовать в том месте формулы, где вы обычно используете . Это вносит небольшую погрешность в расчет: рассчитывается по выборке, значения в среднем ближе к чем они были бы , поэтому сумма квадратов оказывается в среднем меньше, чем . Так уж получилось, что это смещение можно исправить, разделив на вместо . (Доказательство этого является стандартным упражнением в продвинутом курсе бакалавриата или начального курса магистратуры по статистической теории.) Технический термин здесь таков: (из-за деления на ) является несмещенной оценкой .
Другой способ думать об этом состоит в том, что с образцом, который у вас есть независимые фрагменты информации. Однако, поскольку это среднее из тех штук, если знаешь , вы можете понять, что является. Итак, когда вы возводите в квадрат и складываете остатки , есть только независимые части информации там. Так что в этом смысле, возможно, разделив на скорее, чем имеет смысл. Технический термин здесь заключается в том, что существуют степени свободы в остатках .
Для получения дополнительной информации см. статью Википедии о стандартном отклонении выборки .
N-1
независимых фрагментах информации выглядит неубедительно, поскольку вы могли бы применить ту же логику к σ
, но вы не применяете ее, вы применяете ее только к s
.
JM не математик