Стандартное отклонение выборки в сравнении со стандартным отклонением генеральной совокупности

Question

Стандартное отклонение выборки в сравнении со стандартным отклонением генеральной совокупности

статистика
Математика
среднеквадратичное отклонение

Рафид

У меня есть графический калькулятор HP 50g, и я использую его для расчета стандартного отклонения некоторых данных. В расчете статистики есть тип, который может иметь два значения:

Образец населения

Я не изменил его, но продолжал получать неправильные результаты для стандартного отклонения. Когда я изменил его на тип «Население», я начал получать правильные результаты!

Почему это? Насколько мне известно, существует только один тип стандартного отклонения, который заключается в вычислении среднеквадратичного значения!

Я что-то пропустил?

JM не математик

Вопрос @ CrossValidated .

Ответы (1)

Стандартное отклонение выборки в сравнении со стандартным отклонением генеральной совокупности

Майк Спайви · Answer 1

На самом деле здесь есть две разные формулы для стандартного отклонения: Стандартное отклонение генеральной совокупности $\sigma$ и стандартное отклонение выборки $s$ .

Если $x_1, x_2, \ldots, x_N$ обозначить все $N$ значения из совокупности, то стандартное отклонение (популяции) равно

о "=" \sqrt{\frac{1}{Н} \sum_{я "=" 1}^{Н} ({Икс}_{я} - мю)^{2}},

$\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2},$ где

μ

$\mu$ является средним значением населения.

Если $x_1, x_2, \ldots, x_N$ обозначать $N$ значения из выборки, то стандартное отклонение (выборки) составляет

с "=" \sqrt{\frac{1}{Н - 1} \sum_{я "=" 1}^{Н} ({Икс}_{я} - \bar{Икс})^{2}},

$s = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \bar{x})^2},$ где

\bar{x}

$\bar{x}$ является средним значением выборки.

Причина изменения формулы с образцом такова: когда вы вычисляете $s$ вы обычно используете $s^2$ (выборочная дисперсия) для оценки $\sigma^2$ (дисперсия населения). Проблема, однако, в том, что если вы не знаете $\sigma$ вы вообще не знаете население значит $\mu$ , либо, поэтому вы должны использовать $\bar{x}$ в том месте формулы, где вы обычно используете $\mu$ . Это вносит небольшую погрешность в расчет: $\bar{x}$ рассчитывается по выборке, значения $x_i$ в среднем ближе к $\bar{x}$ чем они были бы $\mu$ , поэтому сумма квадратов $\sum_{i=1}^N (x_i - \bar{x})^2$ оказывается в среднем меньше, чем $\sum_{i=1}^N (x_i - \mu)^2$ . Так уж получилось, что это смещение можно исправить, разделив на $N-1$ вместо $N$ . (Доказательство этого является стандартным упражнением в продвинутом курсе бакалавриата или начального курса магистратуры по статистической теории.) Технический термин здесь таков: $s^2$ (из-за деления на $N-1$ ) является несмещенной оценкой $\sigma^2$ .

Другой способ думать об этом состоит в том, что с образцом, который у вас есть $N$ независимые фрагменты информации. Однако, поскольку $\bar{x}$ это среднее из тех $N$ штук, если знаешь $x_1 - \bar{x}, x_2 - \bar{x}, \ldots, x_{N-1} - \bar{x}$ , вы можете понять, что $x_N - \bar{x}$ является. Итак, когда вы возводите в квадрат и складываете остатки $x_i - \bar{x}$ , есть только $N-1$ независимые части информации там. Так что в этом смысле, возможно, разделив на $N-1$ скорее, чем $N$ имеет смысл. Технический термин здесь заключается в том, что существуют $N-1$ степени свободы в остатках $x_i - \bar{x}$ .

Для получения дополнительной информации см. статью Википедии о стандартном отклонении выборки .

Как формула $\frac{ \sigma}{\sqrt{n}}$ родом из $s = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \bar{x})^2}$ ?
@Имрей: это не так. Они относятся к двум разным вещам. Выражение $\sigma/\sqrt{n}$ стандартное отклонение среднего $\bar{x}$ выборочных данных. Выражение $s = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \bar{x})^2}$ стандартное отклонение выборочных данных (а не среднее значение выборочных данных).
«Поскольку x¯ рассчитывается на основе выборки, значения xi в среднем ближе к x¯, чем они были бы к µ» — о, вау, спасибо. Я несколько раз читал объяснение, основанное на df, но это внезапно делает его интуитивно понятным по-другому.
@MikeSpivey: Хорошее объяснение. Но если я знаю, что среднее значение населения равно μ, то не следует ли мне также разделить дисперсию населения на n-1?
@Durin: Нет. Если ты действительно знаешь $\mu$ а ты хочешь посчитать $\sigma$ со всем $N$ конечные значения от населения, то вы ничего не оцениваете. В этом случае $\sigma$ следует рассчитывать, используя прямое среднее квадратов отклонений — делением на $n$ вместо использования версии с поправкой на погрешность оценки, которая делится на $n-1$ .
Так почему же в таком случае я не могу понять это по независимым фрагментам информационной логики "N-1"? Я имею в виду хорошо! Я не оцениваю это время, но мне любопытно, почему первая логика здесь не сработает. Спасибо за ответ.
Разве это не соглашение, обычно используемое $n$ для образца и $N$ для населения?
Не могли бы вы дать ссылку на доказательство «Так получилось, что это предубеждение можно исправить, разделив ...»?
Спасибо за ваше объяснение. Эта часть о N-1независимых фрагментах информации выглядит неубедительно, поскольку вы могли бы применить ту же логику к σ, но вы не применяете ее, вы применяете ее только к s.

Стандартное отклонение выборки в сравнении со стандартным отклонением генеральной совокупности

Рафид

JM не математик

Ответы (1)

Майк Спайви

Коди Багштейн

Майк Спайви

октерн

Дурин

Майк Спайви

Дурин

Бельдаз

Витенис Бивайнис

Витенис Бивайнис

стандартное отклонение выборки с учетом стандартного отклонения генеральной совокупности

Оценка стандартного отклонения совокупности с помощью стандартного отклонения выборки

Стандартное отклонение среднего значения выборочных данных

Стандартное отклонение населения

Почему оценки этого интеграла не учитывают оба равенства?

Определение того, являются ли случайные величины независимыми

Что делать во время докторантуры по математике, чтобы иметь возможность работать в промышленности?

Что такое выборочная дисперсия выборочной дисперсии и что такое теоретическое выборочное распределение?

Выборочное среднее и дисперсия

Путаница - корреляция между -1 и 1