Стандартное отклонение среднего значения выборочных данных

Я не совсем понимаю, что означает эта формула:

о Икс ¯ "=" о н

Я знаю, что такое стандартное отклонение о is - это среднее расстояние моих точек данных (выборок) от среднего значения. Но эта часть сбивает с толку:

Например, пусть случайная величина Икс записывает баллы случайно выбранного учащегося по национальному тесту, где распределение баллов среди населения является нормальным со средним значением 70 и стандартное отклонение 5 ( Н ( 70 , 5 ) ). Учитывая простую случайную выборку (SRS) 200 студентов, распределение выборочного среднего балла имеет среднее значение 70 и стандартное отклонение

5 200 5 14.14 0,35

Источник

Я думал стандартное отклонение о "=" 5 означает, что если я возьму баллы всех студентов и вычислю среднее значение, то среднее расстояние балла от этого среднего будет равно 5 . Набор всех оценок называется «населением», верно? Но здесь говорится, что чем больше баллов я беру, тем ниже стандартное отклонение — таким образом, чем ближе количество выборок к размеру генеральной совокупности, тем ниже стандартное отклонение (и оно становится дальше от 5 ).

Ответы (3)

Во-первых, стандартное отклонение — это не среднее расстояние до среднего, оно всегда равно нулю. Однако это значение для измерения того, насколько точки далеки от среднего или нет. Предполагая, что значения распределены нормально, мы знаем, что ~ 68% значений находятся между мю о и мю + о , например.

Предположим, мы взвешиваем картофель со средним весом 100 г и стандартным отклонением 5 г. Что верно для среднего среднего веса группы из 4 картофелин? Надеюсь, вы видите, что среднее значение среднего веса по-прежнему составляет 100 г. Но каково стандартное отклонение этого среднего веса? Вот где вы используете формулу

о Икс ¯ "=" о н "=" 5 4 "=" 2,5

Не стесняйтесь спрашивать, если вы все еще не понимаете.


Доказательство того, что среднее расстояние между фактическими данными и средним значением равно 0 :
я "=" 1 н ( Икс я мю ) н "=" ( я "=" 1 н Икс я ) мю н н "=" я "=" 1 н Икс я н мю "=" мю мю "=" 0
«Стандартное отклонение — это среднее расстояние между фактическими данными и средним значением». - цитата из: controls.engin.umich.edu/wiki/index.php/…
Тогда этот сайт неправильный. Обратите внимание, что среднее расстояние между фактическими данными и средним значением равно 0. Я напишу почему это в своем ответе, потому что меня тошнит от того факта, что нажатие ввода в комментарии сохраняет комментарий.

Вы вычисляете стандартное отклонение среднего, о Икс ¯ , а не отдельных образцов, о Икс .

Когда переменные независимы, дисперсии складываются. Так

вар я Икс я "=" н вар Икс ,
и разделив на н 2 (дисперсия квадратична),
вар Икс ¯ "=" 1 н вар Икс .

Отсюда извлечение квадратного корня

о Икс ¯ "=" 1 н о Икс .

Это правда, если предположить, что дисперсии Икс я равны.
@ user4205580: гомоскедастичность очевидна из постановки задачи, нет необходимости беспокоить ОП.

Посмотрите внимательно на последнее предложение в цитате: в нем «стандартное отклонение» относится к выборочному среднему . Таким образом, по сути, рассматриваются все возможные выборки из 200 студентов , учитывая, что стандартное отклонение совокупности равно 5. Ответ Вифагора дает формулу для стандартного отклонения среднего значения выборки.

Как понять «стандартное отклонение среднего значения выборочных данных»? Что мы берем все возможные выборки из 200 студентов, вычисляем среднее значение каждого такого набора ( Икс я ), вычислить среднее значение Икс ¯ средств Икс я а затем рассчитать стандартное отклонение, используя Икс я и Икс ¯ ?
Да, но при фактическом вычислении формулы вы можете извлечь знаменатель 200 из суммы среднего значения каждой выборки, что избавит вас от необходимости иметь дело со средним значением каждого такого набора (см. шаг, включающий деление на н 2 в ответе Ива Дауста), что приводит к хорошему простому соотношению между стандартным отклонением среднего значения выборки и стандартным отклонением индивидуальной оценки.