Этот вопрос больше о появлении кривой, которая появляется, когда я анализирую свои данные, а не о реальном вопросе физики, но я думаю, что это актуально.
Я проанализировал некоторые данные из эксперимента EDM и должен выяснить, соответствуют ли данные распределению Гаусса. я использовал и надстройку решателя Excel, чтобы минимизировать это значение и подогнать полученную функцию к моим данным.
Однако, когда я строю свою кривую соответствия (показана здесь оранжевым цветом), она не симметрична. Это довольно близко, но не совсем. Это проблема? И если вы не возражаете, почему или почему бы и нет?
Вот как я интерпретирую случившееся:
Вы использовали Excel для вычисления коэффициентов Гаусса, которые лучше всего описывают данные: среднее значение , среднеквадратичное отклонение и величина для кривой
Затем вы оценили эту функцию по ряду значений X. Поскольку значения X несимметричны относительно рассчитанного среднего значения, вы не увидите одинаковое значение в соответствующих точках по обе стороны от начала координат.
Если вы точно знаете, что хотите, чтобы аппроксимация Гаусса в Excel была симметричной относительно X = 0, достаточно разрешить Солверу только вычислять и , и установите .
Маловероятно, что подобранное среднее зашумленных данных точно равно нулю: обычно более важно проверить, может ли оно быть равно нулю : существуют различные статистические тесты, позволяющие определить, согласуется ли конкретный набор наблюдений с конкретной нулевой гипотезой ( в этом случае нулевой гипотезой может быть «данные получены из распределения со средним значением = 0», и не похоже, что ваших данных будет достаточно, чтобы опровергнуть эту гипотезу).
После комментариев к ответу Вольфрама Джонни вы спрашиваете, можете ли вы сделать вывод, что данные распределены по Гауссу. Ответ: «Нет, ты не можешь». Очень трудно (некоторые говорят, что невозможно) доказать что-то истинное. Вы можете только надеяться показать, что не можете доказать, что это ложь.
В вашем примере нулевой гипотезой будет «данные следуют распределению Гаусса». Ваш тест должен был бы сделать проверить на посадку и посмотреть, соответствует ли значение достаточно мала, чтобы вы не могли исключить, что это гауссиана. Для этого вы смотрите на значение p - если оно меньше некоторого порога (обычно 0,05), вы можете сказать (с подсказкой @Henry, который предложил более точную формулировку):
«Если эта кривая на самом деле является гауссовой, а я применяю этот метод, я буду ошибочно утверждать, что она не является гауссовой (отклонить эту гипотезу) менее чем в 5% (независимо от того, какое p используется) времени, когда я не должен ее отвергать».
Причина запутанной формулировки заключается в том, что случайная выборка из распределения Гаусса приведет к распределению, которое «выглядит негауссовским» примерно в 1 из 20 раз, когда вы используете это отсечение — другими словами, значение p фактически говорит: «вы получите этот результат примерно в p% случаев, когда распределение является гауссовским».
Поначалу это может немного сбивать с толку. Итог - ваша посадка выглядит хорошо, не беспокойтесь об асимметрии, продолжайте тест на хи-квадрат.
Ради собственного развлечения я сделал описанную выше подгонку (с некоторыми выдуманными данными) и получил следующие результаты:
Это "нормальный" вид. Вы можете видеть, что я ввел значения X и Y и создал столбец «соответствия», который зависит от трех ячеек (которые я назвал мю, сигма и А); наконец, я создал метрику ошибок {=SUMSQ(B2:B12-C2:C12)}
- обратите внимание на фигурные скобки, которые вы получаете при вводе в качестве «формулы массива» (ctrl-shift-enter на ПК или cmd-shift-enter на Mac). Это позволяет вам вычислять все в одной ячейке, не создавая отдельный столбец со значениями ошибок. Затем я выбрал ячейку с ошибкой и запустил решатель, минимизируя ячейку F6
при изменении ячеек F2:F4
:
Более внимательный взгляд на формулы (используйте Ctrl-Backtick для расширения формул в Excel, но обратите внимание, что он не показывает формулу {}
массива... я уверен, что это одна из многих ошибок):
Здесь вы можете видеть, что есть встроенная функция =CHITEST
для проверки соответствия между данными и гауссовской подгонкой, и она дает значение ap, которое значительно выше 0,05, поэтому вы не сможете сказать, что эти данные не распределены нормально.
Подгонка по Гауссу симметрична по определению, поскольку является гауссовой. Твоя оранжевая посадка не похожа на гауссову, она даже не гладкая. Я не думаю, что в Excel есть функция подгонки по Гауссу (но я не использую Excel, поэтому не могу сказать наверняка. Вы можете использовать другое программное обеспечение, такое как Matlab, или, вероятно, бесплатные в Интернете. Или просто используйте эти данные для расчета параметров лучше всего подходит гаусс и нарисуйте его в Excel Обновление: я не могу сказать, чего хочет ваш профессор, но я работаю в областях, в которых я работал, когда вы подходите к гауссу, вы подходите к нему с непрерывным (единственный «настоящий» гаусс) , Данные не могут быть симметричными, но гауссовский будет. Фактический источник данных может быть симметричным, но просто случайно и по ошибке ваши данные могут не быть. Теперь, после того, как вы подгоните его под гауссовский, есть тесты, чтобы сказать вам, хорошо ли подходит, и вы можете списать асимметрию на случайность, или если ваши данные не очень хорошо описываются гауссианом. Но я думаю, что это будет довольно продвинуто для того, чего хочет ваш профессор. Я бы сказал (просто на глаз), что ваши данные приемлемо хорошо соответствуют гауссову
В спецификации я могу понять из вопроса - вот что я бы сделал.
(i) Найдите наиболее подходящий гауссовский алгоритм, который, как я предполагаю, вы и сделали.
(ii) Лучшее соответствие должно возвращать значение хи-квадрат.
Вы должны сравнить значение хи-квадрат с критическими значениями распределения хи-квадрат для соответствующего числа степеней свободы подгонки. Здесь я бы предположил, что у вас есть 3 параметра модели для вашего Гаусса (высота/нормализация, ширина/сигма и среднее значение/центр), 14 точек данных и, следовательно, степени свободы.
Например, для 11 степеней свободы вы можете отклонить гипотезу Гаусса с достоверностью 99%, если значение хи-квадрат превышает 24,725.
Таблицы критических значений на: http://www.medcalc.org/manual/chi-square-table.php
(iii) Исследуйте, зависят ли невязки к подгонке от . Если в остатках есть тенденция, то, хотя вы можете получить приемлемый хи-квадрат, тенденция говорит вам о наличии некоторой асимметрии, которая не соответствует гауссиану.
Судя по вашим данным, это не так.
dmckee --- котенок экс-модератор
dmckee --- котенок экс-модератор
jm22b
Qмеханик
jm22b
ПрофРоб
dmckee --- котенок экс-модератор
пайсанко
dmckee --- котенок экс-модератор
ПрофРоб
dmckee --- котенок экс-модератор