Должна ли кривая Гаусса всегда рисоваться симметрично?

Этот вопрос больше о появлении кривой, которая появляется, когда я анализирую свои данные, а не о реальном вопросе физики, но я думаю, что это актуально.

Я проанализировал некоторые данные из эксперимента EDM и должен выяснить, соответствуют ли данные распределению Гаусса. я использовал х 2 и надстройку решателя Excel, чтобы минимизировать это значение и подогнать полученную функцию к моим данным.

Однако, когда я строю свою кривую соответствия (показана здесь оранжевым цветом), она не симметрична. Это довольно близко, но не совсем. Это проблема? И если вы не возражаете, почему или почему бы и нет?

Несимметричная гауссовская подгонка

Возможно, вам потребуется уточнить вопрос. Функция Гаусса симметрична относительно своего среднего по построению. Ничего не поделаешь. Итак, какая асимметрия вас беспокоит? Что среднее значение не равно нулю? Что подгонка может недооценивать один хвост и переоценивать другой. Что они данные просто имеют некоторый разброс?
Имейте в виду, с тем объемом данных, который у вас есть, все это ожидаемо.
Честно говоря, я не уверен, о чем мне нужно беспокоиться... Похоже, вы говорите, что в реальной ситуации мои данные не будут следовать гауссовой функции, поэтому подгонка не будет точно гаусс. Является ли это следствием построения дискретных значений по сравнению с чем-то, что должно быть непрерывной функцией?
Будет ли Cross Validated лучшим ответом на этот вопрос?
Гауссовы функции по определению симметричны. Когда я ввел свои расчетные значения в функцию и построил график, результат не был симметричным. Означает ли это просто, что мои данные не следуют гауссовскому распределению (но, очевидно, в чем-то похожи)? т.е. некоторые значения при вводе в функцию Гаусса не возвращают симметричную функцию? Что ж, Excel — это программа, которую я должен использовать, а надстройка решателя — это то, что мой лабораторный сценарий говорит мне использовать, поэтому я не собираюсь слишком беспокоиться об этом.
Что такое значение хи-квадрат и как оно было рассчитано, если у вас нет неопределенностей в данных? Это действительно метод наименьших квадратов?
Предполагая, что Флорис удовлетворил вашу жалобу, вы хотели спросить что-то вроде: "Оранжевая линия на графике не симметрична, но предполагается, что она представляет собой симметричную функцию (гауссову). Как это может быть правильным?" Важно сосредоточить наше внимание на правильных чертах фигуры. Поскольку вы спросили о «соответствии», некоторые из нас смотрели на взаимосвязь между вашими данными и функцией соответствия и пытались выяснить, что вас беспокоит.
@Qmechanic В CrossValidated ОП, возможно, получит более статистически строгий ответ, но, возможно, за счет физической интуиции. Это тот редкий случай, когда вопрос относится к обоим сайтам?
Опять же, если предположить, что Флорис затронул реальный вопрос ОП, дело вовсе не в статистике . Речь идет об особенности графического отображения функций. На самом деле это не тема для любого сайта, а побочный вопрос, с которым рано или поздно сталкиваются многие студенты.
Если вы отправите его статистикам, вы не получите ничего, кроме байесовской болтовни и аргументов о предварительном отборе;)
@Jacobadtr Я отредактировал ваш пост, чтобы отразить то, что я считаю вашим реальным вопросом (в основном на основе вашего согласия с ответом Флориса). Если я допустил ошибку, пожалуйста, верните ее (или лучше отредактируйте заново, чтобы уточнить). Редактирование подобных сообщений является важной функцией сайтов обмена стеками, потому что этот вопрос должен помочь будущим посетителям, а также помочь вам разобраться. А тот факт, что нескольким людям пришлось спрашивать и догадываться, что вы имели в виду, свидетельствует о неясности исходного текста.

Ответы (3)

Вот как я интерпретирую случившееся:

Вы использовали Excel для вычисления коэффициентов Гаусса, которые лучше всего описывают данные: среднее значение мю , среднеквадратичное отклонение о и величина А для кривой

Д "=" А е ( Икс мю ) 2 / 2 о 2

Затем вы оценили эту функцию по ряду значений X. Поскольку значения X несимметричны относительно рассчитанного среднего значения, вы не увидите одинаковое значение в соответствующих точках по обе стороны от начала координат.

Если вы точно знаете, что хотите, чтобы аппроксимация Гаусса в Excel была симметричной относительно X = 0, достаточно разрешить Солверу только вычислять о и А , и установите мю "=" 0 .

Маловероятно, что подобранное среднее зашумленных данных точно равно нулю: обычно более важно проверить, может ли оно быть равно нулю : существуют различные статистические тесты, позволяющие определить, согласуется ли конкретный набор наблюдений с конкретной нулевой гипотезой ( в этом случае нулевой гипотезой может быть «данные получены из распределения со средним значением = 0», и не похоже, что ваших данных будет достаточно, чтобы опровергнуть эту гипотезу).

После комментариев к ответу Вольфрама Джонни вы спрашиваете, можете ли вы сделать вывод, что данные распределены по Гауссу. Ответ: «Нет, ты не можешь». Очень трудно (некоторые говорят, что невозможно) доказать что-то истинное. Вы можете только надеяться показать, что не можете доказать, что это ложь.

В вашем примере нулевой гипотезой будет «данные следуют распределению Гаусса». Ваш тест должен был бы сделать х 2 проверить на посадку и посмотреть, соответствует ли значение х 2 достаточно мала, чтобы вы не могли исключить, что это гауссиана. Для этого вы смотрите на значение p - если оно меньше некоторого порога (обычно 0,05), вы можете сказать (с подсказкой @Henry, который предложил более точную формулировку):

«Если эта кривая на самом деле является гауссовой, а я применяю этот метод, я буду ошибочно утверждать, что она не является гауссовой (отклонить эту гипотезу) менее чем в 5% (независимо от того, какое p используется) времени, когда я не должен ее отвергать».

Причина запутанной формулировки заключается в том, что случайная выборка из распределения Гаусса приведет к распределению, которое «выглядит негауссовским» примерно в 1 из 20 раз, когда вы используете это отсечение — другими словами, значение p фактически говорит: «вы получите этот результат примерно в p% случаев, когда распределение является гауссовским».

Поначалу это может немного сбивать с толку. Итог - ваша посадка выглядит хорошо, не беспокойтесь об асимметрии, продолжайте тест на хи-квадрат.

Ради собственного развлечения я сделал описанную выше подгонку (с некоторыми выдуманными данными) и получил следующие результаты:

введите описание изображения здесь

Это "нормальный" вид. Вы можете видеть, что я ввел значения X и Y и создал столбец «соответствия», который зависит от трех ячеек (которые я назвал мю, сигма и А); наконец, я создал метрику ошибок {=SUMSQ(B2:B12-C2:C12)}- обратите внимание на фигурные скобки, которые вы получаете при вводе в качестве «формулы массива» (ctrl-shift-enter на ПК или cmd-shift-enter на Mac). Это позволяет вам вычислять все в одной ячейке, не создавая отдельный столбец со значениями ошибок. Затем я выбрал ячейку с ошибкой и запустил решатель, минимизируя ячейку F6при изменении ячеек F2:F4:

введите описание изображения здесь

Более внимательный взгляд на формулы (используйте Ctrl-Backtick для расширения формул в Excel, но обратите внимание, что он не показывает формулу {}массива... я уверен, что это одна из многих ошибок):

введите описание изображения здесь

Здесь вы можете видеть, что есть встроенная функция =CHITESTдля проверки соответствия между данными и гауссовской подгонкой, и она дает значение ap, которое значительно выше 0,05, поэтому вы не сможете сказать, что эти данные не распределены нормально.

Подгонка по Гауссу симметрична по определению, поскольку является гауссовой. Твоя оранжевая посадка не похожа на гауссову, она даже не гладкая. Я не думаю, что в Excel есть функция подгонки по Гауссу (но я не использую Excel, поэтому не могу сказать наверняка. Вы можете использовать другое программное обеспечение, такое как Matlab, или, вероятно, бесплатные в Интернете. Или просто используйте эти данные для расчета параметров лучше всего подходит гаусс и нарисуйте его в Excel Обновление: я не могу сказать, чего хочет ваш профессор, но я работаю в областях, в которых я работал, когда вы подходите к гауссу, вы подходите к нему с непрерывным (единственный «настоящий» гаусс) , Данные не могут быть симметричными, но гауссовский будет. Фактический источник данных может быть симметричным, но просто случайно и по ошибке ваши данные могут не быть. Теперь, после того, как вы подгоните его под гауссовский, есть тесты, чтобы сказать вам, хорошо ли подходит, и вы можете списать асимметрию на случайность, или если ваши данные не очень хорошо описываются гауссианом. Но я думаю, что это будет довольно продвинуто для того, чего хочет ваш профессор. Я бы сказал (просто на глаз), что ваши данные приемлемо хорошо соответствуют гауссову

Я думаю, как нарисовано, это гауссова оценка по значениям X исходных (данных) точек с линейной интерполяцией. Решатель в Excel может легко определить коэффициенты наилучшего соответствия — это довольно мощный инструмент нелинейной оптимизации, если вы знаете, как его использовать.
@Floris О, понятно, я этого не осознавал, я думал, что это как-то сделано вручную!
Привет, я создал гауссовую подгонку вручную, поэтому я полагаю, что это набор точек вдоль гауссовой подгонки, соединенных прямыми линиями. Я следую лабораторному сценарию, поэтому я уверен, что это то, к чему стремился мой инструктор. Цель здесь состоит в том, чтобы определить, являются ли данные распределенными по Гауссу. Очевидно, что он должен быть непрерывным, и у меня относительно мало измерений, но следует ли ожидать несимметричного свойства моей подгонки?
@Floris Да, это то, что я сделал
Я обновляю свой ответ, но Флорис более подробный

В спецификации я могу понять из вопроса - вот что я бы сделал.

(i) Найдите наиболее подходящий гауссовский алгоритм, который, как я предполагаю, вы и сделали.

(ii) Лучшее соответствие должно возвращать значение хи-квадрат.

Вы должны сравнить значение хи-квадрат с критическими значениями распределения хи-квадрат для соответствующего числа степеней свободы подгонки. Здесь я бы предположил, что у вас есть 3 параметра модели для вашего Гаусса (высота/нормализация, ширина/сигма и среднее значение/центр), 14 точек данных и, следовательно, 14 3 "=" 11 степени свободы.

Например, для 11 степеней свободы вы можете отклонить гипотезу Гаусса с достоверностью 99%, если значение хи-квадрат превышает 24,725.

Таблицы критических значений на: http://www.medcalc.org/manual/chi-square-table.php

(iii) Исследуйте, зависят ли невязки к подгонке от Икс . Если в остатках есть тенденция, то, хотя вы можете получить приемлемый хи-квадрат, тенденция говорит вам о наличии некоторой асимметрии, которая не соответствует гауссиану.

Судя по вашим данным, это не так.