Бинирование или просто пропуск значений в симуляции, чтобы избежать автокорреляции

Question

Бинирование или просто пропуск значений в симуляции, чтобы избежать автокорреляции

Физика
симуляции
анализ данных
статистическая механика

Матц

Учитывая набор данных из общего моделирования Монте-Карло $x_i$ , $(1=1,...,N)$ , ожидается, что автокорреляция произойдет между точками данных в течение времени релаксации $\tau$ (время корреляции) расстояние между собой.

Теперь я знаю, что возможный подход к уменьшению/избежанию корреляции состоит в том, чтобы настроить интервалы, намного превышающие время релаксации, и вычислить среднее значение для каждого интервала, а также ошибку.

Что, если я просто рассмотрю начальный $x_i$ а затем перейти к следующему $x_{i+\tau}$ и так далее и тому подобное для $x_{i+2\tau}$ , $x_{i+3\tau}$ ... по сути, рассматривая эти новые выборки как некоррелированные? В этом случае я не вычисляю средние значения и ошибки, я просто пропускаю достаточное количество точек, чтобы сделать оставшиеся некоррелированными.

Я читал об обоих подходах в литературе, но на самом деле я не уверен, что они оба жизнеспособны.

Ответы (1)

Бинирование или просто пропуск значений в симуляции, чтобы избежать автокорреляции

пользователь197851 · Answer 1

Оба описанных вами подхода вполне жизнеспособны и должны давать аналогичные результаты. Очевидно, что в случае просто выборки точек данных через интервалы $\tau$ , вы отбрасываете промежуточные точки данных; но вы можете разумно ожидать, что они не содержат значительно больше информации, поскольку они сильно коррелируют с точками данных, которые вы делаете выборку, учитывая, что $\tau$ имеет порядок времени корреляции. Но я думаю, что ничего не потеряешь, приняв метод биннинга.

Я говорю «отчасти», потому что оба метода предполагают, что вы знаете время корреляции до того, как начнете. Гораздо важнее (на мой взгляд) выбрать метод анализа данных, который существенно определяет время корреляции как часть оценки ошибки. Классическая статья по этому вопросу — Flyvbjerg and Petersen J Chem Phys, 91,461 (1989), и здесь используется подход биннинга. Короче говоря, вы начинаете с дисперсии, рассчитанной для каждой отдельной точки данных. Затем вы усредняете каждую последующую пару точек данных, давая вдвое меньше точек данных, каждая из которых представляет интервал длины 2, и вычисляете дисперсию этих точек данных. Процесс продолжается рекурсивно с интервалами длины 4, 8, 16 и т. д. и может быть запрограммирован достаточно экономично. Их анализ, основанный на идеях перенормировки, показывает, как можно использовать дисперсии в формуле, которая сходится к наилучшей оценке ошибки среднего (при условии, что прогон моделирования достаточно длинный). Метод описан в большинстве учебников по моделированию.

Бинирование или просто пропуск значений в симуляции, чтобы избежать автокорреляции

Матц

Ответы (1)

пользователь197851

Почему ансамбль NPT используется для твердотельных фазовых переходов?

Можно ли сформулировать ансамбль μVEμVE\mu VE?

Критическая температура и размер решетки с помощью алгоритма Вольфа для двумерной модели Изинга

Отрицательная диффузия или сила, которая изменяет распределение скоростей частиц.

как смоделировать крутой потенциальный барьер в уравнении Ланжевена

Генерация стационарных конфигураций модели Изинга

Спиновые очки перекрываются

Локальные минимумы в модели Изинга в моделировании Монте-Карло

Критическое замедление в симуляциях Монте-Карло (MC)

Подгонка к данным методом наименьших квадратов (функция синуса): какова ошибка полученных параметров подгонки?