Почему целевая функция, используемая в методе Nudged Elastic Band, является разумной?

В методе Nudged Elastic Band (NEB) , который используется для поиска путей реакции, когда известны как начальное, так и конечное состояния, сначала строится целевая функция, а затем минимизируется, чтобы найти пути реакции.

NEB создает цепочку реплик (или «образов») системы между начальным и конечным состояниями и соединяет их пружинами, чтобы представить путь, соединяющий начальное и конечное состояния. Первоначально изображения могут быть линейно интерполированы между реагентом и продуктом. Затем применяется алгоритм оптимизации для релаксации изображений по пути с минимальной энергией (MEP).

Целевая функция строится как комбинация потенциальной энергии каждого изображения и «энергии пружины» между каждым изображением, как показывает приведенное ниже уравнение.

С ( р 0 , . . . , р Н ) "=" я "=" 1 Н 1 Е ( р я ) + я "=" 1 Н к 2 ( р я р я 1 ) 2

Где р я — координаты i-го изображения.

В этой модели NEB решил проблемы «срезания углов» и «сползания вниз», рассматривая вертикальную и параллельную составляющие потенциальной силы и силы струны. Я не буду представлять здесь, вы можете посмотреть эту статью для более подробной информации.

Мой вопрос в том, почему целевая функция выше разумна. Приводит ли минимизация этой целевой функции к MEP в достаточной степени? Если да, то как это доказать? Если нет, то почему эта модель «цепочки состояний» широко используется?

Большое спасибо за ответ.

Ответы (2)

У меня нет опыта в этом вопросе, но я думаю, что некоторая базовая интуиция не помешает.

Скольжения вниз:

Предположим, у вас есть цепочка из резиновых мячей, соединенных упругими пружинами. Поднимите цепь и дайте ей повиснуть. Обратите внимание, что энергия системы точно такая же, как указано выше, с Е ( р н ) "=" м г Z н где Z н это высота мяча н .

Как это будет выглядеть? Нумерация шара внизу как н "=" 1 и те, что над ним, как н "=" 2 , 3... , у вас есть сила на мяче н из тех, что висят внизу, это м г ( н 1 ) . Таким образом, расстояние растяжения пружины под ней равно г ( н ) "=" м г ( н 1 ) / к . Определение высоты мяча 1 как 0, высота мяча н будет

час ( н ) "=" Дж "=" 1 н г ( Дж ) "=" г м ( н 2 н ) 2 к
который выглядит так:

ListLinePlot[
 Table[{0, (g m (-n + n^2))/(2 k) /. {g -> 1, m -> 1, k -> 1}}, {n, 
   10}], Axes -> False, PlotMarkers -> Automatic, AspectRatio -> 4]

введите описание изображения здесь

Как видите, он растягивается вверху, потому что верхние звенья несут больший вес.

Теперь предположим, что вы набрасываете веревку на черепаху (или другой объект в форме холма). Как это будет выглядеть? Из предыдущего примера должно быть интуитивно понятно, что в верхней части черепахи шарики будут растянуты дальше друг от друга, тогда как в нижних краях пружины будут более расслабленными и шарики будут сближены. Другими словами, разрешение в верхней части панциря черепахи хуже, чем в нижних краях.

Это проблема. Когда вы пытаетесь найти поверхность с минимальной энергией, вы хотите получить хорошее разрешение в области седловой точки (также известной как точка невозврата), но этот метод делает прямо противоположное. Именно это имеется в виду, когда в статье говорится «сползание вниз»: бусины провисают к неважным частям и истончаются над важными частями.

Обратите внимание, что сила, вызывающая эту проблему, параллельна пружинам, как упоминалось в статье.

Срезание углов:

Теперь предположим, что вы находитесь в долине между двумя холмами, и что долина изгибается в одном направлении. Бросьте веревку в долину и натяните ее.

Как это выглядит?

Если вы не потянете слишком сильно, он выпрямится и сделает все возможное, чтобы соответствовать форме долины, примерно так:

введите описание изображения здесь

Но если вы потянете его слишком сильно, он начнет срезать угол, вот так:

введите описание изображения здесь

Обратите внимание, что сила, вызывающая эту проблему, перпендикулярна пружинам, как упоминалось в статье.

Хорошее объяснение! Но что вы думаете о самой целевой функции? При достаточном количестве изображений обязательно ли минимизация функции приводит к седловой точке между начальным и конечным состояниями?
На самом деле я недостаточно знаю, чтобы строго доказать, при каких условиях он сходится к траектории с минимальной энергией, но я подозреваю, что практический опыт проверки метода на поверхностях и наблюдения за тем, насколько хорошо он сходится, перевешивает теоретические соображения. Интуитивно кажется вероятным, что она должна сходиться; энергетический член ведет к минимизации энергии цепи, а выбор ненулевого к -const делает цепь несколько жесткой (иначе все шары схлопнулись бы в одну низкоэнергетическую точку в конфигурационном пространстве). Но я действительно не знаю.

Итак, это довольно поздний ответ, но я думал об этом и, кажется, понял это, хотя я даже не уверен, был ли первоначальный NEB реализован с учетом именно этого обоснования, видя, насколько бесцеремонным это кажется быть с его обозначением. Но тем не менее, это хорошее оправдание. Пристегните ремни, потому что это небольшая поездка, которая включает в себя квантовую механику и интегралы по путям Фейнмана, не меньше!

Итак, начнем с понятия «действие». Действие — это величина, определенная на пути. Если у нас есть движение во времени от т "=" 0 к т "=" Т следуя по пути Икс ( т ) тогда действие есть интеграл по времени от лагранжиана, л :

С "=" 0 Т л ( т ) г т "=" 0 Т 1 2 м Икс ˙ 2 В ( Икс ) г т

Это связано с интересным свойством квантовой механики. Если мы спросим себя, «насколько вероятно, что частица может быть найдена на Икс 0 в т "=" 0 в потенциале В затем найти в Икс Н в т "=" Т ?", ответ может быть либо выражен пропагатором, либо интегралом по путям. В частности:

п ( Икс Н , Т ; Икс 0 , 0 ) "=" Икс Н | е я ЧАС Т | Икс 0 "=" А Д [ Икс ( т ) ] е я С

Хорошо. Время объяснения! Первая формулировка — это типичная для вас квантовая нотация скобки: вы выбираете свое начальное состояние, вы развиваете его , используя временной пропагатор, который представляет собой экспоненту гамильтониана (также известную как энергия системы), деленную на планковские постоянные времена. я Т , затем вы проецируете его на желаемое конечное состояние. Перекрытие между развитым состоянием и желаемым состоянием показывает, насколько вероятно, что этот конкретный процесс произойдет. Все еще со мной? Хороший.

Вторая формулировка - это обозначение интеграла по путям Фейнмана. Он говорит немного другое: он говорит, что вероятность нахождения системы в этом конечном состоянии пропорциональна (есть коэффициент нормализации А о которых мы пока не будем беспокоиться) к сумме воображаемой экспоненты действия, деленной на постоянную Планка, для всех возможных путей, соединяющих два состояния за это время . Это то что Д [ Икс ( т ) ] означает: это не интеграл по переменной, это интеграл по функциям . И, как вы можете догадаться, это очень трудно вычислить. Подробнее об этом через минуту. Во-первых, давайте рассмотрим, что означает этот формализм интеграла по путям.

Действие, как и энергия, не является абсолютной величиной, оно определено с точностью до константы, являясь интегралом очень похожей на энергию величины, лагранжиана и всего остального. Итак, давайте предположим, что существует один путь, который соединяет наши два события с минимальным действием, а все остальные пути имеют большее действие. Заметьте, это предположение не всегда верно, а это значит, что это рассуждение и все его последствия могут иногда ошибаться; но опять же, то же самое может сделать и NEB, если есть две одинаково возможные седловые точки, так что потерпите меня. Если мы будем работать в этом предположении, то мы можем установить С "=" 0 для этого пути и С > 0 для всех остальных. Затем эти другие пути будут вносить колебательные члены в общий интеграл, и чем больше С , чем быстрее колебания, тем больше вероятность того, что они просто компенсируют друг друга. Если мы представим сокращение (что является большим нет-нет, это не называется константой напрасно, но давайте сделаем из себя богов и создадим на мгновение свои собственные версии вселенной), затем эти колебания становятся все более и более дикими; и в пределе 0 , то есть в пределе совершенно классической, ньютоновской, совершенно не квантовой вселенной, они полностью выходят из-под контроля, и остается только один путь внести свой вклад: тот, с минимальным действием.

Мы только что получили принцип наименьшего действия , который гласит, что (ньютоновский) путь между двумя точками в пространстве и времени всегда является путем с минимально возможным действием.

Итак, какое это имеет отношение к NEB? Что ж, нам нужно еще несколько шагов и хитрость.

Предположим, у нас есть классическая система, и мы хотим вычислить путь наименьшего действия между двумя точками в пространстве и времени. Дело в том, что все ньютоновские траектории представляют собой путь наименьшего действия между тем, где они начинаются, и тем, куда они приходят; но мы не знаем , куда они прибудут, пока не попробуем их. Здесь вместо этого мы знаем как начальные, так и конечные условия, и ничего не знаем о самом пути (включая начальную скорость). Итак, как нам это сделать, особенно с компьютером? Ну, я бы сказал, мы дискретизируем интеграл для вычисления действия в Н шаги, с шагом по времени г т "=" Т / Н , разбив его на сумму промежуточных шагов Икс 1 , Икс 2 , . . . . Таким образом, действие становится:

С "=" я "=" 0 Н [ 1 2 м Икс я ˙ 2 В ( Икс я ) ] г т

Между прочим, эта дискретизация также является отличным способом вычисления приведенного выше интеграла и часто используется, например, в квантовой теории поля. Так как же нам рассчитать эти скорости? Ну, давайте просто предположим, что они постоянны между каждой парой шагов, так что

Икс я ˙ "=" Икс я Икс я 1 г т

и

С "=" я "=" я Н 1 2 м ( Икс я Икс я 1 ) 2 г т я "=" 0 Н В ( Икс я ) г т

Это начинает выглядеть как ваша исходная функция объекта NEB, если вы возьмете к "=" м / г т ?

Но видите, есть еще проблема, а именно тот пагубный знак «минус» перед потенциалом. В вашей оригинальной формуле это плюс! Это гамильтониан, а не лагранжиан. Итак, что заставляет его исчезнуть?

Последний трюк, клянусь. Время вращения фитиля . Еще один фаворит поставщиков QFT.

Это звучит немного похоже на магию, правда. Видите тот квантовый пропагатор вверху? Я имею в виду это:

е я ЧАС т

Теперь, если вы знаете, что гамильтониан в основном представляет собой энергию системы, это очень похоже на статистическую сумму. Итак, давайте сделаем так, чтобы это выглядело как один. Сделаем изменение параметров: Т я т .

е я ЧАС т е ЧАС т

Хорошо, это должно быть мошенничество, верно? Но на самом деле все в порядке, мы просто переопределяем один параметр в нашей математике, ничего не меняется. Мы называем т «воображаемое время», и единственное, что действительно важно помнить, это то, что оно не имеет ничего общего с реальным временем, и мы никогда не должны связывать их так, как если бы они были одним и тем же, а это не так. Теперь давайте посмотрим, что это делает для нашего действия. Мы должны изменить его элемент времени, поэтому г т я г т , но посмотрим, что произойдет...

С "=" я я "=" я Н 1 2 м ( Икс я Икс я 1 ) 2 г т + я я "=" 0 Н В ( Икс я ) г т

Ну вот и у нас! Есть также много удобных следствий, например, если мы вернемся к интегралу по траекториям, теперь неминимальные действия не просто осциллируют, они экспоненциально исчезают , и это делает сходимость интеграла намного лучше. Но при этом мы потеряли первоначальную связь между путями и динамикой! Эти пути, которые мы получаем в результате оптимизации этого действия, не являются реальными путями, это пути в «воображаемом времени», что, честно говоря, звучит как что-то из плохого эпизода «Доктора Кто». Так имеет ли это время отношение к чему-либо? Что ж, проверьте ту часть, где мы впервые выполнили вращение фитиля. Это очень похоже на функцию распределения, верно? На самом деле, это была бы полностью статистическая сумма, если бы мы установили т "=" β ( β здесь это обычная обратная величина температуры, умноженная на постоянную Больцмана). Итак, у вас есть: мнимое время обратно пропорционально температуре . Когда вы вычисляете этот путь, как показано выше, вы не ищете конкретный путь во времени, вы ищете путь при заданной температуре, и чем выше Т (последний раз), чем ниже эта температура... э... Т Я думаю (хорошо, я понимаю, что на самом деле использовал несколько запутанных обозначений. Извините за это). Оказывается, ваш к в целевой функции NEB точно пропорциональна температуре. Установите его высоко, и частицы будут срезать углы: у них достаточно кинетической энергии для этого. Установите низкое значение, и частицы просто соскользнут обратно в свои потенциальные бассейны: они не могут покинуть их.

Вот почему NEB использует эту целевую функцию и каков ее физический смысл.

Функция объекта, которую вы записали, предназначена не для NED, а для простого метода эластичной ленты. NED начинает с этого действия, но удаляет силу пружины perp на пути, а вдоль пути NEB игнорирует все, кроме силы пружины.
Объектная функция, которую он пытается свести к минимуму, концептуально та же самая; Затем NEB добавляет искусственные поправки, чтобы попытаться избежать проблемы избыточного натяжения пружины, приводящей к тому, что путь просто проходит по кратчайшему пути, а не соскальзывает в седловую точку. Я не думаю, что для этого есть более глубокое теоретическое обоснование, чем «это работает». Разница в том, что NEB ищет только путь, а не конкретный процесс при заданной температуре.