Почему граничные условия делают вариационный принцип нечетким?

Позвольте мне начать с определений, к которым я привык. Позволять я [ Φ я ] быть действием для некоторого набора полей. Вариация полей о конфигурации поля Φ 0 я ( Икс ) представляет собой однопараметрическое семейство конфигураций поля Φ я ( λ , Икс ) такой, что Φ я ( 0 , Икс ) "=" Φ 0 я ( Икс ) где λ е ( ϵ , ϵ ) . Мы берем карту λ Φ я ( λ , Икс ) быть дифференцируемым. В этом случае первая вариация определяется как

(1) дельта Φ я ( Икс ) λ | λ "=" 0 Φ я ( λ , Икс ) .

Точно так же первая вариация действия определяется как

(2) дельта я [ Φ я ] д д λ я [ Φ λ я ] , Φ λ я Φ я ( λ , ) .

Теперь, насколько я понимаю, вариационный принцип — это утверждение о том, что физическая классическая конфигурация поля должна быть Φ я такой, что дельта я [ Φ я ] "=" 0 для любой первой вариации дельта Φ я .

Так уж сложилось, что большую часть времени я [ Φ я ] является интегралом по пространству-времени некоторой лагранжевой плотности д -форма л [ Φ я ] . Тогда, если М имеет какую-то границу М может случиться, что дельта я [ Φ я ] имеет граничные условия, способствующие этому.

Теперь в этой статье авторы говорят, что такие граничные условия делают вариационный принцип нечетким (см. стр. 61):

Как утверждали Регге и Тейтельбойм, действие должно иметь четко определенные функциональные производные: оно должно иметь вид дельта я [ ф ] "=" ( что-нибудь ) дельта ф без дополнительных граничных членов, портящих производную. Действие должно быть дифференцируемым , чтобы принцип экстремума имел смысл.

Это также упоминается на странице WP о термине Гиббонса-Хокинга-Йорка в гравитации:

Действие Эйнштейна-Гильберта является основой для самого элементарного вариационного принципа, из которого можно определить уравнения поля общей теории относительности. Однако использование действия Эйнштейна-Гильберта уместно только тогда, когда базовое пространственно-временное многообразие М является замкнутым, т. е. многообразием, которое одновременно компактно и не имеет края. В случае, если многообразие имеет границу М , действие следует дополнить граничным членом, чтобы вариационный принцип был корректно определен.

Упомянутый выше граничный член вводится именно для того, чтобы сократить один граничный член, появляющийся при изменении действия Эйнштейна-Гильберта. Итак, я снова понимаю это как высказывание о том, что если бы вариация действия ЭГ имела такой граничный член, вариационный принцип не был бы четко определен.

Теперь, хотя это кажется такой простой вещью, я должен признаться, что до сих пор не понял:

  1. Что касается обсуждения в связанной статье, при повторном применении правила Либница изменение плотности Лагранжа л всегда можно записать как

    (3) дельта л "=" Е я дельта Φ я + д Θ ,
    где Е я являются уравнениями движения и Θ — предсимплетический потенциал. Таким образом, действие имеет вид
    (4) дельта я [ Φ я ] "=" М Е я дельта Φ я + М Θ ,
    Я не понимаю, как присутствие Θ мешает нам определить Е я как функциональные производные.

    Более того, для меня наиболее разумным понятием дифференцируемости действия является утверждение, что λ я [ Φ λ я ] является дифференцируемым отображением. Я не понимаю, как граничные условия влияют на это.

    Так почему же граничные термины в дельта я [ Φ я ] дает плохо определенные функциональные производные? И в каком смысле это делает я не дифференцируемый?

  2. Что еще более важно, и статья, и страница WP по термину GHY ссылаются на плохо определенный вариационный принцип, если дельта я [ Φ я ] содержит граничные условия. У нас есть отображение λ я [ Φ λ я ] и ищем экстремум такого отображения. Я не понимаю, как тот факт, что дельта я [ Φ я ] имеет граничные члены, сделало бы эту задачу оптимизации нечеткой.

    Так почему же граничные условия делают вариационный принцип нечетким? Другими словами, почему хорошо определенный вариационный принцип требует дельта я [ Φ я ] быть в форме дельта я [ Φ я ] "=" ( что-нибудь ) дельта Φ я как утверждают авторы статьи?

Ответы (3)

Если у нас есть неисчезающие граничные члены, то отображение λ я [ Φ λ я ] не дифференцируема в следующем смысле. Используя несколько менее сложные обозначения, пусть

я [ Φ λ я : η ] "=" М л ( Φ 0 я ( Икс ) + λ η ( Икс ) , Φ 0 я ( Икс ) + λ η ( Икс ) ) д 4 Икс

для произвольной дифференцируемой функции η . Это отображение заведомо дифференцируемо, и мы находим, что

д д λ я [ Φ λ я : η ] | λ "=" 0 "=" М ( л Φ 0 я мю [ л ( мю Φ 0 я ) ] ) η ( Икс )   д 4 Икс + М н мю л ( мю Φ 0 я ) η ( Икс )   д С

где н мю являются компонентами вектора нормали к поверхности. Это дифференцируемость по Гато . Однако эта производная Гато в общем случае зависит от того, какой η мы выбираем.

Конечная цель состоит в том, чтобы потребовать, чтобы изменение функционала действия обращалось в нуль независимо от нашего выбора. η . Если предположить, что граничный член равен нулю, это означает, что

М Е [ Φ 0 я ] η ( Икс ) д 4 Икс "=" 0 Е [ Φ 0 я ] "=" 0

Однако при наличии граничных членов такая импликация невозможна. Для любой конкретной конфигурации поля изменение интеграла действия становится

д д λ я [ Φ λ я : η ] | λ "=" 0 "=" М ф ( Икс ) η ( Икс ) д 4 Икс + М н мю г мю ( Икс ) η ( Икс ) д С

Чтобы это исчезло для произвольного η , либо оба интеграла должны обращаться в нуль, либо они должны компенсировать друг друга. В первом случае граничные члены все-таки отсутствуют, а во втором случае фактически не работает. Чтобы увидеть это, представьте, что

М ф ( Икс ) η ( Икс ) д 4 Икс "=" М н мю г мю ( Икс ) η ( Икс ) д С "=" С 0

для некоторого выбора η , и обратите внимание, что мы всегда можем добавить к η гладкая функция, которая обращается в нуль на границе, но имеет носитель в любой выбранной нами области объема. Это изменит первый интеграл, но не второй, тем самым нарушив равенство. Следовательно, хотя два интеграла могут сократиться для некоторых вариантов выбора η , они не могут отменить для всех вариантов η (опять же, если они оба не исчезают в первую очередь).

Еще хуже в определенном смысле то, что наличие ненулевых граничных членов предполагает, по причинам, которые непосредственно вытекают из приведенных выше, что вариация может принимать любое значение в р соответствующим масштабированием η .

Можно думать об этом как об аналогии с многомерным исчислением. Существование частных (Гато) производных некоторой функции (функционала действия) по какому-либо конкретному направлению (при произвольном выборе η ) недостаточно, чтобы гарантировать дифференцируемость отображения. В этом случае, с прицелом на нашу конечную цель получить исчезающую функциональную производную, которая не зависит от η , назовем функционал дифференцируемым, если его производную Фреше можно представить в виде

д д λ я [ Φ λ я : η ] | λ "=" 0 "=" М Е [ Φ 0 я ]   η ( Икс ) д 4 Икс

и определим его функциональную производную как Е [ Φ 0 я ] .


Я хотел бы сделать небольшое замечание по вашему заявлению

Я не понимаю, как присутствие Θ мешает нам определить Е я как функциональные производные.

В том, что вы говорите, есть большая доля правды. В самом деле, если все, что вам нужно, это уравнения Эйлера-Лагранжа для поля, то вы могли бы утверждать, что правильный формальный рецепт состоит в том, чтобы варьировать действие, отбрасывать любые граничные члены , а затем требовать, чтобы вариация исчезла. Это кажется немного неэлегантным, но это даст вам уравнения, которые вы ищете.

Однако при переходе к гамильтоновой структуре возникают проблемы. Неоднозначность граничных терминов приводит к неоднозначности при попытке определить, например, понятия полной энергии конкретного пространства-времени. В отсутствие поверхностных членов гамильтониан обращается в нуль при г я Дж , π я Дж которые подчиняются уравнениям движения; выбор граничного члена сводится к выбору значения интеграла гамильтониана по всему пространству-времени, а член GHY дает энергию ADM.

Такие граничные условия, по-видимому, также очень важны для квантовой гравитации, но это область, с которой я совершенно не знаком, поэтому я не могу дать ей разумного комментария.


Позвольте мне кое-что спросить, вы говорите: «Однако при наличии граничных условий такое следствие невозможно». Если мы потребуем дельта я [ Φ 0 я ] "=" 0 относительно любой вариации, то, в частности, это справедливо для компактно поддерживаемых η ( Икс ) . Это не означало бы

М Е [ Φ 0 я ] η ( Икс ) д 4 Икс "=" 0
для всех компактно поддерживаемых η ( Икс ) и, в свою очередь, подразумевает Е [ Φ 0 я ] "=" 0 даже при наличии граничных условий? Что здесь не так?

Похоже, вы ослабляете требование, чтобы действие было стационарным при произвольных вариациях, до требования, чтобы действие было стационарным только при вариациях с компактной поддержкой. Если вы сделаете это, то вы вернете импликацию (и, следовательно, уравнения EL). Однако это означает, что вы сужаете пространство «кандидатных» конфигураций полей до тех, которые идентичны исходной на границе.

Если вас не интересует какая-либо временная эволюция на границе, то это нормально; в общем, это слишком ограничительно. Можно, например, представить себе комбинацию начальных условий и эволюционных уравнений, которая обязательно изменит поле на границе. Наложение фиксированных (Дирихле) граничных условий в дополнение к уравнениям эволюции и этому конкретному начальному условию вообще не привело бы к решениям.

Что еще хуже, в частном случае гравитации плотность Лагранжа фактически содержит вторые производные метрики в виде полной производной

мю ( час мю ν ν Φ 0 я )
это возможность, которую я не рассматривал в работе, которую я сделал выше. В этом случае следует, что граничный член становится

М н мю [ г мю ( Икс ) η ( Икс ) + час мю ν ( Икс ) ν η ( Икс ) ] д С

В этом случае было бы недостаточно зафиксировать вариацию на границе — нам также нужно было бы зафиксировать и ее производные. Это неприемлемо, так как сами уравнения движения второго порядка; исправление обоих Φ 0 я и ν Φ 0 я на границе в целом переопределили бы систему, за исключением тех случайных случаев, когда н мю час мю ν 0 .

Спасибо за отличный ответ! Позвольте мне кое-что спросить, вы говорите: «Однако при наличии граничных условий такое следствие невозможно». Если мы потребуем дельта я [ Φ 0 я ] "=" 0 относительно любой вариации , то, в частности, это справедливо для компактно поддерживаемых η ( Икс ) . Это не означало бы
М Е [ Φ 0 я ] η ( Икс ) д 4 Икс "=" 0 ,
для всех компактно поддерживаемых η ( Икс ) и, в свою очередь, подразумевает Е [ Φ 0 я ] "=" 0 даже при наличии граничных условий? Что здесь не так?
@ user1620696 Я отредактировал свой ответ, чтобы ответить на ваш вопрос.

Вот один комментарий. Если мы адаптируем определение OP

(4) дельта я [ Φ я ] "=" М Е я дельта Φ я + М Θ я дельта Φ я ,

тогда для объемного срока Е я и пограничный срок Θ я чтобы быть однозначно определенными, мы должны для начала установить, что они не являются дифференциальными операторами ненулевого порядка (действующими на дельта Φ я ), а просто функции (т.е. дифференциальные операторы нулевого порядка), потому что в противном случае мы могли бы использовать приемы а-ля интегрирование по частям, чтобы перераспределить то, что принадлежит объему, и то, что принадлежит границе. Для действия EH на многообразии с краем оказывается , что это невозможно без граничного члена GHY (из-за высших производных по пространству-времени в действии EH).

Я не полностью согласен ни с одним из ответов, поэтому вот еще один. Похоже, что вопросы ОП по существу сводятся к двум достаточно самостоятельным вопросам:

Вопрос 1: Каково определение функциональной производной действия и влияют ли на это определение граничные условия?

Вопрос 2. Что делает вариационный принцип корректным или неправильным и как на это влияют граничные условия?


I. О функциональной производной: мне не нравится понятие «функциональная производная», потому что в том виде, в каком оно встречается в большинстве текстов и публикаций по физике, оно не является строго определенным математическим объектом или оператором. Давайте тогда проведем различие между функциональной производной и оператором Эйлера-Лагранжа (оператор EL).

Предположим, что Икс гладкий н -многообразие, π : Д Икс является гладким расслоенным многообразием над Икс сечениями (возможно, локальными) являются поля, возникающие в вариационной задаче, и пусть л : Дж ( π ) Λ н Икс быть лагранжианом н -форма. В этом ответе я хочу максимально избегать использования реактивных пространств, поэтому определение лагранжиана н -форма будет такой для каждой локальной секции ф е Г π ( U ) из π над U Икс он ассоциируется с гладкой н -форма л [ ф ] е Ом н ( U ) над U и обладает тем свойством, что существует неотрицательное целое число р е Н (так называемый порядок л ) такое, что если два сечения ф , ψ оба определены рядом Икс имеет те же производные до порядка включительно р в Икс (производные берутся по любой расслоенной карте расслоения π ), затем л [ ф ] Икс "=" л [ ψ ] Икс . Работая с расслоенной диаграммой, это позволяет нам написать знакомый

л [ ф ] Икс "=" л ( Икс , ф ( Икс ) , ф ( 1 ) ( Икс ) , , ф ( р ) ( Икс ) ) д Икс 1 д Икс н
форма для лагранжиана н -форма. Тогда внешние производные являются полными внешними производными, т. е. они дифференцируются через функциональные зависимости поля ф и его производные.

Тогда первая вариационная формула для лагранжиана имеет вид

дельта л [ ф , дельта ф ] "=" Е ( л ) [ ф ] дельта ф + д Θ [ ф , дельта ф ] ,
где вообще Е ( л ) [ ф ] порядок 2 р в ф и алгебраический в дельта ф (обозначается «точечной нотацией»), а Θ порядок 2 р 1 в ф и заказать р 1 и линейный по дельта ф .

Эта формула верна и глобально, но если р > 2 и н > 1 то глобально существующее Θ н 1 -форма строится не только из коэффициентов лагранжиана, она нуждается в некоторых дополнительных данных, таких как разбиение единицы или связь. Излишне говорить, что он не уникален. Оператор нулевого порядка дельта ф Е ( л ) дельта ф однако глобально определен и уникален. Мы называем л Е ( л ) оператор ЭЛ .

Заметим, что здесь вообще не нужны никакие граничные условия. Другой взгляд на вещи заключается в том, чтобы определить

Е ( л ) "=" [ дельта л ] "=" дельта л мод точные условия .
Получается, что каждый класс [ дельта л ] имеет единственного представителя, который является алгебраическим, а не дифференциальным, в вариации поля дельта ф . Этот канонический представитель этого класса в точности
Е ( л ) дельта ф "=" к "=" 0 р ( 1 ) к д мю 1 д мю к л ф , мю 1 . . . мю к я дельта ф я д н Икс .

Таким образом, это по существу согласуется с тем, что написал ОП, и на это также ссылается ответ Дж. Мюррея. Нет ничего плохого в том, чтобы определить оператор EL таким образом, и на самом деле так это делается (по крайней мере, в духе), например. теория вариационного бикомплекса .

Напротив, для подходящего понятия функциональной производной д мы хотели бы следующее:

  1. Космос Ф "=" Г π ( Икс ) гладких сечений можно снабдить некоторой обобщенной дифференцируемой структурой.
  2. Функционалы (т.е. в основном функции на Ф ) формы
    С [ ф ] "=" Икс л [ ф ]
    где л гладкий порядок р лагранжевы, гладкие.
  3. Функциональная производная д является своего рода корректно определенным дифференциальным оператором над гладкими функциями на Ф которые в некотором смысле воспроизводят оператор EL, например. д С "=" 0 Е ( л ) "=" 0 , в любое время С является функционалом «действующего типа».
  4. Функциональная производная в принципе может быть применена к функционалам более общим , чем функционалы действия, т. е. к тем, которые «менее локальны».

Это можно сделать, и я сделаю это в приложении в конце этого ответа. Однако это несколько тонко. Чтобы проиллюстрировать некоторые тонкости, пространство Г π ( Икс ) может быть пустым, т.е. расслоение π может не иметь глобальных разделов. Предыдущий «формальный» подход, давший нам определение EL-оператора, представляет собой локальную формулировку, которая по существу оперирует пучками (точнее, струями) сечений, поэтому, если множество глобальных сечений пусто, мы всегда можем ограничиться дополнительными. Менее очевидно, как учесть эту локальность в чисто функциональной постановке, поскольку функциональное пространство должно быть зафиксировано раз и навсегда. Кроме того, даже если существуют глобальные сечения, интеграл С [ ф ] "=" Икс л [ ф ] может не сходиться, хотя как «формальный интеграл» (ср. формальный степенной ряд) он по-прежнему несет достоверную информацию.

Поскольку формальный подход работает без интегралов, это не проблема.

Дело в том, что ОП по существу верен с

Я не понимаю, как присутствие Θ мешает нам определить Е я как функциональные производные.

хотя, по моему мнению, я бы заменил здесь термин «функциональная производная» на «оператор EL».

Тем не менее, в конце этого ответа будет дано строгое определение функциональной производной, которое, надеюсь, иллюстрирует, как граничные условия связаны с определением.

II. О правильности вариационных принципов: В этом разделе я буду иметь дело только с вариационной формулировкой обыкновенных дифференциальных уравнений (ОДУ). Причина этого в том, что в отличие от ОДУ, где теорема существования и единственности Пикара-Линделёфа дает очень общий набор критериев корректности дифференциальных уравнений, системы частных дифференциальных уравнений не имеют аналогичных теорем, по крайней мере, тех, чья общность сравнима.

Итак, рассмотрим следующие данные:

  1. Замкнутый и компактный интервал я "=" [ т 0 , т 1 ] .
  2. Гладкий н -многообразие Вопрос (конфигурационное пространство). Я хочу работать с координатами, поэтому предположим, что Вопрос р н является открытым множеством. Обобщение на случай, когда Вопрос является более общим многообразием.
  3. Гладкая функция Лагранжа
    л [ д ] ( т ) "=" л ( т , д ( т ) , д ( 1 ) ( т ) , , д ( р ) ( т ) )
    порядка р .
  4. Функциональное пространство Ф "=" С ( я , Вопрос ) гладких функций из я к Вопрос .

Нам нужна общая формула первой вариации для лагранжиана. Это

дельта л "=" Е я дельта д я + д д т ( к "=" 0 р 1 п я ( к + 1 ) дельта д ( к ) я ) ,
где конечно ф ( к ) "=" д к ф / д т к , а канонические импульсы равны
п я ( к ) "=" л "=" 0 р к ( 1 ) л д л д т л л д ( к + л ) я , 1 к р .
Обратите внимание, что официально продолжая к "=" 0 у нас есть п я ( 0 ) "=" Е я .

II. А. Граничные условия:

С вариационной задачей связаны два вида граничных условий: наложенные граничные условия и естественные граничные условия . Это всего лишь две крайности, на практике можно использовать их смесь.

Позволять

Б "=" { а 0 я , а 1 я , , а р 1 я , б 0 я , б 1 я , , б р 1 я }
быть набором 2 н р числа, которые мы называем граничными условиями . Наложение граничных условий означает, что мы рассматриваем только те (гладкие) траектории д : я Вопрос которые удовлетворяют
д ( к ) я ( т 0 ) "=" а к я , д ( к ) я "=" б к я , 0 к р 1.
Позволять
Ф Б "=" { д е Ф :   д  удовлетворяет БК  Б } .

Таким образом, если граничные условия Б накладываются, рассмотрим вариационный принцип в редуцированном функциональном пространстве Ф Б . Поскольку мы варьируемся в этом классе, вариации траекторий гладкие и удовлетворяют

дельта д ( к ) я ( т 0 ) "=" дельта д ( к ) я ( т 1 ) "=" 0 , 0 к р 1.

Отсюда следует, что первый вариант действия есть

дельта С "=" т 0 т 1 Е я дельта д я д т ,
поскольку граничные члены исчезают из-за граничных условий. Отсюда условие стационарности дельта С "=" 0 приводит к дифференциальному уравнению Е я [ д ] "=" 0 .

Чтобы получить естественные граничные условия, вместо этого мы рассматриваем полное пространство Ф как поле для вариационной задачи. Первый вариант действия становится

дельта С "=" т 0 т 1 Е я дельта д я д т + к "=" 0 р 1 п я ( к + 1 ) дельта д ( к ) я | т 0 т 1 ,
с ненулевыми граничными членами. Если дельта С "=" 0 должен быть действителен на некоторой траектории д для любого варианта дельта д , это также должно быть верно для тех вариантов, которые, например. удовлетворяют граничному условию Б или иметь поддержку строго в течение я , следовательно, уравнение ЭЛ Е я [ д ] "=" 0 надо еще применить. Однако, возвращая это в формулу первого варианта для действия, мы получаем чистый граничный член:
дельта С [ д ] "=" к "=" 0 р 1 п я ( к + 1 ) [ д ] ( т 1 ) дельта д ( к ) я ( т 1 ) к "=" 0 р 1 п я ( к + 1 ) [ д ] ( т 0 ) дельта д ( к ) я ( т 0 ) .

Поскольку вариации и их производные в принципе могут принимать любое возможное значение на концах, мы получаем, что все коэффициенты должны обращаться в нуль отдельно друг от друга, следовательно

п я ( к ) ( т 1 ) "=" п я ( к ) ( т 0 ) "=" д , 1 к р .
Другими словами, канонические импульсы должны обращаться в нуль на концах. Это опять набор 2 н р граничные условия на функции д я ( т ) , а поскольку они появились динамически, мы называем их «естественными».

II. B. Корректные вариационные принципы:

Общее определение корректной вариационной задачи следующее: Вариационный принцип дельта С [ д ] "=" 0 является корректным, если при соответствующих граничных условиях (наложенных или естественных) существует одна и только одна экстремаль действия.

Если лагранжиан л порядок р , имеется примерно три достаточных условия корректности вариационного принципа. Я не осмеливаюсь утверждать, что они также необходимы, так как я предполагаю, что даже если некоторые из них будут нарушены, могут произойти некоторые странные происшествия, но для большинства намерений и целей эти условия также необходимы:

  1. Лагранжиан л должен быть регулярным, т.
    дет ( 2 л д ( р ) я д ( р ) Дж ) 0
    .
  2. Уравнения ЭЛ Е я [ д ] "=" 0 порядок 2 р (на самом деле, 1. подразумевает это, но не наоборот).
  3. Никаких «неудачных выборов данных конечной точки» не делается.

Пункт 3 здесь самый загадочный, но он будет раскрыт позже. Уравнения ЭЛ имеют вид

Е я [ д ] "=" ( 1 ) р 2 л д ( р ) я д ( р ) Дж д ( 2 р ) Дж + Условия более низкого порядка ,
таким образом, если выполняется условие 1. и матрица Вт я Дж "=" 2 л д ( р ) я д ( р ) Дж обратимо, умножая на обратное, получаем
д ( 2 р ) я "=" ф я ( т , д , д ( 1 ) , , д ( 2 р 1 ) )
для уравнения EL, которое находится в стандартной форме, и применима теорема Пикара-Линделёфа (PL). Мы это знаем - когда-то в начальный раз т 0 фиксировано, это уравнение имеет единственное решение при начальных положениях, скоростях, ускорениях, ..., 2 р 1 -производные д я ( т 0 ) , д ( 1 ) я ( т 0 ) , , д ( 2 р 1 ) я ( т 0 ) указаны. Это 2 н р исходные данные.

Но мы видели, что количество граничных условий (наложенных или естественных) также 2 н р , поэтому с чисто «нумерологической» точки зрения граничные условия содержат достаточно данных, чтобы однозначно определить решение уравнения ЭЛ.

Однако вариационный принцип требует граничных условий, а PL-теорема требует начальных данных. «Большую часть времени» между ними существует биективная карта, но для «плохого» выбора конечных точек это соответствие может нарушиться. Типичным примером является гармонический осциллятор.

д ¨ + к 2 д "=" 0 ,
общее решение которого
д ( т ) "=" с 1 потому что ( к т ) + с 2 грех ( к т ) ,
где с 1 и с 2 может быть прямо связано с начальными условиями, например. т "=" 0 . Рассмотрим, однако, краевую задачу д ( 0 ) "=" а ,   д ( Т ) "=" б в последний раз Т . Отношения
а "=" с 1 , б "=" с 1 потому что ( к Т ) + с 2 грех ( к Т ) ,
что неразрешимо для с 2 с точки зрения а и б когда Т "=" н π / к для н е Z . Так, например, если мы выберем интервал я "=" [ 0 , π / к ] для области динамики вариационный принцип для гармонического осциллятора становится плохо определенным, даже если условия 1. (и, следовательно, 2.) выполняются.

С другой стороны, если все условия 1., 2. и 3. выполнены, то 1) уравнение EL имеет стандартную форму и, таким образом, применима теорема PL, 2) граничные условия (наложенные или естественные) дают точно 2 н р части данных для дифференциального уравнения, 3) эти данные могут быть биективно отображены в исходные данные, следовательно, существует единственная экстремаль для вариационной задачи, и, таким образом, вариационный принцип корректен.

II. C. Хорошо, но какое это имеет отношение к граничным терминам?

Начните с примера: лагранжиан

л "=" 1 2 д д ¨ 1 2 к 2 д 2 .
Это лагранжиан второго порядка для гармонического осциллятора. Его можно получить из обычного добавлением полной производной по времени. Вариант
дельта л "=" ( д ¨ + к 2 д ) дельта д + д д т ( 1 2 д ˙ дельта д 1 2 д дельта д ˙ ) .
Предполагая интервал я "=" [ 0 , Т ] и для простоты Т н π / к , наложенные граничные условия
д ( 0 ) "=" а , д ( Т ) "=" б д ˙ ( 0 ) "=" а , д ˙ ( Т ) "=" б ,
где а , а , б , б являются независимыми данными. Это четыре части данных для уравнения второго порядка, поэтому, указав их соответствующим образом, можно создать неразрешимую систему. Поскольку теперь существуют граничные условия, для которых нет экстремалей, этот вариационный принцип уже не корректен.

Следует, однако, заметить, что «обычный» лагранжиан л "=" 1 2 д ˙ 2 1 2 к 2 д 2 дает корректную вариационную задачу, если Т н π / к . Кроме того, краевая задача, заданная естественными краевыми условиями на л на самом деле разрешима, хотя и дает тривиальное нулевое решение. Однако можно было бы легко состряпать лагранжиан для гармонического осциллятора, где даже естественные граничные условия плохи.

В более общем случае, если л это приказ р Лагранжиан с каноническими импульсами п я ( к ) ( 1 к р ), а лагранжиан меняется как

л "=" л + д ф д т ,
где ф это приказ р 1 функция (отсюда л и л имеют тот же порядок), то количество граничных условий не меняется, но канонические импульсы меняются как
п я ( к ) "=" п я ( к ) + ф д ( к 1 ) я .
Можно было бы заметить, что налагаемые граничные условия являются гибкими (можно задавать произвольно), а естественные граничные условия — нет , т. е. они всегда таковы, что канонические импульсы должны обращаться в нуль на концах. Тогда возможность настройки естественных граничных условий появляется в преобразовании эквивалентности л "=" л + д ф / д т , что затем позволяет задать естественные граничные условия произвольно.

Однако преобразование л "=" л + д ф / д т также сохраняет уравнения EL, если сказать л порядок р но ф порядок с 1 с с > р . То теперь л является лагранжианом порядка с > р и поставляется с 2 н с > 2 н р граничные условия, но уравнения ЭЛ по-прежнему имеют порядок 2 р и поэтому требуют 2 н р фрагменты данных. Получаемые таким образом дополнительные краевые условия по существу произвольны и переопределяют краевую задачу. Поэтому, если порядок с лагранжиана, от которого порядок 2 р получается такое уравнение, что 2 с > 2 р , то этот вариационный принцип заведомо некорректен, так как существуют граничные условия (в том числе и естественные), которым не соответствует ни одна экстремаль.

Наконец, вопрос ОП

Так почему же граничные условия делают вариационный принцип нечетким? Другими словами, почему хорошо определенный вариационный принцип требует дельта я [ ф ] быть в форме дельта я [ ф ] "=" ( что-нибудь ) дельта ф как утверждают авторы статьи?

можно ответить: Строго говоря, нет необходимости, чтобы вариация имела вид дельта С [ ф ] "=" ( ) дельта ф чтобы вариационный принцип был четко определен, поскольку любые оставшиеся граничные условия просто становятся естественными граничными условиями. Однако если естественные граничные условия сами по себе не подходят (например, их слишком много), то это может привести к плохо определенному вариационному принципу.

II. D. Калибровочные симметрии, системы PDE и все такое прочее:

Я не хочу вдаваться в подробности, но для систем, которые не удовлетворяют дет ( Вт я Дж ) 0 или PDE, приведенный выше анализ намного сложнее.

Условие сингулярности дет ( Вт я Дж ) "=" 0 сигнализирует о наличии калибровочных симметрий, т. е. общее решение системы содержит произвольные функции времени, таким образом, вариационный принцип и любая возможная начальная или краевая задача плохо определены, поскольку любое заданное решение всегда может быть калибровочно преобразовано в новое решение, которое сохраняет начальную или краевую задачу. Чтобы справиться с этими случаями, необходимо использовать какую-то схему редукции (фиксация калибровки, процесс Дирака-Бергмана, симплектическая редукция, BV/BRST и т. д.), чтобы существенно переформулировать задачу без калибровочных симметрий.

Для систем в частных производных ближайшим аналогом теоремы PL является теорема Коши-Ковалевской, но она работает только для эволюционных систем с аналитическими коэффициентами. Таким образом, приведенный выше анализ часто также применяется к теориям поля по аналогии, но для получения точных результатов необходим анализ в каждом конкретном случае.

Приложение. Строгая модель функциональных производных:

Мы используем формулировку диффеологических пространств (хорошим источником для этого является книга Патрика Иглесиаса-Земмура ). Я излагаю здесь только основы. Для п е Н а п -домен является открытым подмножеством U из р п . Тогда домен _ п -домен для некоторых п . Учитывая набор Z а п -параметризация _ Z это заданная карта ф : U Z , где U это п -домен и параметризация Z это п -параметризация для некоторых п .

Диффеология на _ Z это коллекция Д параметризаций, называемых графиками , удовлетворяющими следующим аксиомам:

  1. Покрытие : Каждая постоянная параметризация — это сюжет.
  2. Населенный пункт : если ф : U Z есть такая параметризация, что в некоторой окрестности каждого р е U ограничение на эту окрестность является сюжетом, то ф сюжет.
  3. Гладкая совместимость : если ф : U Z это сюжет и ф : В U гладкое отображение ( В тоже домен) тогда ф ф тоже сюжет.

Затем пара ( Z , Д ) является диффеологическим пространством , но сократит его до Z если диффеология ясна из контекста. Данные диффеологические пространства Z , Вт карта ф : Z Вт является гладким, если для любого графика ф : U Z , карта ф ф : В Вт тоже сюжет. Диффеологические пространства круты, потому что категория Д я ф ф объектами которого являются диффеологическое пространство и чьи морфизмы являются гладкими отображениями, в основном замкнуто относительно любого множества или категориальной операции под солнцем (суммы, произведения, частные, пространства отображения/экспоненты, пределы, копределы и т. д.).

Дифференциал к - форма на Z правило, которое к каждому участку ф : U Z он ассоциируется с обычным гладким к -форма ю [ ф ] е Ом к ( U ) на области построения такой, что для любой гладкой карты ф : В U ( В тоже домен)

ю [ ф ф ] "=" ф * ю [ ф ] .
Тогда внешний продукт, внешняя производная и обратный образ дифференциальных форм определяются естественным образом, и все они обладают обычными свойствами (за счет того, что они коммутируют с оценками на графиках).

Нам нужно еще несколько вещей о диффеологических пространствах:

  • D -топология на Z — это наилучшая топология, делающая все графики непрерывными.

  • Диффеологическое пространство связно (относительно D-топологии) тогда и только тогда, когда оно гладко линейно связно, т. е. любые две точки можно соединить гладкой кривой.

  • Если ю е Ом к ( Z ) является дифференциалом к - форма, то ю "=" 0 если и только если ю [ ф ] "=" 0 для любого к -сюжет ф (иными словами, дифференциальные формы однозначно определяются к - участки).


Вместо того, чтобы работать с общими расслоенными многообразиями, давайте рассмотрим упрощенную модель, которая делает некоторые вещи более прозрачными. Позволять Икс р н быть н размерное компактное подмногообразие с краем р н и разреши Д р м быть выпуклым открытым подмножеством.

Рассмотрим функциональное пространство

Ф "=" С ( Икс , Д )
гладких карт из Икс к Д . Мы диффеологизируем Ф множеством способов.

  • Стандартная функциональная диффеология определяется следующим образом. Данный U р п а п -домен карты ф : U Ф является сюжетом тогда и только тогда, когда совместная карта ф : U × Икс Д ,   ( с , Икс ) ф ( с ) ( Икс ) гладкий.
  • Исправить номер р е Н { , ю } . Параметризация ф : U Ф представляет собой график вариационной диффеологии порядка р если 1) ф представляет собой график стандартной функциональной диффеологии, 2) функция сустава ф ( с ) ( Икс ) такова, что (для 0 р < ) для каждого 0 к р производные
    к ф я Икс мю 1 . . . Икс мю к ( с ) ( Икс )
    являются постоянными функциями с е U когда Икс е Икс является пограничной точкой. Это определение работает и для р "=" в том смысле, что ему должны удовлетворять все частные производные.
  • Для р "=" ю вместо этого определение состоит в том, что граница Икс имеет некоторое соседство Н Икс такой, что ф ( с ) ( Икс ) является постоянной функцией с когда Икс е Н .

На Н { , ю } установить порядок н < < ю для любого н е Н .

Как и прежде, функция С : Ф р является действием, если существует лагранжиан конечного порядка л [ ф ] на Икс связан с Ф такой, что

С [ ф ] "=" Икс л [ ф ] "=" Икс д Икс л ( Икс , ф ( Икс ) , , ф ( р ) ( Икс ) ) ,
где здесь д Икс "=" д н Икс . Этот интеграл сходится, потому что Икс компактен. Если л порядок р , то функция действия С также говорят, что это порядок р . Затем:

  1. функция типа действия С заданный гладким лагранжианом, является гладким относительно стандартной функциональной диффеологии и всех вариационных диффеологий на Ф ;
  2. если С это приказ р функционал типа действия, и Ф оснащен вариационной диффеологией порядка к р 1 , то его внешняя производная может быть отождествлена ​​с обычной функциональной производной .

Мы специально проверяем этот последний пункт в заказе р функция типа действия. Чтобы отличить внешнюю производную на Ф и на любом домене U от дифференциалов на Икс , мы используем д для бывшего. Внешняя производная д С является четко определенным 1 - форма на Ф поэтому достаточно оценить его на 1 -сюжет. На любой 1 -сюжет с ф ( с ) "=" ф с у нас есть

д С [ ф с ] "=" С [ ф с ] с д с "=" [ Икс д Икс к "=" 0 р л ф , мю 1 . . . мю к я [ ф с ] мю 1 мю к ф с я с ] д с "=" [ Икс д Икс к "=" 0 р ( 1 ) к д мю 1 . . . д мю к л ф , мю 1 . . . мю к я [ ф с ] ф с я с + Икс ( д Икс ) мю к "=" 0 р 1 п я мю мю 1 . . . мю к [ ф с ] мю 1 мю к ф с я с ] д с .
Мы можем написать
мю 1 мю к ф с я с "=" с ( мю 1 мю к ф с я )
и по определению вариационной диффеологии (при условии, что порядок диффеологии не ниже р 1 ), эти функции обращаются в нуль на Икс , поэтому граничные члены равны нулю, и мы получаем
д С [ ф с ] "=" [ Икс д Икс Е я [ ф с ] ф с я с ] д с ,
который действительно содержит ту же информацию, что и функционал/производная EL в обычном смысле.

Итак, если мы оборудуем Ф с вариационной диффеологией порядка или ю , то все функционалы типа действия дифференцируемы, а внешняя производная в основном является функциональной производной. Космос Ф по-прежнему содержит все гладкие функции из Икс к Д , поэтому никаких граничных условий накладывать не пришлось, а функциональная производная, тем не менее, корректно определена и имеет классический вид.

Однако граничные ограничения по-прежнему закодированы в пространстве через его диффеологию. При предположениях, сделанных на Д например. его выпуклости (что, строго говоря, не является необходимым, но упрощает доказательство), находим следующие факты о связности пространства Ф .

Во-первых, предположим, что Ф оснащен вариатором р -диффеология ( р е Н { , ю } ). Два поля ф , ψ е Ф являются б -эквивалентно , если для каждого Икс е Икс правда, что

мю 1 мю к ф я ( Икс ) "=" мю 1 мю к ψ я ( Икс ) , 0 к р ,
и для ю -диффеология вместо состояния б -эквивалентность состоит в том, что существует окрестность границы Икс на что они соглашаются. Позволять б ф обозначают класс эквивалентности, которому ф принадлежит под б -эквивалентность.

Затем:

  1. Если Ф оснащен стандартной функциональной диффеологией, пространство Ф подключен.
  2. Если Ф оснащен вариатором р -диффеология ( р е Н { , ю } ) затем Ф отключен, а подключенные компоненты Ф находятся в биекции с множеством всех б -классы эквивалентности б ф .

[Я мог бы привести доказательства этого позже, но это просто, и я устал]

Чистый эффект этого заключается в том, что по существу

Ф "=" б ф Ф б ф
представляет собой объединение компонент связности такое, что каждый элемент Ф б ф представляет собой набор полей, удовлетворяющих соответствующим заданным граничным условиям (которые могут отличаться от обычных наложенных/естественных ГУ, в частности граничному условию, соответствующему ю -диффеология несколько иная).

Это также оказывает некоторое влияние на свойства точности дифференциала. д . Например, для диффеологических пространств также верно, что если гладкая функция замкнута (т.е. д ф "=" 0 ), то она локально постоянна, т.е. постоянной на каждой связной составляющей в отдельности.

Из вариационного исчисления известно, что на функции типа действия С , д С "=" 0 это не значит, что С постоянна, а не (при условии, что Икс и Д стягиваемы), что его подынтегральная функция (лагранжиан) является полной дивергенцией, поэтому значения С определяются значениями, которые поле и ряд его производных принимают на границе. Тот же результат получается из приведенного выше анализа качественно, так как если д С "=" 0 затем С должен быть постоянным на каждой связной компоненте Ф б ф отдельно и (предположим или ю диффеологии) как пространства Ф б ф задаются граничными значениями полей в этом компоненте, это показывает, что С [ ф ] (для д С "=" 0 ) факторы через класс б ф как и ожидалось.


Из этого Приложения следует вынести одну вещь: функциональные производные в вариационном исчислении можно сделать четко определенными независимо от любого набора граничных условий, наложенных на поля, или любых поверхностных членов, которые появляются в действии, однако в строгой структуре, граничные условия существенным образом появляются в самом определении гладкости и влияют на топологические свойства функционального пространства.