Позвольте мне начать с определений, к которым я привык. Позволять быть действием для некоторого набора полей. Вариация полей о конфигурации поля представляет собой однопараметрическое семейство конфигураций поля такой, что где . Мы берем карту быть дифференцируемым. В этом случае первая вариация определяется как
Точно так же первая вариация действия определяется как
Теперь, насколько я понимаю, вариационный принцип — это утверждение о том, что физическая классическая конфигурация поля должна быть такой, что для любой первой вариации .
Так уж сложилось, что большую часть времени является интегралом по пространству-времени некоторой лагранжевой плотности -форма . Тогда, если имеет какую-то границу может случиться, что имеет граничные условия, способствующие этому.
Теперь в этой статье авторы говорят, что такие граничные условия делают вариационный принцип нечетким (см. стр. 61):
Как утверждали Регге и Тейтельбойм, действие должно иметь четко определенные функциональные производные: оно должно иметь вид без дополнительных граничных членов, портящих производную. Действие должно быть дифференцируемым , чтобы принцип экстремума имел смысл.
Это также упоминается на странице WP о термине Гиббонса-Хокинга-Йорка в гравитации:
Действие Эйнштейна-Гильберта является основой для самого элементарного вариационного принципа, из которого можно определить уравнения поля общей теории относительности. Однако использование действия Эйнштейна-Гильберта уместно только тогда, когда базовое пространственно-временное многообразие является замкнутым, т. е. многообразием, которое одновременно компактно и не имеет края. В случае, если многообразие имеет границу , действие следует дополнить граничным членом, чтобы вариационный принцип был корректно определен.
Упомянутый выше граничный член вводится именно для того, чтобы сократить один граничный член, появляющийся при изменении действия Эйнштейна-Гильберта. Итак, я снова понимаю это как высказывание о том, что если бы вариация действия ЭГ имела такой граничный член, вариационный принцип не был бы четко определен.
Теперь, хотя это кажется такой простой вещью, я должен признаться, что до сих пор не понял:
Что касается обсуждения в связанной статье, при повторном применении правила Либница изменение плотности Лагранжа всегда можно записать как
Более того, для меня наиболее разумным понятием дифференцируемости действия является утверждение, что является дифференцируемым отображением. Я не понимаю, как граничные условия влияют на это.
Так почему же граничные термины в дает плохо определенные функциональные производные? И в каком смысле это делает не дифференцируемый?
Что еще более важно, и статья, и страница WP по термину GHY ссылаются на плохо определенный вариационный принцип, если содержит граничные условия. У нас есть отображение и ищем экстремум такого отображения. Я не понимаю, как тот факт, что имеет граничные члены, сделало бы эту задачу оптимизации нечеткой.
Так почему же граничные условия делают вариационный принцип нечетким? Другими словами, почему хорошо определенный вариационный принцип требует быть в форме как утверждают авторы статьи?
Если у нас есть неисчезающие граничные члены, то отображение не дифференцируема в следующем смысле. Используя несколько менее сложные обозначения, пусть
для произвольной дифференцируемой функции . Это отображение заведомо дифференцируемо, и мы находим, что
где являются компонентами вектора нормали к поверхности. Это дифференцируемость по Гато . Однако эта производная Гато в общем случае зависит от того, какой мы выбираем.
Конечная цель состоит в том, чтобы потребовать, чтобы изменение функционала действия обращалось в нуль независимо от нашего выбора. . Если предположить, что граничный член равен нулю, это означает, что
Однако при наличии граничных членов такая импликация невозможна. Для любой конкретной конфигурации поля изменение интеграла действия становится
Чтобы это исчезло для произвольного , либо оба интеграла должны обращаться в нуль, либо они должны компенсировать друг друга. В первом случае граничные члены все-таки отсутствуют, а во втором случае фактически не работает. Чтобы увидеть это, представьте, что
для некоторого выбора , и обратите внимание, что мы всегда можем добавить к гладкая функция, которая обращается в нуль на границе, но имеет носитель в любой выбранной нами области объема. Это изменит первый интеграл, но не второй, тем самым нарушив равенство. Следовательно, хотя два интеграла могут сократиться для некоторых вариантов выбора , они не могут отменить для всех вариантов (опять же, если они оба не исчезают в первую очередь).
Еще хуже в определенном смысле то, что наличие ненулевых граничных членов предполагает, по причинам, которые непосредственно вытекают из приведенных выше, что вариация может принимать любое значение в соответствующим масштабированием .
Можно думать об этом как об аналогии с многомерным исчислением. Существование частных (Гато) производных некоторой функции (функционала действия) по какому-либо конкретному направлению (при произвольном выборе ) недостаточно, чтобы гарантировать дифференцируемость отображения. В этом случае, с прицелом на нашу конечную цель получить исчезающую функциональную производную, которая не зависит от , назовем функционал дифференцируемым, если его производную Фреше можно представить в виде
и определим его функциональную производную как .
Я хотел бы сделать небольшое замечание по вашему заявлению
Я не понимаю, как присутствие мешает нам определить как функциональные производные.
В том, что вы говорите, есть большая доля правды. В самом деле, если все, что вам нужно, это уравнения Эйлера-Лагранжа для поля, то вы могли бы утверждать, что правильный формальный рецепт состоит в том, чтобы варьировать действие, отбрасывать любые граничные члены , а затем требовать, чтобы вариация исчезла. Это кажется немного неэлегантным, но это даст вам уравнения, которые вы ищете.
Однако при переходе к гамильтоновой структуре возникают проблемы. Неоднозначность граничных терминов приводит к неоднозначности при попытке определить, например, понятия полной энергии конкретного пространства-времени. В отсутствие поверхностных членов гамильтониан обращается в нуль при которые подчиняются уравнениям движения; выбор граничного члена сводится к выбору значения интеграла гамильтониана по всему пространству-времени, а член GHY дает энергию ADM.
Такие граничные условия, по-видимому, также очень важны для квантовой гравитации, но это область, с которой я совершенно не знаком, поэтому я не могу дать ей разумного комментария.
Позвольте мне кое-что спросить, вы говорите: «Однако при наличии граничных условий такое следствие невозможно». Если мы потребуем относительно любой вариации, то, в частности, это справедливо для компактно поддерживаемых . Это не означало бы
для всех компактно поддерживаемых и, в свою очередь, подразумевает даже при наличии граничных условий? Что здесь не так?
Похоже, вы ослабляете требование, чтобы действие было стационарным при произвольных вариациях, до требования, чтобы действие было стационарным только при вариациях с компактной поддержкой. Если вы сделаете это, то вы вернете импликацию (и, следовательно, уравнения EL). Однако это означает, что вы сужаете пространство «кандидатных» конфигураций полей до тех, которые идентичны исходной на границе.
Если вас не интересует какая-либо временная эволюция на границе, то это нормально; в общем, это слишком ограничительно. Можно, например, представить себе комбинацию начальных условий и эволюционных уравнений, которая обязательно изменит поле на границе. Наложение фиксированных (Дирихле) граничных условий в дополнение к уравнениям эволюции и этому конкретному начальному условию вообще не привело бы к решениям.
Что еще хуже, в частном случае гравитации плотность Лагранжа фактически содержит вторые производные метрики в виде полной производной
В этом случае было бы недостаточно зафиксировать вариацию на границе — нам также нужно было бы зафиксировать и ее производные. Это неприемлемо, так как сами уравнения движения второго порядка; исправление обоих и на границе в целом переопределили бы систему, за исключением тех случайных случаев, когда .
Вот один комментарий. Если мы адаптируем определение OP
Я не полностью согласен ни с одним из ответов, поэтому вот еще один. Похоже, что вопросы ОП по существу сводятся к двум достаточно самостоятельным вопросам:
Вопрос 1: Каково определение функциональной производной действия и влияют ли на это определение граничные условия?
Вопрос 2. Что делает вариационный принцип корректным или неправильным и как на это влияют граничные условия?
I. О функциональной производной: мне не нравится понятие «функциональная производная», потому что в том виде, в каком оно встречается в большинстве текстов и публикаций по физике, оно не является строго определенным математическим объектом или оператором. Давайте тогда проведем различие между функциональной производной и оператором Эйлера-Лагранжа (оператор EL).
Предположим, что гладкий -многообразие, является гладким расслоенным многообразием над сечениями (возможно, локальными) являются поля, возникающие в вариационной задаче, и пусть быть лагранжианом -форма. В этом ответе я хочу максимально избегать использования реактивных пространств, поэтому определение лагранжиана -форма будет такой для каждой локальной секции из над он ассоциируется с гладкой -форма над и обладает тем свойством, что существует неотрицательное целое число (так называемый порядок ) такое, что если два сечения оба определены рядом имеет те же производные до порядка включительно в (производные берутся по любой расслоенной карте расслоения ), затем . Работая с расслоенной диаграммой, это позволяет нам написать знакомый
Тогда первая вариационная формула для лагранжиана имеет вид
Эта формула верна и глобально, но если и то глобально существующее -форма строится не только из коэффициентов лагранжиана, она нуждается в некоторых дополнительных данных, таких как разбиение единицы или связь. Излишне говорить, что он не уникален. Оператор нулевого порядка однако глобально определен и уникален. Мы называем оператор ЭЛ .
Заметим, что здесь вообще не нужны никакие граничные условия. Другой взгляд на вещи заключается в том, чтобы определить
Таким образом, это по существу согласуется с тем, что написал ОП, и на это также ссылается ответ Дж. Мюррея. Нет ничего плохого в том, чтобы определить оператор EL таким образом, и на самом деле так это делается (по крайней мере, в духе), например. теория вариационного бикомплекса .
Напротив, для подходящего понятия функциональной производной мы хотели бы следующее:
Это можно сделать, и я сделаю это в приложении в конце этого ответа. Однако это несколько тонко. Чтобы проиллюстрировать некоторые тонкости, пространство может быть пустым, т.е. расслоение может не иметь глобальных разделов. Предыдущий «формальный» подход, давший нам определение EL-оператора, представляет собой локальную формулировку, которая по существу оперирует пучками (точнее, струями) сечений, поэтому, если множество глобальных сечений пусто, мы всегда можем ограничиться дополнительными. Менее очевидно, как учесть эту локальность в чисто функциональной постановке, поскольку функциональное пространство должно быть зафиксировано раз и навсегда. Кроме того, даже если существуют глобальные сечения, интеграл может не сходиться, хотя как «формальный интеграл» (ср. формальный степенной ряд) он по-прежнему несет достоверную информацию.
Поскольку формальный подход работает без интегралов, это не проблема.
Дело в том, что ОП по существу верен с
Я не понимаю, как присутствие мешает нам определить как функциональные производные.
хотя, по моему мнению, я бы заменил здесь термин «функциональная производная» на «оператор EL».
Тем не менее, в конце этого ответа будет дано строгое определение функциональной производной, которое, надеюсь, иллюстрирует, как граничные условия связаны с определением.
II. О правильности вариационных принципов: В этом разделе я буду иметь дело только с вариационной формулировкой обыкновенных дифференциальных уравнений (ОДУ). Причина этого в том, что в отличие от ОДУ, где теорема существования и единственности Пикара-Линделёфа дает очень общий набор критериев корректности дифференциальных уравнений, системы частных дифференциальных уравнений не имеют аналогичных теорем, по крайней мере, тех, чья общность сравнима.
Итак, рассмотрим следующие данные:
Нам нужна общая формула первой вариации для лагранжиана. Это
II. А. Граничные условия:
С вариационной задачей связаны два вида граничных условий: наложенные граничные условия и естественные граничные условия . Это всего лишь две крайности, на практике можно использовать их смесь.
Позволять
Таким образом, если граничные условия накладываются, рассмотрим вариационный принцип в редуцированном функциональном пространстве . Поскольку мы варьируемся в этом классе, вариации траекторий гладкие и удовлетворяют
Отсюда следует, что первый вариант действия есть
Чтобы получить естественные граничные условия, вместо этого мы рассматриваем полное пространство как поле для вариационной задачи. Первый вариант действия становится
Поскольку вариации и их производные в принципе могут принимать любое возможное значение на концах, мы получаем, что все коэффициенты должны обращаться в нуль отдельно друг от друга, следовательно
II. B. Корректные вариационные принципы:
Общее определение корректной вариационной задачи следующее: Вариационный принцип является корректным, если при соответствующих граничных условиях (наложенных или естественных) существует одна и только одна экстремаль действия.
Если лагранжиан порядок , имеется примерно три достаточных условия корректности вариационного принципа. Я не осмеливаюсь утверждать, что они также необходимы, так как я предполагаю, что даже если некоторые из них будут нарушены, могут произойти некоторые странные происшествия, но для большинства намерений и целей эти условия также необходимы:
Пункт 3 здесь самый загадочный, но он будет раскрыт позже. Уравнения ЭЛ имеют вид
Но мы видели, что количество граничных условий (наложенных или естественных) также , поэтому с чисто «нумерологической» точки зрения граничные условия содержат достаточно данных, чтобы однозначно определить решение уравнения ЭЛ.
Однако вариационный принцип требует граничных условий, а PL-теорема требует начальных данных. «Большую часть времени» между ними существует биективная карта, но для «плохого» выбора конечных точек это соответствие может нарушиться. Типичным примером является гармонический осциллятор.
С другой стороны, если все условия 1., 2. и 3. выполнены, то 1) уравнение EL имеет стандартную форму и, таким образом, применима теорема PL, 2) граничные условия (наложенные или естественные) дают точно части данных для дифференциального уравнения, 3) эти данные могут быть биективно отображены в исходные данные, следовательно, существует единственная экстремаль для вариационной задачи, и, таким образом, вариационный принцип корректен.
II. C. Хорошо, но какое это имеет отношение к граничным терминам?
Начните с примера: лагранжиан
Следует, однако, заметить, что «обычный» лагранжиан дает корректную вариационную задачу, если . Кроме того, краевая задача, заданная естественными краевыми условиями на на самом деле разрешима, хотя и дает тривиальное нулевое решение. Однако можно было бы легко состряпать лагранжиан для гармонического осциллятора, где даже естественные граничные условия плохи.
В более общем случае, если это приказ Лагранжиан с каноническими импульсами ( ), а лагранжиан меняется как
Однако преобразование также сохраняет уравнения EL, если сказать порядок но порядок с . То теперь является лагранжианом порядка и поставляется с граничные условия, но уравнения ЭЛ по-прежнему имеют порядок и поэтому требуют фрагменты данных. Получаемые таким образом дополнительные краевые условия по существу произвольны и переопределяют краевую задачу. Поэтому, если порядок лагранжиана, от которого порядок получается такое уравнение, что , то этот вариационный принцип заведомо некорректен, так как существуют граничные условия (в том числе и естественные), которым не соответствует ни одна экстремаль.
Наконец, вопрос ОП
Так почему же граничные условия делают вариационный принцип нечетким? Другими словами, почему хорошо определенный вариационный принцип требует быть в форме как утверждают авторы статьи?
можно ответить: Строго говоря, нет необходимости, чтобы вариация имела вид чтобы вариационный принцип был четко определен, поскольку любые оставшиеся граничные условия просто становятся естественными граничными условиями. Однако если естественные граничные условия сами по себе не подходят (например, их слишком много), то это может привести к плохо определенному вариационному принципу.
II. D. Калибровочные симметрии, системы PDE и все такое прочее:
Я не хочу вдаваться в подробности, но для систем, которые не удовлетворяют или PDE, приведенный выше анализ намного сложнее.
Условие сингулярности сигнализирует о наличии калибровочных симметрий, т. е. общее решение системы содержит произвольные функции времени, таким образом, вариационный принцип и любая возможная начальная или краевая задача плохо определены, поскольку любое заданное решение всегда может быть калибровочно преобразовано в новое решение, которое сохраняет начальную или краевую задачу. Чтобы справиться с этими случаями, необходимо использовать какую-то схему редукции (фиксация калибровки, процесс Дирака-Бергмана, симплектическая редукция, BV/BRST и т. д.), чтобы существенно переформулировать задачу без калибровочных симметрий.
Для систем в частных производных ближайшим аналогом теоремы PL является теорема Коши-Ковалевской, но она работает только для эволюционных систем с аналитическими коэффициентами. Таким образом, приведенный выше анализ часто также применяется к теориям поля по аналогии, но для получения точных результатов необходим анализ в каждом конкретном случае.
Приложение. Строгая модель функциональных производных:
Мы используем формулировку диффеологических пространств (хорошим источником для этого является книга Патрика Иглесиаса-Земмура ). Я излагаю здесь только основы. Для а -домен является открытым подмножеством из . Тогда домен _ -домен для некоторых . Учитывая набор а -параметризация _ это заданная карта , где это -домен и параметризация это -параметризация для некоторых .
Диффеология на _ это коллекция параметризаций, называемых графиками , удовлетворяющими следующим аксиомам:
Затем пара является диффеологическим пространством , но сократит его до если диффеология ясна из контекста. Данные диффеологические пространства карта является гладким, если для любого графика , карта тоже сюжет. Диффеологические пространства круты, потому что категория объектами которого являются диффеологическое пространство и чьи морфизмы являются гладкими отображениями, в основном замкнуто относительно любого множества или категориальной операции под солнцем (суммы, произведения, частные, пространства отображения/экспоненты, пределы, копределы и т. д.).
Дифференциал - форма на правило, которое к каждому участку он ассоциируется с обычным гладким -форма на области построения такой, что для любой гладкой карты ( тоже домен)
Нам нужно еще несколько вещей о диффеологических пространствах:
D -топология на — это наилучшая топология, делающая все графики непрерывными.
Диффеологическое пространство связно (относительно D-топологии) тогда и только тогда, когда оно гладко линейно связно, т. е. любые две точки можно соединить гладкой кривой.
Если является дифференциалом - форма, то если и только если для любого -сюжет (иными словами, дифференциальные формы однозначно определяются - участки).
Вместо того, чтобы работать с общими расслоенными многообразиями, давайте рассмотрим упрощенную модель, которая делает некоторые вещи более прозрачными. Позволять быть размерное компактное подмногообразие с краем и разреши быть выпуклым открытым подмножеством.
Рассмотрим функциональное пространство
На установить порядок для любого .
Как и прежде, функция является действием, если существует лагранжиан конечного порядка на связан с такой, что
Мы специально проверяем этот последний пункт в заказе функция типа действия. Чтобы отличить внешнюю производную на и на любом домене от дифференциалов на , мы используем для бывшего. Внешняя производная является четко определенным - форма на поэтому достаточно оценить его на -сюжет. На любой -сюжет у нас есть
Итак, если мы оборудуем с вариационной диффеологией порядка или , то все функционалы типа действия дифференцируемы, а внешняя производная в основном является функциональной производной. Космос по-прежнему содержит все гладкие функции из к , поэтому никаких граничных условий накладывать не пришлось, а функциональная производная, тем не менее, корректно определена и имеет классический вид.
Однако граничные ограничения по-прежнему закодированы в пространстве через его диффеологию. При предположениях, сделанных на например. его выпуклости (что, строго говоря, не является необходимым, но упрощает доказательство), находим следующие факты о связности пространства .
Во-первых, предположим, что оснащен вариатором -диффеология ( ). Два поля являются -эквивалентно , если для каждого правда, что
Затем:
[Я мог бы привести доказательства этого позже, но это просто, и я устал]
Чистый эффект этого заключается в том, что по существу
Это также оказывает некоторое влияние на свойства точности дифференциала. . Например, для диффеологических пространств также верно, что если гладкая функция замкнута (т.е. ), то она локально постоянна, т.е. постоянной на каждой связной составляющей в отдельности.
Из вариационного исчисления известно, что на функции типа действия , это не значит, что постоянна, а не (при условии, что и стягиваемы), что его подынтегральная функция (лагранжиан) является полной дивергенцией, поэтому значения определяются значениями, которые поле и ряд его производных принимают на границе. Тот же результат получается из приведенного выше анализа качественно, так как если затем должен быть постоянным на каждой связной компоненте отдельно и (предположим или диффеологии) как пространства задаются граничными значениями полей в этом компоненте, это показывает, что (для ) факторы через класс как и ожидалось.
Из этого Приложения следует вынести одну вещь: функциональные производные в вариационном исчислении можно сделать четко определенными независимо от любого набора граничных условий, наложенных на поля, или любых поверхностных членов, которые появляются в действии, однако в строгой структуре, граничные условия существенным образом появляются в самом определении гладкости и влияют на топологические свойства функционального пространства.
Золото
Дж. Мюррей