Почему в лагранжиане есть производные только первого порядка?

Почему лагранжиан является функцией положения и скорости (возможно, также времени) и почему исключены зависимости от производных более высокого порядка (ускорение, рывок,...)?

Есть ли для этого веская причина или это просто «потому что это работает».

Вопрос гораздо более конкретен, чем заголовок, поэтому я хочу указать, что успешное объяснение того, что утверждается в вопросе, не означает истинности утверждения в заголовке. Высшие производные иногда важны в физике. Инженеры, разрабатывающие распределительные валы, очень стараются минимизировать «рывки». Дж знак равно г 3 Икс / г т 3 , потому что сильный рывок повреждает толкатель кулачка. Радиационная сила реакции Лоренца-Дирака на заряженную частицу пропорциональна рывку. Общим является то, что только изменяющаяся сила может вызвать излучение механических или электромагнитных волн.
Чтобы узнать о выводе уравнений Эйлера-Лагранжа (EL) более высокого порядка для лагранжианов более высокого порядка, см. этот пост Phys.SE.
Это как бы подразумевается в вопросе, но тем не менее я хотел бы упомянуть об этом - вы рассматриваете только производные по времени. Однако производные более высокого порядка по пространственной переменной Икс не являются проблемой в классической механике. Например, лагранжиан, который дает уравнение Кортевега-де Фриза, имеет Икс 2 ф зависимость. Подробнее см. en.wikipedia.org/wiki/Korteweg-de_Vries_equation .
Разве не любопытно, что наши уравнения движения и уравнение геодезии имеют второй порядок? Свободный (F=0) второй закон можно рассматривать геометрически как выражение геодезического уравнения (в координатах исчезающих символов Кристоффеля), а уравнение F=/=0 как его возмущение. Это объяснило бы это, не так ли? Ведь и свободный лагранжиан можно рассматривать как именно то, что дает геодезические по Эйлеру-Лагранжу. Если все есть возмущение свободного движения... махание рукой.

Ответы (7)

Я воспроизвожу сообщение в блоге, которое я написал некоторое время назад:

Мы склонны не использовать теории высших производных. Оказывается, для этого есть очень веская причина, но эта причина редко обсуждается в учебниках. Возьмем, для конкретности, л ( д , д ˙ , д ¨ ) , лагранжиан, который существенно зависит от 2-й производной. Несущественными зависимостями являются такие термины, как д д ¨ которые могут быть частично интегрированы, чтобы дать д ˙ 2 . Математически это выражается в необходимости инвертировать выражение

п 2 знак равно л ( д , д ˙ , д ¨ ) д ¨ ,
и получите закрытую форму для д ¨ ( д , д ˙ , п 2 ) . Обратите внимание, что обычно мы также требуем аналогичного утверждения для д ˙ ( д , п ) , и неудача в этом отношении является признаком наличия системы с ограничениями, возможно, с калибровочными степенями свободы.

В любом случае невырождение обычным образом приводит к уравнениям Эйлера-Лагранжа:

л д г г т л д ˙ + г 2 г т 2 л д ¨ знак равно 0.
Тогда это четвертый порядок в т , и поэтому требуют четырех начальных условий, таких как д , д ˙ , д ¨ , д ( 3 ) . Это в два раза больше, чем обычно, и поэтому мы можем получить новую пару сопряженных переменных, когда перейдем к гамильтонову формализму. Мы следуем шагам Остроградского и выбираем наши канонические переменные как Вопрос 1 знак равно д , Вопрос 2 знак равно д ˙ , что приводит к
п 1 знак равно л д ˙ г г т л д ¨ , п 2 знак равно л д ¨ .
Заметим, что невырожденность позволяет д ¨ быть выражено в терминах Вопрос 1 , Вопрос 2 а также п 2 через второе уравнение, а первое необходимо только для определения д ( 3 ) .

Затем мы можем действовать обычным образом и найти гамильтониан с помощью преобразования Лежандра:

ЧАС знак равно я п я Вопрос ˙ я л знак равно п 1 Вопрос 2 + п 2 д ¨ ( Вопрос 1 , Вопрос 2 , п 2 ) л ( Вопрос 1 , Вопрос 2 , д ¨ ) .
Опять же, как обычно, мы можем взять производную гамильтониана по времени, чтобы найти, что он не зависит от времени, если лагранжиан не зависит от времени явно и, таким образом, может быть идентифицирован как энергия системы.

Однако теперь у нас есть проблема: ЧАС имеет только линейную зависимость от п 1 , и поэтому может быть произвольно отрицательным. Во взаимодействующей системе это означает, что мы можем возбуждать моды с положительной энергией, передавая энергию мод с отрицательной энергией, и при этом мы увеличивали бы энтропию — просто было бы больше частиц, а значит, нужно было бы их куда-то поместить. Таким образом, такая система никогда не сможет достичь равновесия, мгновенно взорвавшись в оргии рождения частиц. Эта проблема на самом деле является совершенно общей и аналогичным образом применима к более высоким производным.

Хороший ответ, +1. Тем не менее, это оставляет меня несколько неудовлетворенным. В последнем абзаце предполагается, что это QFT, и д это поле, но это очень узкий контекст. Мы не видим теорий высших производных, описывающих какой -либо аспект физики. И даже в КТП, как насчет картины моря Дирака, где все отрицательные энергии полны?
Отличный ответ ... в отношении «оргии создания частиц» ... разве это не один из аспектов большого взрыва? Можем ли мы иметь нестабильную теорию более высокого порядка, которая стабилизируется в эффективную теорию обычной формы первого порядка, поскольку она создает достаточно большой пул взаимодействующих частиц?
Исходное сообщение в блоге автора: tcm.phy.cam.ac.uk/~gz218/2010/01/…
Почему нельзя просто объяснить, что устойчивость достигается только в экстремумах и седловых точках потенциала , т. е. везде, где его вторая производная равна нулю. Следовательно, любые члены более высокого порядка не имеют значения. Я слишком упрощаю вещи?

Отличный вопрос, на который я так и не нашел полностью удовлетворительного ответа. Но подумайте вот о чем: в элементарной классической механике одним из основных законов является второй закон Ньютона, Ф знак равно м а , которая связывает силу, действующую на объект, с ускорением объекта. Теперь большинство сил воздействует одним конкретным объектом на другой конкретный объект, и значение силы зависит только от положения исходного и «целевого» объектов. В сочетании со вторым законом Ньютона это означает, что в классической системе с Н объекты, каждый из которых подчиняется уравнению вида

Икс ¨ я знак равно ф ( { Икс Дж | Дж е 1 , , Н } )

куда ф — некоторая вектор-функция. Суть этого уравнения в том, что если у вас есть положения всех объектов, вы можете вычислить ускорения всех объектов.

Взяв производную от этого уравнения, вы получите

Икс я знак равно ф ( { Икс Дж } ) { Икс ˙ Дж }

(Здесь я немного ошибаюсь в обозначениях ;p) Это позволяет вам вычислить рывок (третью производную), используя позиции и скорости. И вы можете повторить эту процедуру, чтобы получить формулу (хотя бы в каком-то абстрактном смысле) для любой высшей производной. Проще говоря, поскольку второй закон Ньютона связывает функции, производные которых различаются на два порядка, вам нужны только 0-я и 1-я производные, положение и скорость, чтобы «запустить» процесс, после чего вы можете вычислить любую высшую производную, какую только захотите. хотите, а от того любую физическую величину. Это аналогично (и на самом деле тесно связано) с тем фактом, что для решения дифференциального уравнения второго порядка вам нужны только два начальных условия: одно для значения функции и одно для ее производной.

В других областях физики история усложняется, но тем не менее, если вы посмотрите на большинство из них, вы обнаружите, что фундаментальное уравнение эволюции связывает значение некоторой функции с ее первой и второй производной, но не выше. Например, в квантовой механике есть уравнение Шрёдингера,

я Ψ т знак равно 2 2 м 2 Ψ Икс 2 + U ( Икс ) Ψ

или в квантовой теории поля уравнение Клейна-Гордона,

2 ф т 2 + 2 ф Икс 2 м 2 ф знак равно 0

и другие, или уравнения Максвелла (эквивалентно волновое уравнение, которое может быть получено из них) в классическом электромагнетизме. В каждом случае вы можете использовать аналогичный аргумент, чтобы хотя бы мотивировать тот факт, что только положение или его эквивалентное поле и его первая производная достаточны для описания всего состояния системы.

Конечно, вы все еще можете задаться вопросом , почему уравнения, описывающие Вселенную, связывают функции, которые различаются только двумя производными, а не тремя или четырьмя. Эта часть является загадкой, но относится к сфере философии, а не физики.

Хороший ответ +1. Что касается того, почему у нас есть только две производные, или, в более общем смысле, почему лагранжианы имеют такую ​​форму, посмотрите на эту статью Б. Роя Фридена. Он давно пытается подчеркнуть роль информации в физике. Только недавно мейнстрим начал ценить этот факт. Пусть вас не смущают названия некоторых работ Фридена. Грандиозность - простительная обида, особенно для работников такой неумолимой территории :)
супер ответ. Ре. физика.stackexchange.com/q/4102 . Есть ли какие-либо ссылки на «Проще говоря, поскольку второй закон Ньютона связывает функции, которые различаются двумя порядками производных, вам нужны только 0-я и 1-я производные, положение и скорость, чтобы «запустить» процесс», книга или бумага?

Имеются последствия для причинно-следственной связи, когда уравнение движения содержит более высокие, чем вторые, производные полей, ЭМ-излучение заряженных тел превышает производную ускорения

я не знаю подробностей ПОЧЕМУ, но эта книга должна дать более подробную информацию: (причинно-следственные связи и дисперсионные отношения) http://books.google.com/books?id=QDzHqxE4anEC&lpg=PP1&dq=causality%20дисперсион%20relations&pg=PP1#v =одна страница&q&f=false

+1 Я думаю, что эта тема сильно недооценена (по крайней мере, по моему опыту) и чрезвычайно интересна.

Существуют формулировки, включающие производные более высокого порядка, однако вы дали верную характеристику.

Я думаю, что эмпирическое правило будет заключаться в том, чтобы начать искать самый простой лагранжиан, который вы можете придумать. В общем случае хороший лагражиан должен подчиняться однородности пространства, времени и изотропии пространства, что означает, что он не может явно содержать положение, время и скорость в , соответственно. Тогда простейшая допустимая возможность — это иметь лагранжиан с квадратом скорости. Поскольку нам не нужно искать дополнительные условия для выполнения, нет необходимости добавлять термины, включающие высшие производные или комбинации других терминов.

Вы можете увидеть эту процедуру в действии (на самом деле довольно много раз) в книге Ландау и Лифшица «Классическая теория поля».

Если вы правы, то мой ответ неверен. Не могли бы вы привести пример лагранжиана, который включает высшие производные?
@gabgoh: без особых поисков я нашел это в качестве примера arxiv.org/abs/1012.2969 .
Спасибо за ответ. К сожалению, статья, похоже, связана с Калибровочной теорией, с которой я не очень знаком. Я надеялся найти простой пример из классической механики, в котором используется лагранжиан более высокого порядка. Или, может быть, мне нужно выйти за рамки механики, чтобы найти решение?
@gabgoh: я не думаю, что существует общепринятая формулировка, включающая лагранжиан более высокого порядка из классической механики (хотя я могу ошибаться). Может быть, пост, написанный @lurscher, может дать такой пример.

Что ж, обычная физика в классической механике формулируется в терминах дифференциальных уравнений второго порядка. Если вы знакомы с процессом вывода уравнений Эйлера-Лагранжа из лагранжиана, то должно быть естественным, что кинетический член должен быть пропорционален ( т Икс ) 2 воспроизвести это.

Если бы вы рассмотрели более общие лагранжианы (на что вы, безусловно, вольны), вы бы получили сколь угодно сложные уравнения движения, но они не соответствовали бы ничему физическому. Тем не менее, некоторые из этих уравнений могут описывать некоторые математические объекты (поскольку лагранжев формализм и вариационное исчисление присущи не только физике, но и множеству других математических дисциплин).

Этот вопрос на самом деле требует двухэтапного ответа:

  1. Почему лагранжиан имеет производные только первого порядка?:

Лагранжиан был определен таким образом, чтобы решаемая задача давала производную второго порядка по времени при построении уравнения Эйлера-Лагранжа. Он включает в себя неявный вывод импульса (обратите внимание на производную по времени после знака минус в л д г г т л д ˙ знак равно 0 ), что, в свою очередь, является производной первого порядка от положения. Это означает, что об ускорении действительно заботятся, когда настраивается полная задача. В этом можно убедиться, просто проверив, что для большинства случаев уравнение Эйлера-Лагранжа просто превращается в л д м д ¨ знак равно 0 и если определить л д знак равно Ф это становится вторым законом Ньютона. Сказав это, нам нужно перейти к следующему шагу, а именно,

  1. Почему рывок (или любая более крупная производная по времени) не нужен?:

На этот вопрос уже был дан ответ (в том числе и мной) здесь Почему Ф знак равно м а и не Ф знак равно м а ˙ . Краткий ответ таков: «… производная второго порядка — это все , что нужно, чтобы отличить естественные состояния движения от затронутых состояний движения ».

Если мы допустим, скажем, вторую производную в лагранжиане, уравнения Эйлера-Лагранжа, которые минимизируют действие

А [ д ] знак равно Икс 1 Икс 2 л ( Икс , д , д , д ) г Икс

было бы

л д г г т л д + г 2 г т 2 л д знак равно 0

Это дифференциальное уравнение четвертого порядка. Однако этого не может быть, поскольку мы уже знаем, что д знак равно Ф / м , т.е. ускорение определяется Силой, находящейся «вне» начальных условий. В гравитационном силовом поле, например, вы знаете, а piori, силы в каждой точке системы, а значит, и ускорение в каждой точке системы уже известны. DE четвертого порядка приведет к внутренней несогласованности.

Более глубокий вопрос, который следует задать, я полагаю, заключается в том, почему Ф знак равно м д , нет Ф знак равно м д или же Ф знак равно м д . Не буду притворяться, что знаю ответ на этот вопрос, но подозреваю, что он может быть.