Почему уравнение Эйлера-Лагранжа не тривиально?

Уравнение Эйлера-Лагранжа дает уравнения движения системы с лагранжианом л . Позволять д α представляют собой обобщенные координаты конфигурационного многообразия, т представлять время. Лагранжиан является функцией состояния частицы, т. е. положения частицы. д α и скорость д ˙ α . Уравнение Эйлера-Лагранжа

д д т л д ˙ α знак равно л д α

Почему это закон физики, а не простая тривиальность для любой функции ? л по переменным д α и д ˙ α ? Следующее «доказательство» уравнения Лагранжа не использует физику и, кажется, предполагает, что уравнение Лагранжа — это просто математический факт, который работает для любой функции.

д д т л д ˙ α знак равно д ˙ α д л д т коммутативность производных   знак равно л ˙ д ˙ α   знак равно л д α отмена точек

Этого не может быть, иначе всем было бы наплевать на это уравнение, и было бы совершенно бесполезно решать какие-либо задачи. Что не так с логическими рассуждениями выше?

Вы можете потребовать уравнение EL для любого функционала. Однако ваш тезис о том, что это общее тождество, неверен. Откуда вы взяли идеи для шагов 1 и 3?
Несколько комментариев, которые отвечали на вопрос, были удалены. Имейте в виду, что комментарии предназначены для запроса разъяснений или предложений по улучшению исходного сообщения, а не для ответа на вопрос.
На самом деле, чтобы вывести уравнения ЭЛ, используется один из наиболее важных принципов физики, известный как вариационный принцип или принцип Гамильтона. Этот принцип, из которого получены EL, гласит, что путь, по которому будет следовать объект, если вы позволите ему двигаться свободно, это тот, который сводит на нет вариацию действия. С . В формуле дельта С знак равно 0

Ответы (7)

Ах, какую хитрую ошибку вы сделали там. Проблема в том, что вы просто перепутали некоторые понятия в многомерном исчислении. Не расстраивайтесь, хотя - это, как правило, очень плохо объясняется. Оба шага 1 и 3 выше неверны. Будьте уверены, уравнение Эйлера-Лагранжа не является тривиальным.

Давайте сначала сделаем шаг назад. Лагранжиан для частицы, движущейся в одном измерении во внешней потенциальной энергии В ( д ) является

л ( д , д ˙ ) знак равно 1 2 м д ˙ 2 В ( д ) .
Так пишет большинство. Однако это очень сбивает с толку, поскольку явно д и д ˙ не являются независимыми переменными. Один раз д указывается на все времена, д ˙ также указано для всех времен.

Лучший способ написать приведенный выше лагранжиан может быть

л ( а , б ) знак равно 1 2 м б 2 В ( а ) .
Здесь мы представили лагранжиан таким, какой он есть на самом деле: функцией, которая принимает два числа и выводит действительное число. Точно так же мы можем ясно видеть, что
л а знак равно В ( а ) л б знак равно м б .
Обычно большинство людей пишут это как
л д знак равно В ( д ) л д ˙ знак равно м д ˙ .
Однако, д и д ˙ должны пониматься как независимые переменные, чтобы сделать это правильно. Как только а и б были независимыми переменными, д и д ˙ тоже, когда их помещают в лагранжиан. Другими словами, мы можем подставить любые два числа в л ; мы просто решили вставить д и д ˙ .

Кроме того, давайте посмотрим на полную производную по времени д д т . Как следует понимать следующее выражение?

д д т л ( д ( т ) , д ˙ ( т ) )
Обе д и д ˙ являются функциями времени. Следовательно, л ( д ( т ) , д ˙ ( т ) ) зависит от времени просто потому, что д ( т ) и д ˙ ( т ) делать. Следовательно, чтобы оценить приведенное выше выражение, нам нужно использовать цепное правило в многомерном исчислении.
д д т л ( д ( т ) , д ˙ ( т ) ) знак равно д д д т л а ( д ( т ) , д ˙ ( т ) ) + д д ˙ д т л б ( д ( т ) , д ˙ ( т ) ) знак равно д ˙ ( т ) л а ( д ( т ) , д ˙ ( т ) ) + д ¨ ( т ) л б ( д ( т ) , д ˙ ( т ) )

В приведенном выше выражении я еще раз использовал а и б для того, чтобы сделать мою мысль более ясной. Нам нужно взять частные производные от л предполагая а и б являются независимыми переменными. ПОСЛЕ дифференцирования мы ТОГДА оцениваем л / а и л / б подключив ( д , д ˙ ) в ( а , б ) слоты. Это похоже на то, как в исчислении с одной переменной, если у вас есть

ф ( Икс ) знак равно Икс 2
и ты хочешь найти ф ( 3 ) , вы сначала различаете ф ( Икс ) сохраняя Икс неуказанная переменная, а ЗАТЕМ подключите Икс знак равно 3 .

На первом шаге производные НЕ коммутируют, потому что т и д не являются независимыми. ( д зависит от т .) Да, частные производные коммутируют, но ТОЛЬКО если переменные независимы. На третьем шаге вы не можете «отменить точки», потому что л зависит от двух входов. Если л зависело только от д , тогда да, вы можете «отменить точки» (поскольку это эквивалентно цепному правилу в исчислении с одной переменной), но это не так, поэтому вы не можете.

РЕДАКТИРОВАТЬ: Вы можете сами убедиться, что уравнение Эйлера-Лагранжа не тождественно 0 . Если взять лагранжиан л ( д , д ˙ ) Я написал выше и подключил это к уравнению Эйлера-Лагранжа, вы получите

м д ¨ ( т ) + В ( д ( т ) ) знак равно 0.
Это не то же самое, что 0 знак равно 0 . Это условие , что путь д ( т ) должны были бы удовлетворить, чтобы экстремировать действие. Если бы это было 0 знак равно 0 , то все пути будут экстремировать действие.

РЕДАКТИРОВАТЬ: Как отмечает Артур, это также хорошее время, чтобы обсудить разницу между д л / д т и л / т . Если у нас есть зависящий от времени лагранжиан,

л ( д , д ˙ , т )
тогда л может зависеть от т явно, а не просто через д и д ˙ . Так, например, где as мы могли бы иметь лагранжиан для частицы в постоянном гравитационном поле г является
л ( а , б ) знак равно 1 2 м б 2 м г а
если мы позволим позволить л зависит от т явно, мы могли бы сделать так, чтобы гравитационное поле становилось сильнее с течением времени:
л ( а , б , т ) знак равно 1 2 м б 2 м ( С т ) а .
( С константа такая, что С т имеет те же единицы, что и г .)

Количество

т л ( а , б , т )
следует понимать как дифференциацию « т -слот" из л . В приведенном выше примере мы бы имели
т л ( а , б , т ) знак равно м С а .
Количество
д д т л ( д ( т ) , д ˙ ( т ) , т )
следует понимать как полную производную от л из-за того, что д и д ˙ также зависит от т . Для приведенного выше примера
д д т л ( д ( т ) , д ˙ ( т ) , т ) знак равно д ˙ ( т ) л а ( д ( т ) , д ˙ ( т ) , т ) + д ¨ ( т ) л б ( д ( т ) , д ˙ ( т ) , т ) + л т ( д ( т ) , д ˙ ( т ) , т ) знак равно ( д ˙ ) ( м С т ) + д ¨ ( т ) ( м д ˙ ( т ) ) м С д ( т )

Спасибо за исчерпывающий ответ. Нам нужно больше таких в сети Stack Exchange.
Уравнения Эйлера-Лагранжа были первым случаем, когда я правильно оценил разницу между и д в производных. Например, задана функция л ( т , д , д ˙ ) , выражение л т означает «Дифференцировать функцию многих переменных л ( т , д , д ˙ ) по первой переменной", а д л д т означает «Дифференцировать функцию с одной переменной л ( т , д ( т ) , д ˙ ( т ) ) относительно переменной т ".
+1 Я большой любитель писать л ( а , б ) чтобы подчеркнуть, что л просто зависит от двух переменных. Но, может быть, было бы полезно подчеркнуть крошечную деталь: при расчете действия (и, следовательно, при нахождении уравнений ЭЛ) мы подставляем функции времени д ( т ) и д ˙ ( т ) за а и б . В противном случае кажется, что лагранжиан является функцией времени, и в то же время это не так.
  1. Коммутатор

    (1) [ д ˙ Дж , д д т ]   знак равно ( 2 )   д Дж
    производной скорости д ˙ Дж с полной производной по времени
    (2) д д т   знак равно   т + д ˙ Дж д Дж + д ¨ Дж д ˙ Дж + д Дж д ¨ Дж +
    не равен нулю. См. также, например , этот пост, связанный с Math.SE, и этот пост, связанный с Phys.SE.

  2. Отмена точек

    (3) л ˙ д ˙ Дж   знак равно   л д Дж
    работает на функции л ( д , т ) которые не зависят от скорости д ˙ к . Но лагранжиан обычно зависит от скоростей. См. также этот пост на Phys.SE.

  3. Обратите внимание на следующую алгебраическую лемму Пуанкаре:

    л  удовлетворяет уравнениям Эйлера-Лагранжа (EL). тождественно 
    (4)
    л  является полной производной по времени
    (по модулю возможных топологических препятствий). Подробнее см., например, в этом и этом сообщениях Phys.SE.

Мне больше всего понравился ваш ответ, он был коротким, очень лаконичным и прямо по делу. Хотел бы я написать это.

Так что в принципе можно выбрать существенно а н у лагранжиан л с достаточно выбранными координатами (и, возможно, ограничениями) и применить к нему вариационное исчисление с помощью уравнений Эйлера-Лагранжа. Уравнения движения, которые получаются при этом, могут соответствовать понятной модели реальности, а могут и не соответствовать. Есть много лагранжианов, которые не соответствуют действительности (вроде бы). Лагранжианы, которые создают физические модели, обычно обнаруживаются путем догадок и проверок и консультаций с экспериментом / наблюдением.

почему это фундаментальный закон физики, а не простая тривиальность ЛЮБОЙ функции L от переменных д и д ˙ ?

Формализм Эйлера-Лагранжа не является «фундаментальным законом физики». Скорее, это дифференциальное уравнение в частных производных (или их набор), решения которого делают конкретный функционал стационарным, что означает, что решения подчиняются принципу экстремального действия. Это математическое понятие было фактически обобщено в теории управления принципом максимума Понтрягина . Законы физики можно вывести с помощью метода Эйлера-Лагранжа, но этот метод не является фундаментальным, подобно тому, как выбранная конкретная геометрия не является фундаментальной .(пар. 17) для вывода физических законов. Физики используют математику для моделирования реальности, поэтому, конечно же, мы будем использовать то, что работает! Например, Эйнштейн вывел свои уравнения поля эвристическим путем, а Гильберт вывел их (примерно в то же время) из принципа действия, угадав правильное л . Но в наши дни почти все, кто работает с общей теорией относительности или модифицированной гравитацией, начинают с л и использовать принцип действия (за исключением космологии, они обычно начинают с самой метрики).

Неудивительно, что, поскольку мы являемся естественными существами, которые эволюционировали, чтобы понимать закономерности окружающей среды, создаваемые нами инструменты, особенно абстрактные, такие как математика, могут иметь некоторое соответствие с реальностью. Юджин Вигнер написал очень хорошее эссе на эту тему под названием «Необоснованная эффективность математики в естественных науках», в котором он утверждает, что очевидно, что математика так хорошо работает при моделировании реальности, но совершенно не очевидно, почему это работает. .

На вопросы «почему» ответить очень сложно , а на этот особенно сложно. Некоторые лагранжианы работают над созданием физических моделей, а некоторые нет, и, возможно, уравнения EL работают как фильтр для выяснения этого, поскольку его можно использовать для проверяемых прогнозов.

@ AccidentalFourierTransform уже разъяснил ваши математические ошибки, так что не буду.

Я не разделяю ваш аргумент о том, что уравнения не являются законом физики. Разве уравнения с типичными определениями не полностью эквивалентны второму закону Ньютона, который однозначно является законом? Не хочу вступать в дискуссию об определении «физического закона», но некоторые пояснения здесь могут быть полезны.
Конечно, как вы сказали, само определение «физического закона» подлежит обсуждению, но, судя по статье в вики, на которую я дал ссылку, говорится: «Физические законы — это, как правило, выводы, основанные на многократных научных экспериментах и ​​наблюдениях в течение многих лет, которые стать общепризнанным в научном сообществе». Уравнения EL — это математический формализм, в частности, УЧП, которое вы решаете для экстремума действия. Принцип действия — это не закон, а теоретический принцип, который создает очень полезные модели, подобные другим принципам, то есть принципу относительности. Эта помощь?
Итак, чтобы довести до конца, законы движения Ньютона проверяются эмпирически, тогда как уравнения ЭЛ являются методом, с помощью которого эти законы движения выводятся. Законы Ньютона можно принять как аксиомы или вывести из них, но мы называем их «законами», потому что они эмпиричны.

Ваш вопрос: « Почему уравнение Лагранжа не тривиально? Что не так с моим расчетом? ''.

Сначала некоторые обозначения. Используя однозначное обозначение из SICM , уравнения Лагранжа:

(куда Д - полная производная (соответствует производной по времени), а Г [ д ] знак равно ( д , Д д , . . . ) — это функционал, который обеспечивает путь и его производную (и).)

(Если вам интересно, что не так с традиционными обозначениями, то я рекомендую прочитать предисловие к SICM , в котором рассматривается этот вопрос, но в основном это именно те путаницы, о которых идет речь в этом вопросе.)

Попытка переписать свой расчет с использованием однозначной записи из SICM сразу же выявляет некоторые проблемы:

Невозможно просто коммутировать производные: ни

Д ( ( 2 л ) Г [ д ] ) 2 ( ( Д л ) Г [ д ] )
ни
Д ( ( 2 л ) Г [ д ] ) 2 Д ( л Г [ д ] )
иметь смысл.

Невозможно отменить точки:

2 Д ( л Г [ д ] ) 1 ( л Г [ д ] )
и левый, и правый выглядят довольно бессмысленно.

Тогда вам нужно сделать

1 ( л Г [ д ] ) знак равно ( 1 л ) Г [ д ]
восстановить нормальное выражение.

Таким образом, ни один шаг в вашем доказательстве не оправдан.

Это обозначение кажется немного запутанным. Он не предлагает переменные явно (1 и 2 могут быть любыми). Является ли композиция ∘ функциональной? Есть ли Г [ д ] представляет собой внутренний продукт? Насколько я могу судить, его основным преимуществом является простота использования с определенным языком программирования, но он может быть немного незнакомым. Также существует возможность путаницы с символами Кристоффеля или гамма-функцией. Не могли бы вы объяснить это немного более полно в своем ответе?
@ Obie2.0, я рекомендую предисловие к SICM , чтобы объяснить обоснование различных обозначений, но я постараюсь объяснить немного лучше в своем ответе.
+1, эта запись делает его намного лучше!

Речь идет не о том, «что не так», а о том, как вы могли бы выяснить, что не так (или, по крайней мере, найти что-то неправильное в вашей попытке доказательства). Возьмем хороший простой лагранжиан, например, для свободной частицы в одном измерении: л знак равно м 2 ( д ˙ ) 2 (куда д обозначает расстояние). И сделайте какое-нибудь движение, которое не является правильным в этой физической ситуации, например, равномерное ускорение. д знак равно а т 2 , куда а является отличной от нуля константой. От л , вы получите уравнение Эйлера-Лагранжа д д т ( м д ˙ ) знак равно 0 (так как л / д ˙ знак равно м д ˙ и л / д знак равно 0 ), т. е. вы получаете закон сохранения импульса. С другой стороны, из д знак равно а т 2 , ты получаешь д д т ( м д ˙ ) знак равно м д ¨ знак равно 2 м а (при условии, что масса м является постоянным). Таким образом, уравнение Эйлера-Лагранжа нарушается. Это уже показывает, что уравнение Эйлера-Лагранжа не может быть «просто математическим фактом, который работает для любой функции». Но вы можете получить больше информации, подключив этот конкретный л и это конкретное д ( т ) в вашу попытку доказательства, чтобы увидеть, какие именно из ваших уравнений в этом доказательстве неверны.

Привет Андреас! Разве это не больше подходит в качестве комментария? Я не совсем уверен, просто предложение.
@DvijMankad Я настолько с вами согласен, что начал писать это как комментарий, но я думаю, что для комментирования необходимо заработать 100 репутации на этом сайте (а не быть активным на других сайтах обмена стеками). Так что, если кто-то с полномочиями на это переместит это в комментарий, я совсем не буду возражать.
Ага, понятно! Я не думаю, что это можно было сделать. Я думаю, что это может прекрасно работать в качестве «дополнительного ответа», поскольку в тексте четко упоминается, что он намеревается сделать. Добро пожаловать в Physics.SE! :-)

Интересная последовательность символических манипуляций!

Именно из-за отсутствия строгости легко попасть в эти ловушки, и обычно в учебниках по физике не говорится, где они, почему и как их избежать. Это навык, который приобретают, решая задачи, изучая теорию и читая.

Аналогичные проблемы связаны с интегралом по траекториям, который не имеет строгого определения. Однако вариационное исчисление можно сделать строгим. Однако это сложно. Обычно это не затрагивается в курсе математики бакалавриата, где они будут строго определять исчисление для одной действительной переменной, для одной комплексной переменной и многих действительных переменных - либо исчисление на многообразии, либо, что более типично, исчисление с несколькими переменными, которое представляет собой исчисление в ( конечномерное) векторное пространство.

Чтобы сделать эту математику строгой, требуется аппарат струйных пучков. Вы можете найти экспозицию Saunders Jet Bundles и Michors Natural Operations . Это требует некоторого развития.

Н. Штейнле уже дал отличный ответ на вопрос

почему это фундаментальный закон физики, а не простая тривиальность ЛЮБОЙ функции L

но я хотел бы указать на дополнительный лакомый кусочек, касающийся части

... кажется, предполагает, что уравнение Лагранжа - это просто математический факт, который работает для каждой функции.

В то время как уравнения Лагранжа математически действительно описывают только функцию/процесс, который является экстремальным значением некоторого лагранжиана (или также некоторой энергии или потенциала действия), важная часть состоит в том, что обратное не так просто.

Кажется, это "фундаментальный закон физики", что многие процессы, которые мы наблюдаем в природе, имеют даже лагранжиан, энергетический потенциал. Это на самом деле не тривиально, не всякая многомерная функция обладает таким потенциалом и является утверждением о симметричности этих процессов.

У вас там дублируются абзацы...