Динамические переменные в лагранжевом формализме

В Классической механике Гольдштейна было написано, что в лагранжевом формализме независимые динамические переменные Q Q и T T , Вот почему мы представляем состояние системы в лагранжевом формализме, используя точку в конфигурационном пространстве. Но на протяжении расчетов мы относимся Q ˙ Q ˙ также в качестве независимой переменной, как для расчетов из уравнения Эйлера-Лагранжа. Кроме того, Гольдштейн упоминает, что математически мы лечим Q ˙ Q ˙ как независимая переменная, но кроме этого это не так. Как математически независимая величина не может считаться таковой при понимании динамики системы, как при описании состояния ее?

Ответы (3)

Мы не лечим Q ˙ Q ˙ как независимая переменная при выводе уравнений Эйлера-Лагранжа. Грубый ответ заключается в том, что Q Q и Q ˙ Q ˙ являются независимыми в качестве входных данных для лагранжиана, но становятся связанными, как только мы указываем путь через конфигурационное пространство - я остановлюсь на этом в пунктах 5 и 6.


Я буду весьма формален в дальнейшем, но, возможно, формальность будет несколько поучительной. Сначала несколько предварительных замечаний:

1: состояние N N система состоит из точки

Q ( д 1 , д 2 , , Д N ) Q Q ( Q 1 , Q 2 , ... , Q N ) Q
где Q Q называется пространством конфигурации, соответствующим системе, и Q я Q я это я т ч я T час обобщенная координата .

2: кривая γ γ через пространство конфигурации есть карта

γ : R Q γ : р Q
t γ ( t ) = ( q 1 ( т ) , д 2 ( т ) , ... , д N ( t ) ) q γ ( т ) T γ ( T ) знак равно ( Q 1 ( T ) , Q 2 ( T ) , ... , Q N ( T ) ) Q γ ( T )
Кривая поэтому параметризована T T , который мы называем временем. Это описывает, как состояние системы развивается. Обратите внимание, что мы будем требовать, чтобы γ γ быть как минимум дважды дифференцируемым.

3: в каждой точке γ γ существует единственный касательный вектор В γ ( т ) В γ ( T ) дано следующим образом:

В γ : R T Q Q В γ : р T Q Q
т В γ ( t ) = ( q ˙ 1 ( т ) , д ˙ 2 ( т ) , ... , д ˙ N ( t ) ) q ˙ γ ( т ) T В γ ( T ) знак равно ( Q ˙ 1 ( T ) , Q ˙ 2 ( T ) , ... , Q ˙ N ( T ) ) Q ˙ γ ( T )
T Q Q T Q Q называется касательным пространством к Q Q в точке Q Q , Я не буду пытаться определить это строго, но интуитивное понятие касательного пространства должно быть знакомо, если вы берете Голдштейна.

4: дизъюнктное объединение всех касательных пространств Q Q называется касательным расслоением к Q Q и обозначается T Q T Q :

T Q = Q Q T Q Q T Q знак равно Q Q T Q Q
Если ( д , v ) ( Q , v ) является элементом касательного расслоения T Q T Q тогда это означает, что v v является касательным вектором к некоторой кривой, проходящей через точку Q Q ,

5: лагранжиан - это функция, которая принимает три (или два, в зависимости от вашей точки зрения) входа - точку ( д , v ) T Q ( Q , v ) T Q и реальное число t R T р - и отображает их на действительное число:

L : T Q × R R L : T Q × р р
( д , v , t ) L ( q , т , т ) ( Q , v , T ) L ( Q , v , T )
Важным моментом является то, что Q Q не определяет v v - так далеко как L L обеспокоен, Q Q это просто какой-то момент в Q Q и v v является касательным вектором к одной из бесконечности кривых, которая проходит через Q Q ,

6: функционал действия S S отображает кривую γ γ на вещественное число следующим образом:

S [ γ ] = L ( q γ ( т ) , д ˙ γ ( т ) , т ) д T S [ γ ] знак равно L ( Q γ ( T ) , Q ˙ γ ( T ) , T ) d T
Чтобы повторить вышеупомянутую точку, лагранжиан имеет три слота - один для точки в конфигурационном пространстве, один для касательного вектора и один для действительного числа. Так далеко как L L Это связано с тем, что эти три слота являются независимыми, поэтому мы можем использовать частные производные в свободное время.

Когда мы выполняем функционал действия , мы идем по кривой γ γ , На каждый T T кормим γ ( t ) q γ ( т ) γ ( T ) Q γ ( T ) в первый слот, В γ ( t ) q ˙ γ ( т ) В γ ( T ) Q ˙ γ ( T ) во второй слот, и T T в третий слот. Но нельзя подчеркнуть, что сам лагранжиан понятия не имеет, что эти три входа имеют какое-либо отношение друг к другу.


Теперь, когда это не так, мы можем приступить к делу. Мы ищем некоторые γ γ для которого функционал действия является стационарным. Интуитивно мы думаем «взять производную и установить ее на ноль», но на данном этапе не совсем понятно, как взять производную по кривой.

Вместо этого мы сделаем следующее. Обозначим правильную (но неизвестную) кривую γ с γ с , Тогда общая кривая γ γ можно записать как «сумму» γ с γ с и какая-то "ошибка" η η которая исчезает в конечных точках интеграла, и где сумма определяется компонентно. Другими словами, в какое-то время T T ,

Q γ ( t ) = q с ( т ) + ϵ η ( t ) ( q с 1 ( t ) + ϵ η 1 ( т ) , д с 2 ( t ) + ϵ η 2 ( т ) , ... , д с N ( t ) + ϵ η N ( т ) ) Q γ ( T ) знак равно Q с ( T ) + ε η ( T ) ( Q с 1 ( T ) + ε η 1 ( T ) , Q с 2 ( T ) + ε η 2 ( T ) , ... , Q с N ( T ) + ε η N ( T ) )

в то время как касательный вектор (также называемый обобщенной скоростью) становится

Q ˙ γ ( t ) = q ˙ с ( t ) + ϵ η ' ( t ) ( q ˙ с 1 ( t ) + ϵ η ' 1 ( т ) , д ˙ с 2 ( t ) + ϵ η ' 2 ( т ) , ... , д ˙ с N ( t ) + ϵ η ' N ( т ) ) Q ˙ γ ( T ) знак равно Q ˙ с ( T ) + ε η ' ( T ) ( Q ˙ с 1 ( T ) + ε η 1 ' ( T ) , Q ˙ с 2 ( T ) + ε η 2 ' ( T ) , ... , Q ˙ с N ( T ) + ε η N ' ( T ) )

где R R ε р , Вместо того, чтобы беспокоиться о деталях функциональных производных, мы можем искать путь γ γ что делает действие интегральным стационарным относительно изменений в ε ε :

d S [ γ ] d ε = 0 d S [ γ ] d ε знак равно 0

Функционал действия становится

S [ γ ] = В L ( q γ ( т ) , д ˙ γ ( т ) , т ) д т = В L ( q с ( t ) + ϵ η ( т ) , д ˙ γ ( t ) + ϵ η ' ( т ) , т ) д T S [ γ ] знак равно В L ( Q γ ( T ) , Q ˙ γ ( T ) , T ) d T знак равно В L ( Q с ( T ) + ε η ( T ) , Q ˙ γ ( T ) + ε η ' ( T ) , T ) d T

Различение по отношению к ε ε дает

d S [ γ ] d ε = В Σ я = 1 N [ L Q γ я η я ( т ) + L Q ˙ γ я η ' я ( т ) ] д T d S [ γ ] d ε знак равно В Σ я знак равно 1 N [ L Q γ я η я ( T ) + L Q ˙ γ я η я ' ( T ) ] d T

Теперь мы понимаем, что

L Q ˙ γ я η ' я ( т ) = [ L Q ˙ γ я η я ( т ) ] ' - ( д d T L Q ˙ γ я ) η я ( т ) L Q ˙ γ я η я ' ( T ) знак равно [ L Q ˙ γ я η я ( T ) ] ' - ( d d T L Q ˙ γ я ) η я ( T )

и так как граничный член исчезает в конечных точках, мы находим, что

d S [ γ ] d ε = В Σ я = 1 N [ L Q γ я - г d T L Q ˙ γ я ] η я ( т ) д T d S [ γ ] d ε знак равно В Σ я знак равно 1 N [ L Q γ я - d d T L Q ˙ γ я ] η я ( T ) d T

Потому что это количество должно исчезать для любого независимого набора вариантов η я η я отсюда следует, что подынтегральная функция должна исчезать всюду, и поэтому

d d T L Q ˙ γ я = L Q γ я d d T L Q ˙ γ я знак равно L Q γ я

Это дает нам уравнения Эйлера-Лагранжа, которые позволяют нам найти правильный путь в терминах обобщенных координат. Q γ я Q γ я ,


Задание кривой, которая связывает обобщенные координаты с обобщенными скоростями, происходит на уровне действия , а не на уровне лагранжиана . Так далеко как L L обеспокоен, Q ( т ) Q ( T ) и Q ˙ ( т ) Q ˙ ( T ) не имеют ничего общего друг с другом и могут быть выбраны полностью независимо. В этом разница между кормлением L L число Q ( т ) Q ( T ) в отличие от функции Q Q ,

Спасибо за ответ. Можете ли вы предложить книгу для чтения всего этого материала?
Это немного сложно, так как я на деле отказался от идеи касательных пространств, чтобы не углубляться в дифференциальную геометрию. Я более или менее прыгал вперед и назад между стандартной элементарной трактовкой лагранжевой механики и точкой зрения коллектора, хотя почти все, что вы найдете, будет либо тем, либо другим. Самая близкая вещь, которую я могу найти, это «Глобальные формулировки лагранжевой и гамильтоновой динамики на многообразиях» Ли, Леока и Маккламроха. Копия может быть доступна в Интернете, если вы попросите Всевышнего Google.
+1 Если мы хотим быть формальными, я думаю, что «Если η η маленький, мы можем линеаризовать "немного неудобно. Но это можно сделать более строгим, не жертвуя большой читаемостью, учитывая γ = γ с + ϵ η γ знак равно γ с + ε η где ε ε является реальным числом и находкой d S [ γ ] / д 0 = 0 d S [ γ ] / d ε знак равно 0 ,
@JiK Вы абсолютно правы - я исправил некоторые записи и сделал это редактирование. Благодарю.

Общий лагранжев формализм развивается в многообразии J 1 ( E ) J 1 ( Е ) со структурой струйного пучка, построенного из пучка волокон Е R Е р ,

Другими словами Е Е локально является продуктом Q Q и р р , где Q Q это многообразие, где конфигурации системы описываются каждый раз t R T р ,

Е Е покрыт локальными координатными заплатами т , д 1 , , Д N T , Q 1 , ... , Q N где T T является временной координатой по основанию р р волоконного жгута Е R Е р и Q 1 , , Д N Q 1 , ... , Q N покрыть волокна Q T Q T (диффеоморфно Q Q ).

Первое реактивное расширение J 1 ( E ) J 1 ( Е ) над р р увеличивает каждое волокно Q T Q T добавив еще один фактор р N р N покрыты координатами струи , Q ˙ 1 , , Д ˙ N Q ˙ 1 , ... , Q ˙ N независимо от Q 1 , , Д N Q 1 , ... , Q N но такие, что они отождествляют с d Q 1 d T , , д Q N d T d Q 1 d T , , d Q N d T как только движение t ( t , q 1 ( т ) , ... , д N ( т ) ) T ( T , Q 1 ( T ) , ... , Q N ( T ) ) дано. Другими словами ( т , д 1 , , Д N , д ˙ 1 , , Д ˙ N ) ( T , Q 1 , ... , Q N , Q ˙ 1 , ... , Q ˙ N ) исправить кинетическое состояние системы во времени T T , Здесь конфигурация и кинетическое состояние полностью независимы. Волокна J 1 ( E ) J 1 ( Е ) поэтому 2 н 2 N многообразия T T пространство кинетических состояний во времени T T , диффеоморфный каноническому слою покрыты местными координатами Q 1 , , Д N , д ˙ 1 , , Д ˙ N Q 1 , ... , Q N , Q ˙ 1 , ... , Q ˙ N

Ввиду этой структуры, изменение локальных координат и переход к T ' , д ' 1 , , Д ' N , д ˙ ' 1 , , Д ˙ ' N T ' , Q ' 1 , ... , Q ' N , Q ˙ ' 1 , ... , Q ˙ ' N отношения

T ' = т + с (1) (1) T ' знак равно T + с
Q К = q К ( т , д 1 , , Д N ) (2) (2) Q ' К знак равно Q ' К ( T , Q 1 , ... , Q N )
Q ˙ ' К = Q ' К T + J = 1 N Q ' К Q J Q ˙ J (3) (3) Q ˙ ' К знак равно Q ' К T + Σ J знак равно 1 N Q ' К Q J Q ˙ J
и обратные отношения имеют одинаковую структуру.

Вы видите, что третье уравнение совместимо с интерпретацией Q ˙ Q ˙ как производная по времени Q Q , Эта интерпретация является только формальной, потому что эта производная не может быть вычислена, когда точка a A T T дано: для вычисления указанной производной нам понадобится кривая (сечение), проходящая через , не только сам.

Уравнения Эйлера-Лагранжа являются уравнениями первого порядка, индуцированными скалярной функцией L : j 1 ( E ) R L : J 1 ( Е ) р что в каждом локальном графике определяется раздел t γ ( t ) j 1 ( E ) T γ ( T ) J 1 ( Е ) в координатах

t ( t , q ( т ) , д ˙ ( т ) ) , T ( T , Q ( T ) , Q ˙ ( T ) ) ,
решение, для k = 1 , , n К знак равно 1 , ... , N ,
d d T L Q ˙ К - L Q К = 0 , d d T L Q ˙ К - L Q К знак равно 0 ,
d Q К d T = q ˙ К ( т ) , d Q К d T знак равно Q ˙ К ( T ) ,
Ты видишь это Q ˙ Q ˙ Результаты будут производной по времени Q Q только вдоль решений уравнений ЭЛ, в противном случае Q Q и Q ˙ Q ˙ являются независимыми переменными.

ДОБАВЛЕННЫЙ КОММЕНТАРИЙ . Почему струйные связки?

Общая идея заключается в поиске математической структуры, которая кодирует идею, что

Q Q и Q ˙ Q ˙ являются независимыми переменными, и они становятся зависимыми ( Q ˙ Q ˙ является производной по времени Q Q ) вдоль каждого решения уравнений движения.

Первая идея - моделирование пространства кинетических статов на касательном расслоении конфигурационного пространства. T Q T Q где Q Q покрыт лагранжевыми координатными заплатами Q 1 , Д N Q 1 , ... Q N , Вот Q ˙ 1 , , Д ˙ N Q ˙ 1 , ... , Q ˙ N компоненты касательных векторов в Q 1 , Д N Q 1 , ... Q N (интерпретируется как касательные векторы к кривым, проходящим через эту точку, параметризованным посредством временной координаты).

Это хорошо, но, таким образом, преобразования координат, явно зависящие от времени , математически неестественны, но физически необходимы (представьте, что лагранжевы координаты в состоянии покоя с двумя разными системами отсчета, одна из которых инерционная, а другая не инерциальная).

Выходом является использование в качестве пространства-времени кинетических состояний декартового произведения A = R × T Q знак равно р × T Q , где р р это временная ось и просмотр допустимых координат на как координаты ( т , д 1 , , Д N , д ˙ 1 , , Д ˙ N ) ( T , Q 1 , ... , Q N , Q ˙ 1 , ... , Q ˙ N ) где t R T р и Q 1 , , Д N Q 1 , ... , Q N координаты на Q Q и Q ˙ 1 , , Д ˙ N Q ˙ 1 , ... , Q ˙ N координаты на каждом волокне T Q T Q , Координата T T В классической физике требуется совпадать с абсолютным временем и, таким образом, оно фиксируется с точностью до аддитивной постоянной. Это объясняет, почему мы ограничивали возможные изменения временной координаты до элементарной (1).

Эта картина может быть реализована уже на уровне пространства конфигураций, определяя пространство-время конфигураций как Е : = R × Q Е знак равно р × Q ,

На практике эта конструкция эффективна, но страдает идеологическим недостатком , заключающимся в том, что при каждом изменении координаты (1) - (3) может использоваться другая реализация Е Е ) как декартово произведение, что очевидно из правил преобразования (2) (и (3)), тогда как в общем случае естественного выбора не существует.

Таким образом, мы должны искать структуру, которая выглядит как декартово произведение (по крайней мере локально), но ее декартово разложение не является каноническим и допускает адаптированный атлас локальных карт, правила преобразования которых изложены в (1) - (3).

Первым шагом для удаления фиксированной декартовой структуры продуктов является ограничение только (1) и (2), предполагая с нуля, что пространство-время конфигураций не R × Q р × Q но многообразие, которое локально выглядит как этот продукт без фиксирования какого-либо конкретного выбора этого разложения

Эта структура существует и хорошо известна в математике: это расслоение Е R Е р с каноническим слоем, диффеоморфным Q Q , Атлас локальных координат, адаптированный к структуре пучка (с предпочтительной глобальной координатой, определяемой аддитивной постоянной на основе р р ) сделан из местных карт т , д 1 , , Д N T , Q 1 , ... , Q N преобразование точно так же, как в (1) - (2).

Осталось еще расширить эту структуру, чтобы охватить кинетическую информацию. Коллектор A = j 1 ( E ) знак равно J 1 ( Е ) это очень хороший кандидат. Это ничего, кроме Е Е с добавлением n = тусклый ( Q ) N знак равно тусклый ( Q ) координаты Q ˙ 1 , Д ˙ N Q ˙ 1 , ... Q ˙ N к каждому волокну для каждого естественного координатного участка т , д 1 , , Д N T , Q 1 , ... , Q N с требованием, чтобы изменение координат (3) выполнялось. Это связано с тем, что в определении струйного расслоения добавленные координаты точек должны интерпретироваться как компоненты касательных векторов сечений в Е Е компоненты всех возможных касательных векторов к кривым R t ( q 1 ( т ) , ... , д N ( т ) ) р T ( Q 1 ( T ) , ... , Q N ( T ) ) проходя через каждую точку Е Е ,

Не могли бы вы объяснить, почему струйные пучки неизбежны при геометризации классической теории поля, но в принципе их можно обойтись в механике частиц? По крайней мере, это то, что я знаю. Возможно я не прав.
@DanielC Они не являются неизбежными! Просто они являются полезными инструментами для моделирования какой-то базовой физической идеи. Я попытался ответить на ваш вопрос в заключительной ноте, которую я добавил к своему ответу.
  1. Часть вопроса ОП, кажется, является вопросом семантики: если лагранжиан

    L ( q 1 , , Д N , v 1 , , V N , т ) (1) (1) L ( Q 1 , ... , Q N , v 1 , ... , v N , T )
    имеет N N независимые обобщенные переменные положения Q 1 , , Д N Q 1 , ... , Q N пространство конфигурации N N -мерный, то система, как говорят, имеет N N степени свободы (DOF), ср. например, этот пост Phys.SE.

    Это определение DOF используется несмотря на то, что уравнения Лагранжа N N Связанные ODE 2-го порядка и, следовательно, полное решение имеют 2 н 2 N константы интегрирования, т.е. число N N DOF определяется как половина числа констант интегрирования!

  2. Другая проблема заключается в том, что обобщенные скорости v 1 , , V N , v 1 , ... , v N , являются независимыми переменными в лагранжиане (1), но они являются зависимыми переменными в действии

    S [ д 1 , , Д N ; T я , т е ]   : =   T е T я д т   L ( q 1 , , Д N , д ˙ 1 , , Д ˙ N , т ) , (2) (2) S [ Q 1 , ... , Q N ; T я , T е ] знак равно T я T е d T L ( Q 1 , ... , Q N , Q ˙ 1 , ... , Q ˙ N , T ) ,
    Это, например, объясняется в этом посте Phys.SE.