Уравнение Лагранжа формоинвариантно при КАЖДОМ преобразовании координат. Уравнения Гамильтона не подвергаются КАЖДОМУ преобразованию фазового пространства. Почему?

Когда мы делаем произвольное обратимое дифференцируемое преобразование координат

с я "=" с я ( д 1 , д 2 , . . . д н , т ) , я ,
уравнение Лагранжа в старых координатах
д д т ( л д ˙ я ) л д я "=" 0 , я
изменения в
д д т ( л ^ с ˙ я ) л ^ с я "=" 0 , я
где л ^ ( с , с ˙ , т ) получается из л ( д , д ˙ , т ) к
л ^ ( с , с ˙ , т ) "=" л ( д ( с , т ) , д ˙ ( с , с ˙ , т ) , т ) .

Когда мы переходим к гамильтоновой структуре, все не так просто. При произвольном преобразовании в фазовом пространстве

      Вопрос я Вопрос я ( д 1 , д 2 . . . , п 1 , п 2 , . . , т ) , я , п я п я ( д 1 , д 2 . . . , п 1 , п 2 , . . , т ) , я
уравнения Гамильтона не остаются формоинвариантными. Это происходит только для ограниченного класса преобразований, называемых каноническими преобразованиями. Также новый гамильтониан не получается из старого гамильтонина
ЧАС ^ ( Вопрос , п , т ) "=" ЧАС ( д я ( Вопрос , п , т ) , п я ( Вопрос , п , т ) , т )
даже когда преобразование каноническое, если только это каноническое преобразование не является также симметрией.

Почему это причина?

Ответы (3)

Вы действительно должны думать о переменных, которые мы используем, как о координатах на некотором многообразии, конфигурационном пространстве (примерно то же самое, что и фазовое пространство, я не буду осторожен в различиях). В этом языке изменение переменных эквивалентно изменению координат на этом многообразии. Действие представляет собой некоторую скалярную функцию в этом пространстве, и мы можем взять производные по координатам, дельта С дельта д а относительно любых координат д а мы используем на месте. Как и в многомерном исчислении, мы можем сформировать производные по направлениям Д в С "=" в а дельта С дельта д а для любого вектора с компонентами в а нам нравится. Если вы хотите что-то более формальное и геометрическое, производная по направлению — это производная Ли на конфигурационном многообразии.

Теперь вспомните, что когда мы варьируем действие, мы требуем, чтобы изменение было стационарным. То есть мы требуем, чтобы все производные по направлениям обращались в нуль, т. е. Д в С "=" 0 для всех векторов в . Вы заметите, что это утверждение об исчезновении производных по направлению совершенно не зависит от используемых нами координат, но, тем не менее, подразумевает, что если мы используем координаты д а , что дельта С дельта д а "=" 0 для каждого а . Но любая система координат привела бы к тому же условию, что все производные координат равны нулю. Это также должно быть в некотором смысле знакомо из многомерного исчисления.

Так что это перевод инвариантности уравнений Эйлера-Лагранжа на геометрический язык. Помимо того, что это красиво, это также будет правильным языком для понимания того, что происходит в гамильтоновой картине.

Фазовое пространство обычно координируется парами координат ( п а , д а ) , но это действительно не обязательно. В конце концов, фазовое пространство снова представляет собой многообразие, и ( п , д ) являются просто специальной системой координат на этом многообразии (теорема Дарбу подразумевает, что мы всегда можем, по крайней мере локально, найти такую ​​систему координат). На самом деле эти специальные координаты определяются тем, что симплектическая форма принимает совершенно особую форму.

Если вы плохо знакомы с симплектическими формами, позвольте мне сделать следующее, чтобы мотивировать эту идею. Вместо использования координат ( п а , д а ) , вместо этого используйте общую координату ξ а "=" п а , д а , так что все, что я действительно сделал, это поставил п 'песок д в один большой вектор. Просто для ясности, если д а и п а были н -мерные векторы, то ξ а это 2 н -мерный вектор, образованный конкатенацией компонентов (ну, подойдет любой способ объединения компонентов... это просто изменит точную форму Ом Я представлю через мгновение, переставив строки и столбцы соответствующим образом). В терминах этого уравнения Гамильтона теперь могут быть записаны

д ξ а д т "=" Ом а б ЧАС ξ б
где Ом есть некоторая матрица. Обычно это выглядит примерно так
Ом "=" ( 0 1 1 0 ) .
Этот Ом обычно известен как обратная симплектическая форма. Хотя иногда вы просто услышите, что это называется симплектической формой (злоупотребление языком, но не редкость) или, точнее, бивектором Пуассона. Эти имена не так важны для того, что я хочу сказать, но я полагаю, что могу также упомянуть правильную терминологию для тех, кто хочет попробовать поискать в Интернете самостоятельно.

Итак, симплектическая форма на самом деле трансформируется при изменении координат точно так же, как и любой тензорный объект над многообразием. Если принять на веру, что симплектическая форма должна преобразовываться как тензор при изменении координат, то мы уже знаем, как преобразовывается правая часть переписанного уравнения Гамильтона, если бы мы перешли к какой-либо другой системе координат. Но не будем беспокоиться об этом предположении и начнем с исследования левой части.

Предположим, мы выполняем некоторое преобразование ξ а "=" ξ а ( ζ ) в новую систему координат ζ . Затем по цепному правилу

д ξ а д т "=" ξ а ζ мю д ζ мю д т ,
так что мы видим, возможно, неудивительно, что производная по времени также преобразуется как тензор при изменении координат (я использовал мю для индексов новых координат просто для того, чтобы все было визуально различно).

Итак, в конце концов, мы находим, что уравнения Гамильтона преобразуются как

д ξ а д т "=" Ом а б ЧАС ξ б ξ а ζ мю д ζ мю д т "=" Ом а б ζ ν ξ б ЧАС ζ ν ,
что, если мы переместим якобиан слева направо, мы найдем
д ζ мю д т "=" ( ζ мю ξ а Ом а б ζ ν ξ б ) ЧАС ζ ν
и отсюда мы видим, что если мы определим новую симплектическую форму Ом к
Ом мю ν "=" ζ мю ξ а Ом а б ζ ν ξ б ,
(что эквивалентно моему утверждению, что Ом должно быть тензорным относительно замены координат) Уравнение Гамильтона на самом деле инвариантно в том смысле, что мы по-прежнему имеем уравнения вида
д ζ мю д т "=" Ом мю ν ЧАС ζ ν .
Разница лишь в том, что компоненты Ом и Ом может быть не то же самое. Но на самом деле это не должно быть таким шоком после всей этой настройки, поскольку мы не ожидаем, что компоненты тензора останутся прежними после изменения координат.

Рассмотрим в качестве примера метрику Минковского. Мы знаем, как это выглядит в декартовых координатах. Если мы перешли, например, на полярные координаты, то, конечно, составные элементы в метрике изменились, но это все равно, в самом прямом смысле, та же самая метрика. У нас просто есть новое представление о нем.

Так где же во все это вписываться канонические преобразования? Это просто очень специальные преобразования координат, которые на самом деле оставляют компоненты симплектической формы неизменными. Формально это преобразования координат, порожденные векторными полями над фазовым пространством, у которых производная Ли симплектической формы равна нулю. Это во многих отношениях очень похоже на векторное поле, являющееся вектором Киллинга некоторой метрики.

Наконец, я должен отметить, что в том виде, в каком я изложил все обсуждение выше, может показаться странным, почему мы вообще должны рассматривать канонические преобразования. В конце концов, мы можем использовать любое преобразование за счет красивой формы симплектической формы. Возможно, неканонические преобразования могут придать уравнениям красивую форму.

В принципе это конечно верно. Однако канонические преобразования играют весьма существенную роль, тесно связанную с теоремой Нётер и симметрией. По существу можно гарантировать, что каждая симметрия действия соответствует в точности каноническому преобразованию. Кроме того, только векторные поля, которые соответствуют каноническим преобразованиям, гарантированно будут иметь связанный с ними заряд (подобно тому, как гамильтониан - это заряд, связанный с временной эволюцией (которая сама по себе является каноническим преобразованием)).

Похоже, здесь я мог чему-то научиться, но мне пришлось остановиться на ξ а а =< п а , д а > потому что я не могу понять это. ξ кажется переменной координаты, и а и указатель. Тогда почему существует а сидит рядом с ξ а ? А что обозначают ваши угловые скобки?
@garyp В ту секунду а это опечатка. Все, что я здесь делаю, это беру два н -мерные векторы координат п а и д а и смешать их в один большой 2 н -мерный вектор ξ а .
@garyp Я отредактировал свой ответ, чтобы попытаться сделать это немного яснее, но поскольку все, что я делаю, это переписываю стандартные гамильтоновы уравнения движения, вы должны иметь возможность использовать их для заземления, когда я говорю здесь перед координатой трансформация.
Ага. Понятно. Я пытался превратить угловые скобки в продукт. Если бы я читал контекст, то все бы прояснилось. Я думаю.
  1. Более геометрический подход к гамильтоновой формулировке состоит в рассмотрении ( 2 н + 1 ) -габаритный контактный коллектор М с координатами ( д я , п Дж , т ) . Функционал действия Гамильтона равен

    (1) С ЧАС [ γ ]   "="   я γ * Θ , Θ   "="   п Дж д д Дж ЧАС д т ,
    где γ : я М является кривой.

    Отсюда становится ясно, что гамильтониан ЧАС не скалярный объект , а скорее т -компонента 1-формы/ковектора и, следовательно, нетривиально преобразуется при преобразованиях координат. Это отвечает на главный вопрос ОП. См. также, например, мой связанный с Phys.SE ответ здесь .

  2. Более того, гамильтонову формулировку можно обобщить на неканонические координаты, ср. например, мой ответ Phys.SE здесь .

Другие ответы объяснили проблему в основном математически формальным и строгим образом. Я хочу добавить к обсуждению, вместо этого пытаясь объяснить, почему уравнения движения Лагранжа остаются неизменными, неформальным, но, надеюсь, интуитивно понятным способом, а затем обсудить, чем отличаются уравнения движения Гамильтона.

Сначала разберемся с Лагранжем. Давайте вспомним, в чем заключается настоящая проблема. Имеем действие вида С "=" д т л и мы хотим найти траекторию, для которой это действие является экстремальным. Здесь лагранжиан л является (для данного момента времени) функцией свойств траектории, таких как фактическое физическое местоположение и скорость. Чтобы на самом деле выполнить вычисление, мы выбираем координаты для описания физического пространства, называем их д ( т ) , где зависимость лагранжиана от физических свойств траектории (и времени, но будем считать в дальнейшем, что у нас нет явной зависимости от времени) теперь можно записать в виде л ( д ( т ) , д ˙ ( т ) , т ) (Я рассматриваю только одномерную задачу, обобщение на большее количество измерений концептуально просто, и поэтому мне нужно меньше печатать). С вашей стороны наш выбор координат не влияет на решение. Если вместо этого мы возьмем другие координаты Вопрос ( т ) , мы все равно получим ту же траекторию, только в этих разных координатах, потому что задача, которую мы решаем, одна и та же. Нам просто нужно знать изменения координат Вопрос ( д ) и д ( Вопрос ) и лагранжиан теперь должен быть записан как л ( д ( Вопрос ( т ) ) , д ˙ ( Вопрос ( т ) , Вопрос ˙ ( т ) ) ) где зависимость д ˙ ( Вопрос ( т ) , Вопрос ˙ ( т ) ) можно найти, взяв производную по времени от д ( Вопрос ( т ) ) .

На самом деле мы даже знаем, как решить задачу: уравнение движения Лагранжа, которое как математический факт также известно как уравнение Эйлера-Лаграна. Это уравнение утверждает, что интеграл д т г ( Икс ( т ) , Икс ˙ ( т ) ) становится экстремальным, если

д д т г Икс ˙ г Икс "=" 0
Это было получено только с использованием информации о том, что интеграл (который в нашем случае является действием) является экстремальным. Итак, если два человека решают проблему, человек 1 с д -координаты, чел 2 с Вопрос , оба знают, что могут использовать уравнение Эйлера-Лагранжа в своих соответствующих координатах, и оба получат одинаковый результат, только каждый в своих координатах, потому что оба решили одну и ту же задачу.

Но почему это не так для уравнений движения Гамильтона? Чтобы убедиться в этом, давайте посмотрим, как мы идем от Лагранжа к Гамильтону. Самая основная идея заключается в том, что мы вводим «новую» переменную п . Это, конечно, не совсем ново, на самом деле это определено как п "=" л д ˙ , поэтому в каждый момент времени это функция д ( т ) и д ˙ ( т ) , т.е. п ( д , д ˙ ) . Мы предполагаем, что эту зависимость можно обратить, чтобы найти д ˙ "=" ф ( д , п ) для некоторой функции ф . Теперь мы можем просто записать наше действие как С "=" д т л ( д ( т ) , ф ( д ( т ) , п ( т ) ) ) и снова хочу найти функции д ( т ) и п ( т ) что делает его экстремальным, верно? Нет, это было бы неправильно. По крайней мере, если мы сейчас изменимся п и д самостоятельно, мы не получим правильный результат. Вместо этого мы должны соблюдать условие, что д ˙ "=" ф ( д , п ) . Итак, теперь у нас есть не просто задача оптимизации, а задача оптимизации с ограничениями, а именно: д ˙ "=" ф ( д , п ) . Для реализации этого ограничения можно использовать метод множителей Лагранжа, т.е. л такой термин, как λ ( д ˙ ф ( д , п ) ) где λ это множитель Лагранжа. Но это не единственная возможность. Вместо этого мы добавляем термин п ( д ˙ ф ( д , п ) ) . Можно убедиться, что это приводит к правильному уравнению движения для д при изменении п и д независимо, т.е. используя уравнение Эйлера-Лагранжа для

д т ( л ( д ( т ) , ф ( д ( т ) , п ( т ) ) ) + п ( т ) ( д ˙ ( т ) ф ( д ( т ) , п ( т ) ) ) )
Изменение порядка терминов и определение ЧАС ( д , п ) "=" п ф ( д , п ) л ( д , ф ( д , п ) ) теперь мы переписали нашу исходную задачу как оптимизацию
д т ( п ( т ) д ˙ ( т ) ЧАС ( д ( т ) , п ( т ) )
Здесь д и п меняться самостоятельно. Если мы это сделаем, то получим уравнение движения Гамильтона.

Но где наш аргумент сверху теперь терпит неудачу, когда мы рассматриваем «изменение координат» Вопрос ( д , п ) , п ( д , п ) ? У нас все еще есть проблема с оптимизацией, как и раньше. Но теперь разница в том, что если раньше у нас была совершенно произвольная функция в интеграле, и мы просто подставляли ее в уравнение Эйлера-Лагранжа, чтобы получить уравнение движения Лагранжа, то теперь мы полагаемся на подынтегральную функцию, имеющую конкретную форму. Эта конкретная форма обычно не сохраняется при изменении координат. Так что, конечно, мы все еще можем использовать уравнения Эйлера-Лагранжа для экстремума интеграла, но мы не обязательно получим уравнения Гамильтона в новых координатах. Давай посмотрим что происходит:

По-прежнему изменение координат можно осуществить заменой старых переменных соответствующими выражениями, зависящими от новых переменных, т.е. д д ( Вопрос , п ) и п п ( Вопрос , п ) , что приводит к

д т ( п ( Вопрос ( т ) , п ( т ) ) д ˙ ( Вопрос ( т ) , п ( т ) ) ЧАС ( д ( ( Вопрос ( т ) , п ( т ) ) ) , п ( ( Вопрос ( т ) , п ( т ) ) ) )
приходится оптимизировать. Заметим, что он не имеет вида
д т ( п ( т ) Вопрос ˙ ( т ) ЧАС ( д ( ( Вопрос ( т ) , п ( т ) ) ) , п ( ( Вопрос ( т ) , п ( т ) ) ) )
которое было бы выражением, приводящим к уравнениям Гамильтона в новых координатах. На самом деле разница между подынтегральным выражением, которое мы имеем, и подынтегральным выражением, дающим нам уравнения Гамильтона, составляет п ( Вопрос ( т ) , п ( т ) ) д ˙ ( Вопрос ( т ) , п ( т ) ) п ( т ) Вопрос ˙ ( т ) .

Конечно, бывают случаи, когда эта разница не влияет на фактические уравнения. Достаточным условием для этого является то, что это полная производная по времени, т.е. что-то вроде д д т Ф ( Вопрос ( т ) , п ( т ) ) для некоторой функции Ф . Это приводит к тому же уравнению движения, потому что при интегрировании производной по времени просто получается функция Ф оценивается на границах интервала интегрирования (которое я везде опускал) и вариации д , п равны нулю на границе (это используется при выводе уравнения движения Лагранжа, если не помните, просмотрите эту часть!), поэтому интеграл от производной по времени не меняется при изменении.

Кстати: Это условие достаточное, но не необходимое. Например, вы можете представить себе добавление члена к подынтегральной функции, которая пропорциональна самой подынтегральной функции. Это, конечно, также оставило бы неизменными уравнения движения. Но в случае канонических преобразований обычно предполагается, что разность является полной производной по времени.

Итак, теперь мы знаем, что если п ( Вопрос ( т ) , п ( т ) ) д ˙ ( Вопрос ( т ) , п ( т ) ) п ( т ) Вопрос ˙ ( т ) ist полная производная по времени, т.е. равная Ф Вопрос Вопрос ˙ ( т ) + Ф п п ˙ ( т ) , то мы обязательно получим уравнения Гамильтона в обеих системах координат. Это также можно увидеть, подключив Ф Вопрос Вопрос ˙ ( т ) + Ф п п ˙ ( т ) в уравнение Эйлера-Лагранжа для п , Вопрос что тривиально дает ноль, не ограничивая п , Вопрос в любом случае.

Поскольку смешанные вторые производные должны быть равны, т.е. 2 Ф Вопрос п "=" 2 Ф п Вопрос получается из п ( Вопрос ( т ) , п ( т ) ) д ˙ ( Вопрос ( т ) , п ( т ) ) п ( т ) Вопрос ˙ ( т ) "=" Ф Вопрос Вопрос ˙ ( т ) + Ф п п ˙ ( т ) состояние д Вопрос п п 1 "=" п Вопрос д п который можно переписать в более привычной форме { д , п } Вопрос , п "=" 1 . Это показывает, что равенство этой скобки Пуассона 1 (т.е. замена координат является каноническим преобразованием) является достаточным условием сохранения уравнений Гамильтона.