Когда мы делаем произвольное обратимое дифференцируемое преобразование координат
Когда мы переходим к гамильтоновой структуре, все не так просто. При произвольном преобразовании в фазовом пространстве
Почему это причина?
Вы действительно должны думать о переменных, которые мы используем, как о координатах на некотором многообразии, конфигурационном пространстве (примерно то же самое, что и фазовое пространство, я не буду осторожен в различиях). В этом языке изменение переменных эквивалентно изменению координат на этом многообразии. Действие представляет собой некоторую скалярную функцию в этом пространстве, и мы можем взять производные по координатам, относительно любых координат мы используем на месте. Как и в многомерном исчислении, мы можем сформировать производные по направлениям для любого вектора с компонентами нам нравится. Если вы хотите что-то более формальное и геометрическое, производная по направлению — это производная Ли на конфигурационном многообразии.
Теперь вспомните, что когда мы варьируем действие, мы требуем, чтобы изменение было стационарным. То есть мы требуем, чтобы все производные по направлениям обращались в нуль, т. е. для всех векторов . Вы заметите, что это утверждение об исчезновении производных по направлению совершенно не зависит от используемых нами координат, но, тем не менее, подразумевает, что если мы используем координаты , что для каждого . Но любая система координат привела бы к тому же условию, что все производные координат равны нулю. Это также должно быть в некотором смысле знакомо из многомерного исчисления.
Так что это перевод инвариантности уравнений Эйлера-Лагранжа на геометрический язык. Помимо того, что это красиво, это также будет правильным языком для понимания того, что происходит в гамильтоновой картине.
Фазовое пространство обычно координируется парами координат , но это действительно не обязательно. В конце концов, фазовое пространство снова представляет собой многообразие, и являются просто специальной системой координат на этом многообразии (теорема Дарбу подразумевает, что мы всегда можем, по крайней мере локально, найти такую систему координат). На самом деле эти специальные координаты определяются тем, что симплектическая форма принимает совершенно особую форму.
Если вы плохо знакомы с симплектическими формами, позвольте мне сделать следующее, чтобы мотивировать эту идею. Вместо использования координат , вместо этого используйте общую координату , так что все, что я действительно сделал, это поставил 'песок в один большой вектор. Просто для ясности, если и были -мерные векторы, то это -мерный вектор, образованный конкатенацией компонентов (ну, подойдет любой способ объединения компонентов... это просто изменит точную форму Я представлю через мгновение, переставив строки и столбцы соответствующим образом). В терминах этого уравнения Гамильтона теперь могут быть записаны
Итак, симплектическая форма на самом деле трансформируется при изменении координат точно так же, как и любой тензорный объект над многообразием. Если принять на веру, что симплектическая форма должна преобразовываться как тензор при изменении координат, то мы уже знаем, как преобразовывается правая часть переписанного уравнения Гамильтона, если бы мы перешли к какой-либо другой системе координат. Но не будем беспокоиться об этом предположении и начнем с исследования левой части.
Предположим, мы выполняем некоторое преобразование в новую систему координат . Затем по цепному правилу
Итак, в конце концов, мы находим, что уравнения Гамильтона преобразуются как
Рассмотрим в качестве примера метрику Минковского. Мы знаем, как это выглядит в декартовых координатах. Если мы перешли, например, на полярные координаты, то, конечно, составные элементы в метрике изменились, но это все равно, в самом прямом смысле, та же самая метрика. У нас просто есть новое представление о нем.
Так где же во все это вписываться канонические преобразования? Это просто очень специальные преобразования координат, которые на самом деле оставляют компоненты симплектической формы неизменными. Формально это преобразования координат, порожденные векторными полями над фазовым пространством, у которых производная Ли симплектической формы равна нулю. Это во многих отношениях очень похоже на векторное поле, являющееся вектором Киллинга некоторой метрики.
Наконец, я должен отметить, что в том виде, в каком я изложил все обсуждение выше, может показаться странным, почему мы вообще должны рассматривать канонические преобразования. В конце концов, мы можем использовать любое преобразование за счет красивой формы симплектической формы. Возможно, неканонические преобразования могут придать уравнениям красивую форму.
В принципе это конечно верно. Однако канонические преобразования играют весьма существенную роль, тесно связанную с теоремой Нётер и симметрией. По существу можно гарантировать, что каждая симметрия действия соответствует в точности каноническому преобразованию. Кроме того, только векторные поля, которые соответствуют каноническим преобразованиям, гарантированно будут иметь связанный с ними заряд (подобно тому, как гамильтониан - это заряд, связанный с временной эволюцией (которая сама по себе является каноническим преобразованием)).
Более геометрический подход к гамильтоновой формулировке состоит в рассмотрении -габаритный контактный коллектор с координатами . Функционал действия Гамильтона равен
Отсюда становится ясно, что гамильтониан не скалярный объект , а скорее -компонента 1-формы/ковектора и, следовательно, нетривиально преобразуется при преобразованиях координат. Это отвечает на главный вопрос ОП. См. также, например, мой связанный с Phys.SE ответ здесь .
Более того, гамильтонову формулировку можно обобщить на неканонические координаты, ср. например, мой ответ Phys.SE здесь .
Другие ответы объяснили проблему в основном математически формальным и строгим образом. Я хочу добавить к обсуждению, вместо этого пытаясь объяснить, почему уравнения движения Лагранжа остаются неизменными, неформальным, но, надеюсь, интуитивно понятным способом, а затем обсудить, чем отличаются уравнения движения Гамильтона.
Сначала разберемся с Лагранжем. Давайте вспомним, в чем заключается настоящая проблема. Имеем действие вида и мы хотим найти траекторию, для которой это действие является экстремальным. Здесь лагранжиан является (для данного момента времени) функцией свойств траектории, таких как фактическое физическое местоположение и скорость. Чтобы на самом деле выполнить вычисление, мы выбираем координаты для описания физического пространства, называем их , где зависимость лагранжиана от физических свойств траектории (и времени, но будем считать в дальнейшем, что у нас нет явной зависимости от времени) теперь можно записать в виде (Я рассматриваю только одномерную задачу, обобщение на большее количество измерений концептуально просто, и поэтому мне нужно меньше печатать). С вашей стороны наш выбор координат не влияет на решение. Если вместо этого мы возьмем другие координаты , мы все равно получим ту же траекторию, только в этих разных координатах, потому что задача, которую мы решаем, одна и та же. Нам просто нужно знать изменения координат и и лагранжиан теперь должен быть записан как где зависимость можно найти, взяв производную по времени от .
На самом деле мы даже знаем, как решить задачу: уравнение движения Лагранжа, которое как математический факт также известно как уравнение Эйлера-Лаграна. Это уравнение утверждает, что интеграл становится экстремальным, если
Но почему это не так для уравнений движения Гамильтона? Чтобы убедиться в этом, давайте посмотрим, как мы идем от Лагранжа к Гамильтону. Самая основная идея заключается в том, что мы вводим «новую» переменную . Это, конечно, не совсем ново, на самом деле это определено как , поэтому в каждый момент времени это функция и , т.е. . Мы предполагаем, что эту зависимость можно обратить, чтобы найти для некоторой функции . Теперь мы можем просто записать наше действие как и снова хочу найти функции и что делает его экстремальным, верно? Нет, это было бы неправильно. По крайней мере, если мы сейчас изменимся и самостоятельно, мы не получим правильный результат. Вместо этого мы должны соблюдать условие, что . Итак, теперь у нас есть не просто задача оптимизации, а задача оптимизации с ограничениями, а именно: . Для реализации этого ограничения можно использовать метод множителей Лагранжа, т.е. такой термин, как где это множитель Лагранжа. Но это не единственная возможность. Вместо этого мы добавляем термин . Можно убедиться, что это приводит к правильному уравнению движения для при изменении и независимо, т.е. используя уравнение Эйлера-Лагранжа для
Но где наш аргумент сверху теперь терпит неудачу, когда мы рассматриваем «изменение координат» , ? У нас все еще есть проблема с оптимизацией, как и раньше. Но теперь разница в том, что если раньше у нас была совершенно произвольная функция в интеграле, и мы просто подставляли ее в уравнение Эйлера-Лагранжа, чтобы получить уравнение движения Лагранжа, то теперь мы полагаемся на подынтегральную функцию, имеющую конкретную форму. Эта конкретная форма обычно не сохраняется при изменении координат. Так что, конечно, мы все еще можем использовать уравнения Эйлера-Лагранжа для экстремума интеграла, но мы не обязательно получим уравнения Гамильтона в новых координатах. Давай посмотрим что происходит:
По-прежнему изменение координат можно осуществить заменой старых переменных соответствующими выражениями, зависящими от новых переменных, т.е. и , что приводит к
Конечно, бывают случаи, когда эта разница не влияет на фактические уравнения. Достаточным условием для этого является то, что это полная производная по времени, т.е. что-то вроде для некоторой функции . Это приводит к тому же уравнению движения, потому что при интегрировании производной по времени просто получается функция оценивается на границах интервала интегрирования (которое я везде опускал) и вариации равны нулю на границе (это используется при выводе уравнения движения Лагранжа, если не помните, просмотрите эту часть!), поэтому интеграл от производной по времени не меняется при изменении.
Кстати: Это условие достаточное, но не необходимое. Например, вы можете представить себе добавление члена к подынтегральной функции, которая пропорциональна самой подынтегральной функции. Это, конечно, также оставило бы неизменными уравнения движения. Но в случае канонических преобразований обычно предполагается, что разность является полной производной по времени.
Итак, теперь мы знаем, что если ist полная производная по времени, т.е. равная , то мы обязательно получим уравнения Гамильтона в обеих системах координат. Это также можно увидеть, подключив в уравнение Эйлера-Лагранжа для что тривиально дает ноль, не ограничивая в любом случае.
Поскольку смешанные вторые производные должны быть равны, т.е. получается из состояние который можно переписать в более привычной форме . Это показывает, что равенство этой скобки Пуассона 1 (т.е. замена координат является каноническим преобразованием) является достаточным условием сохранения уравнений Гамильтона.
Гарип
Ричард Майерс
Ричард Майерс
Гарип