Вариационное исчисление — как имеет смысл независимо изменять положение и скорость?

В вариационном исчислении, особенно в лагранжевой механике, часто говорят, что мы изменяем положение и скорость независимо друг от друга. Но скорость — это производная от положения, так как же вы можете рассматривать их как независимые переменные?

Не могли бы вы немного пояснить, пожалуйста? Вариационное исчисление само по себе является математической темой, так какое конкретное физическое приложение вы имеете в виду? Вы имеете в виду что-то вроде «Есть ли смысл применять уравнения Эйлера-Лагранжа к проблеме минимизации действия, учитывая, что для этого требуется рассматривать положение и скорость как независимые переменные, когда физически, если вы знаете положение как функция времени, скорость полностью определена?"
Отличный вопрос о самой основе всего, что мы вычисляем. Кроме того, провоцируя отличные ответы. Пожалуйста, поделитесь с нами своими сомнениями @grizzly adam :) Приветствую.
Я беспокоился об этом в течение многих лет, это остановило меня, когда я пытался изучать прикладную математику, и я встречал действительно хороших чистых математиков, которые были так же обеспокоены. Одно объяснение, которое имеет для меня некоторый смысл, содержится в дешевой книге «Классическая механика — теоретический минимум», в которой используется школьный, бесконечно малый подход, который, на мой взгляд, отвечает на вопрос, который автор на самом деле не ставит. Спасибо за размещение этого вопроса.
Связанные вопросы по Math.SE: math.stackexchange.com/q/1798396/11127 , math.stackexchange.com/q/580858/11127
Я рекомендую вам взглянуть на книгу Берка « Прикладная дифференциальная геометрия » (Cambridge U. Press, 1987). Учтите, что его посвящение на первых полосах гласит следующее: « Всем тем, кто, как и я, задавался вопросом, как, черт возьми, вы можете изменить д без изменения д ˙ . " :)

Ответы (8)

В отличие от вашего вопроса, это неправда , что скорость меняется независимо от положения. Вариант положения д д + дельта д вызывает изменение скорости т д т д + т ( дельта д ) как и следовало ожидать.

Единственное, что может показаться странным, это то, что д а также т д рассматриваются как независимые переменные лагранжиана л ( д , т д ) . Но это не удивительно; в конце концов, если вы спросите: «Какова кинетическая энергия частицы?», то недостаточно знать положение частицы, вам также нужно знать ее скорость, чтобы ответить на этот вопрос.

Другими словами, вы можете выбрать положение и скорость независимо в качестве начальных условий , поэтому функция Лагранжа рассматривает их как независимые; но вариационное исчисление не изменяет их независимо , изменение положения вызывает подходящее изменение скорости.

Точнее: речь идет не только о необходимости выбирать независимые начальные условия. Скорости и положения как координаты всегда независимы , если мы не находимся на решении уравнения движения. То есть, в Дж знак равно д ˙ Дж только на траекториях, решающих уравнения Эйлера-Лагранжа. На них вариации первых подразумевают вариации вторых. В остальном они не связаны.
Пожалуйста, объясните первые несколько строк. Положение и скорость независимы. Они явно зависят только от времени. Они, конечно, неявно зависят друг от друга, но вовсе не явно. Вы не можете изменить v, просто изменив x. При изменении x подразумевается, что изменяется t. Именно из-за этого изменения t меняется v. По сути, частная производная v с x равна 0, но производная v с x не равна 0. Вот почему я думаю, что мы не применяем здесь никакого «цепного правила»!
@Shashaank производная v по x равна 0.
@Greg Graviton Итак, согласно вашему ответу, если я могу выбрать ускорение независимо, будет ли оно также рассматриваться как независимая переменная?
@Theoretical В принципе, лагранжиан может также зависеть от ускорения, например, быть представленным функцией л ( д , в , а ) куда д , в , а являются независимыми переменными. Однако он оценивается только на кривых д ( т ) куда д д ( т ) , в т д ( т ) а также а т 2 д ( т ) .
Я несколько убежден в объяснении @gented. Но все же я не могу не заламывать руки в отчаянии. Я прошел через Гольдштейна и т. д., они просто приукрашивают это. Конечно, этот концептуальный скачок мысли заслуживает подробного обсуждения в тексте. Хорошо, даже если мы будем придерживаться того, что говорит gented (другими словами, д а также д д о т зависят, хотя и только на пути решения), что меня все еще беспокоит, так это то, что оно еще не должно быть непротиворечивым? Например, после нахождения пути, обычно, если мы повторяем наши математические шаги, мы обычно ожидаем, что каждый шаг будет удовлетворен. Кажется, это не так.
Например, если ф знак равно д 1 2 т 3 + д 2 2 т 2 . Предполагать д 1 а также д 2 являются функциями времени (которые априори неизвестны, но становятся известными после решения задачи). Тогда правильно ли говорить, что ( ф ) ( д 1 ) знак равно 2 д 1 т 3 , как все оправдания до сих пор можно было бы поверить? Ну, это кажется неправильным, если в конце концов было найдено решение, скажем, д 1 ( т ) знак равно т . Если мы подставим это в ф , мы получаем ф знак равно д 1 5 + д 1 2 д 2 2 , а затем вычислить ( ф ) ( д 1 ) , что дает совершенно другое значение. Как это объяснить?
@vharihar В этом случае проблема на самом деле с частной производной — она не стабильна при замене переменных! Рассмотрим, например грамм ( Икс , у ) . Частная производная грамм / Икс у знак равно константа отличается от частной производной грамм / Икс г знак равно константа куда г знак равно у Икс .

Ответ на ваш главный вопрос уже дан - вы не меняете координацию и скорость самостоятельно. Но кажется, что ваша основная проблема заключается в использовании координаты и скорости в качестве независимых переменных.

Позвольте мне сослаться на эту замечательную книгу: «Прикладная дифференциальная геометрия». Уильям Л. Берк . Самая первая строчка книги (где автор обычно говорит, кому посвящена эта книга) такова:

Уильям Берк

Правда, время от времени студенты задают этот вопрос. Но попытки объяснить это «сверху вниз», как правило, просто приводят к все большему количеству вопросов. Действительно, нужно навести математический порядок в теме «снизу вверх». Что ж, как следует из названия книги, нужная математическая дисциплина — дифференциальная геометрия .

Я не могу пересказать все подробности, но вкратце это выглядит так:

  • Вы начинаете с пространства конфигурации М вашей системы. М является (дифференцируемым) многообразием и д – координаты на этом многообразии.
  • Далее идет определенная процедура, позволяющая сложить все возможные «скорости» в каждой заданной точке М . И вы приходите к касательной связке Т М , которое также является многообразием, и ( д , д ˙ ) — разные координаты на нем.
  • Лагранжиан – это функция на Т М .
У меня есть эта книга, и я пытался ее прочитать. Но в нем отсутствуют четкие определения, и я нашел его скорее разочаровывающим, чем поучительным. Кроме того, я не считаю необходимым знать дифференциальную геометрию, чтобы понимать вариационное исчисление. Это все равно, что сказать, что вы не можете понять арифметику, если не знаете теорию множеств.
Прежде всего, как я уже сказал, вы смешиваете два разных момента: про вариационные исчисления и про независимость скоростей и координат. Во-вторых, я не говорил, что вам нужно прочитать только одну книгу, чтобы понять DG.
Я думаю, что для того, чтобы по-настоящему оценить лагранжеву и гамильтонову механику, вам нужно немного разобраться в дифференциальной геометрии. Арнольд говорит в своей книге « Математические методы классической механики », что «гамильтоновскую механику невозможно понять без дифференциальных форм». Эта книга, между прочим, научит вас дифференциальной геометрии, необходимой для начала работы, при условии, что вы будете заниматься математическим анализом.

Учитывая то, что написал Грег Гравитон, я напишу вывод и посмотрю, смогу ли я его понять.

С знак равно т 1 т 2 л ( д , д ˙ , т ) д т

где S — действие, а L — лагранжиан. Варьируем путь и находим экстремум действия:

дельта С знак равно т 1 т 2 ( л д дельта д + л д ˙ дельта д ˙ ) д т знак равно 0 .

Здесь q и д ˙ варьируются независимо. Но затем на следующем шаге мы используем это тождество,

дельта д ˙ знак равно д д т дельта д .

И вот где связь между q и д ˙ входит в картину. Я думаю, что здесь происходит то, что q и д ˙ изначально рассматриваются как независимые, но затем эта независимость снимается тождеством.

дельта С знак равно т 1 т 2 ( л д дельта д + л д ˙ д д т дельта д ) д т знак равно 0

А затем следует остальная часть вывода. Интегрируем второе слагаемое по частям:

дельта С знак равно [ л д ˙ дельта д ] т 1 т 2 + т 1 т 2 ( л д д д т л д ˙ ) дельта д д т знак равно 0 ,

и выражение в квадратных скобках равно нулю, потому что конечные точки зафиксированы. И тогда мы можем вывести уравнение Эйлера-Лагранжа:

л д д д т л д ˙ знак равно 0 .

Теперь это имеет больше смысла для меня. Вы начинаете с того, что считаете переменные независимыми, но затем удаляете независимость, накладывая условие во время вывода.

Я думаю, это имеет смысл. Я ожидаю, что в целом другие проблемы можно лечить таким же образом.

(Я скопировал приведенные выше уравнения из « Механики » Ландау и Лифшица.)

Ну, вместо того, чтобы сказать " д а также д ˙ изменяются независимо", можно также сказать: " д а также д ˙ различны (возможно, независимо, а возможно, и нет)», а позже отмечают, что вариация дельта д ˙ дан кем-то дельта д ˙ знак равно д д т дельта д .
Обозначение аргументов л несколько сбивает с толку, и в этом случае полезно рассмотреть следующий пример: возьмем Ф ( Икс , 2 Икс у ) и варьироваться Ф ( Икс + дельта Икс , 2 ( Икс + дельта Икс ) у ) знак равно Ф Икс дельта Икс + Ф ( 2 Икс у ) 2 дельта Икс . Можно сказать, что аргументы Ф меняются независимо, но это звучит странно. Во всяком случае, просто обозначения частных производных от Ф плохо; гораздо лучше написать Ф ( ты , в ) а также ( ты , в ) знак равно ( Икс , 2 Икс у ) чтобы получить дельта Ф знак равно Ф ты дельта ты + Ф в дельта в
... и для выражения вариаций дельта ты а также дельта в с точки зрения дельта Икс после.
Да, обозначения сбивают с толку. Это еще одна проблема.
Ландау — великий физик-математик, но простым писателем он не известен :-)
«Ни слова о Ландау, ни мысли о Лифшице».
@grizzlyadam, так что, в конце концов, они не независимы, но с ними можно обращаться так же, потому что математика доказывает это, верно?

Вот мой ответ, который в основном представляет собой расширенную версию ответа Грега Гравитона.

Вопрос о том, почему можно рассматривать положение и скорость как независимые переменные, возникает при определении лагранжиана л себя, прежде чем использовать уравнение движения и прежде чем думать об изменении действия С знак равно т я т ф д т   л , и поэтому не имеет ничего общего с вариационным исчислением.

I) С одной стороны, рассмотрим сначала роль лагранжиана. Пусть задан произвольный, но фиксированный момент времени т 0 е [ т я , т ф ] . (Мгновенный) лагранжиан л ( д ( т 0 ) , в ( т 0 ) , т 0 ) является функцией как мгновенного положения д ( т 0 ) и мгновенная скорость в ( т 0 ) в данный момент т 0 . Здесь д ( т 0 ) а также в ( т 0 ) являются независимыми переменными. Обратите внимание, что (мгновенный) лагранжиан л ( д ( т 0 ) , в ( т 0 ) , т 0 ) не зависит от прошлого т < т 0 ни будущее т > т 0 . (Можно возразить, что профиль скорости д ˙ д д д т : [ т я , т ф ] р является производной профиля позиции д : [ т я , т ф ] р , так как же д ( т 0 ) а также в ( т 0 ) быть действительно независимыми переменными? Дело в том, что, поскольку уравнение движения имеет 2-й порядок, можно сделать 2 независимых выбора начальных условий: 1 начальное положение и 1 начальную скорость.) Мы можем повторить это рассуждение для любого другого момента времени. т 0 е [ т я , т ф ] .

II) С другой стороны, давайте рассмотрим вариационное исчисление. Функционал действия

(1) С [ д ]   знак равно   т я т ф д т   л ( д ( т ) , д ˙ ( т ) , т )
зависит от всего (возможно, виртуального) пути д : [ т я , т ф ] р . Здесь производная по времени д ˙ д д д т зависит от функции д : [ т я , т ф ] р . Экстремальный функционал действия

(2) 0   знак равно   дельта С   знак равно   т я т ф д т [ л ( д ( т ) , в ( т ) , т ) д ( т ) | в ( т ) знак равно д ˙ ( т ) дельта д ( т ) + л ( д ( т ) , в ( т ) , т ) в ( т ) | в ( т ) знак равно д ˙ ( т ) дельта д ˙ ( т ) ]   знак равно   т я т ф д т [ л ( д ( т ) , в ( т ) , т ) д ( т ) | в ( т ) знак равно д ˙ ( т ) дельта д ( т ) + л ( д ( т ) , в ( т ) , т ) в ( т ) | в ( т ) знак равно д ˙ ( т ) д д т дельта д ( т ) ]   знак равно   т я т ф д т [ л ( д ( т ) , в ( т ) , т ) д ( т ) | в ( т ) знак равно д ˙ ( т ) д д т ( л ( д ( т ) , в ( т ) , т ) в ( т ) | в ( т ) знак равно д ˙ ( т ) ) ] дельта д ( т ) + т я т ф д т д д т [ л ( д ( т ) , в ( т ) , т ) в ( т ) | в ( т ) знак равно д ˙ ( т ) дельта д ( т ) ]

с соответствующими граничными условиями приводит к уравнению Эйлера-Лагранжа (EL) , которое является уравнением движения (EOM) .

д д т ( л ( д ( т ) , в ( т ) , т ) в ( т ) | в ( т ) знак равно д ˙ ( т ) ) (3)   знак равно   л ( д ( т ) , в ( т ) , т ) д ( т ) | в ( т ) знак равно д ˙ ( т )   .

III) Обратите внимание, что

(4) д д т   знак равно   в ˙ ( т ) в ( т ) + д ˙ ( т ) д ( т ) + т

является полной производной по времени, а не явной производной по времени т , так что уравнение ЭЛ (3) действительно является обыкновенным дифференциальным уравнением (ОДУ) 2-го порядка,

( д ¨ ( т ) в ( т ) + д ˙ ( т ) д ( т ) + т ) л ( д ( т ) , в ( т ) , т ) в ( т ) | в ( т ) знак равно д ˙ ( т ) (5)   знак равно   л ( д ( т ) , в ( т ) , т ) д ( т ) | в ( т ) знак равно д ˙ ( т )   .

Чтобы решить путь д : [ т я , т ф ] р , следует задать два начальных условия, например,

(6) д ( т я )   знак равно   д я а также д ˙ ( т я )   знак равно   в я .

Может быть лучший ответ в той же строке с этим сообщением и комментарием Кристиана Блаттера math.stackexchange.com/a/1211868/603316 . «Производная» между двумя функциями на самом деле не была производной от переменных, а скорее рассматривалась как функциональная производная, д д ( т 2 ) д д ˙ ( т 1 ) знак равно д т т 2 д ˙ ( т ) д т д д ˙ ( т 1 ) знак равно 0 и это была функциональная вариация. Возможны проблемы с условиями контакта, дельта ( т 1 т 2 ) , которая находилась в районе кв.м.

Хотя верно, что функция д ˙ ( т ) является производной функции д ( т ) время, это не правда, что значение д ˙ вообще не связано со значением д в данный момент времени, поскольку значение — это просто число, а не функция. Действие является функционалом д ( т ) , так что нет смысла варьировать действие как по д а также д ˙ . Но лагранжиан л ( д , д ˙ ) является функцией значений д а также д ˙ , а не функционал функций д ( т ) а также д ˙ ( т ) . Мы можем продвигать л функцией времени, если мы подключим д ( т ) а также д ˙ ( т ) вместо того, чтобы просто д а также д ˙ . (Помните, что функционал превращает функцию в число, например, С [ д ] , тогда как функция превращает значение в число, например, л ( д , д ˙ ) .

Чтобы решить для д ( т ) мы экстремизируем действие С , требуя, чтобы он был экстремальным в каждой точке, т . Это эквивалентно решению уравнений Эйлера-Лагранжа в каждой точке т . Так как в любой момент т ценности д а также д ˙ независимы, их можно варьировать независимо.

Производная функции ф ( т ) это функция ф ˙ ( т ) вообще отличается от ф , и в общем случае они даже не зависят линейно, что легко увидеть, если взять разложение Тейлора. Только после того, как вы определите с ними дифференциальные уравнения, они будут связаны алгебраически, что и делает вариационное исчисление.

Если у нас есть функция ф ( Икс , в ) , частные производные определяются формулой

ф ( Икс , в ) Икс лим час 0 ф ( Икс + час , в ) ф ( Икс , в ) час
а также
ф ( Икс , в ) в лим час 0 ф ( Икс , в + час ) ф ( Икс , в ) час
Это подразумевает, например, для ф знак равно в 2 что
в 2 Икс лим час 0 в 2 в 2 час знак равно 0.
Более того, для в знак равно д Икс д т мы находим, что Икс Икс + час подразумевает в знак равно д Икс д т в знак равно д ( Икс + час ) д т знак равно д Икс д т знак равно в . Таким образом
д Икс д т 2 Икс лим час 0 д Икс д т 2 д Икс д т 2 час знак равно 0.
Поэтому имеет смысл рассмотреть частные производные лагранжиана по Икс а также в отдельно и в этом смысле относиться к ним независимо.


Говоря более физическими терминами, вспомним, что наша цель в лагранжевом формализме — вычислить правильный путь в конфигурационном пространстве между двумя фиксированными точками. Путь характеризуется местоположением и скоростью в каждый момент времени. Мы максимально общие и рассматриваем действительно все возможные пути. Это означает, что мы рассматриваем все возможные пары местоположений и скоростей. Физический классический путь особенный по двум причинам:

  • это решение уравнения Эйлера-Лагранжа (= экстремум действия)
  • местоположения и скорости в каждый момент времени связаны соотношением в д д д т . (Если хочешь, в д д д т это второе уравнение, которое нам нужно в лагранжевом формализме, аналогично тому, как есть два уравнения Гамильтона в гамильтоновом формализме. Второе уравнение Гамильтона определяет канонический импульс как производную от лагранжиана. Для общих траекторий в фазовом пространстве возможно любое сочетание местоположения и импульса. Только для физического классического пути мы находим канонические значения импульса, которые задаются как соответствующая производная лагранжиана.)

Хотя все ответы, кажется, охватывают все детали, я просто добавлю свое лечение для тех, кто разделяет мои взгляды и может найти его полезным.

Полезно разбить символ частной производной (в уравнении Эйлера-Лагранжа) на две разные части. На самом деле у нас есть два разных уравнения, объединенных в одно уравнение. Если л ( Икс , в , т ) тогда

д д т ( л в ) знак равно ф Икс
в знак равно Икс ˙

Априори у вас есть 3 независимых координаты ( Икс 1 , Икс 2 , Икс 3 ) указать положение и 3 независимые координаты ( в 1 , в 2 , в 3 ) чтобы указать вектор в этой позиции. Всего у вас есть 6 независимых координат ( Икс 1 , Икс 2 , Икс 3 , в 1 , в 2 , в 3 ) который может принимать любое значение, которое вам нравится. Эти координаты означают, что есть вектор ( в 1 , в 2 , в 3 ) на позиции ( Икс 1 , Икс 2 , Икс 3 ) .

Тогда лагранжиан является функцией этих координат ( Икс 1 , Икс 2 , Икс 3 , в 1 , в 2 , в 3 ) . Априори все эти координаты могут принимать любые значения, поэтому они считаются независимыми. Затем уравнение Лагранжа Эйлера каким-то образом связывает эти 6 координат. В настоящее время Икс 'песок в становятся зависимыми через это отношение. Как только вы получите соотношение между этими координатами, вы подставите в я знак равно Икс ˙ я так как путь Икс я ( т ) в координатном пространстве будет соответствовать пути ( Икс я ( т ) , Икс ˙ я ( т ) ) в пространстве, на котором определен лагранжиан. Итак, в целом у вас есть два разных отношения между Икс 'песок в , один из которых вы получаете из уравнения Эйлера-Лагранжа, а другой вводите вручную (а именно в я знак равно Икс ˙ я ). Вы можете использовать эти соотношения, чтобы получить дифференциальное уравнение для Икс я ( т ) который позволяет вам получить путь.

Итак, вы можете видеть, что Икс 'песок в здесь действительно независимы. Тогда как Икс 'песок Икс ˙ явно зависимы. Если вы меняетесь Икс ( т ) по дельта Икс ( т ) , Икс ˙ ( т ) изменится соответственно. Вы можете проверить, что мы используем этот факт при выводе уравнения Эйлера-Лагранжа из первого принципа. Путаница возникает из-за того, что в конечном выражении кажется, что мы считаем их независимыми, но на самом деле мы просто рассматриваем их как независимые в этом выражении. Так что если Икс ˙ скорость для вас, то она никогда не считается независимой от Икс (только что так рассматривалось в уравнении Эйлера-Лагранжа). Но если в для вас скорость, то она справедливо считается независимой от Икс .

Изменить: в целом символ в определяется как _ Икс ˙ . В моей трактовке это просто еще один символ, обозначающий компонент любого вектора. Мы не изобретаем новый символ для обозначения скорости Икс ˙ .