Лоренц-инвариантность метрики Минковского

Насколько я понимаю, требуется, чтобы скалярное произведение между двумя векторами было инвариантным относительно преобразований Лоренца Икс мю Икс мю знак равно Λ α мю Икс α , мы требуем, чтобы метрика η мю ν трансформировать как η мю ν η мю ν знак равно Λ мю α η α β Λ ν β .

[Поскольку мы требуем, чтобы Икс мю Икс мю знак равно Икс α Икс α Икс мю Икс мю знак равно η мю ν Икс мю Икс ν знак равно η мю ν Λ α мю Λ β ν Икс α Икс β знак равно Икс α Икс α знак равно η α β Икс α Икс β ].

Что меня смущает, так это то, что я читал о проблеме космологической постоянной, и в нескольких наборах заметок утверждается, что вклад плотности энергии вакуума в тензор энергии-импульса должен иметь форму

Т мю ν в а с знак равно р в а с грамм мю ν
аргумент состоит в том, что вакуум должен быть лоренц-инвариантным, а единственный лоренц-инвариантный тензор - это метрический тензор η мю ν (кроме тензора Леви-Чивиты (плотности)).

Я не понимаю, как это происходит, глядя на η мю ν знак равно Λ мю α η α β Λ ν β , откуда видно, что это лоренц-инвариант? Разве это не должно быть что-то вроде η мю ν знак равно η мю ν ?

Извините, если это глупый вопрос, но у меня просто ментальный блок по этому поводу.

Ответы (2)

Я считаю, что может быть полезно определить следующие понятия (я не буду здесь слишком формальным по педагогическим соображениям):

Любое событие можно описать с помощью четырех действительных чисел, которые мы принимаем за: момент времени, когда оно происходит, и положение в пространстве, где оно происходит. Мы называем эти четыре числа координатами события. Мы собираем эти числа в кортеж, который мы называем Икс ( т , р ) . Эти числа, конечно, зависят от того, какую систему отсчета мы используем: мы могли бы, например, использовать другое начало координат для т или другую ориентацию р . Это означает: для Икс чтобы иметь смысл, мы должны выбрать определенную систему отсчета. Назови это С Например.

Если бы мы выбрали другую рамку, скажем С , компоненты одного и того же события будут Икс , т. е. четыре действительных числа, принципиально отличных от предыдущих. Мы объявляем новую систему отсчета инерциальной тогда и только тогда, когда Икс и Икс связаны через

(1) Икс знак равно Λ Икс
для определенной матрицы Λ , это зависит, например, от взаимной ориентации обеих систем отсчета. Есть определенные условия Λ должны выполняться, что будет обсуждаться через мгновение.

Мы определяем вектор как любой набор из четырех действительных чисел, такой что, если его компоненты в С находятся в знак равно ( в 0 , в ) , затем в С его компоненты должны быть

(2) в знак равно Λ в

Например, координаты Икс события по определению являются вектором, поскольку ( 1 ) . Примеров векторов в физике больше, например, электромагнитный потенциал , или плотность тока , импульс частицы и т.д.

Оказывается, действительно полезно определить следующую операцию для векторов: если ты , в два вектора, то мы определяем

(3) ты в ты 0 в 0 ты в
Причина, по которой эта операция полезна, заключается в том, что она широко распространена в физике: существует множество формул, в которых она используется. Например, любой закон сохранения , волновое уравнение , уравнение Дирака , соотношение энергии-импульса и т. д.

Мы определяем операцию через компоненты векторов, но мы знаем, что эти компоненты зависят от системы отсчета, поэтому, если должна быть четко определенной операцией, мы должны иметь

(4) ты в знак равно ты в
потому что иначе было бы довольно бесполезно.

Это отношение ( 4 ) не будет верным в общем случае, а только для некоторых матриц Λ . Таким образом, мы объявляем, что матрицы Λ могут быть только те, которые делают ( 4 ) быть правдой. Это ограничение на Λ : только некоторые матрицы будут представлять изменения системы отсчета. Обратите внимание, что в чистой математике любая обратимая матрица определяет изменение базиса. В физике только подмножество матриц является приемлемым изменением базиса.

Итак, какие возможны Λ это удовлетворяет ( 4 ) ? Что ж, самый простой способ изучить это — переписать ( 3 ) используя другое обозначение: определить

(5) η знак равно ( 1 1 1 1 )

Это просто матрица, которая упростит наше обсуждение. Мы не должны пытаться найти глубокий смысл для η (оказывается много геометрии за спиной η , но это сейчас не важно). С использованием η , это легко проверить ( 3 ) можно записать как

(6) ты в знак равно ты Т η в
где в правой части мы используем стандартное матричное произведение. Если мы подключим в знак равно Λ в и ты знак равно Λ в вот и ставь ты в знак равно ты в , мы находим, что мы должны иметь
(7) Λ Т η Λ знак равно η

Это отношение, которое определяет Λ : любое возможное изменение системы отсчета должно быть таким, чтобы ( 7 ) удовлетворен. Если это не так, то Λ не может связать два разных фрейма. Это отношение на самом деле не является утверждением того, как η преобразования (как вы говорите в ОП), но на самом деле ограничение Λ . Принято говорить, что η трансформируется как ( 7 ) , что будет объяснено через мгновение. А пока просто подумайте ( 7 ) каковы возможные матрицы Λ .

На этом этапе полезно ввести индексную нотацию . Если в является вектором, мы называем его компоненты в мю , с мю знак равно 0 , 1 , 2 , 3 . С другой стороны, запишем компоненты смены фреймов Λ мю ν . С этим обозначением ( 2 ) можно записать как

(8) в мю знак равно Λ мю ν в ν

Кроме того, используя обозначение индекса, произведение двух векторов можно записать как

(9) ты в знак равно η мю ν ты мю в ν
куда η мю ν являются компонентами η .

Обозначение индекса полезно, потому что оно позволяет нам определить следующее понятие: тензор — это объект с несколькими индексами, например А мю ν . Но не всякий объект с индексами является тензором: компоненты тензора должны изменяться в разных системах отсчета так, чтобы они были связаны через

(10) А мю ν знак равно Λ мю р Λ ν о   А р о Б мю ν знак равно Λ мю р ( Λ Т ) ν о   Б р о С мю ν π т знак равно Λ мю р Λ ν о ( Λ Т ) π ψ Λ т ю   С р о ψ ю
и очевидное обобщение для большего количества индексов: для каждого верхнего индекса существует коэффициент Λ , а для каждого нижнего индекса коэффициент Λ Т . Если компоненты объекта с индексами не удовлетворяют ( 10 ) тогда этот объект не является тензором. Согласно этому определению любой вектор является тензором (только с одним индексом).

Мне не нравится слишком часто использовать индексную нотацию: в знак равно Λ в легче, чем в мю знак равно Λ мю ν в ν , вам не кажется?. Но иногда приходится использовать индексную запись, потому что матричная запись невозможна: при использовании тензоров с тремя и более индексами нельзя использовать матрицы. Тензоры с одним индексом — это просто векторы. Иногда вы будете слышать, что матрицы — это тензоры с двумя индексами, что не совсем так: если вы помните из своего курса линейной алгебры, вы знаете, что при замене базиса матрицы преобразуются как М С Т М С , что похоже на ( 10 ) в случае одного верхнего/одного нижнего индекса. Следовательно, матрицы похожи на тензоры с одним верхним/одним нижним индексом. Это причина, по которой мы написали Λ в качестве Λ мю ν . Это матрица, но это также и тензор.

Также, ( 7 ) очень похоже ( 10 ) , правильно? Вот почему люди говорят ( 7 ) выражает свойства преобразования η . Хотя и не ложно, я вам рекомендую не относиться к этому слишком серьезно: формально это правильно, но в принципе η — это просто набор чисел, который упрощает нашу запись скалярных произведений. Оказывается, вы можете думать об этом как о тензоре, но только апостериорно . В принципе, он не определяется как тензор, но оказывается, что он есть. На самом деле это тривиальный тензор (единственный!), компоненты которого одинаковы во всех системах отсчета (по определению). Если бы вы вычислили, из каких компонентов состоит η в другой системе отсчета, используя ( 10 ) , вы обнаружите, что они одинаковы. Это утверждается, поскольку метрика является инвариантной . Фактически мы определяем его как инвариантный. Определим, что такое смена системы отсчета через ограничение η будучи инвариантным. Нет смысла пытаться доказать η инвариантно, так как это определение. ( 7 ) на самом деле не доказывает η является инвариантным, но на самом деле определяет, что такое изменение ссылки.

Для полноты я хотел бы дать следующие определения:

  • Мы говорим, что объект инвариантен , если он принимает одно и то же значение в любой системе отсчета. Вы можете проверить это, если в является вектором, то в в принимает одно и то же значение на любом кадре, т. е. в 2 является инвариантным.

  • Мы говорим, что объект является ковариантным , если он не принимает одно и то же значение в каждой системе отсчета, но различные значения связаны четко определенным образом: компоненты ковариантного объекта должны удовлетворять ( 10 ) . Это означает, что тензоры ковариантны по определению.

Например, вектор не является инвариантным, поскольку его компоненты зависят от системы отсчета. Но поскольку векторы являются тензорами, они ковариантны. Нам очень нравятся инвариантные объекты, потому что они упрощают множество проблем. Нам также нравятся ковариантные объекты, потому что, хотя эти объекты зависят от фрейма, они трансформируются четко определенным образом, что упрощает работу с ними. Вы поймете это лучше после того, как решите много задач в СТО и ОТО: в конце концов, вы будете благодарны за ковариантные объекты.

Итак, что это значит для η быть инвариантным? Это означает, что его компоненты одинаковы в каждой (инерциальной) системе отсчета. Как мы это докажем? мы на самом деле не можем, потому что мы определяем это как истину. Как мы можем доказать η единственный инвариантный тензор? Мы не можем, потому что на самом деле это не так. Наиболее общий инвариантный тензор пропорционален метрике. Доказательство: пусть Н мю ν — инвариантный тензор по определению. Тогда, поскольку это тензор, мы имеем

(11) Н знак равно Λ Т Н Λ

Но мы также должны иметь Н знак равно Н чтобы он был инвариантным. Это означает Λ Т Н Λ знак равно Н . Умножить справа на η Λ Т η и использовать ( 7 ) получить [ Н , Λ Т ] знак равно 0 . По лемме Шура Н должны быть пропорциональны тождеству. КЭД.


А как насчет символа Леви-Чивиты ? нам обычно говорят, что это также инвариантный тензор, что на самом деле не так: он инвариантен, но это не тензор, это псевдотензор . В SR это не удовлетворяет ( 10 ) для любого Λ , но только для определенного подмножества матриц Λ (проверьте правильную ортохронную группу Лоренца), а в ОТО это тензорная плотность (обсуждается во многих постах на SE).

Доказательство ковариантности символа LC обычно формулируется следующим образом (вам придется заполнить детали): определение определителя матрицы можно сформулировать как дет ( А ) ε мю ν о р знак равно ε а б с г А мю а А ν б А р с А о г . Собственная группа Orthochronus Lorentz состоит из подмножества матриц с единичным определителем, т. е. дет ( Λ ) знак равно 1 . Если вы используете это вместе с определением дет , Вы получаете ε мю ν р о знак равно ε а б с г Λ мю а Λ ν б Λ р с Λ о г , что то же самое, что ( 10 ) для объекта ε мю ν р о . Это доказывает, что при ограничении этим подмножеством группы Лоренца символ Леви-Чивиты является тензором.


Повышение и понижение индексов : это то, что обычно делается более важным, чем оно есть на самом деле. ИМХО, мы можем полностью сформулировать SR и GR, даже не говоря о повышении и понижении индексов. Если вы определяете объект с поднятыми индексами, вы должны оставить его индексы там, где они есть. В общем, нет веской причины, почему кто-то захочет переместить индекс. При этом я объясню, что это такое, просто для полноты картины.

Первым шагом является определение обратной метрики. Используя матричную нотацию, метрика является обратной самой себе: η η знак равно 1 . Но мы хотим использовать обозначение индекса, поэтому мы определяем другой объект, называем его ζ , с компонентами ζ мю ν знак равно η мю ν . С этим вы можете проверить, что η η знак равно 1 можно записать как η мю ν ζ ν р знак равно дельта р мю , куда дельта является символом Кронекера. Теперь, дельта это просто символ, упрощающий запись. Обратите внимание, что ζ не является стандартным обозначением, но мы сохраним его для следующих нескольких абзацев.

(Люди обычно используют одну и ту же букву для обоих η и ζ , и писать η мю ν знак равно η мю ν ; мы обсудим, почему в данный момент. А пока обратите внимание, что это разные объекты с разной структурой индекса: η имеет более низкие индексы и ζ имеет верхние индексы)

Мы можем использовать η и ζ повышать и понижать индексы, которые мы сейчас определим.

Допустим, у вас есть определенный тензор А мю ν р . Мы хотим определить, что значит поднять индекс р : это означает определение нового объекта А ¯ с компонентами

(12) А ¯ мю ν р ζ р о А мю ν о
(это называется поднять индекс р по понятным причинам)

С использованием ( 10 ) вы можете доказать, что этот новый объект на самом деле является тензором. Обычно мы опускаем планку А ¯ и писать А мю ν р . На самом деле мы не должны этого делать: эти объекты разные. Мы можем отличить их от размещения индекса, поэтому мы ослабляем запись, не записывая черту. В этом посте мы сохраним планку по педагогическим соображениям.

Аналогичным образом можно понизить индекс, например мю index: мы определяем другой объект А ~ , с компонентами

(13) А ~ мю ν р η мю о А о ν р
(мы снизили мю )

Этот новый объект также является тензором. Три объекта А , А ¯ , А ~ на самом деле разные, но мы можем отличить их по размещению индексов, поэтому мы можем опустить тильды и бары. Пока не будем.

Мы обсудим полезность этих операций чуть позже. А пока обратите внимание, что если вы поднимете оба индекса метрики, вы получите

(14) η ¯ ¯ мю ν ζ мю р ζ ν о η р о знак равно ζ мю р дельта р ν знак равно ζ мю ν
что обозначает η ¯ ¯ знак равно ζ . Поскольку мы обычно опускаем полосы, это означает, что мы можем использовать одну и ту же букву η для обоих объектов. В принципе они разные: η мю ν является метрикой, и ζ мю ν является его инверсией. На практике мы используем η мю ν и η мю ν для обоих этих объектов, и даже называть их обоих метрическими . Отныне мы будем использовать η как для метрики, так и для ее обратной, но мы сохраняем столбцы для других объектов.

Имея это в виду, мы получаем следующий важный результат:

(15) η мю ν η ν р знак равно дельта мю р
что на самом деле является тавтологией: это определение обратной метрики.

Итак, какая польза от этих операций? например, что мы получим, если понизим индекс вектора в ? Итак, мы получили новый тензор, но это не вектор (можете проверить, что ( 2 ) не выполняется), поэтому мы называем его ковектором . Это не очень важно в СТО, но в других разделах физики векторы и ковекторы действительно очень разные.

Итак, с чем связан ковектор в ? Назовите этот ковектор в ¯ . Его составляющие будут в ¯ мю знак равно η мю ν в ν по определению. Почему это полезно? Ну, одна из причин в том, что при понижении индекса скалярное произведение превращается в стандартный матричный продукт:

(16) ты в знак равно ты ¯ в
как вы можете проверить (сравните это с ( 3 ) или ( 6 ) ). Так что, в принципе, повышение и понижение индексов должно упростить запись. На самом деле, в конце концов, вы увидите, что люди пишут ты в вместо того ты в или ты мю в мю . Итак, вы видите, что запись упрощается без необходимости повышать/понижать какой-либо индекс.

Довольно интересен следующий факт: мы знаем, что если мы поднимем оба индекса метрики, то снова получим метрику. Но что мы получим, если поднимем к метрике только один показатель? то есть что такое η ¯ ?, или, говоря иначе, что такое η мю ν ? Ну, по определению, это

(17) η мю ν знак равно η ν р η мю р знак равно дельта ν мю
где я использовал ( 15 ) . Это значит, что η ¯ знак равно дельта : метрика — это тот же объект, что и символ Кронекера, что является классным результатом. Поскольку мы знаем, что повышение и понижение индексов тензора приводит к новому тензору, мы обнаруживаем, что символ Кронекера на самом деле является тензором! Мы можем даже доказать это из определения тензоров, т. е. мы можем проверить, что ( 10 ) удовлетворяется за дельта . Но нам это и не нужно: мы знаем, что это должно быть правдой (проверьте, если хотите).


В качестве примечания: вы (как и многие люди) пишете простые числа на индексах, а я (как и многие другие) пишу простые числа на тензорах. ИМХО, последнее соглашение является лучшим, потому что меняется тензор, а не индексы. Например, то, что вы написали η мю ν знак равно η мю ν выглядит лучше, когда написано η мю ν знак равно η мю ν , поскольку мю ν компоненты обоих объектов равны, а не мю равно мю компонента (что на самом деле не имеет смысла и приводит к несоответствию индексов).

Блестящий ответ, как раз то, что я искал! Поэтому, когда авторы говорят об инвариантности метрического тензора, это так по определению (т. е. мы выбрали его таким, что он есть), а не в доказательстве. А как насчет тензора Леви-Чивиты и дельта-тензора Кронекера? Можно ли просто показать их инвариантность, применив преобразования Лоренца и показав, что они инвариантны?
Спасибо :) Я отредактирую этот ответ, чтобы обратиться к этим объектам. Если вы заметили какую-либо ошибку или какой-либо неуместный тег, пожалуйста, сообщите мне, чтобы я мог это исправить.
В заключение, можно ли подойти к проблеме с противоположной стороны, т.е. рассмотреть скалярное произведение Икс мю Икс мю и преобразование Лоренца по координатам, такое что Икс мю Икс мю знак равно η мю ν Икс мю Икс ν знак равно ( Λ α мю η мю ν Λ β ν ) Икс α Икс β знак равно η α β Икс α Икс β . Сейчас если η α β знак равно η α β (такие, что компоненты метрического тензора одинаковы в обеих системах отсчета), то скалярное произведение будет лоренц-инвариантным...
... с того времени η α β Икс α Икс β знак равно η α β Икс α Икс β знак равно Икс α Икс α , и Икс мю Икс мю знак равно Икс α Икс α .
@Will yes: это допустимый вариант. так или иначе, я добавил некоторые подробности о символах Кронекера и Леви-Чивита.
В нем содержится некоторая вводящая в заблуждение информация. Я согласен, что η мю ν знак равно η мю ν выглядит лучше, но менее правильно, потому что тензор η вообще не меняется между системами отсчета! Это тот же тензор. Что меняется, так это основа, которую мы используем для извлечения компонентов тензора, поэтому мы заштриховываем индексы .
Также вводит в заблуждение утверждение, что «вы можете думать о η как тензор, но только апостериорно». Метрика по своей сути является тензором. Это полилинейная функция, которая принимает два вектора и выдает число. Это первый тензор, о котором вы узнаете!
@knzhou 1) ты прав, тензор не меняется, но η не тензор, а его компоненты. Это всего лишь соглашение, где символ означает компоненты. На самом деле мне больше нравится ваше соглашение, где символом является тензор, но в физике это не очень часто используется: мы склонны использовать символ для th компонентов (например, мы часто пишем р р р для вращений; здесь р являются компонентами вектора положения, а не самого вектора). Следовательно, по мере изменения компонентов штриховой знак должен переноситься на символ.
Я считаю, что последнее соглашение поначалу более педагогично, но после того, как мотивация станет ясной, от него следует отказаться в пользу вашего соглашения. 2) Помните, что я здесь не очень формален (я сказал это в первом абзаце). Я решил ввести метрику не как билинейную форму в кокасательном пространстве (не очень интуитивно понятную для новичков), а как матрицу, которая упрощает запись произведений. Только тогда я доказал, что это на самом деле тензор. Это предназначено для создания некоторой интуиции для начинающих, а не для формального введения в дифференциальную геометрию.
1) чтобы добавить больше деталей к моему первому комментарию, обратите внимание, что мой пост последователен: я написал в знак равно ( в 0 , в ) что подразумевает в компоненты вектора, а не сам вектор. Именно поэтому в ( 2 ) преобразование вектора записывается в знак равно Λ в . Я использую соглашение, в котором мы используем символ для компонентов, т. е. мы идентифицируем вектор и его компоненты, что означает в на самом деле является кортежем (я ясно дал понять это в своем посте). Это не вектор в геометрическом смысле, а скорее вектор-столбец , что бы это ни значило. Это соглашение очень часто используется в физике
Хотя обороты разные. Обычно они активны, т.е. базис остается прежним, но вектор действительно меняется. Но все преобразования Лоренца пассивны; вектор никогда не меняется, отсюда и другое обозначение.
Я согласен, что ваш способ более педагогичен, но я помещаю свои комментарии здесь как предупреждение для будущего обучения; мне потребовалось некоторое время, чтобы «разучиться» со всеми компонентами.
Я могу опоздать, но отличный ответ!

Ты прав. η мю ν η мю ν знак равно Λ мю α η α β Λ ν β просто говорит, что метрика преобразуется как тензор, как и следовало ожидать от ее индексов; в этом нет ничего особенного. Инвариантность означает, что при преобразовании вы получаете ту же матрицу: η мю ν знак равно η мю ν . В матричных обозначениях мы требуем, чтобы η знак равно Λ Т η Λ . Это неверно для произвольного тензора.

«Инвариантность означает, что при преобразовании вы получаете ту же матрицу: η мю ν знак равно η мю ν " - вот что я подумал, но как же η знак равно Λ Т η Λ показать, что метрический тензор лоренц-инвариантен? Почему не бывает так, что произвольный тензор имеет вид А знак равно Λ Т А Λ (в матричных обозначениях), когда он преобразуется как А мю ν А мю ν знак равно Λ мю α Λ ν β А α β при преобразовании Лоренца?
@Will: Нет, общий двухиндексный тензор преобразуется как А знак равно Λ Т А Λ . Матрицы А и А , являющиеся матричными представлениями тензора в разных координатах, в общем случае различны.
Хорошо, так это то, что для метрического тензора η знак равно Λ Т η Λ и мы требуем, чтобы η знак равно η ?
@Will: Это правильно.
Значит ли это, что, в принципе, в другой системе координат линейный элемент может быть задан как Икс мю Икс мю знак равно η мю ν Икс мю Икс ν , однако мы требуем, чтобы линейный элемент был лоренц-ковариантным, т. е. имел вид Икс мю Икс мю знак равно ( Икс 0 ) 2 + Икс Икс в одном кадре, то он должен иметь вид Икс мю Икс мю знак равно ( Икс 0 ) 2 + Икс Икс в произвольной инерциальной системе отсчета....
...Кроме того, мы требуем, чтобы линейный элемент был на самом деле лоренц-инвариантным, так что Икс мю Икс ν знак равно Икс α α , и, следовательно, мы требуем, чтобы Икс мю Икс мю знак равно η мю ν Икс мю Икс ν знак равно η мю ν Икс мю Икс ν знак равно Икс α Икс α знак равно η α β Икс α Икс β , откуда следует условие на вид преобразований Лоренца?!
@Will: Да, это идея.