Что означает сокращение индексов матрицы Лоренца?

Метрический тензор в SR подчиняется закону преобразования (я использую штриховую нотацию Шютца для разных индексов системы координат):

η α ¯ β ¯ "=" Λ   α ¯ мю   Λ   β ¯ ν   η   мю ν

Если я не ошибаюсь, вторую матрицу Лоренца можно сжать с метрикой так:

η α ¯ β ¯ "=" Λ   α ¯ мю   Λ   мю β ¯

Это кажется неправильным, так как элементы матрицы Лоренца обычно записываются с одним верхним и одним нижним индексом, и я не понимаю, как Λ мю β ¯ может быть записано в матричном представлении.

Из разных источников мне также говорят, что приведенные выше уравнения эквивалентны матричному умножению с транспонированием Λ :

η "=" Λ η Λ Т

  • Транспонирует ли ее сжатие матрицы Лоренца?

  • Каковы различия между Λ   ν ¯ мю , Λ   ν мю ¯ , Λ мю ν ¯ и Λ мю ν ¯ ? Какие из них инверсные, а какие транспонированные?

Вы бы предпочли математическое понимание того, что происходит, или более прагматичный подход к тому, как работают вычисления в индексных обозначениях?
@KilianM Я понимаю, как применять соглашение Эйнштейна о суммировании, поэтому получаю ответы с помощью вычислений. Меня больше смущает интуиция и да, понимание того, что происходит - например, влияние понижения/повышения индекса на матричное представление.

Ответы (3)

Обратите внимание, что Λ не является тензором. Это матрица коэффициентов трансформации.

Тензор корректно определен при отсутствии какого-либо указанного фрейма, и его компоненты могут быть определены в том или ином фрейме. Преобразование Лоренца, напротив, используется для расчета того, как компоненты тензора изменяются от одного кадра к другому.

Сжатие одного верхнего и одного нижнего индексов тензора второго ранга дает тензор нулевого ранга, то есть инвариантный скаляр. Сжатие одного восходящего и одного нисходящего индекса для нетензора, такого как Λ б а даст какой-то математический результат, но не гарантируется, что это будет величина, представляющая какой-либо особый интерес. Точно так же комбинация метрики с Λ б а можно использовать для получения количества со всеми индексами вниз, но это не тензор, и лучше не играть в эту индексную гимнастику с нетензорами. Просто позволь Λ б а быть тем, что есть.

Для тензора второго ранга понижение первого индекса соответствует предварительному умножению на метрику в матричном языке; понижение второго индекса соответствует постумножению на метрику. Операция транспонирования соответствует изменению порядка индексов (обратите внимание, без их перемещения вверх или вниз). Например

Λ мю а Λ ν б Ф мю ν "=" Λ мю а Ф мю ν Λ ν б "=" Λ мю а Ф мю ν ( Λ Т ) ν б
и в матричной записи эту комбинацию можно записать
Λ Ф Λ Т

Я думаю, что понимаю, что вам не следует слишком много играть с понижением/повышением индексов в матрице Лоренца, но меня больше интересовало, как акт понижения/повышения интерпретируется как преобразование представления матрицы, т.е. транспонирование/инверсия матрицы . Как получить транспонированный результат из пониженного индекса Λ мю ν ¯ выше?
@HexiangChang Я добавил дополнительную информацию для решения этих вопросов.

Сначала краткое введение в тензоры. Ан ( р , с ) тензор т на К -векторное пространство В это просто мультилинейная карта из с копии В и р копии двойственного векторного пространства В * к основному полю К :

т : В * × . . . × В * р т я м е с × В × . . . × В с т я м е с К
Двойственное векторное пространство — это просто набор всех линейных отображений из В к К . Набор всех ( р , с ) тензоры на В обычно обозначается Т с р ( В ) .

Хорошо, как нам перейти от этих векторов и линейных карт к этим числам г мю ν с которым мы работаем?

Итак, мы делаем то, что всегда делаем интуитивно, а именно выбираем основу. Скажем, мы выбрали некоторую основу { е я } В в нашем векторном пространстве теперь мы можем выразить каждый вектор в е В как линейную комбинацию этих базисных векторов: в "=" в я е я . в я е К в основном являются числами, и положение индекса до сих пор является просто условным. Теперь мы можем сделать то же самое для двойственного векторного пространства с особенно умным выбором базиса. { е я } В * , такой, что е я ( е Дж ) "=" дельта Дж я . Опять же, положение индекса просто условно, чтобы не путать векторы и дуальные векторы, ведь это принципиально разные объекты!

С этим соглашением об индексах мы теперь запишем компоненты вектора как в я и двойственного вектора как в я .

Для тензоров это очень похоже:

т ( ш к ( 1 ) е к , . . . , ш л ( р ) е л , в ( 1 ) я е я , . . . , в ( с ) Дж е Дж ) "=" ш к ( 1 ) . . . ш л ( р ) в ( 1 ) я . . . в ( с ) Дж т ( е к , . . . , е л , е я , . . . , е Дж )
The т ( е к , . . . , е л , е я , . . . , е Дж ) т я . . . Дж к . . . л снова просто числа, не зависящие от того, на какие векторы и ковекторы действует тензор (просто выбранный нами базис). Аналогично векторам и ковекторам, мы также можем выразить тензор через его компоненты:
т "=" т я . . . Дж к . . . л е к . . . е л е я . . . е Дж

Итак, что происходит, когда мы выбираем другую основу { б я } В и соответствующий двойственный базис { б я } В * ? Поскольку наши новые базисные векторы (и новые базисные ковекторы) по-прежнему являются элементами одного и того же базового (дуального) векторного пространства, мы можем выразить их в виде некоторой линейной комбинации:

б я "=" А я Дж е Дж и б я "=" Б Дж я е Дж
Как и выше, мы можем просмотреть числа А я Дж и Б Дж я как компоненты тензора:
А "=" А я Дж е Дж б я и Б "=" Б Дж я б я е Дж
примечание : в физике мы обычно не рассматриваем эти преобразования как тензоры, однако я думаю, что это весьма полезно для нашего обсуждения здесь. Для получения дополнительной информации см., например, ( Является ли преобразование Лоренца тензором? )

Теперь, наконец, что на самом деле означает сжатие двух тензоров? Тензорные сокращения на самом деле просто определены для отдельного тензора и являются линейными картами. С л к : Т с р ( В ) Т с 1 р 1 ( В ) определяется:

Т мю 1 . . . мю с ν 1 . . . ν р е ν 1 . . . е ν р е мю 1 . . . е мю с Т мю 1 . . . мю с ν 1 . . . ν р е мю л ( е ν к ) е ν 1 . . . е ν л 1 е ν л + 1 . . . е ν р е мю 1 . . . е мю к 1 е мю к + 1 . . . е мю с )
Но это не проблема, так как мы можем сделать один тензор из двух, используя тензорное произведение. В вашем конкретном случае у нас есть "тензор" Λ "=" Λ мю ν е ν б мю и тензор η "=" η мю ν е мю е ν :
η Λ "=" η мю ν Λ β α е мю е ν е α б β
и
С ν α ( η Λ ) "=" η мю ν Λ β α е ν ( е α ) е мю б β "=" η мю ν Λ β ν е мю б β Λ мю β е мю б β
В ОТО (и СТО) пространство-время есть лоренцево многообразие л , интересующее нас векторное пространство — это касательное пространство Т п л в какой-то момент п е л и тензоры, которые вы рассматриваете, имеют особое значение, однако (как всегда) математика не слишком заботится о физике.

Почему вам разрешено рассматривать матрицу Лоренца как тензор? Изменяется ли ваш результат, когда он не обрабатывается тензором? (
Вы можете построить тензор из компонентов Λ ν мю так, как я это описал, однако, поскольку это тензорное произведение старого и нового базисных (ко)векторов, компоненты не трансформируются, как мы ожидаем, при изменении базиса. Однако, когда вы хотите говорить именно об этих математических идеях, таких как сокращение и т. д., очень полезно иметь точное представление о том, что мы делаем.

Мне потребовалось довольно много времени, чтобы добраться до начала класса релятивизма, но это может помочь: общее умножение матриц, как мы все знаем, выглядит так:

[ А ] [ Б ] "=" а р я б я р
Теперь версия теории относительности с эйнштейновским соглашением о суммировании сделает это матричное умножение следующим образом:
[ А ] [ Б ] "=" а ν о б о ν
Как вы видите, это то же самое, что и предыдущее выражение, только с отброшенным символом суммирования, и, таким образом, с первым индексом, представляющим строку, а вторым — столбцом. Теперь, возможно, есть люди, у которых есть объяснение того, чем тензор (2,0) (то есть «ковариантный») отличается от тензора (0,2) (то есть «контравариантный»), однако я просто держу правило в голове. что вы можете сжимать ковариант только с контравариантными индексами и, таким образом, применять метрику формы г мю мю ( г мю мю ) при необходимости снижения (повышения) индексов. Чтобы получить форму матриц, необходимо преобразовать тензор обратно в матричную форму, сжав его с метрикой. Я буду использовать метрику Минковского η здесь для демонстрации. Это возвращает нас к вашему вопросу, ваше уравнение может быть записано как:
Λ о α η мю о Λ ν о η β о η мю ν "=" Λ о α η β о Λ ν о дельта ν о "=" Λ ν α η β о Λ ν о "=" ν β [ Λ ] [ η ] [ Λ ] Т
Где я использовал тот факт, что
η мю о η β о "=" дельта о мю
И просто базовое повышение и понижение индексов через:
Λ α мю "=" Λ о α η мю о  и  Λ мю α "=" Λ о α η мю о

Я мог где-то сделать ошибку в индексе, но я надеюсь, что это даст некоторое понимание, и я надеюсь, что это поможет.

На самом деле это не просто «именование», потому что объекты, с которыми вы работаете, являются не матрицами, а тензорами. Для вычислений удобнее всего просто работать с компонентами этих тензоров в заданном базисе и тогда нижний и верхний индексы имеют точное значение.
Я отредактировал его, теперь он более правильный?
Пожалуйста, не используйте две пары одинаковых индексов в одном выражении.