Почему аналогия между электромагнетизмом и общей теорией относительности отличается, если рассматривать их как калибровочные теории или расслоения?

Электромагнетизм и общую теорию относительности можно рассматривать как калибровочные теории, и в этом случае между ними существует естественная аналогия:

введите описание изображения здесь

(Строго говоря, калибровочная симметрия диффеоморфизм-инвариантности метрики грамм мю ν сводится к глобальной симметрии ф ( Икс ) ф ( Икс ) + константа в ньютоновском пределе.)

Обе теории также можно рассматривать как соединения на расслоениях, и в этом случае между ними существует другая естественная аналогия:

введите описание изображения здесь

Здесь (глубокий вдох) А мю знак равно А - электромагнитный векторный потенциал, грамм мю ν это метрика, ф - ньютоновское гравитационное потенциальное поле, Ф мю ν знак равно Ф – тензор напряженности электромагнитного поля, Г ν р мю связь Кристоффеля, грамм — ньютоновское гравитационное поле, Дж мю – электрическая четырехточность, грамм мю ν тензор Эйнштейна, Т мю ν - тензор энергии-импульса, р - пространственная плотность массы, л означает «длина» и р мю ν р о — это тензор кривизны Римана (уф!).

К сожалению, как отмечено в разделе Анализ размерностей метрического тензора , эти две аналогии не совпадают! Электромагнитный четырехпотенциал А мю и тензор напряженности поля Ф мю ν соответствуют метрике грамм мю ν и связь Кристоффеля Г ν р мю соответственно в первой аналогии и связности Кристоффеля и тензору кривизны Римана р мю ν р о соответственно во втором. Это кажется неправильным — наверняка должна существовать единая унифицированная формулировка каждой теории, в которой истории о калибровочной теории и расслоениях естественным образом совместимы. Так что, черт возьми, происходит?

Возможно, мы сможем даже усложнить его, если рассмотрим геометрию квантовых вычислений, сформулированную М. Нильсеном в его статье arxiv.org/abs/quant-ph/0603161 . Здесь он сформулировал сложность квантовых вычислений в точном виде геометрии ОТО, а оптимальный квантовый алгоритм является аналогом геодезического в ОТО. Тогда ОТО можно сравнить с квантовой механикой или квантовыми вычислениями. На самом деле это моя первоначальная мотивация задать вопрос в моем посте «Размерный анализ метрического тензора».

Ответы (3)

Здесь задействована дополнительная структура. В зависимости от того, на каком уровне вы смотрите, это либо тот факт, что касательное соединение допускает обмен аргументами (если Икс Д хорошо определено, то так Д Икс ), или что есть форма для пайки θ на основной связке рамок для ГР, а для ЭМ такой формы пайки нет.

Во всяком случае, оба эти утверждения означают, что существует различие между калибровочными симметриями.

  • Для локальных симметрий Лоренца отличие состоит в том, что локальная симметрия Лоренца является «внешней» симметрией, тогда как U ( 1 ) симметрия является внутренней. Мы можем преобразовать «внешнюю» симметрию во внутреннюю именно с помощью вильбейнов: А а знак равно А мю θ мю а . Но тогда нам нужно найти динамику для vielbein θ мю а также. Этот фильбейн как раз и является местным проявлением упомянутой выше формы пайки.

  • Для симметрий диффеоморфизма это совершенно другое. Локальная симметрия Лоренца и U ( 1 ) обе симметрии локализуемы. Вы можете сделать преобразование LL или U ( 1 ) трансформация в точку . Вы не можете сделать diffeo в точке . Честно говоря, я не эксперт в этом, мне всегда не нравилось, когда люди говорили, что ОТО — это калибровочная теория с Диф ( М ) является калибровочной группой. Конечно, вы можете смотреть на это так, но это создаст непримиримую разницу с U ( 1 ) / С U ( 2 ) / С U ( 3 ) калибровочные теории стандартной модели.

Единственный несколько унифицированный язык - это когда вы считаете калибровочную группу группой Лоренца. Более того, существование спинорных полей, по-видимому, также предпочитает интерпретацию группы Лоренца.

Если вам нужен какой-то глубокий ответ, я не могу вам его дать. Эта калибровочная аналогия нарушается именно потому, что симметрия Лоренца является внешней пространственно-временной симметрией .

Внутренняя симметрия с калибровочной группой грамм даст вам связь Д действующее на сечения ассоциированных векторных расслоений (связанных с главным грамм -bundle, где живет соединение).

Тот факт, что это грамм - связь, а не грамм л ( к , С ) -связь заключается в том, что форма лагранжиана для поля материи обычно будет включать метрику слоя (для скалярной КЭД это «внутренний продукт» д ( ф , ф ) знак равно ф ф ), обычно эрмитова метрика, которая, поскольку мы хотим, чтобы связь была совместима с метрикой, приводит к грамм л ( к , С ) сводимы к некоторой унитарной группе.

Затем мы задаем лагранжиан и для связности, потому что это должно быть динамическое поле (для унитарных связностей это лагранжиан Янга-Миллса), и тогда у нас есть классическая калибровочная теория.

Для гравитации нам сначала понадобится вильбейн, чтобы сделать внешнюю симметрию внутренней. Vielbein должен иметь динамику, иначе как бы вы его определили? Но давайте пока проигнорируем это. Теперь у нас есть внутренняя лоренц-симметрия с метрикой слоя η , поэтому у нас есть η -совместимое соединение.

Нам нужно указать динамику обоих θ мю а а также ю мю     б   а . Метрическая совместимость и отсутствие кручения обеспечивают это ю должен быть нединамическим, поэтому нам нужно состряпать лагранжиан для θ . Но неустойчивость Остроградского заставляет искать уравнения поля второго порядка, поэтому кривизна (выражение второго порядка) не может быть динамической переменной * (в отличие от Янга-Миллса, где неустойчивость Остроградского этому не помешает, так как там кривизна первого порядка).

Даже если вы не пытаетесь обеспечить совместимость и отсутствие кручения, это ничего не изменит. Если вы навязываете отсутствие кручения, но не совместимость, то вы получаете формализм Палатини, что эквивалентно. Если вы не навязываете отсутствие кручения, вы получаете различия (теория Эйнштейна-Картана), которые чувствуют только спиноры. Даже тогда вы не можете избавиться от θ как «потенциал» теории.

Вывод таков : вильбейн — необходимый динамический объект для достижения гравитации, и это разрушает аналогию.

*: Говоря, что кривизна не может быть динамической, я имею в виду, что она не может фигурировать в уравнениях поля в дифференцированной форме.

Один быстрый вопрос: для общего метрического тензора, если мы исследуем пространство Вирбейна, оно должно иметь инвариантное подпространство относительно группы Лоренца, которое сохраняет инвариантным метрический тензор, верно?
@ X.Dong Я не уверен, что вы имеете в виду, но ортонормированный veilbein однозначно определяет метрику. И ортонормированность может быть своего рода определена без ссылки на метрику в том смысле, что ваш veilbein ортонормирован, если θ а знак равно Λ   а а θ а куда Λ является локальным преобразованием Лоренца, и тогда вы можете определить грамм мю ν знак равно η а б θ мю а θ ν б .
Да, это то, что я имею в виду. Таким образом, пространство Вильбейна имеет своего рода структуру расслоения с группой Лоренца в качестве слоя. Для меня GR имеет очень сложную иерархическую структуру симметрии из симметрии Гаусса SU (2), симметрии Лоренца, симметрии Диффа. Мне интересно, если группа Лоренца генерируется SU (2) / SL (2) как локальная операция на одном спиноре или одном кубите, тогда GL (4) можно рассматривать как операцию на 2 кубитах. Тогда есть ли между ними существенная разница?
Я имею в виду, если геометрия пространства-времени характеризуется грамм л ( 4 ) преобразования (как обобщенная операция над кубитами) в каждой точке, может ли разностная симметрия соответствовать инвариантной подгруппе грамм л ( 4 ) в каждой точке?
@ X.Dong Я понятия не имею, что вы имеете в виду под кубитами, но структура пучка волокон задается п являющееся главным расслоением Лоренца над М с формой пайки θ е Г ( 1 п , р н ) . Форма пайки имеет такое толкование, что для произвольного Икс е Г ( Т п ) векторное поле, θ ты ( Икс ) являются компонентами π * Икс в ортонормированном репере ты . Это определяет ты существования в качестве каркаса , поэтому θ это объект, который идентифицирует п в качестве О ( М ) расслоение ортонормированных реперов.
@X.Dong, тогда, если е представляет собой произвольный локальный участок п , мы определяем θ ~ знак равно е * θ и это θ ~ это то, что мы называем vielbein.

Аналогии, представленные в вопросе, я считаю ошибочными. Я согласен с Вайнбергом, как упоминалось в ответе @tparker, что аналогия проводится между символами Кристоффеля ( Г мю о ν ) и калибровочный потенциал ( А мю ). Эта параллель становится более ясной, если мы сравним гравитацию с неабелевыми калибровочными теориями и не будем исключать групповые индексы. В частности, сравните ковариантные производные (применительно к тензорам «ранга 1» для конкретности):

[ Д мю ] я Дж я знак равно дельта я Дж я мю я грамм [ А мю ] я Дж я [ мю ] ν о ν знак равно дельта ν о ν мю + [ Г мю ] ν о ν .
Обратите внимание, что я изменил стандартную запись для обоих элементов. Я изменил нотацию Янга-Миллса, чтобы включить различие между индексами вверх или вниз. Я изменил ковариантную производную GR, чтобы отделить индекс, определяющий направление, в котором происходит параллельный перенос ( мю ) от тех, которые описывают преобразование вектора по пути ( ν , о ).

Иными словами, базисные векторы векторных пространств в точке пространства-времени, Икс мю , связана с базисными векторами в точке Икс мю + д Икс мю на первый заказ по:

дельта я Дж я + я грамм [ А мю ( Икс ) ] я Дж я д Икс мю дельта ν о ν [ Г мю ] ν о ν д Икс мю .
Обратите внимание, как основания трансформируются в противоположном направлении от векторов. Важно отметить, что это означает, что каждый второй член выше является бесконечно малым генератором преобразований в соответствующем пространстве симметрии, а это означает, что они в целом антиэрмитовы в своих открытых индексах. Приведенные выше ковариантные производные, очевидно, являются обобщением для перевода всей вектор-функции, а не одного вектора. Перенос на конечное расстояние требует построения структуры, называемой линией Вильсона (см. Peskin & Schoeder, стр. 495 и окружающие) в неабелевых калибровочных теориях.

Все сказанное, вот неусловные различия между обычными калибровочными теориями и гравитацией:

  1. метрика в теориях Янга-Миллса постоянна,
  2. групповое пространство в гравитации касается пространственно-временного многообразия,
  3. степени свободы гравитации включают диффеоморфизмы пространственно-временного многообразия, а
  4. лагранжиан в гравитации является линейным по кривизне, а не квадратичным.

Метрика в теориях Янга-Миллса обычно даже не обсуждается, поскольку обычно она изоморфна постоянной евклидовой метрике. Даже абелева теория Янга-Миллса, электромагнетизм, имеет метрику. Определяющее представление U ( 1 ) группа, например, это преобразования, сохраняющие норму комплексных чисел, р 2 знак равно г г . Запись этой нормы в терминах метрики дает вектор г знак равно Икс + я у , а 2 -мерный вектор ( [ г ] я ), а метрика отображает это в ковектор г знак равно Икс я у ( [ г ] я ). Учитывая правила умножения комплексных чисел, это отображает метрику в 2 - д единичная матрица, грамм я Дж знак равно дельта я Дж .

Дело в том, что, насколько я знаю, не изучалось, чтобы теория Янга-Миллса имела метрику, являющуюся функцией пространства-времени.

Гравитация также в некотором смысле особенная для группы, представляющей касательное к многообразию преобразование. Другими словами, важно, что групповые индексы (индексы вне квадратных скобок выше) находятся в том же пространстве, что и симметрии на многообразии, что делает их касательными к пространству таким образом, что даже группа, которая просто изоморфна этим симметрии нет. Это несколько связано с идеей о том, что гравитация связана с диффеоморфизмами самого пространственно-временного многообразия и представляет собой нечто большее, чем просто измерение СЛ ( 1 , 3 ) группа.

Именно по этой причине мы требуем, чтобы связность была «метрически совместимой» в гравитации. Добавление условия отсутствия кручения переводит все степени свободы из соединения в метрику. Вот почему там появляется ньютоновский гравитационный потенциал.

Вследствие всего сказанного кривизна становится квадратичной по метрике, а не линейной по связности. Особое значение имеет то, что у него две производные вместо одной. Это одна из основных причин использования лагранжиана, линейного по кривизне, — существуют нерешенные теоретические трудности с теориями, имеющими более двух производных от лагранжиана; этот обзор Вударда (2007) содержит хороший обзор трудностей, связанных с ф ( р ) гравитационные теории.

Я хотел бы пояснить это на примерах, но мой опыт работы с теориями Янга-Миллса более глубокий, и я еще не полностью выкристаллизовал свое мышление по этой теме и каковы последствия.

Интересно о метрике в теории YM. Насколько я слышал, метрика Фубини-Штуди/Буреса тесно связана с естественной связью в теории ЯМ (например, в расслоении Хопфа). Можете ли вы помочь прояснить, совместима ли метрика FS/Bures со связью в теории YM или какова их связь? Если мы применим другие связи ASD в теории YM, какой будет соответствующая совместимая метрика? Я не знаком с этими вопросами. Спасибо.
Вы упомянули, что в GR мы требуем, чтобы соединение было совместимым с метрикой. Есть ли для этого фундаментальная причина? Обычно мы думаем, что связь более фундаментальная или физическая. Мои вопросы: (1) Почему мы задаем гравитационный диффеоморфный инвариант? Просто разумное предположение, чтобы заставить теорию работать? (2) Определяет ли это допущение сначала метрику, а затем распространяется на определение связи (согласно условиям совместимости и отсутствия кручения)? Или диффеоинвариантность сначала определяет связь, а затем метрику?
Я хотел бы ответить на ваши вопросы, @X.Dong, но этот ответ в значительной степени раскрывает глубину моих текущих знаний.

Вайнберг немного обсуждает эти аналогии в Vol. II из его серии QFT:

Аналогия нарушается в одном важном отношении: в общей теории относительности аффинная связность сама строится из первых производных метрического тензора, в то время как в калибровочных теориях калибровочные поля не выражаются через какие-либо более фундаментальные поля... [стр. 7]

поэтому он, кажется, думает о связности Кристоффеля, а не о метрике, как о калибровочном поле, как о второй аналогии. Но потом на стр. 13, он говорит, что Дж мю аналогичен Т мю ν , как и в первой аналогии.

Кажется, что, вопреки моему первому впечатлению, обе приведенные выше аналогии на самом деле просто аналогии, и ни одно из них не является особенно тесным. Теория Янга-Миллса и ОТО действительно являются качественно разными типами "калибровочных теорий", поскольку в теории Янга-Миллса калибровочно-инвариантный тензор напряженности поля Ф мю ν формируется из первых производных фундаментальных полей, а в ОТО калибровочно-инвариантный тензор напряженности поля р мю ν р о формируется из вторых производных фундаментальных полей. Таким образом, обе приведенные выше аналогии полезны в разных контекстах, но далеки от совершенства.

Однако мы можем сделать вторую аналогию более жесткой, рассмотрев формализм Палатини ОТО, где мы рассматриваем метрику и связность как независимые поля и варьируем действие относительно каждого в отдельности. Согласно этому формализму, сама связность расслоений является фундаментальным полем, как и в теории Янга-Миллса. (Но между этими теориями все же есть большое различие, состоящее в том, что сечения расслоения явно появляются в ОТО как грамм мю ν но не в классическом электромагнетизме.)

Редактировать: общий консенсус, по-видимому, заключается в том, что это «лучшая» аналогия, где стрелки, направленные вниз, обозначают производные, а стрелки, указывающие вправо, обозначают тензорные сокращения:

введите описание изображения здесь

Странность этой аналогии заключается в том, что уравнения, связывающие «тензор напряженности поля» с «полем источника материи», сильно различаются в двух случаях: уравнение движения Янга-Миллса д ( * Ф ) знак равно Дж является динамическим дифференциальным уравнением, а аналогичное уравнение общей теории относительности движения р   мю р ν р 1 2 грамм о λ р   о р λ р грамм мю ν Т мю ν просто алгебраическое отношение без производных. Я не уверен, что с этим делать.

Как вы думаете грамм ты в сечение расслоения, где определена риманова связность ? Для меня это что-то вроде раздела ассоциированной связки.
@ X.Dong Я не знаю, мое понимание пучков волокон недостаточно сильное.
@X.Dong Метрика представляет собой раздел связанного пакета. Его можно построить явно. Позволять грамм быть группой Лоренца и пусть р : грамм грамм л ( 4 , р ) . Позволять р * — двойственное (контрагредиентное) представление. У нас есть С 2 Т * М знак равно О ( М ) × р * р * ( р н * р н * ) , так что это связанный пучок. Однако метрический тензор выступает в совершенно иной роли, чем связанные с ним расслоения, скажем, в полуклассическом EM.
@tparker Нет, я еще один Х. Донг. :-)