Обоснование калибровки U(1)U(1)U(1) для электромагнетизма?

Почему мы должны ожидать или требовать, чтобы U ( 1 ) -калибровочная симметрия в теории заряженной частицы (типа КЭД), а именно то, что ее физические свойства не должны меняться при локальных изменениях волновой функции ψ ( Икс ) ψ ( Икс ) е я α ( Икс ) ? Например, требование этого U ( 1 ) -симметрия оправдывает использование ковариантной производной Д мю ( Икс ) "=" мю + я д Б мю ( Икс ) , пока Б мю трансформируется по Б мю ( Икс ) Б мю ( Икс ) 1 д мю α ( Икс ) . Сдача Б мю векторный потенциал А мю в электромагнетизме допускает взаимодействие / связь между волновой функцией фермионов ψ и электромагнетизм, хотя я не понимаю, почему это действительно правильно. Я слышал, что это именно называется минимальной связью, но я не понимаю точных деталей.

По итогу у меня два вопроса:

Вопрос 1. Какова физическая причина, почему мы должны требовать U ( 1 ) -калибровочная симметрия волновой функции заряженного фермиона?

Вопрос 2. После того, как мы наложим эту калибровочную симметрию на лагранжиан Дирака, каково физическое обоснование того, что мы должны позволить члену 1-формы связи быть в точности векторным потенциалом А мю , а не другие термины из электромагнетизма (скажем, Ф мю ν А ν )?

Есть (много) других вопросов по Physics SE, которые касаются аналогичной проблемы (например, this и this ), но не совсем этого.

Ответы (1)

В конечном счете, физическая причина для этого заключается в том, что это работает. Есть довольно естественная линия рассуждений, которая приводит к этой процедуре - это не доказательство, потому что доказательства не существуют в физике, а наводящая на размышления мотивация. Я пройдусь по этим рассуждениям, разбивая повествование некоторыми пояснениями, которые могут оказаться полезными.


Если вы накладываете локальную симметрию под действием группы Ли г , то сразу приходим к необходимости связи, которую можно представить одноформенной А которая принимает свои значения в алгебре Ли г связано с г и ковариантная производная Д "=" + А .

Позволять Ψ : р 3 С н быть н -компонентная волновая функция. Мы выбираем основу { е ^ 1 , е ^ 2 , , е ^ н } для С н и выразить нашу волновую функцию в компонентной форме Ψ "=" ψ а е ^ а . Если мы допустим, что базис зависит от положения, то дифференцирование волновой функции дает

мю Ψ "=" ( мю ψ а ) е ^ а + ψ а мю ( е ^ а )
где я использую красный греческий нижний индекс для обозначения пространственного индекса и латинские верхние/нижние индексы для обозначения С н индексы. Выражение мю ( е ^ а ) будет неким элементом С н , поэтому мы можем выразить это в локальном базисе как мю ( е ^ а ) "=" А мю     а б е ^ б . Включение этого обратно и перемаркировка индексов дает
мю Ψ "=" ( мю ψ а + А мю     б а ψ б ) е ^ а
Это мотивирует определение Д мю мю + А мю (где для каждого мю , А мю интерпретируется как н × н комплексная матрица), поэтому мю Ψ "=" ( Д мю ψ ) а е ^ а . При смене базы через некоторые Ом е г , ψ а Ом     б а ψ б и е ^ а ( Ом 1 )     а б е ^ б чтобы сохранить ценность Ψ сам. Примечание. С этого момента я буду отбрасывать пространственный индекс, потому что он просто сидит и приходит в себя. Вы всегда можете положить его обратно, если хотите.

Упражнение для читателя : Использование определения ( е ^ а ) "=" А     а б е ^ б , покажите, что при замене базиса А Ом ( А + ) Ом 1 . Далее, аргументируйте, что если Ом "=" е θ для некоторых θ е г , согласованность требует, чтобы А е г .

Спросим теперь, имеет ли эта связь какой-либо физический смысл. Если его можно равномерно установить равным нулю путем соответствующей смены калибровки, то мы можем выполнять все наши вычисления в этой калибровке; поскольку все калибровки физически эквивалентны, это означает, что А не может проявлять никаких физических эффектов. Установка соединения на ноль означает, что Ом ( А + ) Ом 1 "=" 0 А "=" ( Ом 1 ) Ом "=" Ом 1 Ом для некоторых Ом е г .

Упражнение для читателя : Покажите, что если А мю "=" Ом 1 мю Ом , затем

( г А ) мю ν мю А ν ν А мю "=" [ А мю , А ν ]
Итак г -значная(!) 2-форма Ф с компонентами Ф мю ν ( г А ) мю ν + [ А мю , А ν ] "=" 0 . Кроме того, покажите, что при изменении калибровки Ф Ом Ф Ом 1 .

То, что соединение может быть установлено равным нулю, подразумевает, что Ф (так называемая форма кривизны А ) исчезает. Верно и обратное (по крайней мере, локально), но это значительно труднее показать.

Если Ф не исчезает, то нам нужен какой-то способ определить, каким он должен быть. Один из способов сделать это — сделать скаляр (плотность) из Ф и использовать его как плотность Лагранжа. Напомним, что Ф имеет два пространственных индекса, о которых необходимо позаботиться. вообще , простейший скаляр, который можно составить из Ф является 1 4 Тр ( Ф 2 ) , где Ф 2 "=" Ф мю ν Ф мю ν и числовой коэффициент добавлен по обычным причинам.

Обратите внимание, что г мю ν Ф мю ν исчезает одинаково, так что это нехорошо. Однако, Ф 2 г мю α г ν β Ф мю ν Ф α β не. Но надо быть осторожным - каждый Ф мю ν является матрицей . Написано правильно со всеми соответствующими индексами,

Ф 2 "=" г мю α г ν β ( Ф     б а ) мю ν ( Ф     с б ) α β "=" ( Ф 2 )     с а
Нам все еще нужно избавиться от этих индексов векторного пространства, поэтому мы можем просто проследить их, чтобы получить настоящий скаляр:
Тр ( Ф 2 ) "=" ( Ф 2 )     а а "=" г мю α г ν β ( Ф     б а ) мю ν ( Ф     а б ) α β

Требование, чтобы лагранжиан был калибровочно-инвариантным, исключает такие термины, как А мю А мю , что дало бы А поля массы; в результате все вспомогательные поля, полученные таким образом, безмассовы.

В конце концов, связь с материей в теории естественно возникает из-за наличия связи в ковариантной производной. Динамика возникает из-за использования простейшего калибровочно-инвариантного скаляра в качестве лагранжевой плотности.

Вопрос 1. Какова физическая причина, почему мы должны требовать U ( 1 ) -калибровочная симметрия волновой функции заряженного фермиона?

Нет особой причины, по которой мы должны это делать, кроме того, что если мы это сделаем , то электромагнетизм упадет к нам в руки. Если мы повторим процедуру с другими калибровочными группами, мы придем к разным теориям, некоторые из которых кажутся реализуемыми в реальности, а другие — нет.

Вопрос 2. После того, как мы наложим эту калибровочную симметрию на лагранжиан Дирака, каково физическое обоснование того, что мы должны позволить члену 1-формы связи быть в точности векторным потенциалом А мю , а не другие термины из электромагнетизма (скажем, Ф мю ν А ν )?

Я думаю, что воображаем, что U ( 1 ) симметрия навязывается и впоследствии сочетается с электромагнетизмом, но это не совсем правильно. U ( 1 ) симметрия накладывается и затем становится электромагнетизмом. Дело не в том, что мы ищем 1-форму связи и решаем, что это должен быть векторный потенциал; дело в том, что если вы будете следовать приведенной выше процедуре, то 1-форма связи автоматически подчиняется уравнениям Максвелла и действует на заряженное вещество силой Лоренца.

Иными словами, можете называть это как угодно, но навязывание местного U ( 1 ) симметрия требует введения вспомогательного поля, которое ведет себя точно так же, как электромагнитный 4-потенциал, и оказывает точно такое же воздействие на материю. Если он ходит как утка и крякает как утка...


Забавным исключением из этого правила является размерность базового пространства и размерность векторного пространства, на котором г действия одинаковы; тогда греческий и латинский индексы имеют точно такие же значения. Это верно, когда мы рассматриваем г -мерное пространство-время и его г -мерные касательные пространства, например.

В этом случае мы можем связать один латинский индекс с одним греческим индексом в выражении ( Ф     б а ) мю ν , а затем свяжите результат с метрикой. Единственный нетривиальный способ сделать это

г мю ν ( Ф     мю а ) а ν

Этот член линейен по Ф а не квадратичный, и появляется в общей теории относительности; соединение является соединением Кристоффеля, Ф — тензор кривизны Римана, а полученный выше скаляр — скаляр Риччи.

Мне нравится ответ! Я подумал, что, может быть, было бы неплохо добавить, что наложение калибровочной инвариантности на лагранжиан делает фотон безмассовым, поскольку массовые термины нарушают эту инвариантность.
@Ratman Я добавил небольшой абзац, отметив это, спасибо.
@ J.Murray J.Murray цитаты, которые вы привели в своем ответе, взяты из определенного источника? Они очень хорошие, и я хотел бы прочитать больше.