Электромагнитное поле как связь в векторном пучке

Я хотел бы узнать больше о связях Эресмана в векторных расслоениях и о том, как они соотносятся с электромагнитным полем и электроном в квантовой механике.

Справочная информация: уравнение Шредингера для свободного электрона имеет вид

( я ) 2 2 м ψ знак равно я т ψ

Теперь, чтобы записать уравнение Шредингера для электрона в электромагнитном поле, заданном векторным потенциалом А знак равно ( с ф , А ) , мы просто заменяем оператор импульса и времени следующими операторами

я Д я знак равно я + е А я т Д 0 знак равно я т е ф

Я слышал, что это представляет собой «ковариантную производную», и я хотел бы узнать об этом больше.

Мои вопросы :

  1. (Делегировано обозначению секций векторных расслоений .)

  2. Я слышал, что связь - это «однозначная форма с алгеброй Ли». Как я могу это представить? Почему он принимает значения в алгебре Ли U ( 1 ) ?

  3. Так как соединение является одной формой, как я могу применить его к разделу ψ ? Я имею в виду, что форма ест векторы, но у меня есть раздел здесь? Что такое Д мю ψ ( Икс мю ) , это тоже раздел?

Прошу прощения за кажущуюся путаницу, которая, конечно же, является причиной моих вопросов.

Обратите внимание, что в целом отдельные вопросы следует задавать отдельно, но ваши 3 вопроса на самом деле кажутся 3 частями одного вопроса, так что это может быть нормально. Кроме того, возможно, это только я, но я не совсем понимаю, к чему ведет ваш вопрос 1. Если бы вы могли немного подробнее остановиться на этом, это могло бы помочь вам получить более точный ответ.
Ну, дело в том, что мое замешательство настолько велико, что я не совсем знаю, как правильно задать вопрос. :DI думаю, что теперь я лучше понял, чего хочу, ответив на вопрос 1. Хм, наверное, мне их даже разделить.

Ответы (4)

Вот короткий (-иш) ответ. Векторное расслоение — это семейство векторных пространств над многообразием. Векторные пространства могут иметь базы. Многообразие может иметь координаты. Эти два понятия не связаны априори (теперь для расслоения касательных пространств изменение координат вызывает изменение базиса; этот факт часто сеет путаницу). Как только вы выбираете основу для своего векторного пространства, вы определяете вектор по его компонентам, но кто-то другой может описывать тот же вектор в другой основе. Чтобы перевести в физику: смена базиса = калибровочное преобразование.

В случае заряженной частицы волновая функция есть составляющая одновекторного сечения; в новом базисе это число меняется на ненулевое комплексное число (которое может меняться от точки к точке). Опять же, волновая функция — это сечение, а сечение означает один вектор для каждой точки многообразия. Как отличить функцию, которая принимает значения в разных векторных пространствах в разных точках? Нам нужен способ соединения векторных пространств. Соединение делает это; с прагматической точки зрения, это всего лишь правило для проведения этой дифференциации.

Конечно, дифференцирование будет выглядеть по-разному в разных векторных пространствах, поэтому вид связи будет зависеть от базиса и изменяться при калибровочных преобразованиях (точно так же, как изменяется вид линейного преобразования при замене базисов). Вот что пытаются вам сказать различные запутанные формулы о том, как вещи «трансформируются».

Хороший ответ. И только сейчас я понял, что совсем забыл упомянуть векторные расслоения, так что хорошо, что упомянули. Просто чтобы сделать это немного более точным: векторный пучок В является не просто семейством векторных пространств (за исключением тривиального случая декартова произведения), а скорее расслоением со слоем векторного пространства. Дело о грамм -структура п заключается в том, что он действует на это векторное расслоение: слой п (который диффеоморфен грамм ) над точкой Икс действует на волокна В над той же точкой. Мы тогда говорим, что В преобразуется в некоторое представление грамм (например, скалярный, спинорный и т. д.).
Прежде всего, спасибо за ответ! Верно, ψ ( Икс ) сам по себе не является сечением векторного расслоения, это образ сечения в локальной тривиализации π 1 ( U ) U × С . В другой локальной тривиализации, т. е. после изменения калибровки, изображение е я х ( Икс ) ψ ( Икс ) . Все идет нормально.
Теперь мне интересно вот что: для векторного поля в (= сечение касательного пучка), я могу написать в знак равно в мю Икс мю . Это выражение инвариантно , поскольку в нем явно упоминается система координат Икс мю . Наоборот, " ψ ( Икс ) " не является инвариантной записью сечения U ( 1 ) векторный пучок, потому что я не указал локальную тривиализацию. Есть ли обозначение, чтобы сделать это явным, например, для в ? (Я спрашиваю, потому что мне трудно думать о координатах, если я не могу записать их инвариантным способом.)
Всем привет. Причина, по которой я дал свой ответ таким образом, заключается в том, что точность, особенно обозначения и язык, могут сбивать с толку. Спрашивающий, казалось, больше всего был озадачен общей структурой рассказа. Тем не менее, это правда, что разные ответы, безусловно, могут помочь разным читателям. Грегу: если вы действительно хотите, вы можете поставить индекс на \psi, указывающий, что это одновектор.
@Eric: Меня устраивает общая идея, но мне трудно собрать воедино детали. Я разделил вопрос и сделал часть 1 отдельным вопросом .
@Greg: я обновил свой ответ, чтобы ответить на этот вопрос (надеюсь, это поможет). @Eric: вы, безусловно, правы, и я бы дал ваше объяснение как введение в предмет для какого-то совершенного новичка (что не значит, что это плохо, наоборот, мне это очень нравится). Но мне показалось, что Грег уже немного разбирается в этих вещах, а также разбирается в математике дифференциальной геометрии, поэтому я решил сделать свой ответ немного более техническим (я знаю, что хотел бы увидеть эту математическую точку зрения). вид, когда я сам изучал этот материал).
Мне кажется, что выбранная связь по существу произвольна, по крайней мере, локально. (Думаю, я могу представить, что разные связи могут привести к разным глобальным дифференциальным структурам — хотя моя терминология может быть неправильной, извините.) Но любой произвол в соединении — это произвол в А . В настоящее время А имеет большую свободу калибровки, так что это не так уж удивительно, но действительно ли правда, что только глобальная структура соединения влияет на физическую часть А ? Короче, насколько физичен выбор подключения? (Извините за возрождение этого очень старого поста.)
  1. Не совсем уверен в этом вопросе. Возможно, вы просто спрашиваете о нотации? Вы можете выбрать все, что вам нравится. Но обычно вы выбираете одну систему координат и просто работаете в ней. Это, конечно, не проблема, если вы работаете в плоском пространстве-времени: там у вас есть хорошие глобальные координаты для всего.

    • Первая фраза правильная. Для произвольной группы Ли грамм с алгеброй Ли грамм вы можете получить так называемую G-структуру (например , О ( н ) -структура для римановых многообразий), и вы можете определить связность на ней. Это довольно тяжелая математика, но в конце концов вы получите грамм -значная (точнее, принимает значения в присоединенном представлении грамм ) одноформенный ю и ковариантная производная Д мю например тот, что вы написали.

    • В общем, я визуализирую связи так: вы вводите вектор, и связь возвращает вам элемент алгебры Ли, который является генератором некоторого преобразования в группе Ли. Например, на римановом многообразии вы вставляете в связь направление, в котором хотите двигаться, и получаете (очень грубо) информацию о том, насколько пространство искривлено в этом направлении. Точнее, если интегрировать γ опыт ( ю ( γ ˙ ( т ) ) ) г т вы получаете некоторый элемент Т е грамм который говорит вам, как любой вектор параллельно перемещается по замкнутой кривой γ (это называется голономия).

    • Что касается последнего вопроса, почему U ( 1 ) : ну, потому что это электромагнетизм. Различные группы дадут вам различные взаимодействия (например, С U ( 3 ) дает вам QCD). Эти группы возникают из-за того, что теории содержат то, что называется калибровочной симметрией. Я уверен, вы знаете, что уравнения Максвелла, записанные на А а также ф , инвариантны к некоторым преобразованиям. Более конкретно и ясно, как Ф знак равно г А , куда Ф представляет собой электромагнитный тензор и А является четырехпотенциальным. В таком виде очевидно, что уравнения для Ф не измениться при трансформации А знак равно А + г х . Теперь давайте вернемся к ψ и обратите внимание, что если вы хотите сделать теорию локально инвариантной (зачем вам это делать? потому что хорошо иметь локальные свойства вместо глобальных. И теория явно инвариантна по отношению к глобальному фазовому изменению, так что давайте просто попробуем это) что касается изменения фазы, вам придется ввести новую степень свободы А который преобразуется точно так же, как 4-потенциал в теории Максвелла! На самом деле, мы только что восстановили фотоны. Итак, в заключение: если вы выберете U ( 1 ) как группа симметрий появляется электромагнетизм. Но заметьте, что для последовательного включения всего этого вам нужно работать в рамках квантовой теории поля, потому что уравнение Шредингера явно не является релятивистски инвариантным, а это свойство, которое мы, безусловно, хотели бы иметь в теории электромагнетизма.

  2. Это может немного сбить с толку, особенно в литературе по физике, и я сомневаюсь, что смогу сделать это яснее. Возможно, это еще больше запутает вас, но вот: существуют различные пространства секций и грамм -структуры и представления обоих грамм а также грамм что действительно следует различать между но которые идентифицированы в физике. Чтобы сделать это строгим, потребовалось бы слишком много места, поэтому я предлагаю вам просмотреть несколько книг по калибровочной теории. Я просто скажу вам, что вектор (точнее векторное поле ) — это тоже сечение и наоборот. Но обратите внимание, что здесь смешиваются еще два термина: абстрактный вектор как понятие из линейной алгебры (это наш ψ : вы знаете, что это такой вектор, потому что у него нет пространственно-временного индекса мю ) и вектор как элемент пространства-времени Минковского, скажем В мю . Для Д мю , он действует (в расширении) также на тензорной алгебре пространства сечений ψ (в этом простом случае, когда ψ не имеет индекса, тензорная алгебра изоморфна нормальной касательной тензорной алгебре) и дает вам одну форму, живущую в этой тензорной алгебре, так что да: это сечение, но в совершенно другом (хотя и изоморфном) пространстве!

Не нужно извиняться. Эти вещи довольно сложны, и требуется много времени, чтобы разобраться во всем этом, и я думаю, что многие физики просто отмахнулись бы от большей части математического содержания и приступили к вычислению чего-либо. Что здесь возможно, потому что U ( 1 ) только одномерна, ее алгебра Ли одномерна, и поэтому ψ . Таким образом, вы все время работаете только с числами, и не возникает необходимости в абстрактных понятиях. За исключением того, что это ничуть не поможет вам, когда вы попытаетесь обобщить это (либо на КХД с неабелевой группой С U ( 3 ) , или к искривленному пространству-времени), или даже если вы попробуете подумать о некоторых концепциях, довольно основных с точки зрения геометрии (например, попробуйте подумать о том, что означает упомянутая выше голономия по отношению к γ в случае U ( 1 ) ). Так что хорошо, что вы уже пытаетесь понять основные принципы.


Обновление в отношении вопроса Грега в комментариях:

Я не уверен, что полностью вас понимаю, но у меня возникло ощущение (возможно, ошибочное), что вы смешиваете здесь различные понятия инвариантности. Существует как минимум два понятия физической инвариантности (под действием группы Лоренца и под действием U ( 1 ) ), а также понятие инвариантности в смысле «бескоординатности». Теперь, если я правильно чувствую, вы просите аналог в знак равно в мю Икс мю за ψ . Эти две вещи действительно очень похожи, но немного замаскированы. Точнее: в является сечением касательного расслоения Т М и мы разлагаем его по некоторому сечению канонического касательного репера расслоения Ф М , что также несет в себе естественное действие группы грамм л к ( р ) (действие - локальная смена базиса и к ранг Т М ). Другими словами, мы имеем грамм -структура здесь и отсюда берется "бескоординатная" инвариантность. Аналогичная ситуация с ψ : это сечение векторного расслоения π : В М который несет U ( 1 ) -структура. На этом этапе также должно быть ясно, в чем разница между двумя случаями: в первом у вас есть два пакета Т М а также Ф М а в последнем есть только π : В М . Так что нет смысла просить ψ быть более инвариантным, чем оно уже есть: у вас нет ничего, относительно чего вы могли бы разложить его. Поэтому вместо того, чтобы думать о ψ как аналог секции Т М , думайте об этом как об аналоге раздела Ф М .

Просто для придирки: соединение задается одной формой со значениями в алгебре Ли (а не в присоединенном расслоении); но это одна форма на ассоциированном главном расслоении. вы получаете только описание формы на базовом коллекторе локально. Вас может спутать кривизна, которую можно рассматривать как форму базового многообразия со значениями в присоединенном пучке.
@Eric: спасибо за придирки! Я имел в виду, что это одна форма в присоединенном представлении алгебры Ли (правильно?). Но правда, эта часть довольно запутанная. Я подумаю над этим и попытаюсь переписать.
@Eric: что касается кривизны: AFAIK локально кривизна представляет собой двойную форму со значениями в смежном представлении. алгебры Ли. Так что в этом отношении это то же самое, что и подключение. Оба могут быть представлены также на присоединенном расслоении. Или это не так?
Что ж, если вы работаете с векторным пакетом, то формы соединения на самом деле определяются только относительно локального фрейма. Если вы соедините их вместе, чтобы получить что-то глобальное, то это не будет иметь значения ни в одном хорошем пакете. Однако форма кривизны представляет собой глобальную двойную форму со значениями в присоединенном представлении. Но если вы перейдете от векторного расслоения к связанному с ним основному расслоению, то форма соединения будет глобальной формой 1 на основном расслоении со значениями в алгебре Ли (не ad rep), а форма кривизны будет формой 2 на основном расслоении со значениями в алгебре Ли.
@Eric: Понятно, спасибо за разъяснение! Мне определенно нужно больше думать об этих вещах (мне определенно нужна одна чисто математическая лекция по расслоениям волокон и основным расслоениям; прямо сейчас я исправляю свои математические знания из битов, которые я узнал из физической литературы), и тогда я обновлю свой ответ.

Я вполне понимаю ваше замешательство, поскольку вполне естественно, что вы чувствуете себя ошеломленным этой новой точкой зрения на теорию.

Ответы, данные Эриком и Мареком , просто прекрасны, и я не буду прямо говорить о главных связках, локальной тривиализации и тому подобном. Я хочу представить здесь очень интуитивный подход.

Я бы посоветовал вам вернуться на один или два шага назад и попытаться понять понятие ковариантной производной в классической дифференциальной геометрии. Там ковариантная производная Д гарантирует, что если вы получите некоторую величину Ф на многообразии, скажем, на некоторой поверхности, эта новая величина Д Ф также будет лежать «на многообразии» (собственно, что-то связанное с ним, например касательное пространство).

Следующий пример, мы надеемся, проиллюстрирует проблему, что означает, что что-то должно «остаться на коллекторе».

Точка массы на поверхности

Хорошо, давайте рассмотрим самый простой пример, который только можно придумать, движение точки свободной массы на поверхности в ньютоновской механике. Как известно, лагранжиан в данном случае — это просто кинетическая энергия,

л знак равно Т знак равно м 2 в 2

Итак, что сейчас в 2 ? Мы должны предположить, что в каждой точке скорость касается поверхности. Тогда мы знаем, что в 2 знак равно грамм а б Икс ˙ а Икс ˙ б где мы суммируем по индексам и поверхность описывается некоторой метрикой грамм а б ( Икс ) г Икс а г Икс б и мы заменили скорость производной по времени от положения частицы.

Для решения системы нам понадобятся два слагаемых. Прежде всего, мы хотим рассчитать

л Икс к знак равно м 2 к грамм а б ( Икс ) Икс ˙ а Икс ˙ б

второй,

г г т л Икс ˙ к знак равно г г т м 2 грамм а б ( Икс ) ( дельта к а Икс ˙ б + Икс ˙ а дельта к б ) знак равно м г г т грамм к б ( Икс ) Икс ˙ б

поскольку грамм симметричен. В настоящее время,

м г г т грамм к б ( Икс ) Икс ˙ б знак равно м ( л грамм к б ( Икс ) Икс ˙ л Икс ˙ б + грамм к б ( Икс ) Икс ¨ б )

Наконец, уравнения движения имеют вид

г г т л Икс ˙ к л Икс к знак равно 0

и отбрасывая m, повторно используя симметрию в грамм и переименовывая некоторые индексы, приходим к

грамм к б Икс ¨ б + 1 2 ( а грамм к б + б грамм к а к грамм а б ) Икс ˙ а Икс ˙ б знак равно 0

что именно путем применения грамм я к

Икс ¨ я + Г а б я Икс ˙ а Икс ˙ б знак равно 0

Где символы Кристоффеля можно непосредственно рассматривать как

Г а б я знак равно 1 2 грамм я к ( а грамм к б + б грамм к а к грамм а б )

и я надеюсь, что я ничего не просчитался.

Отношение к электродинамике

Вот это уравнение движения уже волшебное, поскольку оно и есть уравнение движения пробной частицы в ОТО . Но как насчет (других) калибровочных теорий поля?
Здесь кривизна определяется не непосредственно по отношению к многообразию, а как-то «привязанной» к нему группе. Вот почему у него будут некоторые групповые индексы, но их можно отбросить, если алгебра Ли группы одномерна, как в случае электродинамики. Там наша кривизна Ф мю ν но мы могли бы также указать Ф мю б ν а где сейчас а а также б являются индексами группы. Это выглядит гораздо более похожим на кривизну общей теории относительности, р ν α β мю где все индексы соответствуют многообразию, касательное пространство в каком-то смысле является группой общей теории относительности, грубо говоря.

По историческим причинам символы Кристоффеля, которые каким-то образом улавливают (не инвариантно!) силу, действующую на частицу из-за кривизны, в калибровочных теориях называются калибровочными полями. А и масштабируется,

β А мю б а г Икс мю "=" Г мю б а г Икс мю

с снова групповыми индексами а а также б .

Теперь, если вы выведете что-то на многообразии, вам всегда придется определять эту производную по отношению к символам Кристоффеля, чтобы оставаться «в многообразии». С другой стороны, вывод также должен учитывать групповой характер, можно сказать, что результат должен оставаться «в группе». Это будет реализовано с помощью ковариантной производной, и здесь «символы Кристоффеля» называются калибровочными полями.

Искренне

Роберт

Я добавил форматирование к вашим уравнениям. Кстати, небольшой терминологический вопрос: Ф мю б ν а стандарт? Я больше привык (и также думаю, что это более естественно) объединять тензорные индексы и индексы алгебры Ли вместе, чтобы подчеркнуть, что Ф на самом деле двойная форма со значениями в алгебре Ли. Как в Ф мю ν а б .
@Marek: Вы совершенно правы, я просто хотел сделать очевидной корреляцию с общей релятивистской кривизной. Ответ также не должен конкурировать с вашим или Эриком, это просто еще один подход к ознакомлению с термином ковариантная производная с другой точки зрения.
@Robert: Конечно, у меня нет проблем с вашим ответом. Наоборот, мне очень понравилось, и я поставил +1 (забыл сделать это раньше из-за редактирования и комментария :-)). Мне просто интересно, является ли это обозначение стандартным (различные школы/книги/люди используют всевозможные необычные обозначения), потому что я не видел его раньше.
@Marek: Спасибо :) Лагранжева механика для меня самая красивая теория из всех. Я всегда стараюсь понять идею новых вещей с ее точки зрения.
Ваш пример так же хорошо продуман, как и гамильтонова механика, и является частью общей (и простой!) истории. На кокасательном расслоении риманова многообразия (что эквивалентно касательном расслоении — они одинаковы, когда у вас есть метрика) вы можете взять гамильтониан как энергию или квадрат длины/2 вектора скорости, как ты сделал. Тогда гамильтонов поток равен геодезическому потоку. Это то, что вы продемонстрировали на своем примере.

Лучшая книга, которую я видел на эту тему, написана Крисом Ишамом под названием « Современная дифференциальная геометрия для физиков » . Это тяжело, потому что он делает все строго, но это того стоит в конце для концептуального прояснения.

В основном есть две концепции, которыми нужно овладеть: главные расслоения и векторные расслоения. Понятие связи может быть определено в обоих независимо, и полезно знать, как переводить между ними.

Основное расслоение имеет структурную группу, обычно известную в физике как калибровочная группа, и основная конструкция, которая дает вам векторное расслоение из нее, называется ассоциированным расслоением, которое получается путем предоставления представления структуры/калибровочной группы.

1) Обозначения тяжелые, потому что есть масса деталей, за которые нужно держаться. Каждый шаг прямолинеен, но это его огромное количество.

2) Соединение на главном пучке Е является расщеплением его касательного расслоения Т Е в вертикальный пучок В Е и горизонтальный пучок ЧАС Е то есть эквивариантно , это означает, что оно совместимо с действием структурной группы на слоях. 1-форма связности возникает из наблюдения, что мы можем отождествить слои вертикального расслоения с касательным расслоением группы грамм в начале е , то есть получаем Т е грамм , а это в точности алгебра Ли группы.

3) Нельзя напрямую использовать 1-форму связи так, как вы указали. Вместо этого ковариантная производная строится из 1-формы связи, которая сама по себе не является 1-формой.

Стоит отметить, что главные и векторные расслоения и связности на них являются глобальными конструкциями, тогда как конструкции, которые обычно встречаются в физике, обычно локальны. Чтобы получить локальную картину, обычно берут часть пучка, а затем вытягивают геометрическую структуру.

Это был момент, который меня смутил. Например, 1-форма математической связи глобальна, а 1-форма физической связи локальна и они разные .