Понимание теоремы Гиббса HHH: откуда взялся «размытый» аргумент Джейнса?

Согласно этой статье в Википедии , ЧАС -теорема была попыткой Больцмана продемонстрировать необратимый рост энтропии в замкнутой системе, исходя из обратимой микроскопической механики. Однако против его первоначального подхода, по-видимому, был выдвинут ряд возражений (см. раздел «Критика ЧАС -теорема"), так что споры, вероятно, продолжаются и сегодня. В статье также описывается попытка Гиббса достичь той же цели (см. ЧАС -теорема"). В этот момент обсуждение переходит к современной версии теоремы, включая довольно странный "размытый" аргумент, который я не уверен правильно понять (и который, кажется, не является полностью убедительным, по крайней мере, из того, что можно прочитать в этой статье).Я цитирую (и я предполагаю, что это описание аргумента не очень строго):

Таким образом, критическая точка теоремы такова: если тонкая структура в взволнованном ансамбле по какой-либо причине очень слабо размыта, то энтропия Гиббса возрастает, и ансамбль становится равновесным ансамблем. Что касается того, почему это размытие должно происходить в действительности, существует множество предполагаемых механизмов. Например, один из предлагаемых механизмов заключается в том, что фазовое пространство по какой-то причине является крупнозернистым (аналогично пикселизации при моделировании фазового пространства, показанном на рисунке). [...] Эдвин Томпсон Джейнс утверждал, что размытие носит субъективный характер и просто соответствует потере знаний о состоянии системы. В любом случае, как бы это ни происходило, увеличение энтропии Гиббса необратимо, если размытие не может быть обращено вспять.

Меня больше всего беспокоит: происходит ли это размытие/потеря знаний из-за какого-либо известного физического закона/принципа? Например, должны ли мы связать квантование фазового пространства с Δ Икс Δ п 2 , или какой-то эффект наблюдателя? Я не думаю, что причина в этом, так как этот принцип должен соблюдаться только в контексте квантовой механики, но я не знаю ни одного подобного (полу)классического механизма, который можно было бы рассмотреть.

В более общем плане нужна ли квантовая механика (как следует из этого ответа на родственный вопрос) для полного объяснения того, как необратимая динамика, наблюдаемая в природе в макроскопическом масштабе, возникает из обратимых законов?

Ответы (2)

Меня больше всего беспокоит: происходит ли это размытие/потеря знаний из-за какого-либо известного физического закона/принципа? Например, должны ли мы связать квантование фазового пространства с ΔxΔp≥ℏ2ΔxΔp≥ℏ2 или с каким-то эффектом наблюдателя?

Описание в статье Википедии дезинформировано и вводит в заблуждение. Размытие или крупнозернистость — это всего лишь один из возможных формальных механизмов получения изображения. ЧАС уменьшение времени в (больцмановской) ЧАС -теорема.

Эта процедура вводит искусственную шкалу, ниже которой детали отбрасываются, и поэтому она имеет мало общего с механикой, где ничего не отбрасывается, или со 2-м законом термодинамики, где нас вообще не интересуют такие детали (мы используем только макроскопические переменные состояния).

Также ЧАС (функция вероятностей и, следовательно, времени) никак не связана с термодинамической энтропией (функция макроскопических переменных состояния).

На самом деле нет никакой размытости функции вероятности, необходимой для объяснения 2-го закона. Джейнс показал, как вывести энтропийную формулировку 2-го закона для термически изолированной системы без какого-либо размытия, только используя гамильтонову механику, принцип максимальной информационной энтропии и предположение о повторяемости результатов макроскопических экспериментов.

Пусть система эволюционирует из термодинамически равновесного состояния А к термодинамически равновесному состоянию Б . Весь процесс опишем также с помощью плотности вероятности р ( т ) , начиная со времени т А с начальной функцией р ( т А ) и заканчивается во время т Б . Начальная плотность р ( т А ) может быть чем угодно, если оно соблюдает ограничения макросостояния А . Последующие плотности р ( т ) для т т А , однако полностью определяются гамильтонианом и начальным условием; мы не свободны выбирать их.

Согласно теореме Лиувилля информационная энтропия (часто называемая энтропией Гиббса)

я [ р ] "=" р п р д д д п

остается постоянной во времени, нет размытия р любого рода . (1)

Будет показано, что термодинамическая энтропия в конечном состоянии равновесия С Б больше или равно начальной термодинамической энтропии С А .

Такой результат возможен потому, что термодинамическая энтропия макросостояния, вообще говоря, не просто пропорциональна информационной энтропии зависящего от времени распределения вероятности р ( т ) . Его отношение к понятию информационной энтропии таково:

Значение термодинамической энтропии макросостояния Икс определяется значением информационной энтропии для этого распределения вероятностей р Икс , что согласуется с макросостоянием Икс и придает максимально возможное значение информационной энтропии. (2)

Теперь, очевидно р ( т Б ) согласуется с макросостоянием Б но я [ р ( т Б ) ] не обязательно является максимально возможным значением я для всех р совместим с макросостоянием Б .

Плотность вероятности, которая не только согласуется с макросостоянием Б но и максимизирует информационную энтропию, в общем случае отличается от р ( т Б ) . Обозначим эту максимизирующую плотность как р Б ; тогда отношение двух информационных энтропий равно

я [ р Б ] я [ р ( т Б ) ] .

Теперь, основываясь на (2), мы можем записать это как

С Б я [ р ( т Б ) ] ,
то есть термодинамическая энтропия в конечном равновесном состоянии выше или равна информационной энтропии эволюционного распределения вероятностей.

На основании (1) мы можем записать это также как

С Б я [ р ( т А ) ] .

Это означает, что при любой плотности р ( т А ) выбирается для описания макросостояния А , термодинамическая энтропия конечного состояния Б равна или превышает информационную энтропию р ( т А ) . Итак, если плотность р А выбирается таким образом, чтобы максимизировать я при ограничениях начального макросостояния А , я достигает значения термодинамической энтропии С А и получаем неравенство

С Б С А .

Это означает, что мы вывели энтропийную формулировку 2-го закона термодинамики из принципа максимальной информационной энтропии, используя постоянство энтропии Гиббса в качестве одного из ингредиентов.

В более общем плане нужна ли квантовая механика (как следует из этого ответа на родственный вопрос) для полного объяснения того, как необратимая динамика, наблюдаемая в природе в макроскопическом масштабе, возникает из обратимых законов?

Если бы мы хотели полностью объяснить процесс вплоть до элементарных частиц, то понадобилась бы теория этих частиц, такая как квантовая теория. Но если цель состоит в том, чтобы просто показать, что необратимая эволюция макроскопических переменных согласуется с обратимой эволюцией микроскопических переменных, то ответ будет отрицательным.

Насколько я понимаю, принцип максимальной информационной энтропии является полезной отправной точкой для прогнозирования системы, о которой вы очень мало знаете (которую впоследствии можно сравнить с экспериментами по итеративному уточнению модели). Слишком большое упование на точки зрения максимальной неопределенности затрудняет оценку важности динамики в статистической механике и невозможность некоторых систем с большим количеством сохраняющихся величин (например, солитонов) уравновесить распределение, связанное с каноническим ансамблем. Мне было бы интересно услышать ваши мысли.
Конечно, нет никакой гарантии, что принцип maxent всегда хорошо работает. Но с точки зрения, которую я изложил выше, распределение вероятностей не эволюционирует (уравновешивается) к каноническому, оно управляется уравнениями движения. Каноническое распределение лучше всего использовать, когда все, что мы знаем, это макроскопические ограничения.
Интересный ответ, который разрешил некоторые из моих недоразумений, спасибо! Просто чтобы прояснить, является ли Больцман ЧАС тогда то же самое, что и информационная энтропия?
@DavidHerreroMartí, пожалуйста. Больцман ЧАС Функция изначально определяется как функция плотности вероятности, заданной на 6-мерном пространстве состояний одиночной молекулы (независимые измерения обусловлены 3 координатами и 3 компонентами скорости молекулы). Информационная энтропия в целом гораздо более общая, она относится к любому распределению вероятностей в любом пространстве. В приведенном выше объяснении информационная энтропия называется так называемой «энтропией Гиббса» и относится к распределению вероятностей. р определяется на фазовом пространстве всей системы. Так что это очень разные вещи.
Я согласен с тем, что вывод Джейнсом второго закона довольно элегантен и не требует каких-либо специальных предположений о микроскопической динамике. Однако это, похоже, приводит к парадоксу Лошмидта, как и многие другие выводы: Ян, хотя вы прямо заявили, что t_B следует за t_A, мы можем изменить это и сказать, что t_B предшествует t_A, и все в вашей аргументации остается в силе. Динамически мы начинаем с конечного состояния, которое однозначно развивается от t_A до t_B. С теми же аргументами, что и выше, мы получаем, что термодинамическая энтропия в прошлом равна или выше, чем в настоящем.
@Martin_S, это справедливо. Однако вывод Джейнса предполагает, что «система развивается от состояния термодинамического равновесия A к состоянию термодинамического равновесия B последовательно во многих экспериментах». Итак, теорема на самом деле такова: если В последовательно эволюционирует из А в экспериментах, то С Б С А . Сам факт, что А следует Б а не каким-то другим крайне маловероятным состоянием с более низкой энтропией, которое нельзя вывести. Возможность такой невероятной эволюции существует.

Используемый физический принцип — это конечное разрешение любого эксперимента, независимое от значения , вместе со связью между наблюдаемыми и микроскопическими степенями свободы, т. е. применимо как к классическим, так и к квантовым системам. Технически сохранение энергии и теорема Лиувилля или унитарность в КМ также необходимы для предотвращения коллапса различных траекторий в какой-то аттрактор. Классически результат следует из чувствительности к начальным условиям и того факта, что большинство систем имеют относительно небольшое количество глобально сохраняющихся величин (важное исключение см. в проблеме Ферми Паста Улама ). Отсечка Δ Икс Δ п / 2 вполне естественно из-за нашего дополнительного эмпирического знания о том, что разрешение любогоклассическое описание не работает в этом масштабе. Если бы мы использовали обычную линейку для измерения положения, маятник для измерения времени и равновесное смещение неподвижной пружины для измерения сил, то наша разрешающая способность и предсказательная сила были бы ограничены точностью линейки и маятника. В квантовой механике конечное разрешение любого эксперимента подразумевает, что любое начальное измерение игнорирует степени свободы, связанные с малыми масштабами. Эти степени свободы обычно не оказывают существенного влияния на траектории на коротких временных масштабах, но в совокупности приводят к очевидной потере унитарности на больших временах. В ядерном магнитном резонансе вы можете с достаточной точностью предсказать состояние отдельного спина вскоре после подачи импульса, но со временем,

Как в классической, так и в квантовой динамике увеличение энтропии можно рассматривать как происходящее из-за неполных исходных данных: по мере того, как недостающая информация становится экспериментально доступной, это приводит к члену ошибки или ненулевой энтропии Шеннона/фон Неймана, связанной с наблюдаемой. часть системы.

Хотя есть кое-что, что меня все еще немного беспокоит: разница между термодинамической и информационной энтропией. Как субъективный эффект, зависящий от наблюдателя, может привести к чему-то столь же «объективному», как термодинамическая энтропия? Я что-то пропустил?
Термодинамическая энтропия в некоторой степени зависит от наблюдателя. Парадокс Гиббса обычно объясняется в отношении идентичных или неразличимых частиц, но он также применим к различимым частицам, которые остаются неразличимыми (очень подходящий термин, который я впервые увидел у Джеймса Сетны в его учебнике по статистике меха) либо потому, что эксперимент не может различить частиц, или потому, что даже если бы существовали видимые различия между частицами, было бы почти невозможно использовать различия в осмотическом давлении для извлечения работы.