Почему свободные параметры плохи для теории?

Часто говорят, что одним из недостатков стандартной модели является то, что она имеет много свободных параметров. Мой вопрос двоякий:

  1. Что такое свободный параметр? Насколько я понимаю, свободные параметры модели/теории — это те параметры, которые не могут быть предсказаны теорией и должны быть измерены и введены в теорию, так сказать, «вручную». Являются ли тогда все константы природы свободными параметрами? Кроме того, можете ли вы привести пример несвободного параметра в теории?

  2. Почему для теории плохо иметь свободные параметры? Не может ли быть так, что некоторые величины в природе, такие как масса электрона, просто «случайно» имеют определенное значение, которое не может быть предсказано теорией?

Цитируя Ферми: «Дайте мне 3 параметра, и я смогу подогнать слона. Дайте мне 4-й, и я смогу заставить слона шевелить хвостом».
Я думаю, что эта цитата приписывается Джону фон Нейману :)
@Floyd: Нет, фон Нейман запросил еще один параметр: как подогнать слона . "="
«Оказывается, вы можете буквально подогнать слона к четырем параметрам, если разрешите параметрам быть комплексными числами». Ахаха прикольно.
Подумайте о GPS, вам не нужна теория относительности, чтобы заставить его работать, без него они могли бы просто эмпирически скорректировать время (аналогично придумыванию параметра). Но без теории ученые были бы немного озадачены, зачем нужны корректировки.
@eps GPS без теории относительности был бы невозможен сразу после его появления. Ньютоновская физика оценила дрейф примерно в 1000 футов в час. Это потребует почти постоянных обновлений вместо 2 в день, которые они получают в настоящее время.
Слоныогромные и сложные молекулярные машины. Замечание Джона фон Неймана о том, что он может подогнать слона по трем параметрам, больше говорит о его невежестве в отношении слонов, чем о чем-либо другом. ;)

Ответы (7)

Параметр — это число, которое не «выходит» из теории, а должно быть введено в теорию вручную. Хорошим примером является масса электрона — никто (в настоящее время) не может вычислить массу электрона, это просто то, что мы измеряем.

Не существует абсолютных правил в отношении таких вещей, как «сколько параметров — это слишком много параметров», хотя, конечно, многие люди придерживаются разных мнений. С точки зрения фундаментальной физики обычно прогресс достигается за счет синтеза или объединения , то есть развития более глубокой теории, которая одновременно объясняет два явления, которые вы изначально считали разными. Обычно синтез двух внешне разных физических теорий приводит к пониманию того, что то, что изначально было свободным параметром в одной из теорий, на самом деле может быть вычислено в единой теории.

Есть несколько очень известных примеров этого в студенческой физике. Вот несколько примеров (по общему признанию, последний на самом деле не пример уровня бакалавриата)

  1. Ускорение свободного падения на поверхности Земли , г , можно рассчитать по массе М и радиус р Земли и гравитационная постоянная Ньютона, г "=" г М р 2 . Во времена Галилея не было известно, что гравитация на Земле связана с астрономическими величинами, такими как масса и радиус Земли, но Ньютон показал, что гравитация — это одна из сил, лежащих в основе падения яблок с деревьев и лун, вращающихся вокруг планет.

  2. Скорость света с можно рассчитать из констант связи электрического и магнитного полей, которые в единицах СИ равны ϵ 0 и мю 0 . В единицах СИ имеем с 2 "=" ( мю 0 ϵ 0 ) 1 . Это следует из осознания Максвеллом того, что свет, электричество и магнетизм — три явно разных предмета — на самом деле представляют собой одну единую теорию электромагнетизма.

  3. Газовая постоянная р связано с числом Авогадро Н А и постоянная Больцмана к , р "=" к Н А . Осознание атомного строения вещества объяснило многие явления в термодинамике, сведя их к статистическому движению отдельных атомов.

  4. Пиковая длина волны света, излучаемого черным телом при температуре Т , как было известно в 1800-х годах, определяется законом смещения Вина , λ п е а к "=" б / Т . Постоянная б известна как постоянная смещения Вина. С развитием квантовой механики и распределения Планка было показано, что б "=" час с / Икс к , где час постоянная Планка, с это скорость света, к - постоянная Больцмана, а Икс является вычислимым фактором первого порядка, который выпадает из какой-то надоедливой алгебры ( Икс "=" 4,965... решает ( Икс 5 ) е Икс + 5 "=" 0 ).

  5. Хотя это не так «основно», как другие, объединение электрических и слабых взаимодействий показало, что постоянная Ферми г Ф контролирующее время жизни мюона, тесно связано со средним значением вакуума Хиггса. в , с помощью в "=" ( 2 г Ф ) 1 / 2 (и, следовательно, также к массе и связи W-бозона).

Обратите внимание, что эти примеры унификации, ведущие к более глубокому пониманию входного параметра, коррелируют с основными достижениями в физике — гравитацией, электромагнетизмом, статистической механикой, квантовой механикой и электрослабой теорией.

В теоретической физике существует мнение, что Стандартная модель не является фундаментальной теорией (на самом деле мы знаем, что этого не может быть, потому что она не содержит гравитации и темной материи). Экстраполируя логику унификации, которая всегда ассоциировалась с прогрессом в физике, можно надеяться, что по крайней мере некоторые из чисел, которые в настоящее время являются входными параметрами Стандартной модели, на самом деле будут показаны как вычисляемые результаты с использованием более глубокой теории.

@Galen Это видео сводит меня с ума! Скорость света не является условностью — свет движется с конечной, измеримой скоростью. В этом видео несоизмеримо малая техническая подробность о том, как вы синхронизируете часы в специальной теории относительности. Существует свободный выбор того, как вы соглашаетесь синхронизировать часы, но от этого выбора не зависят никакие физические результаты, и есть один очевидный выбор, который делает математику намного проще , а физику намного яснее — никто в моей профессиональной жизни физиком никогда не делал этого. даже подумывал сделать другой выбор.
Аналогия, которую я видел на этом сайте, заключается в измерении продолжительности полета на самолете из Великобритании в США путем вычитания времени прибытия в часовом поясе США из времени отправления в часовом поясе Великобритании. Если вы сделаете это, вы можете получить ноль за время полета на самолете и сделать вывод, что самолет мгновенно перелетел из Великобритании в США. Но это только потому, что вы использовали сумасшедшую условность. Если вы используете фактическое время, измеренное кем-то в самолете, как способ измерения продолжительности, вы всегда получите положительный ответ. «Спор» о скорости света в одном направлении имеет такое же содержание, как и этот пример.
Мне трудно разобрать ваши комментарии. Похоже, вы говорите, что есть свободный выбор, и что математически удобный выбор всегда используется физиками. Это точное изложение ваших пунктов?
@Galen Трудно обобщить это в чате, но на этом сайте много вопросов по этой теме. Вы должны решить, как синхронизировать часы между наблюдателями в специальной теории относительности. Это соглашение, и разумное соглашение состоит в том, чтобы предположить, что свет движется с одинаковой скоростью на пути от наблюдателя А к наблюдателю В, как и от наблюдателя В к наблюдателю А, для всех пар А и В. Если вы решите использовать другое соглашение, нет наблюдаемых последствий, которые отличаются. Но теперь вы встроили, что свет каким-то образом движется с разной скоростью по разным путям...
...и в разные стороны. Ваше соглашение ввело специальные пути, на которых вы предполагаете, что свет движется быстрее в одну сторону, чем в другую. Набор путей и «скоростей в одном направлении» не может быть оправдан никаким наблюдением или физическим принципом и не имеет наблюдаемых последствий. Поскольку, в конечном счете, проблема заключалась в синхронизации ваших часов, это, по сути, то же самое, что и определение скорости как Δ Икс / Δ Т , где Δ Т разница между двумя значениями времени, измеренными на несинхронизированных часах; ты определяешь Δ Т как разница времени, измеренного в разных часовых поясах.
Мое очень твердое мнение состоит в том, что это полный отвлекающий маневр (математический, физический, философский), и это действительно позор, что это видео заставило людей тратить так много времени на размышления об этом. Стоит разобраться в этом вопросе, но лично я очень сильно чувствую, что очень легко потратить слишком много времени на это, не получив взамен никакого фактического физического понимания.
Хорошо. Спасибо, что поделились и разъяснили свою точку зрения.
@Galen, извините, что повторяю это, и я остановлюсь после этого сообщения. Хотя я согласен с тем, как вы резюмировали мои мысли, на самом деле я бы пошел еще дальше. Я думаю, что на самом деле это глубокое непонимание физики — использовать вещь «односторонняя скорость света», чтобы утверждать, что свет не движется со скоростью света. Свободный выбор, который у вас есть, на самом деле не является свободным выбором скорости , это свободный выбор того, как вы сравниваете измерения часов в разных местах.
Дело в том, что вы всегда можете синхронизировать свои часы так, чтобы скорость света была одинаковой. Единственный физически разумный смысл предложения «скорость света различна в разных направлениях» состоит в том, что невозможно выбрать условия измерения, при которых скорость света одинакова. Другими словами, разные физики с разными соглашениями согласятся с инвариантным утверждением, что скорость света меняется. Это явно не так в специальной теории относительности.
@Эндрю: Возможно, в этом контексте упоминание о бритве Оккама было бы разумным, поскольку оно дает нам четкий критерий, чтобы решить, какое из этих предположений является «правильным», используя «правильный» не в смысле «правильный или неправильный » , а в смысле "правильный инструмент для работы". Ясно, что предположение о том, что свет распространяется с одинаковой скоростью во всех направлениях, имеет меньшее количество «сущностей» (в смысле «бритвы Оккама» entia non sunt multiplicanda praeter necessitatem ) и, таким образом, является «правильным» предположением, и это не просто мнение, а объективно измеримый факт.
@JörgWMittag Это, безусловно, один из способов обозначить проблему. Я согласен с вами, но я также считаю, что обращение к бритве Оккама в этой ситуации излишне и, возможно, создает впечатление, что есть место для разумного научного разногласия. Для меня дело не в том, что односторонняя скорость света вводит правдоподобный, но эмпирически более сложный, чем необходимо, набор моделей. Скорее, это запутанный подход, ведущий к бесполезно запутанному формализму. Это все равно, что намеренно замазать объектив телескопа грязью и опубликовать изображения с примечанием для читателя, чтобы он вычел пылинки.
Что-то меня раздражает в этом ответе. Это не неправильно, но есть константы и есть константы. Десять свободных параметров поперечных сечений фундаментальных частиц не поместятся и в слоне. Четыре свободных параметра в уравнениях силы подходят этому слону.
@ Джошуа Я прочитал ваш комментарий, в котором говорилось, что мы должны быть впечатлены тем, что у Стандартной модели так мало параметров, учитывая огромное количество явлений, которые она описывает, а не жаловаться, что их слишком много. Если это справедливое резюме, я на самом деле в значительной степени согласен с вами (и я также ненавижу цитату о слоне). Но все же можно надеяться на лучшее. Я склонен пессимистично относиться к тому, что человечество сможет добиться большего успеха, чем СМ, в следующие 100 лет, но если выяснится, что кто-то выясняет какую-то взаимосвязь между муфтами Юкавы (например), я был бы в восторге.
  1. Да, свободный параметр — это параметр, который не фиксируется теорией и должен быть измерен в эксперименте. Примерами являются масса электрона или его заряд. Нет, не все константы природы являются свободными параметрами, в этих случаях мы можем найти выражения для представления величины рядом действительно свободных параметров. Примером может служить г фактор. Он очень точно предсказывается КТП исключительно в терминах свободных от СМ параметров.

  2. Вы должны понимать, что в основе каждой теории мы пытаемся связать некоторые измеренные величины с некоторым предсказанием. Например, мы хотим вычислить сечение для е е + мю мю + и мы делаем это, используя е , м е и м мю . Менее предсказательная теория, чем КЭД (например, классическая КМ), не смогла бы сделать это предсказание и должна была бы сделать сечение новым свободным параметром. Таким образом, чем более предсказательной и, следовательно, полезной является теория, тем больше свободных параметров связано с наблюдаемыми. Поэтому было бы здорово не иметь свободных параметров и иметь неограниченное количество наблюдаемых. Это была бы окончательная теория, но существует ли она — совсем другой вопрос (но я так не думаю).

Не могли бы вы подробнее рассказать о 2? Я понимаю, что чем больше свободных параметров имеет теория, тем менее предсказательной и, следовательно, менее полезной она становится. Но как вообще может быть теория без свободных параметров? Разве наблюдаемые, такие как поперечное сечение, не обязательно всегда зависят по крайней мере от некоторых свободных параметров? В принципе, если я правильно понимаю, все параметры «окончательной теории» будут определяться исключительно из теории, но я не понимаю, как можно определить значение параметра без каких-либо входных данных из экспериментальных данных.
@Floyd В планковских единицах все величины представляют собой безразмерные числа. Теория в принципе может дать математические формулы для всех соответствующих параметров и, следовательно, предсказать их значения в планковских единицах.
Я тоже не могу себе этого представить xD. Как я уже сказал, я не думаю, что мы можем найти или что существует такая теория. Но я мог представить, что в какой-то момент мы обнаружим, что, например, матрица CKM параметризована только одним или двумя параметрами. Но кто знает? Может быть, я наивен, и мы можем предсказать гораздо больше в будущем, или я мечтатель, и мы не можем больше сокращать число.
@Floyd Такой теорией были бы некоторые фундаментальные предположения, из которых вы однозначно получаете определенное уравнение и значения для определенных величин, из которых вы делаете дальнейшие предположения и уравнения, пока в конечном итоге не получите значение фундаментальных констант, таких как м е , с , час и так далее. Я тоже нахожу это маловероятным, но вполне правдоподобным. Например, вы могли бы предположить, что некоторые определенные x-мерные многообразия соответствуют чему-то, и использовать их топологические числа и математические константы, такие как π прийти к какой-то конкретной константе через какое-то волшебное топологическое уравнение.

Теория: Это правда, что свободные параметры плохи для теории. При определенном значении true.

Полезная теория не просто кодирует все существующие наблюдения. Предсказывает новые. При достаточном количестве свободных переменных теория не предсказывает. Это становится записью того, что мы видели, представленным в другом виде.

Трудно найти более глубокий смысл, если теория — это просто бесконечно искажаемое зеркало в комнате смеха, поднесенное к тому, что мы уже знаем.

Я думаю, что "свободный параметр" и "настраиваемый параметр" и "параметр" по сути синонимы. я бы назвал г фактор (упомянутый в предыдущем ответе) предсказание Стандартной модели, а не параметр. Это может быть свободный/регулируемый параметр другой модели.

Значения параметров могут быть случайными и бессмысленными, но мы не знаем, что они есть, а пока мы этого не знаем, есть мотивация продолжать искать объяснения. Если физик говорит, что свободные параметры — это плохо, значит, это плохо, в каком-то смысле, что мы еще не все знаем. Но в другом смысле это хорошо, потому что дает им занятие.

Настраиваемый параметр и свободный параметр не совпадают для математической (большинства наук) модели. Настраиваемый параметр не имеет отношения к экспериментальным данным - все, что нужно для прогнозов, тогда как свободный параметр исходит из данных.
@user2617804 user2617804 Язык носит описательный, а не предписывающий характер. Я согласен с тем, что философское различие, которое вы пытаетесь провести, полезно, но я не думаю, что большинство научно грамотных носителей английского языка сделали бы вывод о нем из фраз «настраиваемый параметр» и «свободный параметр», если ваши лингвистические соглашения не были изложены в тексте. рассматриваемый документ. Но мне было бы интересно увидеть какой-нибудь научный словарь, который заставил бы вас так думать, если таковой имеется.
Я думаю, что есть исторический контекст. Раньше мы, возможно, измеряли g . Затем мы лучше понимаем и обнаруживаем, что его можно предсказать по другим параметрам. Таким образом, он превращается из бесплатного параметра в прогноз. Но мы по-прежнему можем использовать его как параметр в формулах, которые его используют.

Теория/модель, по сути, является математической структурой, которая предсказывает данные, наблюдаемые в эксперименте, как функцию набора параметров. Некоторые параметры являются специфическими для эксперимента, другие считаются известными, а третьи, возможно, придется подбирать по результатам эксперимента (или для лучшего соответствия данным). Именно эти последние мы называем свободными параметрами .

Наличие большого количества параметров не обязательно плохо: вопрос заключается в переобучении (слишком большом количестве параметров и подгонке «шума») по сравнению с недостаточным (их слишком мало и отсутствует важная физика). Существуют стандартные статистические процедуры для проверки и сравнения моделей, как описано в этом ответе .

Короче говоря: предположим, что для явления существуют н величин, полностью его описывающих. Ваша модель взять а количество свободных параметров в качестве входных данных (их необходимо измерить и включить в теорию) и выходных данных б количество величин в качестве предсказаний таких, что

а + б "=" н .

В результате чем выше а есть, чем меньше б становится, следовательно, менее предсказательной становится теория.

Идеальная теория может прекрасно объяснить все наблюдаемые данные и вообще не может объяснить ничего, что не наблюдалось.

Например, теория

[Теория] : «все просто случается, за исключением случаев, когда этого не происходит»

может быть использован для объяснения любого экспериментального наблюдения (В: «Почему электрон двигался, когда я набирал напряжение?» А: «Просто происходит что-то, за исключением случаев, когда этого не происходит», В: «Почему...» А: « То же самое».) Но это плохая теория, потому что она могла бы с таким же успехом объяснить то, чего не было . (В: "Почему дракон материализовался, когда я набрал напряжение?" О: "то же самое", В: "... Но я пошутил про дракона!")

Свободные параметры — это проблема, потому что они всегда дают вам больше возможностей исказить теорию, чтобы она соответствовала вещам, независимо от того, наблюдались эти вещи или нет. Теория со слишком большим количеством таких параметров становится все ближе и ближе к теории «вещи просто случаются». Конечно, теория со слишком малым количеством параметров может оказаться неспособной объяснить какую-то реальную физику. При добавлении нового параметра в идеале следует взвесить, насколько теория выигрывает в своей способности объяснять реальное (которое мы хотим максимизировать) по сравнению с тем, насколько она способна объяснять вымышленное (которое мы хотим минимизировать).