Могут ли искусственные нейронные сети быть эффективными теориями?

Question

Могут ли искусственные нейронные сети быть эффективными теориями?

модели
Физика
компьютер
Математика
приближения
вычислительная физика

Гален

Википедия описывает « эффективные теории » следующим образом.

В науке эффективная теория — это научная теория, которая предлагает описать определенный набор наблюдений, но в явном виде без заявления или намека на то, что механизм, используемый в теории, имеет прямое соответствие в действительных причинах наблюдаемых явлений, к которым относится теория. установлен. Это означает, что теория предлагает моделировать определенный эффект, не предлагая адекватного моделирования какой-либо из причин, которые способствуют этому эффекту.

В то время как Википедия начинается с контекста «в науке», я видел, что этот язык используется только в физике, поэтому я спрашиваю здесь, на Physics.SE.

Такие теоремы, как теорема об универсальной аппроксимации функций, показывают, что определенные классы искусственных нейронных сетей могут аппроксимировать измеримые по Лебегу функции с произвольной точностью (вплоть до нулевой меры) при достаточной ширине и глубине слоев сети. Это побудило меня рассказать людям анекдот, что «нейронные сети никогда не будут теорией всего, но они уже являются теорией «чего угодно»».

Связывая понятие эффективных теорий с нейронными сетями, действительно ли нейронные сети считаются эффективными теориями? Или тут есть нюанс, в котором они не квалифицируются?

Предположительно можно было бы задать аналогичный вопрос о полиномах в контексте теоремы Стоуна-Вейерштрасса , но я подозреваю, что ответ будет аналогичным по характеру.

Ответы (1)

Могут ли искусственные нейронные сети быть эффективными теориями?

Хиральная аномалия · Answer 1

Я не думаю, что это меняет суть вопроса, который вы задаете, но я начну с уточнения, потому что я думаю, что определение Википедии неясно (я не знаю, что означает «фактические причины»). То, как большинство физиков используют термин «эффективная теория», не относится к какой-то одной теории. Это связь между двумя разными теориями, одна из которых может быть неизвестна. Одна теория может быть «эффективной теорией» другой теории (возможно, неизвестной), воспроизводя некоторые из предсказаний этой другой теории с использованием менее подробных постулатов.

С этим уточнением ответ довольно очевиден: да: нейтральная сеть действительно может быть создана для воспроизведения многих предсказаний какой-либо другой теории, скажем, КЭД, поэтому нейронная сеть действительно может быть «эффективной теорией». Большинство физиков не удовлетворило бы такую теорию, даже как «эффективную теорию», потому что она не очень эффективна: каждый параметр, характеризующий каждый нейрон, не говоря уже о топологии сети, по сути является отдельным постулатом. Это множество постулатов . Но помимо эстетических критериев ответ положительный: нейронная сеть может быть (очень неэффективной) эффективной теорией.

На самом деле, может быть, я несправедлив, предполагая, что это будет неэффективно. Предположим, мы обучили нейронную сеть воспроизводить миллионы различных экспериментальных результатов. Чтобы обучение прошло успешно, архитектура нейронной сети, с которой мы начали, должна быть достаточно выразительной. Если нам посчастливится выбрать архитектуру, которая едва ли достаточно выразительна, тогда у нас действительно будет эффективная теория, независимо от того, называем мы ее «эффективной» или нет. На практике, однако, выбрать архитектуру, которая едва ли достаточно выразительна, кажется так же сложно, как и придумать эффективную теорию традиционным способом — путем урезания проблемы на протяжении многих десятилетий, по одной публикации за раз.

Могут ли искусственные нейронные сети быть эффективными теориями?

Гален

Ответы (1)

Хиральная аномалия

Как узнать, ошибка в законе или в неопределенности измерения?

Проблема приближения [дубликат]

Определение элементарной частицы [дубликат]

Понимание этой цитаты Фейнмана

Что такое точечные объекты?

Способны ли квантовые компьютеры моделировать любой физический процесс, который может моделировать классический компьютер?

Откуда частица знает, как себя вести? [дубликат]

Получение коэффициента прохождения луча по линейному потенциалу

Почему GW-DFT дает большую ширину запрещенной зоны в полупроводниках

Математическое приближение к физике