Почему Байесовское когнитивное моделирование?

Недавно я прочитал статью о синтезе байесовских программ . В нем говорится, что байесовское когнитивное моделирование поможет системам ИИ учиться на нескольких примерах по сравнению с глубоким обучением. Но я не смог понять преимущества использования байесовского подхода по сравнению с другими формулировками в когнитивном моделировании. Я хотел бы понять, почему этот байесовский подход выделяется? Каковы недостатки современных подходов к когнитивному моделированию?

Ответы (1)

Вот быстрый ответ из общих базовых знаний, а не из каких-либо конкретных знаний о «синтезе байесовских программ (BPS)».

В общем, байесовские модели могут использовать сильно информированные априорные или рассеянные априорные предположения «может быть что угодно». Сильные априорные значения указывают, что многие значения параметров очень маловероятны, в то время как несколько других значений параметров являются возможными описаниями данных. При сильном априорном анализе требуется относительно мало данных для отсеивания возможностей (т. е. для более быстрого обучения). Слабые априорные вероятности допускают гораздо более широкий диапазон возможностей, но для их сужения требуется масса данных (т. е. более медленное обучение).

Многие байесовские модели разума используют сильные априорные предположения. Такие модели поставляются с предустановленной структурой или зависимостями параметров, которые настроены для типа проблемы, которую необходимо изучить. Это не "обман"; априорная является важной частью теории. Другой пример связан с компьютерным зрением: выяснить, какие объекты и освещение создают пикселизированное 2D-изображение, можно только при наличии глубоких предварительных знаний о типах объектов и типах освещения «где-то там» в мире, в противном случае это неразрешимая проблема. Вводная статья находится здесь или здесь (в частности, см. раздел «Предыдущие знания», начиная со стр. 17).

Глубокое обучение, однако, является (насколько я знаю) общим подходом, который может изучить практически любую возможную взаимосвязь между переменными. Цена этого слабого априора заключается в том, что для сужения распределения параметров требуется тонна обучения.