Когнитивные модели обучения использованию рабочей памяти

В последнее время в области глубокого обучения наблюдается всплеск изучения того, как использовать память как часть процесса оптимизации (например , LSTM и стеки ). Однако на самом деле это не аналогично тому, как когнитивные системы учатся использовать свою рабочую память.

Существуют ли модели того, как модули рабочей памяти (где сохраненное значение со временем уменьшается) можно научиться оптимально использовать? Либо через обучение с подкреплением, либо через обучение с учителем?

По памяти существует несколько простых когнитивных моделей, которые могут предсказать оптимальные модели поиска в памяти. Однако я не знаю, действительно ли это то, что вам нужно.
@MichaelAnderson Я больше после того, как узнал, как использовать модули памяти, которые могут нуждаться или не нуждаться в поиске

Ответы (2)

ACT-R — это полная когнитивная модель, включающая в себя рабочую память, декларативную память и процедурную память, а также входные (визуальные и слуховые) и выходные (ручные) буферы. Это действительно интересная модель о человеке в целом, но она находится на высоком уровне абстракции.

Статья о памяти, которую вы хотите, называется « ОТРАЖЕНИЯ ОКРУЖАЮЩЕЙ СРЕДЫ В ПАМЯТИ » Скулера и Андерсона. Он описывает, как и почему память похожа на обучение с подкреплением. В этой статье вы можете прочитать, как память используется для обучения. Насчет того, чтобы научиться использовать рабочую память, я точно не знаю, что вы имеете в виду, но я думаю, что эти статьи дадут вам хороший старт.

Если вы хотите узнать больше об ACT-R, я бы порекомендовал эту книгу или просто прочитайте множество статей, которые они опубликовали за эти годы. У них есть отличные примеры, которые объясняют, среди прочего , многозадачность и восприятие времени .

Я смог найти только один пример обучения использованию памяти. «Происхождение эпистемических структур и прото-представлений» Чандрасекхарана и Стюарта показывает, как включить опцию сохранения текущего состояния (путем обучения нейронной сети выводить «1» при вводе текущего состояния) и вводить эту память в состояние представление задачи обучения с подкреплением. В статье этот метод позволяет агенту переключаться между поиском пищи и возвращением домой.

К сожалению, проверка ссылок на эту статью ведет в тупик, поэтому дальнейшие ссылки будут весьма признательны.