Модулируется ли объем обучения передатчиками вознаграждения?

Человеческий мозг представляет собой систему обработки сигналов. Входные потоки содержат смешанные сенсорные, двигательные, вознаграждение и, возможно, другие сигналы. Интересно, нейротрансмиттеры, связанные с вознаграждением, увеличивают или уменьшают запоминание этих потоков? Это приведет к тенденции запоминать потоки, совпадающие с высокой наградой, а не совпадающие с низкой наградой. Таким образом, аттракторы будут довольствоваться лучшими потоками, а мы будем выполнять действия, оптимизирующие вознаграждение.

Итак, вы ищете модели, которые используют нейротрансмиттеры, связанные с вознаграждением (такие как дофамин), для стимулирования обучения?
@ Seanny123 Это тоже было бы интересно. Мой вопрос заключается в том, существуют ли биологические доказательства более быстрого обучения или повышенной пластичности, например, при выбросе дофамина.

Ответы (2)

Эффект передачи сигналов дофамина является одной из областей, в которых вычислительная нейробиология дала представление о механизмах мозга, в частности, с помощью моделей обучения с подкреплением (RL).

Основываясь на этой статье и докторской диссертации Дэна Расмуссена, это началось с публикации Шульца , показывающей, что дофамин действует как сигнализатор вознаграждения. Из аннотации:

Дофаминовые нейроны активируются вознаграждением за события, которые лучше, чем предсказано, остаются неподверженными влиянию событий, которые так же хороши, как предсказано, и угнетаются событиями, которые хуже, чем предсказано. Сигнализируя о вознаграждении в соответствии с ошибкой предсказания, дофаминовые реакции имеют формальные характеристики обучающего сигнала, постулируемого теориями обучения с подкреплением.

Чтобы ответить на ваш вопрос напрямую, кажется, что скорость/пластичность обучения модулируется дофаминовыми нейронами.

Но также см. Friston et al., 2012, где представлена ​​более общая теория функции дофамина.
Спасибо за ваш ответ и извините за поздний ответ. Вы заключаете свое последнее предложение из цитаты выше? Я понимаю, что дофамин связан с вознаграждением. Но это не имеет прямого отношения к тому, означает ли высокий уровень дофамина много обучения, а низкий уровень дофамина (или отрицательное вознаграждение) означает меньше обучения, не так ли?
@danijar ты прав. Я случайно перепрыгнул уровень во время индукции. Я постараюсь это исправить.

Немного контекста

В мозгу млекопитающих основным нейротрансмиттером, связанным с вознаграждением, является дофамин. Эта молекула вырабатывается в вентральной области покрышки (VTA) и в черной субстанции (SN).

В очень известном исследовании Шульц зафиксировал нейроны в этих двух областях (в то время мы не видели между ними разницы) и понял, что активность этих нейронов связана с вознаграждением. Точнее, нейроны кодировали ошибку предсказания вознаграждения, функцию, реализованную в моделях обучения с подкреплением.

Недавно некоторые исследователи решили обратиться к вашему вопросу. Для этого они использовали оптогенетику — метод, позволяющий модулировать активность нейронов с помощью света.

Вы можете прочитать статью здесь: McNamara et al. Нац. Неврологи. (2014)

Каковы основные результаты?

Мыши с повышенной активностью дофаминовых нейронов лучше справлялись с пространственной задачей. Они лучше изучали новый лабиринт. Вдобавок ко всему, повышенная активность нейронов VTA индуцировала большее количество специфических колебаний (называемых острой волновой рябью) в гиппокампе, структуре, важной для пространственного обучения. У нас появляются убедительные доказательства того, что эти колебания важны для памяти, поскольку их нарушение ухудшает память (см. Jadhav et al. Science (2012) и Girardeau et al. Nat. Neuosci. (2009) , если вам интересна эта тема) .

Обратите внимание, что это исследование было проведено на мышах. Вероятно, это документы, связывающие активность VTA и обучение с использованием FMRi на людях, но я недостаточно знаком с литературой.

Большое спасибо! Вы случайно не знаете, есть ли исследования того, увеличивает ли домапин пластичность на уровне синапсов? То есть синапс с большей вероятностью будет расти/укрепляться при более высокой концентрации дофамина?
@danijar Добро пожаловать! Действительно, есть доказательства того, что дофамин изменяет силу синапсов. Точнее, дофамин изменяет долговременное потенцирование, один из основных известных механизмов изменения силы синапсов (один пример, который я только что нашел: S. Li et al. Nat. Neurosci. (2003) . Это действительно хороший вопрос, и я отредактируйте мой ответ, когда у меня будет время.