Человеческий мозг представляет собой систему обработки сигналов. Входные потоки содержат смешанные сенсорные, двигательные, вознаграждение и, возможно, другие сигналы. Интересно, нейротрансмиттеры, связанные с вознаграждением, увеличивают или уменьшают запоминание этих потоков? Это приведет к тенденции запоминать потоки, совпадающие с высокой наградой, а не совпадающие с низкой наградой. Таким образом, аттракторы будут довольствоваться лучшими потоками, а мы будем выполнять действия, оптимизирующие вознаграждение.
Эффект передачи сигналов дофамина является одной из областей, в которых вычислительная нейробиология дала представление о механизмах мозга, в частности, с помощью моделей обучения с подкреплением (RL).
Основываясь на этой статье и докторской диссертации Дэна Расмуссена, это началось с публикации Шульца , показывающей, что дофамин действует как сигнализатор вознаграждения. Из аннотации:
Дофаминовые нейроны активируются вознаграждением за события, которые лучше, чем предсказано, остаются неподверженными влиянию событий, которые так же хороши, как предсказано, и угнетаются событиями, которые хуже, чем предсказано. Сигнализируя о вознаграждении в соответствии с ошибкой предсказания, дофаминовые реакции имеют формальные характеристики обучающего сигнала, постулируемого теориями обучения с подкреплением.
Чтобы ответить на ваш вопрос напрямую, кажется, что скорость/пластичность обучения модулируется дофаминовыми нейронами.
Немного контекста
В мозгу млекопитающих основным нейротрансмиттером, связанным с вознаграждением, является дофамин. Эта молекула вырабатывается в вентральной области покрышки (VTA) и в черной субстанции (SN).
В очень известном исследовании Шульц зафиксировал нейроны в этих двух областях (в то время мы не видели между ними разницы) и понял, что активность этих нейронов связана с вознаграждением. Точнее, нейроны кодировали ошибку предсказания вознаграждения, функцию, реализованную в моделях обучения с подкреплением.
Недавно некоторые исследователи решили обратиться к вашему вопросу. Для этого они использовали оптогенетику — метод, позволяющий модулировать активность нейронов с помощью света.
Вы можете прочитать статью здесь: McNamara et al. Нац. Неврологи. (2014)
Каковы основные результаты?
Мыши с повышенной активностью дофаминовых нейронов лучше справлялись с пространственной задачей. Они лучше изучали новый лабиринт. Вдобавок ко всему, повышенная активность нейронов VTA индуцировала большее количество специфических колебаний (называемых острой волновой рябью) в гиппокампе, структуре, важной для пространственного обучения. У нас появляются убедительные доказательства того, что эти колебания важны для памяти, поскольку их нарушение ухудшает память (см. Jadhav et al. Science (2012) и Girardeau et al. Nat. Neuosci. (2009) , если вам интересна эта тема) .
Обратите внимание, что это исследование было проведено на мышах. Вероятно, это документы, связывающие активность VTA и обучение с использованием FMRi на людях, но я недостаточно знаком с литературой.
Шонни123
Данияр