Модулируется ли объем обучения передатчиками вознаграждения?

Question

Модулируется ли объем обучения передатчиками вознаграждения?

Работа
вознаграждение
неврология
нейротрансмиттеры
когнитивная нейробиология

Данияр

Человеческий мозг представляет собой систему обработки сигналов. Входные потоки содержат смешанные сенсорные, двигательные, вознаграждение и, возможно, другие сигналы. Интересно, нейротрансмиттеры, связанные с вознаграждением, увеличивают или уменьшают запоминание этих потоков? Это приведет к тенденции запоминать потоки, совпадающие с высокой наградой, а не совпадающие с низкой наградой. Таким образом, аттракторы будут довольствоваться лучшими потоками, а мы будем выполнять действия, оптимизирующие вознаграждение.

Шонни123

Итак, вы ищете модели, которые используют нейротрансмиттеры, связанные с вознаграждением (такие как дофамин), для стимулирования обучения?

Данияр

@ Seanny123 Это тоже было бы интересно. Мой вопрос заключается в том, существуют ли биологические доказательства более быстрого обучения или повышенной пластичности, например, при выбросе дофамина.

Ответы (2)

Модулируется ли объем обучения передатчиками вознаграждения?

Итак, вы ищете модели, которые используют нейротрансмиттеры, связанные с вознаграждением (такие как дофамин), для стимулирования обучения?
@ Seanny123 Это тоже было бы интересно. Мой вопрос заключается в том, существуют ли биологические доказательства более быстрого обучения или повышенной пластичности, например, при выбросе дофамина.

Шонни123 · Answer 1

Эффект передачи сигналов дофамина является одной из областей, в которых вычислительная нейробиология дала представление о механизмах мозга, в частности, с помощью моделей обучения с подкреплением (RL).

Основываясь на этой статье и докторской диссертации Дэна Расмуссена, это началось с публикации Шульца , показывающей, что дофамин действует как сигнализатор вознаграждения. Из аннотации:

Дофаминовые нейроны активируются вознаграждением за события, которые лучше, чем предсказано, остаются неподверженными влиянию событий, которые так же хороши, как предсказано, и угнетаются событиями, которые хуже, чем предсказано. Сигнализируя о вознаграждении в соответствии с ошибкой предсказания, дофаминовые реакции имеют формальные характеристики обучающего сигнала, постулируемого теориями обучения с подкреплением.

Чтобы ответить на ваш вопрос напрямую, кажется, что скорость/пластичность обучения модулируется дофаминовыми нейронами.

Но также см. Friston et al., 2012, где представлена более общая теория функции дофамина.
Спасибо за ваш ответ и извините за поздний ответ. Вы заключаете свое последнее предложение из цитаты выше? Я понимаю, что дофамин связан с вознаграждением. Но это не имеет прямого отношения к тому, означает ли высокий уровень дофамина много обучения, а низкий уровень дофамина (или отрицательное вознаграждение) означает меньше обучения, не так ли?
@danijar ты прав. Я случайно перепрыгнул уровень во время индукции. Я постараюсь это исправить.

Хорникар · Answer 2

Немного контекста

В мозгу млекопитающих основным нейротрансмиттером, связанным с вознаграждением, является дофамин. Эта молекула вырабатывается в вентральной области покрышки (VTA) и в черной субстанции (SN).

В очень известном исследовании Шульц зафиксировал нейроны в этих двух областях (в то время мы не видели между ними разницы) и понял, что активность этих нейронов связана с вознаграждением. Точнее, нейроны кодировали ошибку предсказания вознаграждения, функцию, реализованную в моделях обучения с подкреплением.

Недавно некоторые исследователи решили обратиться к вашему вопросу. Для этого они использовали оптогенетику — метод, позволяющий модулировать активность нейронов с помощью света.

Вы можете прочитать статью здесь: McNamara et al. Нац. Неврологи. (2014)

Каковы основные результаты?

Мыши с повышенной активностью дофаминовых нейронов лучше справлялись с пространственной задачей. Они лучше изучали новый лабиринт. Вдобавок ко всему, повышенная активность нейронов VTA индуцировала большее количество специфических колебаний (называемых острой волновой рябью) в гиппокампе, структуре, важной для пространственного обучения. У нас появляются убедительные доказательства того, что эти колебания важны для памяти, поскольку их нарушение ухудшает память (см. Jadhav et al. Science (2012) и Girardeau et al. Nat. Neuosci. (2009) , если вам интересна эта тема) .

Обратите внимание, что это исследование было проведено на мышах. Вероятно, это документы, связывающие активность VTA и обучение с использованием FMRi на людях, но я недостаточно знаком с литературой.

Большое спасибо! Вы случайно не знаете, есть ли исследования того, увеличивает ли домапин пластичность на уровне синапсов? То есть синапс с большей вероятностью будет расти/укрепляться при более высокой концентрации дофамина?
@danijar Добро пожаловать! Действительно, есть доказательства того, что дофамин изменяет силу синапсов. Точнее, дофамин изменяет долговременное потенцирование, один из основных известных механизмов изменения силы синапсов (один пример, который я только что нашел: S. Li et al. Nat. Neurosci. (2003) . Это действительно хороший вопрос, и я отредактируйте мой ответ, когда у меня будет время.

Модулируется ли объем обучения передатчиками вознаграждения?

Данияр

Шонни123

Данияр

Ответы (2)

Шонни123

мрт

Данияр

Шонни123

Хорникар

Данияр

Хорникар

Как нейротрансмиттеры взаимодействуют с нейронами в головном мозге?

Существует ли сопоставимая метафора для познания, которая существует для медленных и быстрых мышечных волокон?

Концептуальные представления в мозгу распределенными группами нейронов

NEO-FFI и NEO-FFI-3: в чем разница?

Каковы неврологические сходства между человеком и приматами?

Каковы последствия лишения зрения для психического здоровья и других органов чувств?

Как дифференцировать внимание, возбуждение и память по гамма-колебаниям

Как мысли работают на уровне нейронов?

Испытывает ли человек выброс дофамина, когда делает что-то, что ему нравится?

Нужны ли потенциалы действия для опыта?