Как люди контролируют саккады?

Я собрал стандартный логический вывод для зрительной системы, использующей саккады, из учебников по восприятию: нейронные затраты на обработку всей сцены с высоким уровнем детализации были бы непомерно высокими, но изображения с низкой точностью недостаточно хороши, чтобы функционировать в мире. . Таким образом, у вас есть сетчатка с высокоточным центром, который может сэмплировать сцену, саккадируя вокруг, предположительно руководствуясь комбинацией информации о низкоточном окружении и убеждениях и целях воспринимающего.

Однако мне еще предстоит найти подробную теорию, отвечающую на вопрос о том, как выбирается следующая цель саккады.

Чтобы уточнить, под «детальной теорией» я подразумеваю теорию, описывающую механизмы, используемые для выполнения вычислительных трюков, описанных в стандартном объяснении из учебника, о котором я упоминал выше.

Ответы (1)

Теория интеграции функций Treisman & Gelade предполагает, что мы можем обрабатывать всю визуальную сцену параллельно на уровне отдельных функций. Например, в задаче визуального поиска время, необходимое для нахождения синего кружка в поле красных кружков, не зависит от общего количества кружков . Однако для интеграции независимых функций в единый объект требуется сфокусированное внимание (обычно фовеальное). Таким образом, при поиске красного кружка в поле синих кружков и красных квадратов время поиска растет линейно с количеством объектов. Это связано с тем, что цель состоит из двух элементов (круг и красный), которые необходимо объединить, чтобы их можно было идентифицировать, что требует саккад вокруг сцены.

Несколько теорий визуального поиска используют это различие для моделирования смещения зрительного внимания. В частности, управляемый поиск Джереми Вулфа и модель визуального внимания Итти и Коха. Основная предпосылка обеих моделей в чем-то похожа: рецепторы признаков низкого уровня реагируют автоматически и параллельно всему полю зрения. Таким образом, существует множество отдельных карт признаков, которые представляют восходящую значимость мест в визуальной сцене. Этой заметности снизу вверх может быть достаточно, чтобы вызвать саккаду; например, карта признаков, реагирующая на локальное движение, полезна организму для идентификации движущихся хищников. Таким образом, областям с движением придается большое значение, потому что они имеют историю предоставления информации, полезной для организма.

В условиях задачи (например, при визуальном поиске) нисходящие карты значимости также могут быть созданы на основе знания о том, какие объекты в окружающей среде имеют ценность. Если я ищу свой зонт, я знаю, что он синий, длинный и прямой, и эта информация может быть закодирована в картах признаков, управляющих саккадами.

В более общем смысле саккады направлены на цели с высокой ожидаемой ценностью. (Было даже показано, что скорость саккад пропорциональна ожидаемому значению цели: Shadmehr, et al.) Это значение определяется на основе взвешенной оценки карт характеристик как сверху вниз, так и снизу вверх, доступных предварительно. внимательно.

Точное местоположение саккады определяется с помощью процесса, называемого пространственным объединением, который пытается определить «центр тяжести» цели, снова используя карты характеристик низкого уровня. В то время как саккады удивительно быстрые и точные, конечно, есть некоторая ошибка в конечной позиции саккады, которая часто требует меньших саккад для достижения цели. Недавно было высказано предположение, что эта серия саккадических движений подражает закону Фиттса в отношении компромисса между скоростью и точностью. Большой и тщательный обзор текущего состояния саккадических движений глаз можно найти у Kowler, 2011.

Очевидно, что здесь есть довольно много подробной информации, которую я не упомянул — из приведенных ссылок я бы начал с раздела 3 («Саккады») статьи Каулера, а затем перешел к статье Итти и Коха для более конкретные сведения об их конкретной модели.

Вулф, Дж. М. (1994). Управляемый поиск 2.0. Пересмотренная модель визуального поиска. Psychonomic Bulletin & Review, 1, 202–238.

Итти, Л., и Кох, К. (2001). Компьютерное моделирование зрительного внимания. Nature Reviews Neuroscience, 2, 1-11.

Шадмер и др. (2010). Временное дисконтирование вознаграждения и стоимости времени в двигательном контроле. Журнал неврологии, 30, 10507-10516.

Коулер, Э. (2011). Движения глаз: последние 25 лет. Vision Research, 51, 1457-1483.

** Примечание. Я цитирую Guided Search 2.0, потому что это хорошее изложение всей теории, хотя сама теория усовершенствовалась до версии 4.0.

Вы также можете ознакомиться с этой статьей и обсуждаемыми в ней моделями. SWIFT и EZ-Reader являются моделями глазодвигательного контроля при чтении. ncbi.nlm.nih.gov/pmc/articles/PMC2906818