Какой нейронный механизм объясняет склонность зрительно обращать внимание на всю сцену, прежде чем обращать внимание на детали?

У меня есть интуиция, что человеческое зрение сначала обращает внимание на крупномасштабные объекты, а затем на мелкие детали. Есть ли в зрительной коре какой-либо механизм, объясняющий это явление? Существует ли процесс уточнения разрешения, когда мы смотрим на сцены?

Ответы (3)

Во-первых, дело не только в вашей интуиции — есть много экспериментальных результатов, показывающих, что мы сначала воспринимаем суть сцен (например, на улице или в помещении?), а затем основные ее части (было ли это животное или человек). фигура в нем?) затем все больше и больше подробностей (это фигура мужчины или женщины? каково ее выражение?) [1] [2] . Обратите внимание, однако, что это не совсем связано с размером объекта, а больше с его предполагаемой важностью или актуальностью. (См. также отличное видео о слепоте к изменениям , иллюстрирующее это)

Теория обратной иерархии [3] предлагает для этого механизм – активация в сети протекает в основном «снизу вверх», но сознательное восприятие начинается на более высоком уровне, а затем активно (посредством внимания) обращается к деталям «нижнего уровня» по мере необходимости. или по их словам:

Классически зрительная система рассматривалась как иерархия областей коры и типов клеток. Нейроны областей низкого уровня (V1, V2) получают визуальную информацию и представляют простые элементы, такие как линии или края определенной ориентации и местоположения. Их выходные данные интегрируются и обрабатываются последовательными уровнями коры (V3, V4, медиально-височная область MT), которые постепенно обобщают пространственные параметры и специализируются на представлении глобальных признаков. Наконец, последующие уровни (IT нижневисочной области, PF префронтальной области и т. д.) объединяют свои выходные данные для представления абстрактных форм, объектов и категорий. Функция обратных связей была неизвестна. Теория обратной иерархии предполагает, что описанная выше прямая иерархия действует неявно, при этом явное восприятие начинается в коре высокого уровня. представление сути сцены на основе приближенного интегрирования первого порядка низкоуровневого ввода. Позже явное восприятие возвращается в нижние области через обратные связи, чтобы интегрировать в сознательное видение с тщательным изучением доступную там подробную информацию. Таким образом, первоначальное восприятие основано на рассеянном внимании (большие рецептивные поля), угадывании деталей и ошибках связывания или конъюнкции. Более позднее видение включает в себя детали, преодолевая такую ​​слепоту.


[1] Поттер, MC (1976). Кратковременная концептуальная память на изображения. Журнал экспериментальной психологии: человеческое обучение и память; Журнал экспериментальной психологии: человеческое обучение и память, 2 (5), 509. ссылка

[2] Ренсинк, Р.А., О'Реган, Дж.К., и Кларк, Дж.Дж. (1997). Видеть или не видеть: потребность во внимании для восприятия изменений в сценах. Психологическая наука, 8(5), 368-373. соединять

[3] Хохштейн С. и Ахиссар М. (2002). Взгляд с верхних иерархий и обратных иерархий в зрительной системе. Нейрон, 36(5), 791-804. соединять

Феномен, который вы описываете, называется глобальным эффектом предшествования, и впервые он был подробно изучен Дэвидом Навоном (1977). Один из способов измерить этот эффект — создать конфликт между глобальными и локальными функциями. Например, Навон представил наблюдателям буквенные стимулы, которые глобально были организованы в разные буквы, например;

введите описание изображения здесь

Наблюдатели были проинструктированы указать либо а) когда меньшие буквы были E против H, либо b) когда большие буквы образовывали E против H. Навон обнаружил, что время реакции обычно было быстрее, когда глобальные и локальные признаки были конгруэнтны. Однако конфликт, вызванный глобальной формой, уменьшил время реакции в a) намного больше, чем конфликт, вызванный меньшими буквами в b). Большую интерференцию со стороны глобальной структуры интерпретировали как свидетельство того, что глобальная форма обрабатывается раньше, чем локальные детали.

Этот эффект был более подробно изучен Одом Оливой и Филиппом Шинсом. Олива представила гибридные изображения природных сцен. Эти изображения были составлены из информации с высокой пространственной частотой из одной сцены и информации с низкой пространственной частотой из другой сцены. Например, на изображениях ниже информация о низкой пространственной частоте шоссе была объединена с информацией о высокой пространственной частоте изображения небоскребов (верхнее изображение) и наоборот в нижнем изображении. Они показали, что информация о низкой пространственной частоте более полезна, особенно в тех случаях, когда сцены просматривались ненадолго или когда участникам приходилось делать очень быстрые выводы.

введите описание изображения здесь

Что интересно в исследовании, проведенном Шинсом и Оливой, так это то, что оно предоставляет доказательства нейронного объяснения того, почему глобальные особенности доминируют над деталями. Это объяснение основано на двух типах клеток, которые существуют в сетчатке и посылают аксоны в таламус головного мозга. Эти типы клеток можно условно разделить на два типа: крупные крупноклеточные нейроны и меньшие парвоцеллюлярные нейроны. Эти типы клеток имеют разные пространственные предпочтения и временные характеристики. Мангоклеточные нейроны предпочитают входы с низкой пространственной частотой и демонстрируют быстрый переходный ответ. Парвоцеллюлярные нейроны, с другой стороны, предпочитают красочный вход с высокой пространственной частотой и демонстрируют медленный, устойчивый ответ. Итак, идея состоит в том, что магноцеллюлярный путь быстро несет грубые, информация низкой пространственной частоты поступает в мозг для формирования первоначальной интерпретации мира. Затем эта интерпретация сравнивается с более подробной информацией, которую несет парвоцеллюлярный путь, когда она поступает в кору.

Ссылки Навон, Д. (1977). Лес перед деревьями: приоритет глобальных функций в зрительном восприятии, Когнитивная психология, том 9 (3), 353–383.

Шинс, П.Г., и Олива, А. (1994). От капель к граничным краям: доказательства распознавания сцены в зависимости от времени и пространственного масштаба. Психологическая наука, 5(4), 195-200.

Человеческое зрение привыкло сначала видеть то, что движется. Таким образом, учитывая, что в поле зрения присутствуют как крупномасштабные, так и мелкомасштабные объекты, объект будет показывать первые признаки движения, которые сначала будут присутствовать в зрительной коре. Я считаю, что это из-за эволюционного процесса, когда люди были охотниками, а разум развился, чтобы обнаруживать любое движение животных на периферии.