Пожалуйста, не могли бы вы дать мне очень краткое объяснение обо всех функциях в архитектуре вентрального потока, представленных на этом рисунке:
Этот рисунок взят из книги Серра и др. « Количественная теория немедленного визуального распознавания » . Прог Мозг Res. 2007.
Я прочитал несколько статей об этой модели, но я до сих пор не понимаю основную цель, особенно за двумя операциями (гауссовыми и максимальными операциями). Поэтому, пожалуйста, кто-нибудь может подробно объяснить мне путь вентрального потока ( от V1-V2-V4-IT-PFC), включая две операции в этой модели.
Например: я не понимаю, как устроены ячейки в S1...
Это типичная архитектура вычислений, предложенная в качестве модели вентрального потока обработки изображений у приматов . Он имеет долгую историю (например, Неокогниторон на Фукусиме был в 1980 году ) и до сих пор широко используется в машинном обучении (например, глубоком обучении ) и нейробиологии.
Это мотивировано организацией простых клеток V1 и сложных клеток. Простые клетки в V1 можно приблизительно рассматривать как детекторы краев в определенном месте сетчатки. Поэтому на приведенном вами рисунке они изображены в виде круга с полосой (мультяшное рецептивное поле). Простые ячейки могут обнаруживать вещи только очень локально, то есть, если край появляется в другом месте в вашем поле зрения, он не будет реагировать.
Математически вы можете думать о пространственном фильтре, который обнаруживает край (например, ориентированный участок Габора), умножается на ваше изображение на сетчатке и суммируется. Например, приведенный ниже фильтр обнаружит соответствие 45-градусной полосе, выровненной по выделенной области, но будет иметь меньшую активность, если полоса сместится за пределы определенной позиции.
С другой стороны, сложные ячейки в V1 по-прежнему являются детектором границ, но имеют некоторую инвариантность местоположения. Другими словами, при небольшом смещении края реакция сложных клеток как бы не меняется. Считается, что это происходит потому, что сложные клетки вытягиваются из нескольких простых клеток с одинаковой ориентацией. Это то, что вы видите на рисунке, где одна сложная ячейка извлекает информацию из простых ячеек той же ориентации, но в разных местах.
Математически операция soft-max или операция max над выходными данными простой ячейки может привести к хорошей модели сложной ячейки. Но, это не ограничивается такими операциями. Фактически, квадратичные или другие нелинейные модели также широко используются в вычислительной нейронауке.
Полная иерархия для вентрального потока затем просто получается путем многократного расширения с использованием аналогии простой-клеточной-сложной-клетки. Для каждого стека слой простых ячеек извлекает некоторую локальную характеристику (вычисляя выходные данные сложной ячейки предыдущего слоя), а слой сложных ячеек делает его инвариантным в пространстве. Из ребер в V1 можно получить углы на следующем слое, затем сложные контуры и вплоть до объектов. По крайней мере, так гласит история.
мемминг
Кристина
мемминг
Кристина
мемминг
Кристина
Йонска
Кристина
мемминг