О семейном сходстве Витгенштейнов и машинном обучении

Витгенштейн предложил в своей более поздней философии концепцию семейного сходства для описания групп, которые не могут быть определены одним (или простым набором) общих признаков, а вместо этого демонстрируют ( из SEP ):

Нет причин искать, как мы это делали традиционно — и догматически, — одно сущностное ядро, в котором находится значение слова и которое, следовательно, является общим для всех употреблений этого слова. Вместо этого мы должны путешествовать с использованием слова через «сложную сеть сходств, перекрывающихся и пересекающихся» (фот. 66). Семейное сходство также служит для демонстрации отсутствия границ и отдаленности от точности, которые характеризуют различные употребления одного и того же понятия. Такие границы и точность являются определяющими чертами формы — будь то платоновская форма, аристотелевская форма или общая форма предложения, намеченного в «Трактате». Именно из таких форм могут быть выведены приложения понятий, но именно этого Витгенштейн сейчас избегает в пользу обращения к родовому сходству с фамильным сходством.

Теперь рассмотрим типичную задачу распознавания образов/машинного обучения : у нас есть набор фотографий, на некоторых из которых изображены деревья, а на некоторых нет. Мы хотим разделить их на две группы: «фотографии деревьев» и «фотографии других вещей». Не существует единого критерия («ствол/без ствола», «листья/без листьев», «зеленый/не зеленый») для принятия решения о том, является ли фотография изображением дерева или нет, но существует подходящий алгоритм распознавания образов, такой как нейронная сеть . или машина опорных векторов легко сможет разделить два класса фотографий.

Дело в том, как работают такие алгоритмы: между двумя классами есть четкая граница, просто ее слишком сложно представить с помощью простой функции или набора правил «если-то». Это может быть представлено только в пространстве признаков высокой размерности, которое нельзя визуализировать в 2D или 3D, но четкая граница решения все еще существует, иначе алгоритмы не работали бы.

Мои вопросы:

  • Основываясь на этом соображении, действительно ли семейное сходство Витгенштейна сводится к недостатку знаний?

  • Ошибается ли Витгенштейн, когда говорит, что для таких понятий нельзя описать ни границы, ни точные расстояния? Они могут, они слишком сложны, чтобы их можно было описать просто?

  • Или есть примеры семейного сходства, где нельзя найти четкой границы, сколь бы сложной ни была используемая нами репрезентация?

Что касается критерия, разве «дерево/нет дерева» не является единственным критерием, который точно определяет, является ли изображение деревом или нет? С точки зрения машинного обучения, очевидно, безумно сложно определить этот критерий, не делая этого путем определения меньших критериев и поиска кластеров, но с точки зрения языка и того, о чем говорит Витгенштейн, многие люди утверждают, что «дерево/не дерево» хорошо определенный.
Такие алгоритмы работают без четких границ, возможно, даже лучше, например, нечеткая c-кластеризация была введена для улучшения четкой k-кластеризации для сегментации изображений, предшествующей распознаванию образов. Даже если в конце концов кластеризация будет усилена, скажем, максимальным членством, это может быть случай прагматического проведения границы где-то через «серые области», а не обязательно случай «существующих ранее», они различаются в зависимости от алгоритма. . Витгенштейн даже описывает что-то вроде парадигматических кластерных центров своего «семейного сходства».
Что касается вашего второго вопроса, мы должны принять концепцию использования языка, согласно которой некоторые люди могут ошибаться даже в отношении «языка как использования». Если бы я постоянно называл камень «деревом», ни у кого не возникло бы никаких проблем со словами, что я неправильно употребил слово «дерево», и это не привело бы к тому, что определение слова «дерево» из-за моего неоднократного использования включало в себя огромное серые глыбы камня. Таким образом, можно определить сложные границы для понятий и просто утверждать, что любое использование, не подпадающее под них, является неправильным использованием. Здесь не может быть правильного ответа.
Но сначала вы сообщаете машине, что является деревьями, а что нет, помечая данные.

Ответы (3)

Ответы на ваши вопросы не будут полностью решены, потому что они опираются на определенные теории философии языка и отношения языка к философии сознания. Однако перед любыми объяснениями следует отметить одну очень интересную вещь: сам Витгенштейн не верил, что машины могут мыслить. Кроме того, он считает, что мышление «сосредоточено вокруг человека; таким образом, оно явно антропоцентрично» , как указывает Обермайер. Из философских исследований :

Aber eine Maschine kann doch nicht denken! - Ist das ein Erfahrungssatz? Неин. Wir sagen nur vom Mensch, und was ihm, ähnlich ist, es denke. (ИП 360)

Но ведь машина не может думать! - Но разве это эмпирическое утверждение? Нет. Мы говорим только о человеке и о том, что похоже на то, что он думает. (ИП 360)

Он считает, что мы априори знаем, что машины не могут думать, потому что мышление — это только то, что делают люди или вещи, подобные людям. Он считает, что было бы категорической ошибкой думать, что машины могут думать. В этом смысле, скорее всего, он отвергнет аргументы за или против своих теорий языка и мышления, основанных на программах искусственного интеллекта. Однако одна из сложностей в его философии заключается в том, что он был загадочен даже для близких ему людей, и никто точно не знает, с чем он согласится или не согласится. Возможно, он был бы настолько впечатлен сегодняшними программами ИИ, что полностью изменил бы свое мнение о своих идеях, почти так же, как он изменил свое мнение о « Трактате » ; в данный момент мы не знаем, что он подумает, и все, что у нас осталось, это то, что он написал.

Центральной для более позднего Витгенштейна является его идея о том, что значение есть использование . Идея, используемая в семейном сходстве по отношению к значению использования, заключается в том, что мы не можем дать точное определение игры, однако мы все же можем прекрасно знать, когда кто-то имеет в виду игру, а когда нет. Он утверждает, что хотя, используя его пример, «игра» может использоваться и пониматься в языке, не существует единого полного определения этого слова.

Und so können wir durch die vielen, vielen anderen Gruppen von Spielen gehen. Ähnlichkeiten auftauchen und verschwinden sehen. Und das Ergebnis dieser Betrachtung lautet nun: Wir sehen ein kompliziertes Netz von Ähnlichkeiten, die einander übergreifen und kreuzen. Ähnlichkeiten im Großen und Kleinen. (Фот. 66)

И мы можем таким же образом пройтись по многим, многим другим группам игр, увидеть, как сходство возникает и исчезает. И итог этих соображений таков: мы видим сложную сеть перекрывающихся и пересекающихся сходств: сходства в большом и в малом. (Фот. 66)

Для Витгенштейна проблема не сводится к эпистемологии. Он считает, что абсолютно не существует конкретного определения; он не верит, что он существует, но некоторые люди могут просто не знать об этом. Эта точка зрения основана на его теории о том, что значение — это использование. Слово «игра» получает свое значение от того, как люди его используют, и люди используют его таким образом, что его нельзя определить одним определением, вместо этого его использование демонстрирует семейное сходство. Из СЭП:

Эта новая перспектива настолько отличается, что Витгенштейн повторяет: «Не думай, а смотри!» (Фот.166); и такое рассмотрение делается по отношению к частным случаям, а не к обобщениям. При указании значения слова любое объяснительное обобщение должно быть заменено описанием употребления.

Этот взгляд на язык резко контрастирует с такими теориями, как каноническая теория значения Фреге/Рассела. Как правило, теории значения Фреге/Рассела занимают центральное место в идее о том, что предложения обладают значением и каким-то образом семантически связаны с миром. Идея о том, что язык, предложения и определения хорошо определены, занимает центральное место в этой точке зрения. Даже Витгенштейн поделился этой идеей в первые годы своей жизни в « Трактате» :

  1. В чем дело — факт — это существование положений дел.
  2. Логическая картина фактов есть мысль.
  3. Мысль есть предложение со смыслом.

В конечном счете, философы, придерживающиеся семантических теорий значения , будут утверждать, что Витгенштейн ошибается, когда говорит, что никакие границы не могут быть сформированы. Неизбежно они сталкиваются с такими проблемами, как парадокс Сорита . Эти вопросы по-прежнему остаются центральными в философии языка, и на них пока нет ответов с полным консенсусом. Ясно, однако, то, что Витгенштейн считал, что некоторые слова не могут иметь четкого логического граничного условия (его пример — «игра»), а философы по другую сторону теории значения, такие как Дэвидсон , полагали, что мы можем .

Парадокс Сорита представляет собой прекрасный пример слов, которые, кажется, не имеют четких граничных условий, и поэтому это центральное место, где эта дискуссия выходит на свет. Из СЭП:

Проблема, стоящая перед эпистемическим теоретиком, заключается в том, что при таком взгляде обычно предполагаемая связь между значением и употреблением оказывается разорванной. Хотя принцип допустимой погрешности, обсуждавшийся в Williamson (1994), мог бы служить для объяснения того, как мы могли бы не знать о постулируемых четких границах, если бы они существовали, можно было бы подумать, что, поскольку наше использование нечетких терминов не проводит четких границ, они не могли обладать ими при общепринятой связи между значением и употреблением.

Как было сказано, он не верил, что машины могут думать. Однако если мы распространим его идеи на философа, который действительно верит, что машины могут думать, она будет утверждать, что существуют некоторые границы принятия решений, которые машина никогда не сможет полностью распознать, например, граница принятия решений между играми и неиграми. Те философы, которые отвергают значение как использование, будут утверждать, что достаточно сильная программа ИИ всегда сможет найти границу решения, если значение критерия хорошо определено.

(Перевод и исходный текст, которые я использовал для PI, - это 4-е издание Wiley-Blackwell )

Они могут легко разделить два типа фотографий, потому что они используют подходы, явно вдохновленные работой нашего мозга, другими словами, они повторяют в упрощенной форме то, что мы изначально делали при создании таких классификаций. Означает ли это, что паттерн существует там «независимо от разума»? Ответ зависит от философских предпочтений, и ведутся вечные споры об «изобретенном» и «открытом», номинализме и реализме и т. д.

Но я подозреваю, что у этих алгоритмов будут проблемы с изображениями определенных кустарников и кустарников, как у человека. Официальное ботаническое определение « деревянное растение высотой не менее 5 метров с главным стеблем, нижняя часть которого обычно неветвистая » тоже не кажется мне особенно резким. Достаточно обученная нейросеть, вероятно, классифицирует Плутон иначе, чем Земля и Марс, но трудно увидеть различие между планетами и карликовыми планетами .как острые или написанные на звездах. В той мере, в какой мы можем принять это как доказательство философских позиций, успех нечетких методов в распознавании образов скорее указывает на то, что Витгенштейн был прав: наши классификации основаны на множественных сходствах и мерах подобия, предполагают произвольный выбор и дают размытые результаты. «Резкие границы» — это чаще всего вырождения или идеализации.

Сам Витгенштейн в «Синей книге» (1933-35) описывает процесс обучения человека в терминах, напоминающих обучение нейросети до того, как появились какие-либо намеки на (искусственные) нейросети:

« Существует тенденция, коренящаяся в наших обычных формах выражения, думать, что человек, который научился понимать общий термин, скажем, термин «лист», благодаря этому получил своего рода общее представление о листе, как о листе. Ему показывали разные листья, когда он узнавал значение слова «лист», и показ ему отдельных листьев был лишь средством для того, чтобы произвести «в нем» идею, которую мы воображаем какой-то общий образ. " [цитата из " Универсалии и семейные сходства" Бамбро ]

То, что несколько скрыто в нейросетях, становится явным в алгоритмах кластеризации , также популярных в распознавании образов. Они как будто созданы в соответствии со спецификациями семейного сходства Витгенштейна:

Кластеризация или кластерный анализ включает в себя присвоение точек данных кластерам (также называемым корзинами, корзинами или классами) или однородным классам таким образом, чтобы элементы одного класса или кластера были как можно более похожими, а элементы, принадлежащие к разным классам, были максимально непохожими. насколько это возможно. Кластеры идентифицируются с помощью мер подобия. Эти меры подобия включают расстояние, связность и интенсивность » .

Один (который может быть нейросетью) выбирает «функции» и группирует объекты на основе совокупности их значений, затем кластеризация сводится к поиску центров кластеров, «парадигматических представителей», вокруг которых «группируются» другие объекты. Как только они будут найдены, будь то в трехмерном пространстве или в пространстве более высоких измерений, можно провести границы между кластерами. Это будет работать почти всегда, а не только тогда, когда мы «видим» границу, как с деревьями и не деревьями. Конечно, есть показатели качества, и они могут быть высокими или низкими. Должны ли мы сказать, что граница «действительно» существует всякий раз, когда можно достичь высококачественной кластеризации? Или скажем, а-ля Кант, что мы (или нейросеть) «помещаем» его туда, определяя особенности и делая другие неуникальные выборы, которые делают такие алгоритмы? Даже в визуальном 3D»

Обнаружение краев является важной частью многих систем компьютерного зрения. В идеале края соответствуют границам объекта, и поэтому обнаружение краев обеспечивает средство сегментации изображения на значимые области. Однако определение того, что представляет собой край, довольно расплывчатое, эвристическое. , и даже субъективный " [из " Нечетких моделей и алгоритмов распознавания образов и обработки изображений " ] .

Действительно, именно для учета этой неопределенности «четкие» алгоритмы k-кластеризации были заменены нечеткими алгоритмами c-кластеризации:

Метод нечеткой кластеризации присваивает каждому обучающему вектору набор значений членства, по одному для каждого кластера, вместо того, чтобы присваивать каждому обучающему вектору один и только один кластер. Поскольку он более реалистичен, несколько результатов исследований показали, что он превосходит алгоритм жесткой кластеризации » [из Image Segmentation by Hsieh et. др. ]

Нечеткие «значения принадлежности» означают, что каждый объект рассматривается как принадлежащий каждому кластеру, но в разной степени. В конце концов, кластеризацию можно усилить, назначив кластеру максимальное членство, и оказалось, что сохранение нечеткости в процессе часто приводит к более четким кластерам.

Программа искусственного интеллекта и человек, у которого возникают проблемы с задачей определения различных типов кустов, — это не то же самое, что те кусты, у которых нет четкой границы принятия решения посредством определения типов кустов. Аргумент Витгенштейна состоит в том, что при определенных обстоятельствах этих определений не существует.
@Not_Here Аргумент Витгенштейна состоит в том, что «четкие» границы и определения часто являются неправильным толкованием процесса и результатов классификации, серые зоны и колебания являются симптомами этого. Даже границы между биологическими видами не совсем четкие, не говоря уже о полупрагматических категориях, таких как деревья и не-деревья. По иронии судьбы, даже в связанной статье в Википедии говорится, что «границы решений не всегда четкие». Возможно, строго говоря, они никогда не бывают, кроме как «для практических целей».
Я с @Not_Here, нечеткое членство по-прежнему составляет описываемую аналитическую границу, даже если она нечеткая. У меня сложилось впечатление, что Витгенштейн считает, что семейное сходство вообще невозможно измерить.
@AlexanderSKing Мое мнение о мягких и часто даже «резких» границах заключается в том, что они более или менее «произвольно» нарисованы на основе прагматических (явно или неявно) соображений, деревья и карликовые планеты являются примерами этого. Семейное сходство обрисовывает в общих чертах «принципиальные» многокритериальные кластеры с широкими промежутками и перекрытиями, которые затем для удобства закрепляются аналитическими «границами». Мы можем провести прямую линию на карте, это не значит, что линия границы между Германией и Францией, скажем, обусловлена ​​природой или даже структурой населения сама по себе.

Мне нравятся вопросы и ответы @Conifold и @Not_Here.

Предположим, машина учится классифицировать объекты как способные или неспособные мыслить. Обученный в 80-х годах и представленный изображением другого компьютера, он классифицирует его как неспособный к мышлению. Вновь обученный в 2100 году и получивший изображение другого компьютера, он теперь классифицирует его как способного мыслить.

Чему научилась машина? определение того, что представляет собой мышление, или правомерное использование слова «мышление» по мере его развития во времени?

Предположим, машина научилась классифицировать изображения как представляющие деревья или не-деревья. Он усвоил функцию, скажем, даже резкую границу. Но в каком смысле это определение вещи?

Означает ли это, что он классифицирует изображения на деревья или не деревья со 100% точностью? Что вообще означает для него 100% точность при выполнении такой задачи?

Я думаю, что мы можем предположить точность ниже 100% для нетривиальных проблемных областей. Скажем, это 97% точности, что тогда делать с оставшимися 3%? похоже, что некоторые члены сообщества ораторов не согласны с машиной. будет ли он учиться у них или даже учить их во время взаимодействия с ними? будет ли указанная граница меняться со временем?

И что это вообще за граница? предположим, что оно определяется каким-то произвольным порогом, скажем, оценкой 50 %, и предположим, что машине представлены некоторые входные данные, для которых вычисленная оценка равна 50 %, и другие входные данные, для которых оценка равна 49,999 %.

Предположим, что эти входные данные являются изображениями школьных автобусов. В каком смысле правомерно определять, что на первой картинке изображен школьный автобус, а на второй нет?

Что, если второе изображение получается из первого путем незначительного изменения значения конкретного пикселя таким образом, который большинство людей даже не заметит?

Этот пример соответствует интересному явлению, называемому «состязательными» изображениями, которое сбивает с толку нейронные сети, но не людей:

введите описание изображения здесь

Имеет ли машина право использовать границу для объявления шины в первом случае и не-шины во втором случае?

Или было бы более оправданным ответить «я не уверен»?

Если да, то в каком смысле резкость границы интересна или актуальна?

И вы, и @Not_Here дали соответствующие ответы. Я забыл о состязательных изображениях.