В этой статье утверждается, что существует программное обеспечение, которое может сказать, является ли человек гомосексуалистом, основываясь только на изображении его лица. Однако в другой статье это называется «псевдонаукой»:
критики говорят, что мы возвращаемся к лженауке
Это правда или подделка? Как они измерили 91%? Если 7-11% людей являются гомосексуалистами, просто говоря "натурал" все время программа будет иметь 89%-93% успеха.
Это правда или подделка?
Рассматриваемый исследовательский документ прошел экспертную оценку, что свидетельствует о том, что методология была признана надежной другими экспертами в этой области. Вполне возможно, что результаты были сфальсифицированы (что иногда случается в исследованиях), но это очень маловероятно, учитывая, насколько легко было бы воспроизвести и проверить результаты. На самом деле ничто не мешает вам воспроизвести их работу самостоятельно.
Но могут ли результаты быть ошибочными? Ну а сами авторы исследования написали следующее:
Наши выводы могут быть ошибочными. На самом деле, несмотря на доказательства обратного, мы надеемся, что ошибаемся. Однако научные выводы могут быть опровергнуты только научными данными и повторениями, а не благонамеренными юристами и специалистами по связям с общественностью, не имеющими научной подготовки.
в ответ на критику со стороны HRC и GLAAS ( источник ).
Как они измерили 91%? Если 7-11% людей являются гомосексуалистами, просто говоря "натурал" все время программа будет иметь 89%-93% успеха.
Как поясняется в статье , алгоритму было представлено равное количество фотографий гетеросексуальных и гомосексуальных людей. Другими словами, априорная вероятность того, что человек на каждом изображении гомосексуален, составляла 50%, а не 7-11% людей, которых вы встречаете на улице.
Резюме: Эта статья является настоящей научной статьей, прошедшей рецензирование. Настоящим судьей того, верны их выводы или нет, является возможность их воспроизвести. С момента публикации исследования просто не хватило времени для публикации реплики. Кроме того, есть вопросы о том, что именно означают их результаты. Искусственные нейронные сети не объясняют пользователю, почему они сделали свои прогнозы; они черный ящик.
Искусственные нейронные сети (ИНС) — это инструмент машинного обучения, который можно научить распознавать закономерности в данных и делать прогнозы на основе этих закономерностей. Их структура была вдохновлена структурой естественных нейронных сетей мозга. Подобно естественной нейронной сети, их процессы принятия решений представляют собой черный ящик . ИНС делают прогноз (гей или натурал) на основе входных данных (набора фотографий), но не объясняют свои рассуждения. Исследователи размышляют о том, что могла улавливать ИНС, но на самом деле они не знают.
Какие черты лица использовались алгоритмом для определения сексуальной ориентации? Средние лица, которые, скорее всего, принадлежали геям (см. рис. 1), были более женственными, в то время как лица, которые, скорее всего, принадлежали лесбиянкам, были более мужскими. Как правило, у мужчин более крупные челюсти, более короткие носы и меньшие лбы. Однако мужчины-геи, как правило, имели более узкие челюсти, более длинные носы, большие лбы и меньше растительности на лице. И наоборот, у лесбиянок, как правило, более мужественные лица (большая челюсть и меньший лоб), чем у гетеросексуальных женщин.
Гендерная атипичность гей-лиц выходит за рамки морфологии. Лесбиянки, как правило, использовали меньше косметики для глаз, имели более темные волосы и носили менее открытую одежду (обратите внимание на более высокий вырез), что свидетельствует о менее женственном уходе и стиле. Кроме того, хотя женщины в целом склонны больше улыбаться, лесбиянки улыбаются меньше, чем их гетеросексуальные коллеги.
Кроме того, в соответствии с связью между бейсболками и мужественностью в американской культуре, гетеросексуальные мужчины и лесбиянки, как правило, носили бейсболки (см. тень на их лбу на рис. 1; это также было подтверждено ручным просмотром отдельных изображений).
Возможно, ИНС в основном ориентировалась на черты лица, а может быть, и на другие сигналы, такие как улыбка или ношение бейсболки. Тренировочный набор был взят с сайта знакомств. Я ожидаю, что геи и лесбиянки будут выбирать фотографии, которые будут привлекательны для других геев и лесбиянок. ANN может уловить эти различия. Отвечая на эти вопросы , авторы утверждают, что:
Во-первых, мы протестировали наш классификатор на внешнем образце фотографий Facebook. Он достиг сопоставимой точности с образцом сайта знакомств, предполагая, что изображения с сайта знакомств были не более показательными, чем фотографии профиля Facebook. ...
Наконец, используемая здесь глубокая нейронная сеть была специально обучена фокусироваться на фиксированных чертах лица, которые нелегко изменить, например, на форме элементов лица. Это помогло снизить риск того, что классификатор обнаружит некоторые поверхностные и не связанные с лицом различия между изображениями лиц геев и гетеросексуалов, использованными в этом исследовании.
Примечание. Хотя они пытаются устранить любую зависимость от других вещей, кроме фиксированных черт лица, я не уверен, что им это удалось. Я не очень хорошо знаком с алгоритмами распознавания лиц или нейронными сетями.
ИНС в статье использовала тренировочный набор с полугейскими и полугейскими лицами. ANN представят одно веселое и одно серьезное лицо и спросят, что есть что. Когда лица были созданы с использованием 5 фотографий, он смог правильно выбрать, какая из них была геем в 91% случаев. Это сильно отличается от любого реального приложения, где примерно 10% населения являются геями.
Предположение: Наивысшая точность предсказания, точность 91%, была достигнута с 5 фотографиями одного и того же человека. Однако было только 219 геев и 223 лесбиянки с 5 фотографиями в их наборе данных, по сравнению с ~ 3500 каждым на 1 фотографию. Это может быть слабостью их методов, но 200 испытуемых — это все же немало. Возможно, их методы преувеличивают свою точность. Прогнозы на основе 4 фотографий имели значительно больше субъектов и лишь немного меньшую точность. Если бы я произвольно решил выбросить точность множественных фотографий, у нас все равно осталась бы точность 81% для мужчин-геев.
Если вы будете читать это в будущем, по этой ссылке Google Scholar будут показаны все статьи, в которых цитируется рассматриваемая статья. Надеюсь, через пару лет по этой ссылке будет приличный список статей. Мы надеемся, что статьи, которые будут опубликованы, будут более сильной формой рецензирования, чем рецензирование. Я ожидаю, что многие из них кратко и некритично повторят выводы этой статьи. Авторы этих статей, вероятно, не читали эту статью достаточно глубоко, чтобы дать реальную критику ее методов. Если один из них обсуждает это подробно, эти авторы, вероятно, достаточно хорошо понимают методы и выводы, чтобы относиться к ним должным образом скептически. Если эта статья также посвящена очень похожей теме или основана на этой работе, мне было бы очень интересно узнать мнение авторов статьи по этому вопросу.
ДжонатанРиз
лимон
Дуг.МакФарлейн
ГордонМ
PoloHoleSet
Даниэль