Эмпирическое доказательство для моделей социальных сетей

Недавно я столкнулся с областью моделирования социальных сетей, когда читал статьи о моделях стратегического голосования (неопубликованные), динамике мнений и распространении влияния .

Во всех этих работах создаются сложные вычислительные модели, обычно моделирующие социальные сети в виде графов и делающие вывод о том, что их поведение соответствует реальному социальному поведению.

Однако я не понимаю, как эти модели могут быть эмпирически строгими. Мне кажется, что способы проверки модели — это сопоставление с эмпирическими данными либо путем сопоставления данных, либо путем прогнозирования. Кажется, это не сделано ни в одной из этих бумаг.

Следовательно, как эти модели проверяются?

Возможно, вас заинтересует этот пост в блоге, в котором я обсуждаю некоторые несоответствия между тем, как выглядят данные социальных сетей, и тем, как они используются в моделях (эволюционной теории игр).

Ответы (2)

Существующие документы

Я нашел три статьи в том же ключе со значительно большим количеством эмпирических данных.

1. Моделирование размера войн

В статье моделируются провинции и конфликты, чтобы подтвердить наблюдение Ричардсона о том, что пропорция серьезности конфликтов по отношению к их частоте описывается степенным законом. Другими словами, чем больше расстояние между конфликтами, тем больше жертв. В моделях используется много деталей. Создается географическая карта, и конфликты (вплоть до технического прогресса, политических структурных изменений и распределения ресурсов) моделируются в моделях с десятками параметров. Что еще более важно, уровень детализации в документе позволяет устанавливать параметры для проверки исторических сценариев, чтобы опровергнуть или предоставить дополнительные доказательства модели.

2. Динамика поляризации

Основное внимание в статье уделяется моделированию изменения общественного мнения в Соединенных Штатах как способу объяснения двух явлений:

  1. Поляризация мнений встречается редко, несмотря на то, что они воспринимаются иначе
  2. Однородность мнений встречается редко, несмотря на то, что их воспринимают иначе.

Чтобы смоделировать это явление, строится сеть, аналогичная сети из статьи «Динамика мнений» из вопроса, с навязанной гомофилией. Тем не менее, в статье обоснованы его параметры в действительности (например, вопросы взлета, вызывающие широкое обсуждение, считаются редкими). Напротив, в статье «Динамика мнений» создаются параметры для скептицизма и эмпатии, не уделяя особого внимания механизмам, лежащим в основе этих атрибутов, и тому, как они могут меняться со временем.

3. Психологически мотивированная модель изменения мнения с приложениями к американской политике.

В данной статье обосновывается моделирование двухмерных распределенных агентов с использованием психологических параметров Влияние, Восприимчивость и Согласие и их взаимодействие. Затем модель проверяется на американских политических взглядах, поскольку они меняются со временем.

Заключение

Есть работы с эмпирической основой в области моделей социальных сетей. Как правило, этот реализм достигается за счет того, что параметры основываются на эмпирических данных, а не на упрощении когнитивных явлений.

Ответ автора статей в социальных сетях

Автор двух статей, которые я процитировал в вопросе, Алан Цанг, был достаточно любезен, чтобы опровергнуть мой скептицизм в личной переписке:

Идея обеих статей заключалась в том, чтобы изучить последствия определенного психологического явления, исследуя его изолированно. Мы основываем нашу работу на более традиционных экономических моделях агентов, которые предполагают полностью рациональных субъектов. Мы хотим увидеть, что происходит, когда рациональное поведение корректируется, чтобы включить поведенческий компонент. В частности, нас интересуют производимые качественные эффекты и механизмы, с помощью которых они достигаются. Моделирование на основе агентов является идеальным способом изучения этого, потому что оно позволяет нам детализировать и проводить измерения, которые было бы невозможно или очень сложно сделать в реальном сообществе. Так что мы делаем больше математики и меньше науки. Результаты статей дают качественное представление о возможных последствиях такого поведения для более крупной системы. Следующим шагом, безусловно, может быть проверка модели на реальных данных, но цель статьи не в том, чтобы проводить научные исследования «полного стека». Скорее, мы надеемся, что это окажется полезным компонентом в более подробной модели, которая будет использоваться для сбора данных в дикой природе.

Тем не менее, мы также заинтересованы в проверке нашей модели на реальных данных, но их трудно найти. Например, у Facebook почти наверняка есть доступ к данным, которые можно использовать для выявления гомофилии в сетях и того, как они могут со временем повлиять на мнения. Но данные очень конфиденциальны, и даже если бы мы их получили, этические соображения могли бы ограничить возможности их использования. Как вы указали в последующем посте, есть несколько документов, в которых исследуется политическая принадлежность, и они потенциально могут быть полезной истиной. Но у меня нет опыта, чтобы правильно собрать такой набор данных с нуля (поскольку для этого потребуется как временной ряд мнений, так и базовая сетевая структура). Более того, наверняка будут действовать и другие эффекты, которые могут запутать анализ. Мы' Мы думаем о сборе данных для последних выборов в Канаде, поскольку стратегическое голосование было настолько широко распространено и успешно, но любые данные, которые мы собираем, скорее всего, не будут связаны со структурой социальной сети. Возможно, можно вывести некоторые совокупные свойства сети (например, на основе региона), но это будет многоуровневая проблема.

Статья Барбары Уэбб « Могут ли роботы создавать хорошие модели биологического поведения » относится к несколько иной области, то есть к моделированию биологических организмов с помощью робототехники, например, к созданию искусственных тараканов.

Это блестящее теоретическое исследование моделирования с точки зрения эпистемологии и философии науки. По вашему вопросу возможно, что вы скептически относитесь к упомянутым в статье размерам 5 и 6, т.е. совпадению структурной точности и производительности.

С точки зрения структурной точности, например, если социальная сеть использует случайные графы, такие как Эрдёш-Реньи, она делает предположение, которое не соответствует фактическому распределению степеней человеческих социальных сетей.

С точки зрения соответствия производительности точность предсказания модели может оцениваться на различных уровнях точности. Например, модель может качественно «улавливать тенденции», чего может быть достаточно, а может и недостаточно для крупномасштабного моделирования.

С другой стороны, можно найти точные числовые прогнозы и проверить их соответствие реальным данным. Я думаю, что большинство моделей находится где-то посередине.