Я пытаюсь провести статистическое сравнение «самых популярных» фильмов по годам. То есть, я хотел бы посмотреть примерно 20-50 лучших фильмов за каждый год, возможно, с 1950 по 2010 год. Я проявляю гибкость в отношении точных деталей, но это должно дать представление о духе того, что я делаю.
Самый очевидный выбор, мне кажется, это кассовые сборы. Я нашел довольно подробные списки самых прибыльных в целом или лучших людей по годам ( 1 , 2 , 3 и т. д.). Тем не менее, для X лучших фильмов за год (где X не 1) лучшее, что я нашел, находится на IMDb , хотя они, похоже, имеют данные о кассовых сборах только примерно за 1971 год. Кроме того, я скептически отношусь к этому. надежность этих данных, поскольку IMDb имеет вики-компонент, и они утверждают, что кассовые сборы в любом случае не всегда точны . (Тем не менее, я готов согласиться на менее чем идеальную точность)
Я также подумал о том, чтобы найти несколько наград, которые существуют уже давно, и использовать лауреатов в качестве точек данных. Например, я мог бы использовать победителей (и, чтобы получить больше точек данных, возможно, также и номинантов) премии «Оскар» ( примерно с 1929 года ) или, поскольку я занимаюсь в первую очередь научной фантастикой, премии «Сатурн» ( к сожалению, только примерно с 1972 года ). Меня беспокоит то, что награды не обязательно отражают популярность, и я недостаточно знаю о кинонаградах, чтобы утверждать, что они являются хотя бы грубым приближением популярности. Кроме того, они не собираются предоставлять столько точек данных.
Существует ли какое-то современное состояние в этом отношении? То, что я ищу, принципиально невозможно?
РЕДАКТИРОВАТЬ: я изменил заголовок и внес некоторые изменения, чтобы было более понятно, что я не прошу списки. Моя цель — найти разумный способ утвердить популярность фильмов в разные исторические периоды. Наличие списков, подтверждающих применимость метрики, безусловно, было бы плюсом, но я вполне умею пользоваться поисковой системой.
РЕДАКТИРОВАТЬ 2: Просто для тех, кто в будущем будет выполнять те же поисковые запросы в Google, что и я, относительно авторитетного источника кассовых сборов фильмов: после разговора с несколькими учеными в области медиа-исследований существует общее согласие в том, что отраслевой журнал Variety является самым строгим местом для получения эти данные. Каждый год в одном из своих первых выпусков они перечисляют 250 самых кассовых фильмов прошлого года. Я не нашел хорошего открытого источника этих данных, но стандартная «хорошая» библиотека будет иметь это. (Сейчас я просматриваю тонны микрофильмов)
Я думаю, что тема сложная, сложная проблема. Не невозможно, но очень тяжело. И я не думаю, что какая-то одна метрика будет работать. Я подозреваю, что вам нужно будет просмотреть ряд различных типов метрик и найти среди них общие черты.
Кассовые сборы несовершенны, но важны. Но не используйте его без поправок на инфляцию. И в некоторых источниках могут быть более тонкие сигналы, которые также могут помочь, например, продолжительность жизни (например, как долго фильм продержался в кинотеатрах или насколько хорошо держались долгосрочные продажи в цифровом формате или на DVD).
Некоторые доступные рейтинговые шкалы также ценны. Как обсуждается здесь, рейтинги IMDB более надежны, чем большинство других. Являются ли рейтинги IMDB объективно достоверными? . Однако более надежный не означает очень надежный . Но стоит посмотреть не в последнюю очередь потому, что они охватывают многие старые фильмы, которые, как правило, упускаются из виду во многих опросах журналов «Голосуй за свой любимый фильм».
Также стоит обратить внимание на агрегированные шкалы, которые позволяют проводить сравнения из многих источников. «Гнилые помидоры» собирают мнения многих критиков (что может дать вам некоторое представление о том, насколько они не согласны, а также о том, каков их средний рейтинг). Все пользователи могут проголосовать там, чтобы у вас был готовый подсчет того, насколько критики согласны с любителями кино.
Я ожидаю, что не существует действительно надежного метода самого по себе. Но мне было бы интересно посмотреть, есть ли какие-то значимые общие сигналы, если сравнивать несколько источников. Однако это может быть серьезной статистической проблемой, которая потенциально того стоит.
Мясо
Джон Смит Факультативный
Джон Смит Факультативный
Каннолиопсида
Каннолиопсида
Наполеон Уилсон
Оливер_С