Сколько людей читают отдельную журнальную статью?

Общий фон

Некоторое время назад я читал запись в блоге, где обсуждалось, сколько людей читают журнальные статьи . Я думаю, что такая оценка важна при попытке оценить влияние исследований на общество. Однако, в то время как интернет-сайты легко отслеживают использование. Такую информацию немного сложнее получить, когда речь идет о читательской аудитории конкретной журнальной статьи.

Первоначальные идеи

  • Статьи различаются : Очевидно, журнальные статьи различаются по многим параметрам, и, как и в случае с подсчетом цитирования, читательская аудитория, вероятно, будет сильно искажена, возможно, что-то вроде функции мощности. В дополнение к академическому влиянию, предположительно статьи, которые доступны бесплатно в Интернете, читают больше.
  • Время с момента публикации : количество прочтений со временем увеличивается, но уровень читательской аудитории предположительно меняется со временем (возможно, всплеск при первоначальном выпуске, а затем постепенное снижение по мере исчезновения актуальности).
  • Определения чтения различаются : количество прочтений также будет увеличиваться или уменьшаться в зависимости от того, как определяется чтение. В нижней части находится взгляд на аннотацию. В конце внимательно прочитать всю статью. Я был бы счастлив с рабочим определением, которое включало бы чтение по крайней мере двух страниц.

Исходные данные

  • Статистика статей PlosOne : очень приблизительный показатель показывает, что среднее количество просмотров статьи составляет около 800 в год.
  • Journal of Vision : в этой статье приводится некоторая статистика загрузок: «В последнем отчете за июль 2008 г. каждая из пяти лучших статей была загружена от 1 993 до 3 478 раз».
  • В некоторых журналах указано количество подписок.

Начальная догадка

Я считаю полезным иметь приблизительную оценку этих вещей. Мое собственное первоначальное предположение, основанное на минимальных данных, состоит в том, что читательская аудитория в 50-1000 раз превышает число цитирований статьи. Привязка оценки к количеству цитирований облегчает оценку для данной статьи и должна учитывать такие эффекты, как время и престиж журнала.

Вопрос

  • Как правильно оценить количество людей, прочитавших данную журнальную статью?
  • Какие данные и источники информации подтверждают эту оценку?
  • Есть ли авторитетная литература, которая может дать такую ​​оценку?
Я хотел бы знать хороший ответ на этот вопрос (с вариациями, основанными на разных определениях чтения и т. д.). Я думаю, что оценка в 50-1000 раз больше числа цитирований — это далеко не так, по крайней мере, когда вы получаете более чем несколько цитирований. Например, существует множество статей с 200 цитированиями в областях, у которых просто нет 10 000 вероятных читателей. Для журналов PLoS представляется приемлемым приближение, если вы считаете каждый просмотр страницы отдельным читателем, но это переоценивает читателей и является исключительно допустимым способом подсчета чтения.
Один аргумент в пользу моей приблизительной оценки: скажем, среднее число прочтений для 6-летнего PLOS одной статьи составляет 5000, а среднее количество цитирований равно 10, это приводит к оценке в 500 прочтений на цитирование. Я знаю, что это всего лишь предварительная оценка, но мне она кажется правдоподобной. Я согласен с тем, что PlosOne разрешает, но он также, по-видимому, упускает из виду многие аспекты (например, неформальный обмен журнальными статьями, доступ с веб-страницы академика, синдикация, обмен студенческими пакетами для чтения и т. д.)
Я знаю, что некоторые журналы Springer публикуют загрузки статей за последние несколько недель/месяцев, например , см. JQC . Потенциально более актуальная мера, но ее трудно включить в другие метрики, которые вы упомянули. Самая загрузка статьи за последние 3 месяца (на момент исправления этого комментария) имеет 885 загрузок и цитируется 30 раз (хотя статье уже более 3 лет).
Просмотры страниц должны переоценивать читательскую аудиторию: многие люди открывают страницу, просто взглянув на нее во время поиска в Интернете, и каждый фактический читатель, вероятно, просматривает ее несколько раз. Данные PLoS могут быть лучшими из тех, что у нас есть, и они, безусловно, интересны, но у меня возникли проблемы с согласованием их с моими собственными документами. При 500 читателях на одну цитату просто не хватило бы возможных читателей в мире, чтобы учесть цитаты. Например, общее число математиков, активно занимающихся исследованиями, во всем мире, вероятно, составляет несколько десятков тысяч, и лишь небольшая их часть читала мои статьи.
Один из ключевых вопросов заключается в том, каково соотношение между количеством статей, которые вы читаете, и количеством, которое вы цитируете. Это явно не 500 (если только вы не читаете постоянно и почти не цитируете), и даже 50 кажутся неправдоподобно высокими: если вы цитируете всего 20 статей в год, что не очень много, вы будете читать 1000 статей в год. Таким образом, единственный реальный способ достичь среднего отношения 50+ — это включить в него огромное количество читателей, которые не цитируют, и маловероятно, что они будут законными читателями, понимающими статью.
@AnonymousMathematician Я могу вспомнить многих студентов, выпускников и людей за пределами академических кругов, которые прочитали 50, 100, 500 или более статей, но никогда ничего не публиковали, кроме, может быть, диссертации. По мере того, как вы поднимаетесь по цепочке академического опыта, население становится меньше, а количество прочитанных статей увеличивается, но я полагаю, что те, кто имеет более низкий академический опыт, все равно добавят много к количеству читателей. Я согласен, что было бы полезно иметь разные подсчеты в зависимости от типа читателя.
Стандартная шутка заключается в том, что большинство журнальных статей читаются не более двух раз: не более одного раза автором и не более одного раза тремя рецензентами.
@JeffE, тогда газету прочитали бы четыре раза? :)
Нет, всего дважды. (Это часть шутки.)
По поводу «Время после публикации»: Должен быть курс, использующий одну из моих статей, так как каждый год примерно в одно и то же время количество полнотекстовых загрузок увеличивается примерно в 10 раз.

Ответы (2)

Похоже на проблему Ферми :)

Вопрос, который я недавно задал себе, основываясь на многих случаях плагиата со стороны ведущих политиков Германии в области гуманитарных наук, заключался в том, что в гуманитарных науках публикуется больше статей/текстов, чем ученые могут прочитать полностью. Количество скопированного текста в одной докторской диссертации, показанное такими сообществами по обнаружению плагиата в Германии, как Vroniplag или Guttenplag , меня шокирует. Часто 50% текста неправильно помечены как цитата. Даже руководители местных университетов выглядят так, будто некоторые из этих диссертаций никогда полностью не читали. Я очень надеюсь, что это не репрезентативно, но боюсь, что это может быть верхушка айсберга в гуманитарных науках (в Германии).

Лично я, придя и работая в STEM-сфере, сделал очень специализированную диссертацию, зачастую в мире меньше десятка групп, работающих над такой узкоспециализированной темой (вопрос научной конкуренции/поиска ниши, времени, опыта и лабораторного оборудования). в таких сферах). Таким образом, будут статьи в рецензируемых журналах, которые на самом деле не интересны более чем 20-50 исследователям и, возможно, такому же количеству отраслевых исследователей по всему миру в области STEM.(конкуренция между компаниями и исследовательскими группами не сильно отличается из-за экономических ограничений). Без современных поисковых систем большинству людей, не являющихся учеными или частными лицами, было бы трудно найти такие статьи. Это еще один пункт в вашей оценке. Количество читателей журналов о природе/науке и очень специализированных журналов сильно различается, я не думаю, что какое-то среднее число действительно вам сильно поможет или это интересно. Если вы знаете свою специализированную область, вы должны довольно быстро заметить, изучая некоторые журналы, сколько ученых действительно интересуются этой областью.

Ваша ссылка PlosOne интересна. Я могу немного подтвердить это, чтобы дать вам, по крайней мере, приблизительную величину порядка того, что читатель считает ведущими, специализированными, ... журналами. Я считаю вполне нормальным читать статьи не полностью (даже если вы их цитируете), но я внимательно просматриваю скачанные мной статьи, часто из-за того, что я использую много ключевых слов и операторов гугла, чтобы действительно отфильтровать то, что я ищу. Это то, что также сильно различается между разными учеными/студентами. Меня часто шокирует то, как студенты пользуются поисковыми системами, если это лень или незнание поисковых операторов. Это может сэкономить вам много времени на чтение. Поэтому я думаю, что экстраполированное количество читателей, основанное на коэффициенте цитирования, может быть более репрезентативным и надежным, чем использование просмотров/загрузок сайта.из-за того, что ученые, частные лица, неспециалисты часто загружают статьи с информацией, которую они не искали из-за плохого использования поисковой системы. Еще одним фактором здесь является растущая избыточность/плагиат.

Некоторые возможные эвристики:

  • сравнение опубликованных статей в месяц и посетителей веб-сайта/интерфейса в месяц на таких платформах загрузки, как PlosOne, arxiv, nature.

arxiv имеет около 6000 опубликованных статей в месяц , 100000 уникальных посещений , 12,4 миллиона загрузок академическими учреждениями, всего 50 миллионов статей по сравнению с 12x6000 статей . Конечно, это не учитывает статьи, не опубликованные в этом году, поэтому среднее количество прочитанных одной статьи в архиве, вероятно, ниже 170 и более, что соответствует отметке 20-50, о которой я говорил выше. Но здесь у вас есть ИМО разумный и вполне объективный минимум и максимум для научной статьи, которая действительно интересует других ученых, 50-170

у природы 900 000 уникальных посещений в месяц, около 200 статей в месяц, поэтому вы понимаете, почему статья, опубликованная в природе, вероятно, стоит больше, чем 10 статей в arxiv, PlosOne или многих других специализированных журналах в отдельной отрасли, даже если они равны пересмотрел ;)

  • поиск библиографии какой-либо докторской диссертации в вашей области в вашем местном университете, количество цитируемых статей в STEM часто находится в диапазоне 50-200 (вы видите, даже здесь сильно различается то, что один аспирант будет / должен читать). Конечно, вы не цитируете все статьи, которые читаете, но коэффициент не должен быть выше 2 между (или использование вашей поисковой системы имхо неоптимально) цитируемыми и прочитанными статьями. Учитывая, что аспирант опубликует 3-5 (разумное количество в STEM или 1 статью о природе :) ) статей во время своей докторской работы и умножив 3-5 * 20-50 (среднее количество прочитанных институциональными учеными), вы также получите количество статей в библиографии кандидатской диссертации 50-200. Чистый шанс?! Выглядит как странный расчет, но существует связь между тем, сколько статьи требуется среднему ученому, и тем, сколько результатов он создает (вот почему я умножаю оба значения), и это подтверждает мой опыт/анализ выше, что 10-100 читателей — это разумная величина порядка для людей, очень интересует одна средняя статья. Для меня это не похоже на чистую случайность, но это главная проблема с вопросами и ответами Ферми :)

PS: обратите внимание, что этот анализ сосредоточен на STEM, я считаю, что среднее количество прочтений намного ниже в гуманитарных науках, а побочные эффекты, такие как разные языки и плагиат, похоже, играют большую роль, чтобы сделать действительно объективную оценку.

Smithsonian.com недавно отметил, что ежегодно в 28 000 журналов публикуется около 1,8 миллиона научных статей и статей. Около половины из них не читал никто, кроме автора, редактора журнала и пары рецензентов. Они сообщают, что 90 процентов никогда не цитируются другими газетами.

@RGardner Есть ссылка на эту статью. Мне было бы любопытно узнать, какие методы использовались для оценки читательской аудитории. Я также думаю, что цитирование — это в основном игра с нулевой суммой. Наконец, я полагаю, что читательская аудитория связана с авторитетностью журнала. Например, в целом при оценке средней читательской аудитории меня больше интересовала бы фильтрация, например, по журналам выше определенного порога (например, импакт-фактор выше 0,5 или 1,0).
@JeromyAnglim Я добавил ссылку. Пожалуйста, дайте мне знать, если у вас возникли проблемы с чтением этой страницы.
Спасибо за ссылку. Утверждение, кажется, исходит от Мехо «подъем и подъем анализа цитирования», в котором говорится: «Действительно, целых 50% статей никогда не читаются кем-либо, кроме их авторов, рецензентов и редакторов журналов. Мы знаем это благодаря анализу цитирования, отрасли информатики, в которой исследователи изучают, как статьи в научной области доступны и на них ссылаются другие». Однако я не понимаю, как отсутствие цитирования показывает, что статью не читали другие.
Как упомянул @JeromyAnglim, заявление было сделано в статье Локмана Мехо, хотя сам Мехо на самом деле этого не писал; он был добавлен редактором без, кажется, большого количества доказательств: blogs.lse.ac.uk/impactofsocialsciences/2014/04/23/…