Как и многие другие, я извлекаю данные из Google Scholar в рамках своего процесса обзора, чтобы иметь структурированный набор данных для метаанализа литературы.
Я заметил, что по паре многих тем, представляющих интерес, количество статей в год вроде бы увеличивается до 2017 года, а затем резко падает.
Интересно, действительно ли можно предположить, что в 2018 году было опубликовано меньше статей?
Возможно ли, что это означает, что данные за 2017 год являются относительно «полными», тогда как журналы и авторы за 2018 год все еще находятся в процессе добавления в индекс Google, поэтому общее количество занижено?
Кто-нибудь сталкивался с этим?
У Google Scholar есть свои сильные стороны (например, индексирование «серой» литературы, которой нет ни в одной обычной научной базе данных), но качество данных не входит в их число. Конечно, это не потому, что у Google нет возможности создать базу данных высокого качества; это скорее потому, что издатели отказываются предоставить ему разрешение на создание высококачественной базы данных, которую он распространяет бесплатно. Индекс Google основан на веб-пауке Google Scholar, полнота которого зависит от того, что доступно на общедоступных веб-сайтах (Google строго соблюдает разрешения веб-сайтов; он не пытается индексировать что-либо, если веб-сайты просят не делать этого с записью robots.txt). Я не удивлюсь, если некоторые издатели ограничат разрешение Google индексировать детали некоторых из своих последних публикаций.
С этой точки зрения, тогда для любой данной темы, если будет резкий спад в течение или после 2017 года (неясно, в каком случае это так, как вы сформулировали вопрос), я бы не считал это свидетельством чего-либо. То есть это не обязательно свидетельство того, что люди вдруг перестали публиковаться на эту тему; это только свидетельство того, что индекс Google больше не содержит эту тему по какой-либо причине. Я знаю, что видел довольно много статей с такими диаграммами и подобными заявлениями, но я не считаю такие утверждения надежными. (И когда я рецензирую статьи с такими утверждениями, я говорю об этом авторам.)
Чтобы сделать какое-либо конкретное, серьезное заявление об изменении моделей публикации тем, вам потребуется более строгий и систематический источник базы данных (такой как Web of Knowledge, Scopus и т. д.) и по крайней мере двухлетний лаг, чтобы убедиться, что все данные полные.
Вам может быть полезен этот ресурс с открытым доступом: Какие академические поисковые системы подходят для систематических обзоров или метаанализов? Оценка поисковых качеств Google Scholar, PubMed и 26 других ресурсов ( http://dx.doi.org/10.1002/jrsm.1378 )
пользователь48953094
Хак-Р