Почему в Google Scholar могут быть включены только некоторые статьи с конференции?

Почему некоторые публикации не включены в Google Scholar, а некоторые есть для той же конференции?

Например, есть ряд статей о Black Hat:

https://www.blackhat.com/docs/us-15/materials/us-15-Arnaboldi-Abusing-XSLT-For-Practical-Attacks-wp.pdf

https://www.blackhat.com/docs/us-15/materials/us-15-Evenchick-Breaking-Access-Controls-With-BLEKey-wp.pdf

Но когда вы ищете их, например, «Злоупотребление XSLT для практических атак» в Google Scholar, результата нет. Это документы 2015 года, с тех пор прошел год.

Кроме того, они соответствуют требованиям Google Scholar к включению: https://scholar.google.com/intl/en/scholar/inclusion.html .

Однако некоторые другие статьи на той же конференции (Black Hat USA 2015) включены в Google Scholar.

Итак, каковы реальные стандарты для включения публикаций и поиска в Google Scholar?

Google Scholar довольно хитрый - он использует сканер, который не курируется вручную. Меня не сильно удивит, если материал по разным причинам просто не будет подхвачен.
Ваш заголовок и общий вопрос уместны (например, почему некоторые публикации включены, а некоторые нет), но если вас действительно интересует только то, почему документы конференции Black Hat плохо индексируются Google Scholar, то вам следует спросить об этом в качестве конкретный вопрос. В противном случае информация о критериях включения Академии Google (на которую вы ссылаетесь) адекватно отвечает на ваш общий вопрос. Дело Black Hat — небольшое исключение. Однако, если Black Hat - это то, что вас действительно волнует, то, пожалуйста, сделайте это темой вашего вопроса, а не просто "примером".

Ответы (1)

Немного покопавшись, я обнаружил, что большинство статей о BlackHat 2015 не указаны в Google Scholar, и все статьи, которые я нашел в списке, цитировались в других газетах.

Тогда мне кажется вероятным, что это один из сайтов «серой зоны», которые Google Scholar не индексирует (статус BlackHat как научной конференции неясен), и, таким образом, любой материал, который вы найдете, добавляется в индекс Google Scholar через другие маршруты.

Что такое «другие пути»? Если у статьи есть цитата, будет ли она просканирована?
@WindChaser Google делает выводы о публикациях по цитатам, даже если не может найти исходный документ.
Если да, то как Google Scholar связывает найденный PDF-файл с записью публикации (у которой ранее не было PDF-файла)?
@WindChaser Я не инженер Google, поэтому я не знаю наверняка, но я предполагаю, что Google находит все PDF-файлы с остальной частью своего веб-сканирования, и его несложно связать, когда Scholar обнаруживает, что это научная публикация.