Когда поставщики наборов данных стали обычным делом просить пользователей цитировать их статьи?

В настоящее время поставщики наборов данных обычно просят пользователей наборов данных цитировать их документы, представляющие набор данных. Когда эта практика стала общепринятой?


(Учитывая то, что я прочитал на этой странице, я чувствую необходимость подчеркнуть, что я не собираюсь начинать дискуссию о полезности таких цитат.)

С каких это пор стало обычным писать статьи на основе чужого набора данных?
@keshlam Поскольку люди делятся наборами данных?
В таком случае мой ответ будет таким же. Если кто-то внес большой вклад в вашу статью, вы должны признать его... и вы должны дать своим читателям возможность отследить данные, если в них было что-то необычное. Кредит или цитата кажутся очевидными способами сделать это. Я не уверен, почему вы считаете, что этого не было бы сделано в прошлом; я бы подумал, что это просто «лучшая практика».
@keshlam Мне любопытно.
Ваш вопрос совершенно не ясен; не могли бы вы уточнить, что вы ищете? Вы спрашиваете, с каких пор следует цитировать наборы данных? Вы спрашиваете, с каких пор авторы наборов данных прямо просили, чтобы их цитировали? Под «цитированием наборов данных» вы конкретно спрашиваете о ссылке на документы, описывающие наборы данных, или о предоставлении какой-либо атрибуции для наборов данных? Если вы ссылаетесь на статьи, вы спрашиваете об авторах наборов данных, указывающих на конкретную статью, которая, по их мнению, наиболее предпочтительна для представления набора данных, или о цитировании какой-либо из статей, в которых упоминается набор данных?
@ORMapper Я спрашиваю, с каких пор поставщики наборов данных просят пользователей цитировать свои статьи, представляющие набор данных, то есть одну или несколько конкретных статей, которые, по мнению поставщика набора данных, наиболее предпочтительно представлять набор данных.
Одна из причин, по которой люди реагируют на этот вопрос не так, как вы ожидали, заключается в том, что любое предложение, начинающееся с «С каких пор…», обычно интерпретируется несколько конфронтационным образом (по сравнению с нейтральной формулировкой, которую ДжеффИ отредактировал в вопросе).
@TobiasKildetoft Хороший вопрос, спасибо, вопрос отредактирован, не стесняйтесь редактировать дальше.
Теперь гораздо лучше. Теперь ясно, что речь идет о сроках, а не о передовом опыте.
Вопрос к ОП: акцент в вашем вопросе делается на «проблеме», что авторы набора данных просят цитировать определенную статью вместо самого набора данных ? Или, скорее, вы заинтересованы в том, чтобы с тех пор они вообще просили получить какой-либо тип цитирования?
@DCTLib Меня интересует, с каких пор они вообще просят цитировать.

Ответы (1)

Я не вижу логического различия в цитировании используемых алгоритмов и наборов данных. Оба кажутся совершенно естественными, чтобы их цитировали. Оба являются неотъемлемой частью результатов, о которых вы сообщаете в статье, и, следовательно, должны быть атрибутированы.

Вы, вероятно, думаете о документах по машинному обучению, где обычно новый метод должен быть протестирован на большом количестве наборов данных. Хотя может показаться излишним цитировать каждый использованный набор данных, давайте не будем забывать, что тот, кто предоставил эти данные, также приложил усилия и заслуживает похвалы за это. Опять же, это не сильно отличается от цитирования конкурирующих алгоритмов, с которыми вы сравниваете.

Пакеты (академического) программного обеспечения также должны цитироваться или, по крайней мере, упоминаться, когда они используются. На самом деле это не ново, например, старая лицензия BSD из 4 пунктов по сути требовала того же.

«Я не вижу логического различия в цитировании использованных алгоритмов и наборов данных. И то, и другое кажется совершенно естественным для цитирования». - и еще софт часто не приводится. Эта статья , например, содержит частые упоминания о Microsoft Word , и все же в библиографии полностью отсутствует ссылка на что-то вроде «Microsoft Corp. Microsoft Word. <URL>». Это аналогично простому упоминанию имени набора данных, а не фактическому цитированию его в качестве библиографической ссылки.
@ORMapper Я знаю, что это происходит часто, но, на мой взгляд, и то, и другое - плохая практика.
Я полностью согласен. Просто этот ответ (а также некоторые комментарии к вопросу) звучит так, как будто мы должны были объяснить ОП, почему следует цитировать наборы данных (и программное обеспечение и т. д.) (что может быть или не быть необходимым для объяснения ), в то время как на явно заданный вопрос, когда поставщики наборов данных начали явно предлагать определенные статьи по набору данных для цитирования , на самом деле нет ответа.
@ORMapper, насколько я знаю, когда нет , это всегда было правильно. Я думаю, именно поэтому комментарии и мой ответ такие, какие они есть.
Опять же, вопрос в том виде, в котором он написан, заключается не в том, когда это стало правильным делать, а в том, когда стало обычной практикой явно писать что-то вроде «Если вы используете этот набор данных, пожалуйста, цитируйте статью XYZ». на веб-сайте, откуда можно получить набор данных, а не полагаться на то, что авторы поступят правильно. Делали ли это самые первые авторы, публикующие наборы данных? Или они были полностью довольны тем, что предоставили сообществу эту новую услугу, предоставив набор данных, тогда как идея о том, что вы можете активно запрашивать цитату, возникла только позже?
Поскольку набор данных Fisher's Iris имел сопроводительный документ, я думаю, что всегда было довольно часто цитировать данные. Я считаю, что Iris — один из первых наборов данных, которые активно используются повторно. Даже если в прошлом об этом прямо не спрашивали, атрибуция источника всегда была важна в академическом письме.
Поскольку мы, кажется, по-разному интерпретируем вопрос, я попросил ОП дать разъяснения в комментарии.
Да, мне любопытно узнать, когда поставщики наборов данных начали явно просить, чтобы их цитировали.
Вскоре после того, как кто-то был достаточно груб, чтобы использовать данные, которые они должны были зачислить, не делая этого, я полагаю. Если вы хотите знать, когда это стало обычным явлением в определенной области, я предлагаю вам изучить литературу и сообщить нам... или выяснить, в какой области уже проводилось такое исследование, и выполнить поиск литературы в ней. .