Есть ли примеры публикации ArXiv, поощряющей или предотвращающей плагиат?

В первую очередь речь идет о плагиате в смысле кражи идей. Плагиат с копированием и вставкой включен, но вряд ли произойдет в случаях, имеющих отношение к этому вопросу.

Рассматривая публикацию статьи перед рецензируемой публикацией на ArXiv (или другом сервере препринтов), обычно есть две основные позиции относительно возможной кражи идеи (или того, кто придумал ту же идею):

  • Если кому-то удастся опубликовать вашу идею в рецензируемом журнале раньше вас, вы можете доказать, что вы придумали эту идею первым или, по крайней мере, самостоятельно, если вы опубликовали свою статью на ArXiv. Поэтому рекомендуется публиковать статьи об ArXiv до того, как они будут опубликованы в рецензируемом журнале.
  • Если вы опубликуете свою статью на ArXiv до того, как она будет опубликована в рецензируемом журнале, другие могут украсть вашу работу и опубликовать ее с рецензированием до того, как вы это сделаете, и, таким образом, получить научный кредит. Нападать на таких людей сложно, поскольку ArXiv не рецензируется. Кто-то может зарабатывать на жизнь плагиатом документов ArXiv. Поэтому не стоит публиковать статьи об ArXiv до того, как они будут опубликованы в рецензируемом журнале.

Существуют ли какие-либо примеры (или даже исследования), подтверждающие любое из этих утверждений? Такие примеры могут включать, но не ограничиваться:

  • Был ли когда-нибудь рецензируемый журнал отозвал статью из-за плагиата статьи ArXiv?
  • Известны ли случаи «безнаказанного» плагиата статей ArXiv?
  • Кто-нибудь когда-нибудь успешно разрешал спор о приоритете с публикацией на ArXiv?
  • Кто-нибудь когда-либо обвинял кого-то в плагиате статьи ArXiv (с тем фактом, что плагиатная статья была опубликована на ArXiv, что повлияло на результат).

Обратите внимание, что это действительно примеры, а не теоретический анализ утверждений, которые я ищу. (Ни одна из этих двух позиций полностью не отражает мое мнение, и некоторые из неявных предпосылок¹ спорны. Однако обсуждение этих точек зрения на теоретической основе или нападки на некоторые из посылок обычно бесполезны.)


¹ например, что научная заслуга определяется только рецензируемой публикацией

Цитируя Говарда Эйкена: «Не беспокойтесь о том, что люди могут украсть ваши идеи. Если ваши идеи хоть сколько-нибудь хороши, вам придется впихивать их людям в глотки».
Полностью достойный награды. Если бы мы могли получить список примеров , есть большая вероятность, что это могло бы в конечном итоге превратиться в вопрос о витрине/акционере для сайта. :)
Третья позиция: раз никто не придумал примеров, просто выложи свой препринт в arxiv и не парься. ;-)
Кто-нибудь, у кого есть опыт работы с arxiv и академическими публикациями, когда-либо занимал вторую позицию? Я нахожу это совершенно иррациональным. Как вы можете зарабатывать на жизнь, воруя общедоступный контент с временными метками...
@SashoNikolov: я слышал, как профессора (из областей, которые обслуживает ArXiv) делают это заявление (не то чтобы я его поддерживаю). Я думаю, что это должно быть достаточной причиной, чтобы мотивировать этот вопрос. Также помните, что вы можете считать, что этот вопрос, оставшийся по существу без ответа, сам по себе является заслуживающим внимания свидетельством.
@Wrzlprmft Я не уверен, о чем говорят эти доказательства. В любом случае, это редкие события, и я сомневаюсь, что они когда-либо были хорошо задокументированы редакторами журналов, по крайней мере, публично. Если трудно найти случаи плагиата arxiv papers, я думаю, это говорит о том, что система работает, сдерживая плагиат или останавливая споры о приоритетах на ранних стадиях. Конечно, есть много случаев, когда «независимая работа» устанавливается по архивным датам, как это предлагается в ответах.

Ответы (5)

Если вы опубликуете свою статью на ArXiv до того, как она будет опубликована в рецензируемом журнале, другие могут украсть вашу работу и опубликовать ее с рецензированием до того, как вы это сделаете, и, таким образом, получить научный кредит. Нападать на таких людей сложно, поскольку ArXiv не рецензируется.

Это предполагает, что рецензируемые публикации определяют научный авторитет, что может быть верно в некоторых областях, но не является универсальным. В математике это вообще не имеет отношения к присвоению кредита. Рецензируемые статьи, конечно, проверяются более тщательно, но они не дают вам никакого дополнительного интеллектуального кредита, так что эта трудность даже не возникает. (В частности, для присвоения кредита статья arXiv превосходит опубликованную статью с нетривиально более поздней датой подачи.)

Например, отзывал ли рецензируемый журнал статью из-за плагиата статьи ArXiv? Или известны случаи «безнаказанного» плагиата статей ArXiv?

На этот вопрос сложно ответить, потому что как вы могли сказать? Если плагиатор не копирует текст, а просто берет идеи, то доказать, что что-то было украдено, практически невозможно.

В математике это работает так. Если кто-то публично распространяет статью, то есть короткое окно, в течение которого люди, независимо сделавшие одно и то же открытие, имеют шанс объявить об этом факте и заявить о своей доле. Они должны сделать это более или менее сразу после того, как узнают об этом.

Напротив, если прошло слишком много времени, то сообщество не считает это одновременным открытием, а, в лучшем случае, повторным открытием чего-то, что уже было известно (что дает гораздо меньше доверия тому, кто открыл заново). Нет четкого ограничения по времени, но я вижу его следующим образом: через несколько дней — это определенно нормально, через несколько недель — может быть, через несколько месяцев — вообще ненормально, через год — определенно не ок.

Самая большая слабость этой системы в том, что есть окно, в котором можно украсть чьи-то идеи и заявить, что вы придумали их самостоятельно. Это, безусловно, редкость (действительно, заявления о независимом открытии необычны, независимо от того, верны они или ложны), но трудно точно знать, насколько это редкость, из-за сложности доказательства плагиата идей. Большинство заявлений о независимых открытиях, очевидно, верны (потому что есть рукопись, которая не могла быть написана так быстро, или есть история переговоров или дискуссий с другими исследователями, или есть нетривиальные вариации идей и приложений), но каждый раз через какое-то время кто-то делает такое заявление без явных доказательств.

Даже когда документации не так много, я склонен верить утверждениям о независимом открытии. Подделка этого требует много наглости и усилий, это не то, что вам может сойти с рук неоднократно, и это неловкая ситуация, в которую вы не хотели бы попадать без необходимости, поэтому кажется разумным дать людям презумпцию невиновности.

На практике я не думаю, что реальная опасность представляет собой прямую кражу, когда кто-то, кто вообще не работал над этой темой, замечает новую статью и говорит: «Выглядит красиво! Думаю, я ее украду». Наоборот, наиболее тревожной является ситуация, когда кто-то на самом деле работает над похожими идеями, но еще не закончил проработку деталей. Когда они видят статью, они сразу же узнают некоторые из своих идей, а остальные детали кажутся настолько естественными, что они говорят: «Да, это именно то, что я имел в виду. Эта статья просто конкретизирует мои идеи». Они искренне верят, что практически завершили эту работу, тогда как могли продвинуться несколько дальше, чем думали. Здесь есть целый континуум, от людей, которые в основном правы в своих убеждениях, до тех, кто совершенно неправ, и это

Конечно, я понятия не имею, как часто кто-то заявляет о независимом открытии, основанном на преувеличенных убеждениях (опять же, это в основном недоказуемо), но я полагаю, что иногда это случается. Это, конечно, прискорбно, если это имеет место, но это не так страшно, как откровенное воровство. В худшем случае приходится делить заслуги с кем-то, кто менее достоин.

Хотя это очень хороший ответ, он как бы отвечает на другой вопрос — см. мое редактирование вопроса.
@Мартин: Спасибо! Wrzlprmft: Хорошо, я не привожу конкретных примеров, но думаю, что будет сложно привести хорошие примеры.

В вашем вопросе есть сложные части, но легко найти примеры, когда публикация в arXiv действительно устанавливала приоритет. На самом деле, вы можете открыть случайные опубликованные статьи и обнаружить, что приличная часть из них цитирует препринты arXiv (я нашел один со второй случайной попытки ).

Приведу известный пример: Григорий Перельман публиковал свои новаторские статьи только на arXiv, и его заслуга в том, что ему предлагали Филдсовскую медаль и премию Клэя в один миллион долларов (как известно, он отказался от них обоих). ).

Эти статьи рассматривались сообществом в течение нескольких лет, что привело к появлению нескольких наборов заметок от разных групп математиков, все из которых, конечно же, благодарили Перельмана за решение геометризации и гипотез Пуанкаре; некоторые из этих заметок, содержащие разъяснения, детали или альтернативные доказательства части работы Перельмана, были опубликованы, иногда в ведущих журналах. В этой части также приводится интересный пример онлайн-публикации (на веб-странице, а не на arXiv, но, похоже, уместно), создающей прецедент, см. следующую опечатку .. Короче говоря, авторы опубликованной статьи написали опечатку, чтобы признать, что они не смогли должным образом процитировать препринт, который был только распространен в Интернете и официально не опубликован, в то время как они использовали некоторые идеи, содержащиеся в нем. Ожидается, что именно так любой разумный журнал и авторы будут относиться к таким случаям, по крайней мере, в области математики.

Обратите внимание: хотя ваш ответ заставил меня заметить, что я слишком широко сформулировал один из моих примеров, это, по моему мнению, не делает ваш ответ недействительным.
Похожая история, хотя и менее гламурная, связана с работой Алекса Постникова над абсолютно позитивным грассманианом. Единственная статья представляет собой неполный препринт, опубликованный на arXiv. Некоторые из ненаписанных глав были завершены другими авторами и опубликованы в очень хороших журналах.

По словам Стивена Дж. Бланделла (в книге «Сверхпроводимость: очень краткое введение »), приоритет и плагиат были именно той причиной, по которой люди начали распространять и индексировать препринты в Интернете.

Был ли когда-нибудь рецензируемый журнал отозвал статью из-за плагиата статьи ArXiv?

Вот пример для этого:

Статья А была отозвана, так как она является плагиатом статьи Б , ранее появившейся в arxiv. Документ B был отправлен в архив 7 мая 2018 г. и представлен в Physical Review D 9 мая 2018 г. Документ A был представлен в секцию A ядерных инструментов и методов физических исследований 8 мая 2018 г.

На этой временной шкале показано, что документ А должен был быть плагиатом из архивной версии документа Б и сделать это до того, как документ Б был отправлен на рецензирование. Предположительно, временная метка arxiv помогла открыть и закрыть дело о плагиате, хотя могли быть доступны и другие способы доказательства.

Этот пример был найден при просмотре записей Retraction Watch , связанных с физикой высоких энергий (одной из старейших и наиболее плодотворных областей, где используется arxiv). Второстепенный вывод из этого упражнения состоит в том, что в этой области редки случаи отказа от публикации из-за плагиата.

Я нашел эту ссылку. Кажется, у самого arXiv есть политика против плагиата.

Также в документе описывается «широкомасштабное применение методов обнаружения плагиата и самоплагиата в коллекциях исследовательских документов». под названием «Обнаружение плагиата в arXiv».

Если я не сильно ошибаюсь, оба источника говорят о плагиате контента, который был размещен на ArXiv, а не о публикациях, которые плагиатят публикации ArXiv.