Плагиат с препринта статьи (из архива)

Недавно мы написали исследовательскую работу и разместили препринт на Arxiv, чтобы получить неофициальную экспертную оценку и повысить качество нашей статьи. До сих пор мы не представили эту статью ни на какую конференцию или журнал (она не опубликована), но мы заинтересованы в том, чтобы послать ее на конференцию.

Проверяя нашу статью на плагиат с помощью бесплатных сайтов, мы получили результаты, показывающие 83% плагиата по сравнению с версией, которую мы разместили на Arxiv. Другими словами, программное обеспечение говорит, что мы занимаемся плагиатом из нашей собственной работы. Мы также пытались удалить нашу статью из архива, чтобы избежать плагиата, но это невозможно. Означает ли это, что наша статья будет отклонена всеми конференциями? Что нам делать?

Я согласен с Крисом, но позвольте мне просто сказать, что, на мой взгляд, ваша публикация на arXiv действительно полезна , потому что она дает понять людям, откуда был взят материал.
Я не могу себе представить, чтобы любой, кто запустит проверку на плагаризм и получит такой результат, не увидит, что помечено, и не поймет, что это от тех же людей. Предполагая, что они не запрещают статьи, опубликованные в arXiv ранее (некоторые делают...), они привыкнут к таким вещам.
Предполагая, что вы цитируете свой препринт на Arxiv.
Не принимайте близко к сердцу. Программное обеспечение для обнаружения плагиата чрезвычайно плохо обнаруживает плагиат в математических работах. Он помечает совершенно невинные вещи, такие как «Пусть $G$ будет графом». как плагиат... Я работал в университете в Азии, который ввел обязательные проверки докторских диссертаций на плагиат, и у моего последнего аспиранта там были проблемы с этими проверками, несмотря на то, что в тексте были оригинальные результаты исследований...
@ Эндрю, к сожалению, некоторые редакции ленивы и просто запускают проверку схожести текстов в статье, не интерпретируя результаты. Программное обеспечение не может определить плагиат, только схожесть текста. Человек должен принять решение о том, является ли сходство текста плагиатом. Лучше всего цитировать статью arXiv.
Лучше всего цитировать статью arXiv . Что? Нет абсолютно никакой причины цитировать более раннюю версию той же статьи ! Если вы хотите обезопаситься от подобных вещей, правильная защита — это ссылка на более ранние версии — препринт arXiv, технический отчет, докторскую диссертацию или что-то еще — предпочтительно в сноске на титульном листе.
Вы говорите (it is unpublished), но это не совсем так. arXiv — это общедоступный форум, на котором любой представитель общественности может просмотреть вашу статью. Это и есть определение «опубликовано», если вы спросите меня. Я знаю, что академики постоянно используют такой язык, но это не имеет особого смысла.

Ответы (3)

Но при тестировании на плагиат с использованием бесплатных сайтов мы обнаружили, что результаты показывают 83% плагиата только из нашей статьи, которая размещена на Arxiv.

Два вопроса:

  1. Почему вы вообще проверяли свою работу на плагиат? Я представил около 50 статей и никогда не делал этого... отчасти потому, что я никогда не думал об этом, а отчасти потому, что я знаю, что не занимался плагиатом, потому что я написал статьи! Вы сомневались, занимались ли вы плагиатом или нет? Я не понимаю.

  2. Если я вас правильно понял, вы, кажется, обеспокоены тем, что детектор плагиата нашел вашу статью на Arxiv . Но это очень странно — статья не может плагиатить сама себя, и вы не первый и не десятитысячный человек, размещающий свой препринт на Arxiv. Почему это может быть проблемой?

Судя по тому, что вы сказали, удивительно, что вы получили только 83% плагиата. Я предполагаю, что причина того, что это не 100%, заключается в том, что вы внесли некоторые нетривиальные изменения в свою статью (и не упомянули об этом в своем вопросе). Хорошо, так что... Я рекомендую вам выложить обновленную версию на Arxiv. Затем детекторы плагиата либо выяснят, что происходит, либо сообщат, что вы на 100% плагиатили с препринта с теми же авторами и названием... головоломка, с которой должен справиться даже самый измученный редактор конференции.

Наконец, поскольку вопрос изначально был опубликован на Math Overflow, позвольте мне сказать, что в математике было бы абсурдно, если бы статья цитировала свой собственный препринт Arxiv. Если это на самом деле половинчатое стандартное соглашение в других областях, мне было бы очень интересно увидеть примеры.

Немного странно задавать вопросы в разделе ответов.
удивительно, что у вас получилось только 83% плагиата — это тоже может быть из-за уравнений. Средство проверки на плагиат, вероятно, рассматривает PDF-файл Arxiv, уравнения которого отличаются от их источника TeX (по крайней мере, для средства проверки на плагиат) или PDF-файл той же статьи, созданный с другим файлом стиля.

Ситуация как я понимаю:

  • Вы написали рукопись А и загрузили ее на arXiv. Вы не собираетесь публиковать рукопись А в журнале или на конференции.

  • Позже вы написали рукопись Б. Вы собираетесь представить Б на конференцию. Эта рукопись B показывает 83% совпадения с рукописью A.

Таким образом, вы опасаетесь проблем с публикацией рукописи Б.


Хотя оба являются вашей работой, существует потенциальный риск, что кто-то может подумать, что вы занимаетесь самоплагиатом. (Как если бы вы попытались опубликовать и А, и Б в журнале или на конференции, это могло бы стать реальной проблемой.) Чтобы избежать такого восприятия, вы должны четко определить статус А.

Вы можете сделать это через:

  • Добавление сноски на первую страницу документа А о том, что это проект/технический отчет/и т. д. и не предназначен для публикации. Вы также можете включить это примечание как «комментарий» в метаданные на arXiv.

  • Упоминание черновика А в статье Б, например: «Предварительная версия этих результатов с более подробными доказательствами доступна на arXiv». или что соответствует вашему контексту.

Выполнение любого из них должно быть достаточным, но выполнение обоих может добавить дополнительную безопасность.

(Предположим, что нет правил, согласно которым результаты не должны распространяться заранее для конференции, на которую вы подаете заявку. Но в математике это практически никогда не должно иметь место.)

Мое прочтение исходного вопроса состоит в том, что OP написала рукопись A, разместила ее в arXiv, а затем через некоторое время хочет представить редакцию A той же статьи на конференцию.
@JeffE Ответ, кажется, совпадает с вашим комментарием? Просто пусть B = A'

Что ты должен делать:

  1. Не беспокойтесь об этом.
  2. Когда вы загружаете свою статью на конференцию/журнал, включите статью arXive в свои цитаты.
  3. Напишите сопроводительное письмо председателю / редактору конференции, указав, что эта статья основана на работе, которую вы разместили в качестве препринта на arXive, и укажите, есть ли/что дополнительно в вашей заявке.
Нет, ссылаться на версию arXiv было бы совершенно абсурдно. Статья не должна цитировать себя.
Ссылаясь на себя? Я предполагаю, что статья, представляемая на рецензирование, не идентична статье на arXive, но содержит ту же общую идею. Если это одна и та же рукопись, то, конечно, пропустите № 2 и перейдите к № 3.
Суть arXiv заключается в том, чтобы сначала поместить статью туда, а затем отправить именно эту статью (по модулю некоторого форматирования) в журналы/конференции (а затем обновить статью, чтобы отразить комментарии рецензента, чтобы она соответствовала опубликованной статье).