Как бороться с самоплагиатом или повторной публикацией предыдущей работы в обзоре литературы?

Я пишу систематический обзор литературы, и проблема в том, что в моей теме есть несколько случаев перепубликации предыдущих работ или самоплагиата: одни и те же авторы пишут несколько (2-3) статей на одну и ту же тему почти без изменений. Интересно, как с этим бороться. Я рассматриваю теоретические модели, поэтому я не могу просто решить, описываются ли в статье одни и те же или разные эксперименты. Дублированные документы обычно отличаются некоторыми незначительными особенностями. Я хотел бы построить график того, как моя выбранная тема развивалась во времени, нанося различные статьи и их цитаты, а также какая модель была основана на какой предыдущей. Но я не знаю, как быть с такими дубликатами документов. Объединить их в единое, первая бумага? Построить их все как производные модели? Или, может быть, я должен как-то графически пометить бумаги, которые описывают одно и то же содержание?

Все эти «лишние» статьи цитируются в других? Если да, то это не самоплагиат. Или они все пишутся как "первые" статьи?
@ Баффи Я не хочу вступать здесь в дискуссию о том, что такое самоплагиат, а что нет. Что меня беспокоит, так это то, что содержание этих бумаг почти одинаково, и я не знаю, что с ними делать. Если у вас есть лучшая номенклатура для таких случаев, то я поправлю свой вопрос.
Их цитировали? Это все, о чем я прошу. Содержание может быть очень похожим, когда одна статья расширяет или модифицирует другую. Но это только самоплагиат, если другие статьи не цитируются. Если они были процитированы, ваш лучший ответ — перечислить их, как и любые другие документы. Поступать иначе — значит выдвигать обвинение, которое может быть несправедливым.
@ Баффи иногда цитируют друг друга, иногда нет. Меня не интересуют обвинения, но я опасаюсь, что если я пропущу эти дубликаты, то не упущу никаких новых идей. Они просто избыточны.
Но, возможно, вы правы в том, что пропустить их было бы неправильно. А как насчет их объединения?
Это не сходство или повторное использование модели, которая делает ее самоплагиатом. Это отсутствие цитирования более ранних работ. Если они это сделали, то у вас нет никаких проблем, и вы должны относиться к ним как обычно. Цитирование - не сходство. Если читателю более поздних статей указать на более ранние, то все в порядке.
@Buffy Я отредактировал свой вопрос, чтобы указать, что я хочу знать, как бороться как с самоплагиатом, так и с повторной публикацией предыдущих работ.
«Я не могу просто решить, описываются ли в статье одни и те же или разные эксперименты». Вы намекаете, что не совсем понимаете документы?
Если авторы расплывчаты и не публикуют все уравнения или значения параметров, используемых в модели, что, к сожалению, довольно часто, то я не могу сказать, что я на 100% уверен, что обе статьи описывают одни и те же результаты.
Мой совет остается прежним. Если вы относитесь к этим бумагам не так, как к другим, вы находитесь на шаткой и, возможно, опасной почве. Вы не можете принимать решения, основываясь на том, чего не понимаете.
Дублирование публикации может быть неправомерным поведением, даже если это не плагиат, потому что дублирование публикации — пустая трата ресурсов.

Ответы (2)

Поскольку вы не хотите затрагивать вопрос дублирования или многократной публикации (я предпочитаю эти термины; мне не нравится сомнительное понятие «самоплагиат»), я сосредоточусь только на вопросе рассмотрения существования таких работ в литературе. кроме выбора игнорировать некоторые из публикаций.

То, что вы описываете, похоже на проблему, возникающую при метаанализе (статистическом подходе к обзорам литературы). Чтобы статистические данные, лежащие в основе метаанализа, работали, важным статистическим допущением является то, что каждая анализируемая публикация независима друг от друга, так что каждая публикация считается отдельным доказательством. Но это предположение нарушается, если два или более исследований проводились с одним и тем же набором данных (в которых может участвовать одна и та же группа авторов, но не обязательно, особенно если набор данных общедоступен). Существуют разные способы решения возникающих статистических проблем, но обычно они включают в себя присвоение каждому из ненезависимых исследований более низкого веса, чтобы в целом они имели примерно такой же вес в общем мета-анализе, как и любое отдельное независимое исследование.

Следуя этому принципу, если у вас есть случай ненезависимых исследований (то есть ваш случай дублирующих публикаций), вы можете каким-то образом взвесить их как одно исследование. Я не могу рекомендовать, как лучше всего это сделать, не зная подробно характера вашего исследования, характера дублирования, степени дублирования и т. д. Вам нужно будет рассмотреть вашу конкретную ситуацию, а затем решить, как лучше всего представить эти дубликаты публикаций. как одна точка данных (будь то среднее значение результатов, первая публикация, последняя публикация, наиболее цитируемый результат или любое другое представление, которое вы считаете наиболее подходящим).

В вашем окончательном анализе может быть хорошей идеей представить и сравнить два набора результатов, как это иногда делается в мета-анализе: один набор рассматривает каждый дубликат как независимое исследование, а затем другой анализ использует выбранный вами подход агрегирования для группировки. все дубликаты как одно доказательство. Таким образом, вы могли бы увидеть, существенно ли дублирующиеся публикации влияют на общее свидетельство или нет, что очень ценно.

Я хотел бы построить график того, как моя выбранная тема развивалась во времени, нанося различные статьи и их цитаты, а также какая модель была основана на какой предыдущей.

Я думаю, что ответ на ваш вопрос на самом деле не решит вашу проблему. Публикации и цитаты не описывают, как развивалось исследование. Вместо этого я предлагаю построить график того, как результаты исследования менялись с течением времени.

Классический пример: https://www.nrel.gov/pv/cell-efficiency.html.

Такой подход позволит избежать проблемы дублирования публикации.

Этот тип графика возможен, если у вас есть одна единственная мера, используемая и разработанная во всех исследовательских работах. Это невозможно в моей области, которая только начинает развиваться, и каждая статья задает немного другой вопрос. Но я думаю, что это лучший подход, если только это возможно.