Я пишу систематический обзор литературы, и проблема в том, что в моей теме есть несколько случаев перепубликации предыдущих работ или самоплагиата: одни и те же авторы пишут несколько (2-3) статей на одну и ту же тему почти без изменений. Интересно, как с этим бороться. Я рассматриваю теоретические модели, поэтому я не могу просто решить, описываются ли в статье одни и те же или разные эксперименты. Дублированные документы обычно отличаются некоторыми незначительными особенностями. Я хотел бы построить график того, как моя выбранная тема развивалась во времени, нанося различные статьи и их цитаты, а также какая модель была основана на какой предыдущей. Но я не знаю, как быть с такими дубликатами документов. Объединить их в единое, первая бумага? Построить их все как производные модели? Или, может быть, я должен как-то графически пометить бумаги, которые описывают одно и то же содержание?
Поскольку вы не хотите затрагивать вопрос дублирования или многократной публикации (я предпочитаю эти термины; мне не нравится сомнительное понятие «самоплагиат»), я сосредоточусь только на вопросе рассмотрения существования таких работ в литературе. кроме выбора игнорировать некоторые из публикаций.
То, что вы описываете, похоже на проблему, возникающую при метаанализе (статистическом подходе к обзорам литературы). Чтобы статистические данные, лежащие в основе метаанализа, работали, важным статистическим допущением является то, что каждая анализируемая публикация независима друг от друга, так что каждая публикация считается отдельным доказательством. Но это предположение нарушается, если два или более исследований проводились с одним и тем же набором данных (в которых может участвовать одна и та же группа авторов, но не обязательно, особенно если набор данных общедоступен). Существуют разные способы решения возникающих статистических проблем, но обычно они включают в себя присвоение каждому из ненезависимых исследований более низкого веса, чтобы в целом они имели примерно такой же вес в общем мета-анализе, как и любое отдельное независимое исследование.
Следуя этому принципу, если у вас есть случай ненезависимых исследований (то есть ваш случай дублирующих публикаций), вы можете каким-то образом взвесить их как одно исследование. Я не могу рекомендовать, как лучше всего это сделать, не зная подробно характера вашего исследования, характера дублирования, степени дублирования и т. д. Вам нужно будет рассмотреть вашу конкретную ситуацию, а затем решить, как лучше всего представить эти дубликаты публикаций. как одна точка данных (будь то среднее значение результатов, первая публикация, последняя публикация, наиболее цитируемый результат или любое другое представление, которое вы считаете наиболее подходящим).
В вашем окончательном анализе может быть хорошей идеей представить и сравнить два набора результатов, как это иногда делается в мета-анализе: один набор рассматривает каждый дубликат как независимое исследование, а затем другой анализ использует выбранный вами подход агрегирования для группировки. все дубликаты как одно доказательство. Таким образом, вы могли бы увидеть, существенно ли дублирующиеся публикации влияют на общее свидетельство или нет, что очень ценно.
Я хотел бы построить график того, как моя выбранная тема развивалась во времени, нанося различные статьи и их цитаты, а также какая модель была основана на какой предыдущей.
Я думаю, что ответ на ваш вопрос на самом деле не решит вашу проблему. Публикации и цитаты не описывают, как развивалось исследование. Вместо этого я предлагаю построить график того, как результаты исследования менялись с течением времени.
Классический пример: https://www.nrel.gov/pv/cell-efficiency.html.
Такой подход позволит избежать проблемы дублирования публикации.
Баффи
Марта Cz-C
Баффи
Марта Cz-C
Марта Cz-C
Баффи
Марта Cz-C
Баффи
Марта Cz-C
Баффи
Анонимный физик