Я работаю над документом, который включает в себя некоторые данные и фрагмент кода для анализа данных.
Я хочу, чтобы результаты анализа были воспроизводимыми, а код открытым. Эта концепция «воспроизводимого исследования» практически не существует в моей области, и потенциальные журналы не имеют рекомендаций относительно кода. Кроме того, у меня нет требований относительно публикации моих данных и кода учреждением или финансирующим агентством.
Вопрос в том, как мне разделить данные и код между открытым репозиторием и дополнительными файлами статьи? Что я сейчас имею в виду, так это:
R
( то есть функции) будет размещен в онлайн-репозитории, таком как figshare или github.knitr
, в качестве дополнения к статье.Каковы плюсы и минусы этого подхода? Есть ли что-то, что я должен изменить?
Хороший способ подумать о различии заключается в следующем:
Код и/или данные в дополнении являются статичными, предоставляя моментальный снимок, который гарантированно будет работать в определенное время и в определенном месте. Архивное представление гарантировано, но оно не может поддерживаться и, таким образом, может со временем устаревать.
Код и/или данные в открытом репозитории можно обслуживать, и, таким образом, это может быть «живой» проект, который обновляется и продолжает выполняться. Однако по той же причине он также может быть уничтожен различными способами, включая повреждение обновлений, удаление и смерть репозитория. Скорее всего, это будет нормально, по крайней мере, в течение нескольких лет, но многолетнее сохранение гораздо более сомнительно.
Однако, как отмечает @Davidmh в комментариях, обычно нет причин, по которым вы не можете поместить все в оба места. Вопреки распространенному мнению, ничто не препятствует распространению кода под более чем одной лицензией . Это особенно верно, если вы сначала размещаете его в открытом репозитории, а затем размещаете снимок («форк») этого репозитория в дополнительной информации. Предоставление журналу контроля над форком не влияет на исходный репозиторий.
Однако во многих случаях открытая лицензия и авторское право журнала даже не будут взаимодействовать друг с другом. Многие журналы не будут претендовать на какие-либо авторские права на код или данные как на код или данные . Вместо этого журнал будет претендовать только на право распространять пакет в качестве дополнительной публикации , что не ограничивает использование информации в этом дополнении в качестве данных или кода.
Итог: сначала поместите его в открытый репозиторий, затем дайте журналу снимок в качестве дополнительного. В крайне маловероятном случае, если журнал не примет его, открытый репозиторий все еще является прекрасным местом для его хранения.
Дэвидмх
Гимелист
Компас
Трилкс