В настоящее время мы с соавторами сотрудничаем GitHub
в написании и написании кода, а также в обмене данными. У нас есть много данных, часто не в текстовом формате (например, pdf
). Большая часть этого собрана научными сотрудниками, которыми мы не делимся в нашем Git
репозитории.
В частности, мы используем python
, shell
, R
, Stata
и Latex
большинство из них полностью интегрированы. То есть python
скрипты shell
генерируют данные, которые используются R
и Stata
чьи выходные данные напрямую компилируются в Latex
.
Мы не хотим отклоняться от этого высокого уровня автоматизации, но у нашего подхода есть два основных недостатка:
git
хранилище. Это накладывает на меня дополнительную нагрузку, но мы хотим, чтобы они использовали git, потому что это увлекательный инструмент для отслеживания проблем. Однако у нас слишком много дополнительной работы, и git
часто она слишком сложна для молодых научных сотрудников (даже с графическим интерфейсом).git
, который не был создан для обмена данными, отслеживает эти изменения. Но это бесполезно для нашей цели.Можете ли вы предложить мне другое программное обеспечение или подходы, которые сочетают в себе интеграцию, которую мы достигли до сих пор, где мы можем легко обмениваться данными?
Я сталкивался с подобными проблемами в сотрудничестве с биологами и обнаружил, что подход с двумя технологиями лучше всего.
Преимущество этого заключается в сохранении необходимого вам разделения данных, хранении опасного программного обеспечения для контроля версий подальше от экспериментаторов, а также в предотвращении жонглирования огромными массивами данных в системе контроля версий, которая никогда не предназначалась для поддержки этого.
АЭ
MEРоуз
хЛейтикс
MEРоуз
АЭ
Джейкбил
Джейкбил