Передовой опыт обмена качественными данными, такими как стенограммы интервью, вместе с бумажной публикацией?

В прошлом я делился наборами количественных данных, загружая их в репозитории данных (например, Zenodo ) в виде CSV-файлов или подобных форматов.

Но мне не хватает опыта работы с качественными данными, такими как стенограммы интервью.

Интервьюируемым будет предложено дать согласие на передачу (псевдонимизированных или анонимных) стенограмм.

Но помимо этого, существуют ли лучшие практики, связанные с таким качественным обменом данными? Будет ли достаточно просто загрузить, скажем, простой Word-документ расшифровки интервью на Zenodo ? Или, возможно, также HTML-файл, который будет содержать мой способ кодирования стенограмм * ? Есть ли что-то еще, что я должен принять во внимание?


* Я планирую использовать специальную программу для кодирования стенограмм интервью, а именно RQDA , R -пакет; Похоже, что RQDA позволяет пользователям экспортировать размеченные стенограммы в формате HTML-файла.

Некоторые национальные исследовательские ассоциации имеют специальные учреждения для обмена и повторного использования данных, которые имеют свои собственные репозитории. В Австрии, например, есть AUSSDA. Я бы проконсультировался с вашим соответствующим учреждением не только по поводу хранения данных, но и по юридическим/этическим вопросам, связанным с обменом и хранением качественных данных.
MS Word определенно не является подходящим форматом для обмена данными.
@ user2705196, интересное замечание, что MS Word определенно «не подходит для обмена данными». Мое интуитивное предположение состояло бы в том, что файл *.doc будет настолько общеузнаваем, что можно будет загрузить такой файл в репозиторий для предоставления расшифровок интервью. Могу ли я, таким образом, попросить обоснование вашего утверждения?
«Предполагается, что *.doc-файл будет общеузнаваемым». Предположение неверно. Есть несколько форматов, которые более широко используются и которые легче реализовать на будущих компьютерах.
@anpami Вот пара моментов. Суть в том, что Word — это очень специфический проприетарный формат, который может открываться на чужих компьютерах, а может и не открываться по вашему желанию. goldmark.org/netrants/no-word/attach.html
Другое объяснение, что MS Word неуместно. Стоит подумать о том, что вы хотите на самом деле разделить в депозитарии. (Кстати, вы, очевидно, не одиноки в том, что MS Word является форматом обмена файлами де-факто. Но как только вы подумаете об этом, имеет смысл использовать что-то еще) logological.org/word

Ответы (1)

Если ваши исследовательские данные поступают от людей, ваш обмен данными должен быть одобрен в рамках процесса этической проверки или должно быть получено освобождение от этого процесса в рамках процесса освобождения.

Формат CSV кажется самым надежным форматом данных; не имеет значения, являются ли ваши данные количественными или качественными. Ваш выбор репозитория должен основываться на обычаях вашей области и ваших взглядах на надежность репозитория, а не на типе данных.

CSV для таблиц, верно? Я думаю, что качественные данные, о которых идет речь, представляют собой текст, возможно, с некоторой разметкой транскрипции.
@henning--reinstateMonica Нет причин, по которым нельзя записать в формате CSV.
но это не делает его лучшим выбором, чем запись, скажем, температуры в нотной записи. (не мой DV, кстати.)
@henning--reinstateMonica Вы не правы. CSV — это стандартизированный формат, широко используемый для многих типов данных. Нотная запись — это нестандартизированный формат, широко используемый для одного типа данных. MusicXML будет более сравним с CSV. А XML — хорошая альтернатива CSV для данных запрашивающего.
Я работаю с расшифровками интервью всю свою профессиональную жизнь и ни разу не сталкивался с тем, что они хранятся в табличной форме. Это просто не имеет никакого смысла. Таблицы иногда могут быть полезны для некоторого анализа расшифровок интервью, но не для хранения «сырых» данных.
Поясню: мы говорим о качественных, неструктурированных или, по крайней мере, полуструктурированных данных интервью, а не об опросе с четко разделенными переменными и элементами.
Я в курсе. Если вы действительно настаиваете на том, чтобы ваши данные не были структурированы, вы можете просто не использовать запятую в формате CSV.
Конечно, вы также можете покататься на парусной яхте. :)