Публичный набор данных без лицензии: что разрешено?

Многие общедоступные наборы научных данных сопровождаются лицензией, например, довольно часто используются варианты Creative Commons. Однако во многих случаях общедоступные академические наборы данных не содержат никакой информации о лицензировании. Вот два примера:

В PhosphoSite мы обнаруживаем, что он «создан Cell Signaling Technology под лицензией Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License», поэтому разрешения на использование ясны из лицензии.

Вот еще один набор данных , в котором мы не видим ничего о лицензировании, даже заявления о том, что данные можно использовать бесплатно в академических целях. Там написано только что "можно скачать", а что делать после скачивания? Могу ли я распространять его, модифицировать, продавать? Исходя из контекста, я предполагаю, что они предназначали свои данные для публичного использования, они счастливы, если больше людей используют их, чтобы получить больше кредитов и цитирований. Но это всего лишь предположение.

Правообладатель в обоих случаях ясен, во втором случае разрешения отсутствуют.

Мне интересно, если я напишу программное обеспечение, используя эти данные, или создам более сложный набор данных, включающий эти данные, какие решения будут юридически правильными:

1: Программное обеспечение загружает набор данных на собственный компьютер каждого пользователя из исходного источника и обрабатывает его. Однако это не всегда возможно или не всегда легко реализовать.

2: Распространите копию исходного набора данных или модифицированную версию со ссылкой на первоисточник. Я думаю, что это более проблематично, но я не специалист в области права.

Запрашивать разрешение — очевидное решение, но в случае с десятками наборов данных связываться со всеми правообладателями и ждать их ответов — утомительный и долгий процесс. Кроме того, некоторые наборы данных являются дополнениями к опубликованным статьям. В этом случае, если у журнала есть лицензия, например, Nucleic Acids Research публикуется под лицензией Creative Commons, действительна ли она для этих наборов данных?

В большинстве юрисдикций по умолчанию предполагается, что вам не разрешено делать ничего, кроме просмотра данных, которые вы загрузили для себя, и, возможно, распространять сильно агрегированную информацию о них (например, обычно не нарушается закон, указывая объем данных или краткое изложение того, о чем данные).
Ваша вторая ссылка уже не работает. Является ли этот захват Wayback Machine точным?

Ответы (3)

Это может варьироваться в зависимости от страны, но, по крайней мере, в США условия по умолчанию (если альтернатива не указана) — «все права защищены», что означает, что вам не разрешено воспроизводить работу (набор данных), создавать производные работы из его, продавать/арендовать/сдавать в аренду или публично исполнять или демонстрировать его . В частности, не допускается его перераспределение другим лицам. На практике авторов это может устраивать, но с юридической точки зрения вам не разрешается распространять набор данных в том виде, в котором он был опубликован, без явного разрешения (которое может быть предоставлено, например, лицензией Creative Commons). .

Если вы хотите воспроизвести набор данных в другой форме, которая передает ту же информацию, это может быть разрешено или запрещено. Суд должен решить, считать ли это производным произведением или просто использованием лежащих в его основе идей, и юрист по авторскому праву мог бы лучше посоветовать вам, является ли желаемое использование юридически приемлемым.

Вам разрешено читать опубликованный набор данных и использовать идеи, содержащиеся в нем (т.е. данные), чтобы делать выводы. Закон об авторском праве не допускает ограничения этих прав. Я думаю, что проведение анализа данных и публикация результатов этого анализа (но не самих данных), как вы сделали бы в процессе написания статьи, обычно считается нормальным.

Вопрос, кажется, в основном о перераспределении данных.
Я отредактировал ответ, чтобы подчеркнуть это.
По крайней мере, в США авторские права на данные обычно не распространяются . Необработанные данные (факты о мире), как правило, не соответствуют требованиям для творческой или выразительной работы, требуемой для защиты авторских прав, хотя, если они активно курировались, курирование и презентация могут быть приемлемыми. Очевидно, вам нужно поговорить с юристом (или, скажем, с квалифицированным библиотекарем), прежде чем распространять данные, но базовое предположение о том, что все права защищены, не то же самое для данных, что и для творческих работ.
@EP Конечно; когда я говорю об авторском праве, я имею в виду сам набор данных как творческую работу, а не содержащиеся в нем данные (факты).
Однако ответ звучит не так.
Ах, да, позвольте мне уточнить это.
Как насчет обучения модели машинного обучения на данных, а затем публикации/продажи модели?
@hans Мой второй абзац, вероятно, относится к этому, т. Е. Модель ML может считаться производной работой, и юрист по авторским правам сможет дать более точный совет о том, будет ли это так.

Кроме того, говоря с точки зрения США. Не совсем знаком с другими странами.

Как правило, данные не защищены авторским правом, они не являются творческим выражением. Вы не можете копировать тот факт, что температура в этой комнате в этот момент составляет 32. Это просто факт, это не творчество. Да, создание наборов данных может потребовать много работы, но авторское право защищает не тяжелую работу, а творческое самовыражение. В некоторых случаях наборы данных могут быть творческими. Например, если вашими исследовательскими данными являются фотографии, эти фотографии, вероятно, будут защищены авторским правом. Или, если вы собираете данные оригинальным творческим способом, это может быть защищено авторским правом. Тем не менее, что защищает авторское право, так это стратегию компиляции, а не сами данные.

У ученых и создателей данных есть другие варианты защиты своих наборов данных, не предусмотренные законом об авторском праве. Я считаю, что вы можете, например, запатентовать наборы данных.

Если набор данных общедоступен и содержит только факты, а не творческую работу, то он является общественным достоянием. Вы можете распространять и делать производные по своему усмотрению. Вы не обязаны указывать авторство по закону. Однако в академическом мире от вас ожидают указания авторства, не имеет значения, находится ли набор данных в открытом доступе. Если вы не указываете авторство, использование набора данных может быть расценено как плагиат. Плагиат — это неправомерное исследование, и вы можете попасть в беду.

Это хороший вопрос, который можно задать библиотекарю в академической библиотеке. Многие из них имеют специалистов по управлению данными или специалистов по авторскому праву, которые знают, как ответить на эти вопросы.

Закон об авторском праве гласит, что создатель произведения может сохранять все права на использование указанного произведения, и точка. Если владелец авторских прав явным образом не разрешает какое-либо использование (например, чтение, копирование, перевод и т. д.), никому не разрешается это делать. Причудливое юридическое слово для «разрешения» — лицензия. Есть некоторые тонкости со сбором данных, вроде того, что вы описываете, но, насколько этот неюрист понимает, тут ничего не меняется.

Если данные являются «вспомогательными данными для опубликованной статьи», то издатель, вероятно, закрепил за собой авторские права (или некоторую форму лицензии) на саму статью для ее публикации, но, вероятно, он не закрепил за собой права на вспомогательные данные.

Итак, вкратце: они (неявно) дают разрешение на загрузку, но не более того . Да, мало полезного. Конечно, крайне маловероятно, что они развернутся и подадут на вас в суд за нарушение авторских прав за чтение данных или их использование в личных целях . Но теоретически могли. Что суд сделает с таким иском, можно только догадываться.

Если вы не получите четкое заявление от сборщика данных, вам не разрешено их использовать. Вы должны связаться с владельцами данных и попросить разрешения.

Возможно, вы захотите ознакомиться с некоторыми лицензиями на сбор данных, такими как Open Data Commons Open Database License . Обратите внимание, что такие лицензии, как набор Creative Commons или лицензии с открытым исходным кодом, плохо подходят для данных. Ознакомьтесь с ними и предложите владельцам данных явно лицензировать свои данные в соответствии с разрешающей лицензией.

Нет, закон об авторском праве защищает только определенные права, связанные с распространением . Вы не можете использовать закон об авторском праве, чтобы помешать кому-либо прочитать что-либо или использовать содержащиеся в нем идеи. (По крайней мере, в США, но если это работает так, как вы говорите, в какой-то другой стране, я думаю, что в этом ответе нужно указать, какая это страна.)
Если я не дам вам копию для чтения, вам не разрешается рыться в моих вещах, чтобы прочитать ее.
Действительно, но причина тому - рыться. Это незаконная часть. Не само чтение. Имейте в виду, что когда я говорю о чтении чего-либо, я говорю о содержании, которое у вас уже есть. Получение контента не является частью (хотя и является обязательным условием) его чтения.
@DavidZ без распространения вы его не получите.
да, я знаю. Я хочу сказать, что закон об авторском праве может объявить незаконным предоставление кому-либо копии произведения, но он не может дополнительно объявить незаконным чтение человеком копии, которая уже у него есть.