Сотрудник нашего отдела планирует загрузить миллионы профилей с общедоступного веб-сайта. Данные находятся в свободном доступе после того, как вы вошли в систему, хотя за веб-сайтом стоит компания, которая имеет коммерческие интересы и продает премиум-членство. Положения и условия веб-сайта прямо не запрещают массовую загрузку информации, и он утверждает, что его программное обеспечение будет имитировать нормальное поведение пользователя, не мешая, таким образом, нормальной работе сайта.
Предварительная оценка нашего комитета по этике предполагает, что с этической точки зрения все будет хорошо, пока он не опубликует набор данных (чего он не планирует делать) и данные будут анонимными. Кроме того, он будет агрегировать данные, поэтому никакая информация, касающаяся отдельных лиц, не будет понятной.
Тем не менее, я не полностью убежден, что это исследование должно быть проведено, и окончательное голосование еще не завершено. Есть ли другие вещи, которые следует учитывать? Может ли компания, управляющая веб-сайтом, подать в суд на университет (или на него) за использование данных, или это будет оправдано законом о защите свободы прессы или чем-то подобным? Мы находимся в Германии, поэтому применяются законы Германии и ЕС.
То, что вы описываете, — это выпуск данных OKCupid , просто без публикации набора данных. Обратите внимание, что «исследование» OKCupid и аналогичные исследования данных Facebook были сочтены некоторыми спорными с этической точки зрения, которые утверждают, что пользователи, которые участвуют в веб-сайте, не обязательно дают согласие на участие в исследовании, особенно когда данные профилей пользователей доступны только для авторизованных пользователей. (Также см.: «Но данные уже общедоступны»: об этике исследований в Facebook Майкл Циммер.)
Re: чтобы избежать судебного иска, вы должны получить согласие на веб-сайте. Как отметил Wrzlprmft в комментарии:
Если исследование не выставит их в плохом свете, им также может быть интересно узнать что-то о своей пользовательской базе. Кроме того, вы можете узнать соответствующую информацию о данных, например о скрытых механизмах отбора и т.п.
Если вы решите не идти по этому пути, я бы порекомендовал проконсультироваться с юристом по поводу условий веб-сайта. На самом деле, никто здесь не может сказать вам вероятность судебного преследования или проигрыша судебного процесса. Судебный процесс, вероятно, будет основан на условиях веб-сайта; попросите юриста просмотреть их. Оценка вашего коллеги о том, что они «прямо не запрещают массовую загрузку информации», не совсем обнадеживает. (Например, формулировка в положениях и условиях, в которой перечисляется разрешенное использование веб-сайта, может потенциально исключать другие виды использования без явного перечисления запрещенных видов использования.)
Судебная практика по этому вопросу далека от завершения. Решения до сих пор были ограничены. Не существует юридического прецедента, четко устанавливающего, что «скрапинг всегда разрешен, если Условия прямо не запрещают это». Есть некоторые избранные случаи, которые начали намечать случаи, когда парсинг запрещен и не запрещен, но правовая территория еще не полностью изучена. Еще немного о прецедентном праве в США и ЕС:
ff524
Врзлпрмфт
ff524
Майкл Бренндёрфер
ff524
Майкл Бренндёрфер
ff524
София
Джейкбил