Этика очистки «общедоступных» источников данных для получения адресов электронной почты

Мне интересно, этична ли следующая исследовательская практика.

Исследователь в области разработки программного обеспечения загружает репозитории исходного кода с Github., большой источник общедоступного открытого исходного кода. Исследователь просматривает журналы коммитов git, чтобы найти адреса электронной почты разработчиков программного обеспечения, которые приняли участие в проекте, и использует эти адреса электронной почты, чтобы отправить им электронное письмо с просьбой принять участие в опросе. Если получатель переходит по ссылке на опрос, опрос содержит соответствующий брифинг и получает информированное согласие. Исследователь соблюдает все институциональные и юридические требования, связанные с исследованиями на людях. Исследователь ограничивает количество отправляемых электронных писем только тем участникам, которые, по их мнению, им понадобятся для проверки своих гипотез. Однако, по крайней мере, один получатель этого письма раздражен тем, что исследователь таким образом получил его адрес электронной почты и отправил ему незапрошенное электронное письмо.

Является ли это этической исследовательской практикой? В частности, каковы будут соответствующие этические принципы или этические рамки для анализа этого вопроса? Я прочитал кучу статей и справочных материалов по этике в исследованиях на людях и в инженерных исследованиях, но они, кажется, сосредоточены на других проблемах. Существуют ли принятые нормы или руководящие принципы, касающиеся такого рода ситуаций? Рассматривался ли он в других областях, таких как социальные науки?

Возможный аргумент в пользу этичности такой практики: источник данных общедоступен, и адреса электронной почты были получены из этих общедоступных данных. Разработчики решили сделать свой репозиторий программного обеспечения общедоступным, и они должны предполагать, что любая информация, содержащаяся в нем, общедоступна. Разработчики, которые не хотят, чтобы с ними связывались, могли специально настроить свой клиент git для использования другого адреса электронной почты. Исследование принесет пользу нашему пониманию науки разработки программного обеспечения. Субъекты имеют возможность решить, участвовать или нет в опросе. Конфиденциальность участников будет защищена, и все ответы будут обрабатываться анонимно. Исследование соответствует всем требованиям законодательства и комплаенс. С юридической точки зрения электронные письма не являются «спамом».

Возможный аргумент в пользу того, что такая практика неэтична: разработчики программного обеспечения, вероятно, не ожидают, что кто-то будет очищать адреса электронной почты из журналов коммитов git. Их адрес электронной почты может содержаться в общедоступном наборе данных, но некоторые разработчики могут ожидать или считать эту информацию конфиденциальной или, по крайней мере, не общедоступной и бесплатной для неограниченного использования. Некоторые разработчики могут возразить, что одно дело использовать адреса электронной почты, которые публично перечислены на странице их профиля Github, и совсем другое — извлекать частные адреса электронной почты, которые предоставляются как часть их конфигурации git, и что их понимание социальных норм заключается в том, что адреса электронной почты, автоматически вставленные в журналы коммитов их git-клиентом, не предназначались для этой цели.


Обратите внимание: я не спрашиваю о IRB, юридических требованиях или соответствии. Я очень хорошо знаком с этими соображениями. Предположим, что исследователь добросовестно выполнил все требования, применимые в его стране. Я не об этом аспекте спрашиваю. С моей точки зрения, исследователи несут независимую обязанность проводить исследования в соответствии с этическими нормами и по собственному усмотрению избегать неэтичного поведения, даже если это юридически разрешено или одобрено IRB.

Помимо того, что это неэтично в соответствии с рекомендациями в ответе ff524, это также, по-видимому, нарушает ToS GitHub и, следовательно, является незаконным. См. раздел G.10, в котором прямо запрещается передача нежелательной электронной почты. Кроме того, согласно разделу F.3, если кто-то подаст в суд на GitHub по этому поводу, вы соглашаетесь возместить GitHub любые присужденные убытки и гонорары адвокатов.
@reirab Я не думаю, что это применимо, поскольку OP не использует средства GitHub для загрузки, публикации, размещения или передачи нежелательной электронной почты, SMS-сообщений или «спама» . Технические детали имеют значение в вопросах права.
Мы сделали это однажды сами, так как это не редкость в нашей области. Сейчас мы предпочитаем держаться подальше от этого. Несмотря на то, что процент ответов был хорошим (указывая на то, что многие люди действительно согласны с нашей незапрошенной почтой), определенно есть нетривиальное количество людей, которые очень раздражены этим спамом. Давайте внесем ясность: если вы это сделаете, вас ждет какая-то разъяренная рассылка, и один этот факт уже многое говорит вам об этичности всей затеи.
Ваше представление о том, что такое спам, кажется слишком узким. Любая массовая рассылка людям, которые не подписались на нее, может быть обоснованно расценена как спам.
@kasperd Если это имелось в виду в ответ на мой комментарий - я согласен, что это можно считать спамом, и это определенно «нежелательная электронная почта». Однако OP не использует Github для «загрузки, размещения или передачи» этой рассылки, а просто извлекает список получателей. С юридической точки зрения это важно. Как я уже сказал, когда дело доходит до ToS и подобных вещей, важны технические аспекты.
@xLeitix Я предположил, что это означает, что вы не будете рассылать спам другим пользователям GitHub по электронной почте, SMS и т. Д., А не только то, что вы не будете делать это напрямую через серверы GitHub (если это вообще возможно). Язык там, по общему признанию, немного двусмысленно, но нет никаких ограничений, что это только запрещает делать это напрямую через GitHub. Он просто говорит: «Вы не должны загружать, публиковать, размещать или передавать нежелательные сообщения электронной почты, SMS или« спам »».
@xLeitix G.6 также говорит: «Вы соглашаетесь не воспроизводить, не дублировать, не копировать, не продавать, не перепродавать и не использовать какую-либо часть Сервиса, использование Сервиса или доступ к Сервису без явного письменного разрешения GitHub». Сбор адресов электронной почты, безусловно, кажется мне эксплуатацией службы, но, опять же, это достаточно двусмысленно, и я полагаю, что аргумент может быть приведен в любом случае.
@xLeitix Я имел в виду вопрос, который предполагает, что только электронные письма, отправленные в коммерческих целях, могут считаться спамом.
Software developers probably would not expect someone to scrape email addresses from the git commit logs.Прошло много времени с тех пор, как я общался с разработчиками программного обеспечения, которые бы этого не ожидали .
@kasperd, пожалуйста, прочитайте вопрос внимательнее. Я сформулировал это достаточно осторожно, так как предвидел именно такую ​​реакцию. Как я уже писал: « Возможный аргумент в пользу этичности этой практики: […] С юридической точки зрения электронные письма не являются «спамом», поскольку [...]» Я выделяю части, которые вы, возможно, упустили из виду, курсивом. . Ваш комментарий является ответом на соломенного человека: он не отвечает ни на один аргумент, описанный в вопросе. Если вы хотите дать полный ответ, я бы хотел его увидеть, но комментарии предназначены только для разъяснения или предложения по улучшению вопроса.
OP не использует средства GitHub для ... передачи нежелательной электронной почты . Если пользователи GitHub явным образом не согласились связаться с ними, это именно то, что предлагает OP. Незапрошенная электронная почта по-прежнему является нежелательной, даже если она не предназначена для коммерческих целей.
Не круто, нет. Будьте более открытыми, особенно если вы хотите завоевать доверие в долгосрочной перспективе...
@paulgarrett, это древний вопрос, и я не хочу практиковать его; это то, что я наблюдал за кем-то другим, и я хотел знать, следует ли считать это неэтичным.
к настоящему времени во многих странах также может быть незаконным (например, из-за европейского закона GDPR) отправлять подобные массовые сообщения без предварительного согласия получателя :)

Ответы (3)

Соответствующее руководство из Кодекса стандартов и этики для проведения опросных исследований Совета американских исследовательских организаций :

Исследовательские организации обязаны удостовериться в том, что лица, с которыми связываются по электронной почте для проведения исследований, имеют разумные основания ожидать, что они получат контакт по электронной почте для проведения исследований. Такое согласие может быть принято при наличии ВСЕХ следующих условий:

  1. Между лицами, с которыми мы связываемся, и Исследовательской организацией, Клиентом, предоставляющим адреса электронной почты, или поставщиками Интернет-образцов, предоставляющими адреса электронной почты (последние указаны в приглашении по электронной почте), существуют существенные ранее существовавшие отношения;

  2. Приглашенные по электронной почте для опроса имеют разумные ожидания, основанные на ранее существовавших отношениях, когда приглашенные по электронной почте для опроса специально выбрали интернет-исследование с исследовательской компанией или поставщиком образцов, или в случае предоставленных Клиентом списков, что с ними можно связаться для исследования. и приглашенные не отказались от общения по электронной почте;

  3. Приглашения по электронной почте для участия в опросе четко сообщают имя поставщика выборки, отношение человека к этому поставщику и четко предлагают выбор, который следует исключить из будущих контактов по электронной почте.

  4. Примерный список адресов электронной почты исключает всех лиц, которые ранее надлежащим и своевременным образом запрашивали удаление из будущих контактов электронной почты.

  5. Участники выборки по электронной почте не были набраны с помощью незапрошенных приглашений по электронной почте.

Здесь может показаться, что пользователи GitHub не имеют разумных оснований ожидать, что с ними свяжутся для проведения исследований.

Соглашаясь получать сообщения, связанные с открытым исходным кодом, от SourceForge, я всегда ожидал, что эти сообщения будут включать информацию о конкретных инструментах с открытым исходным кодом, советы о том, как вести и публиковать проекты с открытым исходным кодом, а также общую информацию о мире открытого исходного кода (все из которых может быть интерактивным, а может и не быть). Я не думаю, что это ожидание особенно необоснованно или будет принципиально другим на Github. Однако может иметь значение то, что рассматриваемое приглашение было отправлено не Github от имени исследователей, а самими исследователями.
@ORMapper Кроме того, на самом деле, вы можете выбрать, какие типы электронной почты вам нужны, SourceForge/GitHub/и т. д. отправить вам. По крайней мере, в США я совершенно уверен, что их законы требуют, чтобы они хотя бы позволяли вам отказаться. Во всяком случае, в первом пункте вышеизложенного говорится, что между отдельными лицами и исследовательской организацией существуют ранее существовавшие отношения , а не между отдельными лицами и веб-сайтом, с которого RO взял их адрес . Также вполне вероятно, что это нарушает условия обслуживания GitHub.
@reirab: «Исследовательская организация, Клиент, предоставляющий адреса электронной почты, или Интернет-провайдеры образцов, предоставляющие адреса электронной почты»
@ORMapper Верно, но дело в том, что ни один из них здесь не имеет места, по крайней мере, в той мере, в какой «предоставление», кажется, подразумевает, что предоставление было преднамеренным, а не очисткой их веб-сайта, что кажется нарушением их ToS .
Это интересное руководство. Интересно, сколько фактических обзорных исследований действительно следуют всему этому. Основываясь на моем опыте разработки программного обеспечения, я бы поставил менее 50%. В частности, подход ОП к анализу репозиториев GitHub адресов потенциальных приглашенных вовсе не редкость, хотя я согласен, что эта практика уже очень сильно склоняется к «спаму».
It would seem here that GitHub users do not have a reasonable expectation that they will be contacted for research...... членом CASRO.
Как только вы делаете это достаточно часто, у них должно быть разумное ожидание, что с ними свяжутся :D
Не соглашайтесь с этим правилом. В некоторых случаях это слишком строго.

Меня заинтересовал этот вопрос, и я спросил GitHub о таком использовании. Вот их ответ:

Спасибо за обращение! Мы всегда рекомендуем пользователям, у которых есть вопросы о наших Условиях, напрямую обращаться в службу поддержки GitHub, чтобы мы могли узнать больше об их конкретной ситуации.

А пока я буду рад указать вам на Условия обслуживания GitHub и решить общую проблему отправки нежелательных электронных писем.

Раздел G10 наших условий гласит:

Вы не должны загружать, публиковать, размещать или передавать нежелательную электронную почту, SMS-сообщения или «спамовые» сообщения.

Таким образом, похоже, что они также интерпретируют раздел G.10 как запрещающий эту практику, хотя и призывают любого, у кого есть вопрос о том, какие виды использования их сервиса разрешены, обращаться к ним напрямую.


Обновление за апрель 2022 г.:

Как указал polm23 в комментарии, условия Github были обновлены с момента написания моего ответа. Эта проблема теперь рассматривается в разделе 7 Политики допустимого использования Github , которая включает следующее (выделено мной):

Вы не можете использовать информацию из Сервиса (независимо от того, была ли она извлечена, собрана с помощью нашего API или получена иным образом) в целях рассылки спама, в том числе для отправки нежелательных электронных писем пользователям или продажи Личной информации пользователя (как определено в Заявлении о конфиденциальности GitHub), например, рекрутерам, охотникам за головами и доскам объявлений.

Таким образом, отправка нежелательных электронных писем пользователям по-прежнему запрещена, просто в соответствии с другим разделом их политик.

Теперь это находится в разделе C5 или разделе H для использования API.
Теперь он находится в другом месте в их политиках допустимого использования. docs.github.com/en/site-policy/acceptable-use-policies/…

На мой взгляд, описанный вами конкретный случай является этическим со следующей оговоркой:

  1. Это зависит от того, о чем опрос и для чего он предназначен.
  2. Должно быть так, что парсер позволяет легко отказаться от любых дальнейших электронных писем от них.
  3. Это немного в этической «серой зоне», и небольшие изменения обстоятельств соскабливания и его использования могут вывести его за черту приемлемости.

Когда я помещаю свое имя и адрес электронной почты в качестве участника в файл в каком-либо общедоступном репозитории (игнорируя случай, когда электронное письмо попало к вам вопреки моей воле), я делаю себя в некоторой степени доступным, чтобы со мной можно было связаться по вопросам, касающимся этого исходного файла. Да, это правда, что опрос о привычках разработчиков — это не то, что я имел в виду; но если это, возможно, по общественно-полезной причине - я не считаю злоупотреблением тем, что я помещаю туда свою электронную почту в файле.