Этика использования данных компании со стажировки для академического проекта

Я аспирант, и один из моих исследовательских проектов требует от меня сканирования веб-сайта с использованием их общедоступного API. Все идет хорошо, но количество данных, которые мы можем собрать, ограничено, поскольку это общедоступный API.

Так получилось, что я буду проходить стажировку в компании, которой принадлежит этот веб-сайт, и вскоре получу доступ к неограниченному количеству их данных. Ничего, если я буду использовать эти данные для моего академического исследовательского проекта, или они ожидают, что я буду использовать их данные только для проектов, связанных с моей стажировкой?

Вам почти наверняка потребуется разрешение компании. Я ожидаю, что вам придется подписать NDA. Также может быть сложнее опубликовать ваши результаты, если вы не можете поделиться своими данными с рецензентами.
«Будут ли они ожидать, что я буду использовать их данные только для проектов, связанных с моей стажировкой?» - Почему бы вам просто не спросить их?
Дело не в этике, а в законе.
Общедоступные данные, очевидно, можно использовать для академических исследований, но не раскрывайте данные частных клиентов через исследовательские публикации, независимо от того, действует ли соглашение о неразглашении. Я гарантирую, что вы станете персоной нон грата в своей отрасли, если сделаете это. Вы были бы де-факто занесены в черный список любой компанией, которая обнаружила бы, что вы раскрыли личную корпоративную информацию клиента. Я точно знаю, что если бы я когда-либо узнал, что вы опубликовали личные данные любой компании, в которой вы работали, вы бы никогда не стали работать на меня; Я бы удостоверился в этом.
Вам нужно спросить разрешения. Агрегированные сводные данные могут подойти, но закрытые данные, вероятно, не подойдут.
Я предполагаю, что вы, возможно, уже обречены еще до того, как спросите. В зависимости от характера вашего исследования вы должны быть готовы стать изгоем в корпоративном мире за публичное раскрытие личных корпоративных данных или изгоем в исследовательском сообществе за шиллинг для клиента, независимо от того, используете ли вы его личные данные для своего исследовательского проекта. . Если ваш результат будет нелестным для корпорации А, вы можете быть занесены в черный список. Если ваш результат льстит корпорации А, вас могут считать корпоративным подставным лицом. Если ваши результаты находятся между ними, никто не будет заботиться о ваших выводах.

Ответы (5)

Вы должны спросить компанию, где вы проходите стажировку. Возможно, их устраивает все, что вы хотите делать. Возможно, они позволят вам использовать свои данные, но будут публиковать только сводки, а не необработанные данные. Возможно, они потребуют, чтобы вы анонимизировали его.

Кроме того, как вы будете делать анализ? Вы возьмете данные компании и перенесете их на свой компьютер? (Компания вполне может не приветствовать это.) Или вы планируете использовать машину, поставляемую компанией, для проведения анализов? (Та же проблема — компаниям не обязательно нравится, если вы используете их оборудование для решения, по сути, личных задач.) Вы хотите установить стороннее программное обеспечение для анализа ваших данных на их машинах?

Подумайте, что вы хотите сделать, а затем обратитесь к своему руководителю. В зависимости от их личности, люди могут даже быть заинтересованы в том, чтобы поработать с вами над этим, возможно, получить от этого публикацию.

Что бы вы ни делали, не используйте данные без запроса. Независимо от того, подписываете ли вы NDA.

Сильный, сильный акцент на "нельзя". Это может привести к серьезным неприятностям.

Спросите их и посмотрите, что они скажут. Одно дело сканировать их общедоступный API в свободное время (что на самом деле может специально помешать вам проводить исследования в соответствии с его условиями использования), но использование их внутренних данных напрямую без запроса было бы в лучшем случае неэтичным, а в худшем — потенциально незаконным. (и последнее, что вы хотели бы, это быть известным как парень, который украл личную информацию людей для собственной выгоды, а затем предстал перед судом, когда они обнародовали ее), в то время как ваше исследование может содержать только совокупные данные или анонимные наборы данных, тогда это все равно не изменит восприятие потенциальных будущих работодателей.

  • Вы должны запросить разрешение в письменной форме [*]. Не используйте данные без запроса, это было бы крайне неэтично. Если они сопротивляются или беспокоятся о конфиденциальности или безопасности, вам (и/или вашему научному руководителю) необходимо объяснить им, какую пользу они получат от публикаций и разоблачения — для репутации, найма и т. д. Проведите эти переговоры. на самом высоком подходящем уровне, которым вы можете управлять, т. е. вовлекайте людей, которые имеют право сказать «да» и действительно заинтересованы в этом. (Также хорошо для признания вашей карьеры). Иногда вам нужно, чтобы технический отдел подтолкнул юридический отдел от вашего имени или отменил глупые политики.
  • Определите, можете ли вы/должны ли вы анонимизировать/двойно анонимизировать/агрегировать/выбирать/нечеткие данные (например, посмотрите, как это делает перепись). Или, может быть, использовать только неидентифицирующие поля. Они могут попросить вас принять разумные меры для его защиты (пароль, шифрование, брандмауэр, внешний жесткий диск), но не соглашайтесь на неограниченную компенсацию.
  • Постарайтесь, чтобы соглашение было как можно более широким, т. е. без ограничений по времени, без ограничений по (некоммерческому) объему, разрешайте производные работы вами, вашим отделом или вашими коллегами-исследователями. Соглашения почти всегда запрещают производное коммерческое использование. Если вы придумаете патентоспособную идею, кому принадлежат права? и т. д.

[*] ОБНОВЛЕНИЕ: кошмары, подобные следующему (ретроспективная политика в области интеллектуальной собственности), — это как раз то, что может случиться: «Аспирант подписал контракт на 3-й год, который подпишет интеллектуальную собственность. Это законно?» . Теперь этот человек может наложить вето на все свои публикации и закрыть свою диссертацию промышленным партнером.

@StephanKolassa: черт возьми. Что, если пару лет спустя первоначальные менеджеры, с которыми вы имели дело, изменились, или вы хотите выполнить производную или дополнительную работу, или предоставить доступ своим коллегам-исследователям, или компания просто передумает, или потеряет приоритет сотрудничества, или ваш контакт уходит... Не говоря уже о разногласиях по поводу интеллектуальной собственности, а также о том, кто чем владеет или не владеет, что открыл или не обнаружил. Все это может случиться.
Единственная опасность заключается в том, что если вы хотите что-то в письменной форме, могут быть вызваны адвокаты. В этом случае все будет намного сложнее и займет гораздо больше времени.
@StephanKolassa: да, конечно. Вы должны развить чувство того, что достижимо, и закрепить это в письменной форме, заранее, довольно быстро. Часто просто не стоит определять права ИС, или они уже могут быть охвачены рамочным соглашением (или устной договоренностью) между университетом и компанией. Корпоративные культуры по этому поводу сильно различаются. Часто определение человека/группы людей в компании, которые одновременно заинтересованы в том, чтобы сказать «да», и имеют на это полномочия, является большой частью этого. А иногда и само по себе познавательно. Или открывающий глаза.
@StephanKolassa: кошмарный сценарий заключается в том, что вы не хотите выполнять массу работы, а затем партнер накладывает эмбарго на публикацию или задерживает ее ...

Я буду проходить стажировку в компании, которой принадлежит этот веб-сайт, и вскоре получу доступ к неограниченному количеству их данных. Ничего, если я использую эти данные для своего академического исследовательского проекта?

НЕТ!

Нет с той же силой, что и ответ на вопрос: «Я изучаю заработную плату в разных профессиях. Друг пригласил меня на ужин на следующей неделе. найти расчетный лист?»

Если вы хотите использовать чьи-то данные, и эти данные не являются однозначно общедоступными, вы сначала получите их явное разрешение. В корпоративной среде существует множество причин, по которым в разрешении может быть отказано: например, данные могут быть конфиденциальными с коммерческой точки зрения или у компании могут быть обязательства по обеспечению конфиденциальности по отношению к своим клиентам. Тот факт, что вам нужен привилегированный доступ для получения данных, должен сразу сказать вам, что вам нужно разрешение на их использование для чего-либо, кроме конкретной причины, по которой вам был предоставлен этот доступ.

То, о чем вы говорите, технически считается корпоративным шпионажем без явного разрешения клиента.

Факты (как вы их изложили):

  1. Вы проводите академические исследования, используя общедоступные данные корпорации А.
  2. Вы пройдете стажировку в Корпорации А и получите доступ к личной информации Корпорации А.
  3. Ваши возможности в Корпорации А не связаны с вашими академическими исследованиями с участием Корпорации А.
  4. По крайней мере, вы поддерживаете идею использования личных данных Корпорации А в исследовательских целях без их согласия.

Так что моя рекомендация полностью зависит от характера отношений между вашей стажировкой в ​​Корпорации А и их знанием вашего исследовательского проекта, включающего их данные.

Если они знали о вашем исследовательском проекте до того, как предоставили вам стажировку, я считаю вполне уместным спросить у них разрешения.

Если они не знали о вашем исследовательском проекте до того, как предоставили вам стажировку, вы подвергаете свою стажировку риску, запрашивая разрешение на использование их личных данных, в зависимости от конфиденциальности данных, к которым у вас будет доступ, и личностей участников бизнеса. контролировать ваши отношения с корпорацией. Риски, связанные с тем, что вы нарушите их отказ в удовлетворении вашего запроса, могут принести больше проблем, чем вы того стоите.

Если они не знали о вашем исследовательском проекте до того, как предоставили вам стажировку, и вы публикуете личные корпоративные данные без явного согласия, у них есть законное заявление о том, что вы стремились к ним на стажировку с явной целью получения сомнительного доступа к их личной информации, и вы будет в мире больно как юридически, так и профессионально. В зависимости от последствий этого, вы могли бы разумно ожидать, что никогда больше не сможете работать в своей области, и вы могли бы разумно ожидать, что окажетесь в тюрьме в зависимости от характера данных, которые вы раскрываете, и политического влияния, которым обладает люди, которых ты бесишь.

Изменить, чтобы добавить

Возможно, вы уже находитесь между Сциллой и Харибдой в этом вопросе. Посмотрите на потенциальную оптику: у вас есть исследовательский проект (характер которого вы не раскрыли). У вас также есть стажировка с доступом к корпоративным частным данным одного из субъектов вашего исследования. Если вы не объявите о своем исследовательском проекте и пойдете на стажировку, ваше положение как в академическом сообществе, так и в корпоративном мире определенно будет зависеть от характера и результатов вашего исследовательского проекта.

Если вы пройдете с ними стажировку, а затем распнете их в своем исследовательском проекте, их услуга за услугу будет взаимной, независимо от того, согласны ли они на публикацию их личных данных. Имея доступ к их личным данным, ваша методология исследования будет поставлена ​​под сомнение (возможно, юридически), и любая потенциальная ошибка, которую вы, возможно, совершили, усугубится. Если ваши результаты льстят Корпорации А, то ваши академические коллеги могут счесть вас политически обязанным Корпорации А.

Возможно, вы уже находитесь в безвыходном сценарии, кроме отмены вашего исследовательского проекта или отмены стажировки. Вы действительно не должны делать то, о чем думаете.