Я исследователь и хочу выполнить парсинг веб-сайта (в частности, TripAdvisor) для сбора данных, чтобы использовать их в исследовательском проекте. Однако, ознакомившись с положениями и условиями веб-сайта , я обнаружил, что компания запрещает пользователю:
... копировать любое содержимое или информацию этого веб-сайта с помощью любого робота, программы-паука, скребка или других автоматизированных средств или любого ручного процесса для любых целей без нашего явного письменного разрешения.
-- Запрещенная деятельность, пункт (ii)
Таким образом, я хочу связаться с компанией, чтобы спросить разрешения. Мне было трудно найти какую-либо информацию о том, как связаться с компанией, чтобы запросить разрешение на использование данных. Тем не менее, мой вопрос заключается в том, что при отправке подобных запросов компаниям, как лучше всего убедиться, что я связываюсь с нужным отделом/человеком?
Во-первых, признайте, что они, вероятно, поместили эти Условия использования по некоторым или всем из следующих причин:
Скорее всего, вы попадаете во вторую категорию (а может быть, и в четвертую, я не знаю, от чего еще они себя защищают). В этом смысле вы должны убедить их, что вы не идиот, который будет буйствовать на их серверах. Если вы связаны с известным университетом, возможно, вам повезет больше, но даже в этом случае это будет натяжка... это коммерческая компания, а не научно-исследовательский институт. Даже если вы сможете убедить их, что вы не полный идиот, у них все равно будет очень мало причин давать вам такое разрешение. Ваш любимый проект не принесет им ничего, и на самом деле может продемонстрировать что-то плохое в их сайте, что они не хотят публиковать. Аргумент «Я поделюсь своими выводами» на самом деле не заходит слишком далеко... у компаний есть свои собственные интересы, которые регулируются многими вещами, включая политику, программы, эго и все, что у вас есть. Ваша презентация в PowerPoint, которая может быть сделана через год или два, и которая, вероятно, будет слишком технической для вице-президента по бизнесу, чтобы ее понять, в любом случае не принесет им никакой ценности для бизнеса.
Смысл всех предыдущих слов просто в том, чтобы убедить вас в том, что здесь предстоит довольно тяжелая битва.
Все это говорит о том, что я просто начну звонить по всем номерам «свяжитесь с нами», которые попадутся мне в руки. Обязательно начните с номеров на странице «Контакты». Не бойтесь отправить письменное письмо! Что касается телефонных звонков, мне нравится фраза, которую Джек Сент-Клер использовал в своем комментарии: «У меня странный вопрос».
Успех легко определить. Проверьте свою почту... есть ли у вас письмо (письменное или электронное) от юридического отдела TripAdvisor, разрешающее вам провести исследование? Если нет, то вы еще не добились успеха. Продолжайте пытаться! Упорство будет ключевым здесь.
Я бы предложил 2 вещи.
1) связаться с другими академическими исследователями, которые получили эти данные ранее (вы упоминаете в комментариях, что это произошло) и спросить, как они это сделали. Это действительно ваш лучший выбор и единственное, что когда-либо действительно работало для меня.
2) Используйте LinkedIn, чтобы выяснить, кто может обработать такой запрос. Для TA это может быть кто-то из их юридического отдела или, возможно, из их группы машинного обучения. По крайней мере, вы можете получить здесь представление о том, что такое отделы. Я использовал этот метод в прошлом, чтобы получить ответы на свои запросы, хотя они были «нет».
Также отмечу, что однажды у меня было разрешение от компании на сбор данных, и тогда компания не закрыла меня, а мой университет, потому что он подумал, что я «хакер из Китая». Затем подключились оба юридических отдела и забрали данные. Поэтому постарайтесь получить набор данных непосредственно от компании, а не разрешение на парсинг.
Наконец-то я нашел помощь на ResearchGate.com. Один исследователь предоставил мне несколько адресов электронной почты, которые он нашел на этой странице , и предложил мне отправить запрос на разрешение генеральному директору (Стиву Кауферу). Я отправил ему запрос по электронной почте, и я жду его ответа. Надеюсь, это может помочь кому-нибудь в будущем.
пользователь60356
Moh_BOB
пользователь60356
Moh_BOB
суперлучший
Безумный Джек
Moh_BOB
Рассвет
Moh_BOB
эйканал
ИЛИ картограф
ИЛИ картограф
Moh_BOB
ИЛИ картограф
Moh_BOB