Я заинтересован в использовании Mechanical Turk в качестве средства набора участников для онлайн-исследований по психологии. Я никогда не использовал его для каких-либо исследований. Тем не менее, многие из моих исследований занимают от 30 минут до часа. Типичное исследование может включать в себя ответы на набор анкет с использованием Inquisit. У меня сложилось впечатление, что Mechanical Turk лучше всего работает с короткими исследованиями (т. е. от одной до пяти минут).
В целом я понимаю, что более длительное обучение потребует гораздо большего вознаграждения, возможно, больше, чем просто кратное количеству времени. Я также предполагаю, что возникнут дополнительные вопросы контроля качества.
Я только начал читать о Механическом Турке. Это краткое изложение некоторых советов, которые я нашел. Правда, большая его часть относится к психологическим экспериментам вообще, а не конкретно к более длительным.
Дэвид Шарек обсуждает свой рабочий процесс, который явно включает исследования в диапазоне 30 минут . Таким образом, этот пост является одним из наиболее актуальных для решения вопроса о более длительных исследованиях.
Вот некоторые другие разнообразные ресурсы; см. также ссылки внизу.
Разные блоги, относящиеся к Mechanical Turk, упомянутые Buhrmester
Общая модель, по-видимому, состоит в том, чтобы иметь ссылку на внешний сайт (убедитесь, что он открывается в новой вкладке или окне), где проводится опрос, и поле для ввода кода завершения.
Бурместер обсуждает различные системы кодов завершения и выбрал относительно простой вариант, когда участники должны составить 4- или 5-значное число и ввести его как в опрос, так и в mturk. Затем он использует данные временной метки, чтобы проверить исходный завершитель.
Мейсон и Сури Стэйт
Однако недавнее исследование поведения рабочих (Chilton et al., 2010) показало, что у рабочих была резервированная заработная плата (наименьшая сумма оплаты, за которую они будут выполнять задание) всего 1,38 доллара в час при средней эффективной почасовой оплате труда. заработная плата в размере 4,80 доллара США для рабочих (Ipeirotis, 2010a).
С точки зрения взаимосвязи между оплатой и качеством работника они ссылаются на исследования, предполагающие, что существует первоначальная положительная взаимосвязь, которая выравнивается в определенный момент, так что в определенный момент дополнительная оплата не улучшает производительность. Затем Массон и Сури предлагают:
Следовательно, часто рекомендуется начинать с выплаты меньше ожидаемой резервной заработной платы, а затем повышать заработную плату, если уровень выполненной работы слишком низок.
Точно так же заработная плата до определенного момента должна увеличить скорость сбора данных.
Что касается отказа от хитов, Майкл просто принял все хиты. Это может быть проще, чем пытаться выяснить, какие хиты являются законными. Это также имело смысл, учитывая, что он часто платил всего 10 центов за участника за 10-минутные эксперименты. Это также имеет то преимущество, что не наносит ущерба вашей репутации.
Здесь есть две проблемы. Завершил ли участник исследование вообще? И завершили ли они исследование должным образом (например, примерили задание на выполнение, правильно прочитали инструкции и т. д.)?
Общий подход состоит в том, чтобы включить дополнительные средства для обнаружения сомнительных данных. Если таких участников просто отфильтровать, то они не испортят окончательный набор данных.
Несколько идей:
Бурместер делает причинно-следственное наблюдение, что качество ответов может варьироваться в зависимости от страны респондентов, поэтому, например, ограниченное участие участников из США является одним из грубых способов фильтрации качества.
Бурместер упоминает о принятии всех совпадений как для простоты, так и для управления репутацией.
Мейсон и Сури (2012) обсуждают, как обсуждается и отслеживается репутация на внешних сайтах.
Turkopticon — это сайт, который позволяет работникам оценивать заказчиков по четырем осям: коммуникабельность, щедрость, справедливость и оперативность. Turker Nation — это онлайн-доска объявлений, где сотрудники регулярно комментируют запросы и сообщают об отдельных HIT. Настоятельно рекомендуется, чтобы новые запрашивающие лица «представляли» себя сообществу Mechanical Turk, сначала размещая сообщения в Turker Nation, прежде чем размещать HIT.
Вы можете взглянуть на SurveyComet.com и TurkPrime.com . Оба предлагают довольно хороший набор инструментов для проведения внешних опросов (например, на Qualtrics и SurveyMonkey) и позволяют создавать последующие опросы, исключать предыдущих сотрудников, иметь определенные демографические панели и многое другое.
Длинный опрос можно разбить на две части. Запустите часть 1, а затем часть 2 в качестве продолжения, которое будет открыто только для тех, кто принял участие в части 1.
Отказ от ответственности: я являюсь частью команды разработчиков программного обеспечения и в настоящее время работаю над этими сайтами.
Джефф
Офри Равив
Джероми Энглим
Джероми Энглим