В тесте « Коэффициент спектра аутизма » испытуемый сталкивается с пятьюдесятью утверждениями, такими как:
Я не особо люблю читать художественную литературу.
Я предпочитаю повторять одно и то же снова и снова.
и спрашивают, являются ли они
с ними. Нейтрального варианта нет.
Тест оценивается следующим образом: если испытуемый соглашается с «аутичным» утверждением, он получает балл. То же самое относится, если они не согласны с «неаутичным» утверждением. Нет разницы между слегка и определенно согласным (или несогласным).
Я ожидаю, что такой дизайн теста (без нейтрального варианта, без различия между слабыми и сильными тенденциями) приведет к усилению малых эффектов, таких как интерпретация вопроса, слабые тенденции, прайминг, случайность и так далее. Хотя я признаю, что этот эффект может быть желательным в опросах клиентов и т. п., мне он кажется проблематичным в тесте для целей диагностики и эпидемологии (например, в этом тесте). Например, я ожидаю, что люди, у которых уже диагностирован аутизм (и они об этом знают), или люди с банально аутистическими интересами, такими как математика, с большей вероятностью склонятся к более аутистическому варианту, даже если их фактическая позиция по вопросу нейтральна.
Теперь, я непрофессионал, и я признаю, что разработать такой тест непросто, так как нужно учитывать несколько эффектов. Поэтому я задаюсь вопросом: каковы оправдания такого дизайна теста , в частности, в свете его приложений (диагностика и эпидемология) и моей критики выше? В документе, представляющем тест , нет никаких ссылок или причин для этого, по крайней мере, не в тех разделах, где я этого ожидал.
Многие конструктные шкалы разрабатываются с относительно небольшим вниманием к содержанию. Исследователи могут начать с большого набора вопросов-кандидатов, версий, форматов и формулировок, а затем в процессе проверки сузить их до подмножества, которое хорошо коррелирует с конструктом, который они пытаются измерить. Цель состоит в том, чтобы найти баланс между коротким сроком теста и сохранением его прогностической ценности. Во введении Baron-Cohen et al (2001) они отмечают:
AQ, как показано в Приложении, является результатом пилотного тестирования нескольких версий в течение нескольких лет.
Во многих случаях исследователей заботит не то, почему вопросы работают, а то, что они работают.
Сказав это, решение использовать формат принудительного выбора вместо, скажем, рейтинговой шкалы типа Лайкерта с большей детализацией и нейтральным вариантом, может быть политическим:
Ипсативные меры могут быть более полезными для оценки черт внутри человека, тогда как шкалы типа Лайкерта более полезны для оценки черт у разных людей.
Это может сделать меры принудительного выбора желательными для стигматизированных ярлыков, чтобы препятствовать сравнению людей друг с другом:
Поощрение учеников к тому, чтобы они превзошли свои предыдущие оценки, может снять давление со стороны сверстников в ситуациях и устранить элемент соперничества, связанный с ссылками на нормы.
Обратите также внимание на то, что оригинальное исследование подтверждает, что математики получают значительно более высокие баллы по этой шкале, как и следовало ожидать:
... ученые набирают больше баллов, чем неученые; а в естественных науках математика, ученые-физики, компьютерщики и инженеры имеют более высокие баллы, чем более гуманитарные или жизненные науки, такие как медицина (включая ветеринарию) и биология. Этот последний вывод повторяет наши более ранние исследования, обнаружившие связь между состояниями спектра аутизма и профессиями/навыками в области математики, физики и инженерии.
Это говорит о том, что авторы считали вполне допустимым, чтобы математики получали более высокие баллы по своей шкале аутизма (т. е. эта шкала не предназначена для того, чтобы отличать аутистические наклонности математиков от склонностей людей с диагнозом аутизм).
Шонни123
Врзлпрмфт
Шонни123
Врзлпрмфт
Робин Крамер-тен Хав
пользователь3116
Врзлпрмфт
пользователь3116
Врзлпрмфт