В некоторых исследованиях фальсификации личностных тестов при отборе и найме использовался внутрисубъектный дизайн. Эти исследования включают проведение личностного теста в двух условиях. Предполагается, что одно условие измеряет честные ответы (например, в соответствии с честными инструкциями в лаборатории или в целях профессионального развития в прикладных условиях). Второе условие предназначено для получения аутентичных ответов соискателя (например, инструкции по ролевой игре в лаборатории или реальное заявление о приеме на работу в прикладных условиях).
Мне также было бы интересно узнать, как результаты варьируются в зависимости от особенностей теста, контекста, дизайна и так далее.
Ричард Гриффит и Патрик Конверс (2012) представили хороший обзор исследований по симуляции личности, в которых использовался внутрисубъектный план для изучения изменений в ответах на личностные тесты между заявителем и контекстом развития.
Ниже представлен мой обзор статей, указанных Гриффитом и Конверсом (2012). Я полагаю, что в литературе достаточно хорошо известно, что большинство, но не все исследования обнаруживают различия в средних групповых значениях между различными условиями заявителей и не заявителей. В этом обзоре основное внимание уделяется индивидуальным различиям в том, притворяются ли люди, а также в количестве притворяющихся.
Среди прочего, Артур и коллеги (2010) сообщили о двух исследованиях, в которых изучались различия в ответах между участниками, прошедшими личностный тест в качестве кандидата на работу, а затем примерно через год, прошедшими тот же личностный тест в качестве анонимного участника исследования.
SEM_d : авторы использовали стандартную ошибку измерения повторного тестирования. классифицировать операциональным способом, участвовал ли участник в искажении ответа в контексте высоких ставок
Результаты исследования 1 показали, что для большинства личностных шкал немногим более 30% баллов были классифицированы как более низкие в условиях низких ставок.
Конечно, это значение следует интерпретировать в свете того факта, что, исходя из нормального распределения и выбранных пороговых значений, можно ожидать превышение этого порогового значения примерно на 16%. Существуют также проблемы регрессии к среднему и снижения надежности крайних значений, которые можно было бы учитывать при более сложном анализе. Наконец, этот показатель фальсификации не дает информации о распределении оценок фальсификации.
SEM_d по баллам кандидатов на работу : они также исследуют распространенность снижения баллов по сравнению с баллами в условиях высоких ставок. Они пришли к выводу, что распространенность снижения баллов не зависит от результатов высоких ставок. Тем не менее, графики немного сложны для интерпретации (они представляют собой гистограммы с накоплением). Кроме того, по своему дизайну графики отвечают на вопрос о том, какая доля испытуемых на данном уровне притворяется, что интересно, но они не отвечают на вопрос, связана ли истинная оценка с притворством.
Корреляция между оценками кандидата и исследовательского контекста : отчеты в таблице 5 корреляции для обоих исследований Большой пятерки. Корреляции между 0,49 и 0,78. Такие корреляции имеют смысл в свете идеи, что одни участники отвечают честно, а другие притворяются. Это должно привести к корреляциям немного ниже, чем типичная надежность повторного тестирования.
Конечно, многие факторы влияют на корреляцию результатов личностных тестов в контексте соискателя и исследователя. В частности, важны надежность теста и время между тестами. Таким образом, немного сложно сказать, какая часть наблюдаемого снижения корреляции связана с фальсификацией в контексте заявителя, а какая — с другими факторами.
Исследователи действительно предоставляют выборка участников исследования 1, которые выполнили оба условия в контексте с низкими ставками (т. е. с существующим сотрудником и исследовательским контекстом). Эти корреляции представлены в таблице 6. Следующий анализ с использованием R показывает корреляции для двух условий, где теория предполагает, что условие высоких ставок-низких ставок (т.е. HL) должно иметь меньшую корреляцию, хотя наблюдаемая разница довольно минимальна. .
x <- data.frame(matrix(c(0.53, 0.55, 0.51, 0.7, 0.66, 0.56, 0.49,
0.5, 0.87, 0.75), ncol = 2))
names(x) <- c("HL", "LL")
row.names(x) <- c("Agreeableness", "Conscientiousness", "Emotional stability",
"Extraversion", "Openness")
x$diff <- x$HL - x$LL
round(rbind(x, Mean = sapply(x, mean)), 2)
## HL LL diff
## Agreeableness 0.53 0.56 -0.03
## Conscientiousness 0.55 0.49 0.06
## Emotional stability 0.51 0.50 0.01
## Extraversion 0.70 0.87 -0.17
## Openness 0.66 0.75 -0.09
## Mean 0.59 0.63 -0.04
Griffith et al (2007) провели исследование, в ходе которого 60 соискателей сначала прошли тест на добросовестность из 30 пунктов в условиях претендента на работу. Затем, через месяц, они завершили тест с инструкциями честно ответить на тест и притвориться.
Они обнаружили корреляцию между честным и соискателем , и стандартизированная разница между честным и заявителем . Это показывает, что баллы увеличиваются в условиях абитуриентов и что существуют индивидуальные различия в степени, в которой это происходит. Хотя отсутствие знаний о корреляции тест-повторный тест в контексте честности-честности несколько затрудняет оценку степени, в которой эта корреляция меньше, чем можно было бы ожидать.
Они также использовали несколько индексов в качестве пороговых значений разности оценок, которые классифицировали 31 или 22 процента заявителей как фальшивые в зависимости от индекса.
В последней части статьи также обсуждается изменение размера балла различия.
Эллинсон и коллеги провели исследование, основанное на большой базе данных участников, прошедших личностный тест в четырех комбинациях контекстов развития и отбора.
Средние корреляции выборки между развитием и развитием были были немного выше среднего развития-отбора ( ) и отбор-развитие ( ) корреляции.
Среднее увеличение от сеанса 1 до сеанса 2 предполагает несколько низкий уровень искажения ответа.
average scale d
development/development 0.14
development/selection 0.26
selection/development 0.04
selection/development 0.07
Насколько я могу судить, специального обсуждения распределения оценок изменений не было.
Donovan et al (2008) и Peterson et al (2008) звучат интересно, но они представляют собой презентации на конференциях, поэтому публикации не всегда доступны.
Таким образом, в целом, есть некоторые свидетельства того, что корреляция между заявителем и условиями разработки ниже, чем между двумя сопоставимыми условиями разработки. Предположительно, величина этого падения корреляции связана с количеством фальсификаций, а количество фальсификаций связано с количеством индивидуальных различий в фальсификации.
Безусловно, имеется качественное осознание того, что существуют разные категории фальсификации. Эллингсон пишет:
Консервативные оценки этого направления исследований показывают, что менее 20% соискателей намеренно искажают свои ответы и что менее 4% соискателей делают это в крайней степени.
Тем не менее, я еще мало что читал из этих внутрисубъектных исследований о распределении оценок за фальсификацию и не видел формальных математических моделей оценок изменений, хотя данные позволяют проводить такой анализ.