Как измерить точность в рамках классической теории тестирования?

Какие методы или подходы существуют или могут быть разработаны для измерения точности измерений в рамках классической теории тестирования? Стандарты образовательного и психологического тестирования (Американская психологическая ассоциация, 2014 г.) говорят о точности измерения в нескольких местах, но, похоже, не содержат никаких ссылок.

Кроме того, в какой степени точность измерения в теории IRT аналогична или отличается от абсолютного совпадения баллов (в отличие от межэкспертной надежности или надежности теста, измеряемой альфа-каналом) в CTT?

Ответы (1)

«Точность» в классической теории тестирования

В большинстве описаний классической теории тестов нет понятия точности как такового, но иногда надежность можно назвать точностью. Взаимосвязь, вероятно, наиболее лаконично проиллюстрирована на стандартных мишенях для дротиков. Это также объясняется на странице « Теория ответов на вопросы» в Википедии , но, как вы можете видеть, в CTT точность — это надежность, а точность — валидность.

введите описание изображения здесь Тафт Ю

( Статья о надежности Википедии сопоставлена ​​с руководством Университета Тафтса .

Происхождение «точности» в классической теории тестов

Кронбах (1951) предложил Кумбса (1950) как источник путаницы между надежностью и точностью.

Кумбс (6) предлагает несколько более удовлетворительное название «коэффициент точности» для этого индекса, который показывает абсолютную минимальную ошибку, которую можно обнаружить, если один и тот же инструмент применяется дважды независимо к одному и тому же субъекту. Коэффициент стабильности можно получить, сделав два наблюдения с любым желаемым интервалом между ними. Таким образом, строгое определение коэффициента точности состоит в том, что это предел коэффициента стабильности, поскольку время между испытаниями становится бесконечно малым.

Я не совсем уверен, правильно ли я интерпретирую вторичный вопрос, но точность IRT — это мера точности в IRT, а ICC — мера надежности в CTT. Основное отличие состоит в том, что CTT выражает надежность как одно значение, тогда как IRT выражает точность для разных значений базовой характеристики. Однако это не относится к абсолютному согласию, поэтому, возможно, я неправильно понимаю.

использованная литература

Мне непонятна ваша лексика: "точность к валидности". Являются ли точность и достоверность синонимами? Являются ли надежность и точность синонимами в рамках CTT?
Это скорее параллель. Короче говоря, в СТТ нет «точности», есть только «надежность».