Предположим, я хочу оценить, насколько эффективно два учителя преподают английский язык немецким детям. Оба учителя преподают в одной и той же средней школе в течение двадцати лет, и оба используют совершенно разные педагогические методики. На самом деле между ними возникла небольшая конкуренция: они публиковали и обсуждали свои идеи и практику в журналах, имеющих отношение к их профессии, и теперь они призвали аналитика данных (вас) для проведения этой оценки, которая, как они надеются, решит их состязание и примирение бывших друзей.
Школа, в которой они оба работают, является единственной школой для маленького городка. Когда ученики поступают в эту школу, им случайным образом распределяют классы: одна половина детей распределяется в один класс (и один учитель математики), другая половина - в другой класс (и другой учитель математики).
Два учителя устали от того, что не знают, какой метод лучше. В интересах своих учеников они хотят, наконец, выбрать лучший, и с этого момента оба используют его. Они надеются, что вам не нужно тестировать одну группу детей, когда они заканчивают начальную школу, обучать их в течение 8 лет с 5-го класса до окончания средней школы, а затем снова измерять их математические способности, чтобы прийти к заключение. Поэтому они спрашивают вас:
Достаточно ли сравнить уровни зависимой переменной после вмешательства? Или вам нужно измерить его до вмешательства? Почему?
Обратите внимание, что этот ответ изначально был написан на основе вашего первоначального примера, где вы спросили:
Предположим, я разработал новое вмешательство для людей с легкой депрессией. Я хочу сравнить эффективность этого вмешательства (E) с существующим вмешательством (C). Для этого я набираю испытуемых из местной психотерапевтической скорой помощи и случайным образом распределяю их либо в экспериментальную (Э), либо в контрольную группу (С). Интересная зависимая переменная — это, конечно, депрессивность.
Как правило, вам не нужно измерять предварительную обработку для зависимой переменной . В пределе случайное назначение гарантирует равенство групп. Или, другими словами, случайное распределение гарантирует, что группы не будут предвзято относиться к тому, чтобы быть выше или ниже по зависимой переменной на исходном уровне. Типичный t-критерий между субъектами, сравнивающий баллы после лечения, как правило, обеспечивает беспристрастный тест того, оказало ли вмешательство влияние на зависимую переменную (например, депрессию) по сравнению с контрольным вмешательством.
Тем не менее, есть много преимуществ от включения базовой меры :
Обратите внимание, что существует несколько вариантов анализа планов до и после лечения, включая ANCOVA, оценки различий и эффекты взаимодействия. См. это обсуждение для дальнейших идей .
Обратите также внимание на то, что есть веские причины оценивать вмешательство, измеряя более двух моментов времени . Например, вы можете получить (а) несколько исходных показателей, чтобы получить представление о стабильности до вмешательства (б) несколько показателей, которые вы можете измерить во время вмешательства, чтобы оценить депрессию во время вмешательства, и (в) несколько дополнительных показателей, особенно для увидеть как немедленный, так и долгосрочный эффект вмешательства.
Ана
пользователь3116
Гала
пользователь3116
Гала
Ник Стаунер