Я оцениваю экзамены вместе с коллегой, но не согласен с их оценкой. Что я должен делать?

Недавно сдавал экзамены (50 шт.) вместе с коллегой из другого отдела. Я чувствовал, что мой коллега присуждает слишком много баллов за неправильные/неполные ответы. Например, начисление баллов только за написание информации о вопросе (значение и единицы измерения параметров) на листе ответов; или начисление баллов за копирование одной из формул на листе формул в лист ответов, если это специально не указано в шаблоне оценивания.

Во время оценки экзаменов я обсудил это со своим коллегой и решил в основном следовать его «системе начисления баллов», чтобы она не создавала несправедливую оценку между подгруппами всего населения. Впоследствии я снова обсудил это, но мне кажется, что мой коллега не хочет менять свой стиль оценивания.

Какие следующие шаги я могу предпринять? Нужно ли, чтобы во всем университете был один и тот же стиль оценивания?

ps: Курс проводится их отделом, и я помогаю с этого года, потому что он пересекается с моим опытом. Он имеет проходной балл ~ 50%.

ps2: Дело не в том, что его система начисления баллов настолько свободна, что студенты с 3/10 внезапно получат 6/10, но это, безусловно, изменит результат прохождения курса для некоторых студентов.

Почему вам кажется, что ваш коллега ставит слишком много баллов? Люди будут не соглашаться, это просто жизненный факт, и если вы не можете предоставить веские, объективные аргументы в пользу того, что он слишком «проигрышный» (что, как я полагаю, невозможно при оценке, поскольку разные люди оценивают разные части ответа по-разному), это звучит как вы просто должны согласиться не согласиться
Примеры: Начисление баллов за простое написание информации о вопросе (значение и единицы измерения параметров) на листе ответов. Или начисление баллов за копирование одной из формул с листа формул на лист ответов, если это специально не указано в шаблоне оценивания.
@Bollehenk - на каком уровне это происходит? Выставление частичных оценок за определение правильных методов (формул) не обязательно кажется необоснованным, хотя выделение значений/единиц может быть спорным в зависимости от объема работы, который потребуется для их извлечения, и уровня обучения.
Имеет ли он право прийти сюда и задать тот же вопрос, но сказать, что вы «присуждаете слишком мало баллов за неправильные/неполные ответы»?
Было бы полезно узнать, в какой области это находится. Субъективность намного выше в некоторых дисциплинах (классика, философия), чем в других (машиностроение... и т. д.).
@J ... учитывая, что примерами являются значения, единицы измерения, параметры и формулы, я бы рискнул предположить поле STEM.
Что бы вы подумали о том, что другой отдел потребует от вас изменить систему оценивания собственных курсов?
@ Кевин Я ничего не видел об этом в вопросе, но теперь вижу, что это было отмечено в комментариях. Вероятно, следует отредактировать эти детали в вопросе.

Ответы (8)

Пусть каждый оценивает разные вопросы , а не разных учеников .

Последовательность в оценках важна, и это несправедливо по отношению к учащимся, если их оценки существенно зависят от распределения их работы оценщиком. По этой причине, если вам необходимо разделить обязанности по выставлению оценок по конкретному элементу оценивания с другим коллегой, лучше разделить обязанности по выставлению оценок за вопросы , а не делить выставление оценок учащимся . Так, например, один человек оценивает Q1-3 по всем работам , а другой оценивает Q4-6 по всем работам . Таким образом, каждый ученик оценивается одним и тем же человеком по одному и тому же вопросу. (С точки зрения логики каждый из вас должен оценить свои вопросы по половине заданий, а затем поменяться местами.)

Похоже, этот корабль уже отплыл, и вы совершили ошибку новичка, разделив оценки для студентов, чтобы разные люди выставляли разных студентов. Также похоже, что вы пытались обсудить это со своим коллегой, но вы исчерпали все попытки изменить его оценку . В этом случае, даже если ваш собственный стиль оценивания лучше, чем у вашего коллеги, адаптация к его уровню оценок для этой оценки , вероятно, является разумным вторым лучшим вариантом, просто чтобы поддерживать постоянство уровня выставляемых оценок. В будущем постарайтесь избежать этой проблемы, разделив оценку по вопросам, а не по учащимся.

Должен согласиться здесь, разделение вопросов НАМНОГО лучше, чем разделение студентов, и в прошлом пробовали и то, и другое.
На самом деле удивительно, что этот метод не является обязательным в университете.
На первом экзамене по математике, который я написал, оценка была сделана менее чем за 24 часа с использованием «конвейера», при этом каждый ТА оценивал один вопрос. Как только первый ассистент оценивает первый вопрос первого экзамена, второй ассистент может начать работу над вторым вопросом первого экзамена, время обработки сведено к минимуму, и ни один экзамен не пропускается в процессе замены. Личный ассистент профессора тогда только суммировал баллы, а профессор расписывался на экзамене.
Мой друг проводит ТА в Канаде, и они используют именно эту систему. На самом деле листы бумаги сканируются, программное обеспечение разделяет изображения на разные вопросы, и ассистенту назначается один из вопросов, и они параллельно проводят онлайн-оценку, поэтому тому, кто быстрее, не нужно ждать других ассистентов, прежде чем получить ответ. экзамены на оценку. Очевидно, что для сканирования и разделения требуется очень хорошая система, иначе это невозможно.
Именно по этой причине мы используем скрепленные листы ответов, где каждый ответ на каждый вопрос должен быть представлен на отдельном листе. После того, как экзамены сданы, мы разбираем экзамены и раздаем вопросы оценщикам так, чтобы один оценщик получил все листы с конкретным вопросом.
@damian Спасибо, что наконец заставили меня понять, почему мне пришлось писать свое имя/удостоверение личности на каждой странице (некоторых) моих экзаменов.
Последовательность в оценках (почти) невозможна ИМХО. Его презумпция — тщеславие. Но разделение вопросов действительно полезно.
@mbrig это не обязательно только из-за того, что многие люди отмечают отдельные страницы, размещение вашего имени на каждом листе гарантирует, что, если страница по какой-либо причине потеряется, ее все равно можно будет сопоставить с правильным учеником.
Стоит отметить, что это все еще не идеально: если на экзамене есть вопросы типа A и B, а вы исправите только вопросы типа B, может случиться так, что студенты с одинаковым уровнем навыков, но один хорош в A, а другой плохо хорошо в B, получить совсем другие оценки. Поэтому, если это возможно, я считаю, что лучше не делить вопросы по типам.
@ Дэвид, некоторые причины, по которым этот подход не является обязательным. Во-первых, для больших классов (много сотен) это невозможно. Другой заключается в том, что наличие нескольких маркеров позволяет проводить модерацию, предотвращая оценку одного вопроса совершенно иначе, чем другие. Но если у вас есть несколько маркеров вопроса, у вас должна быть схема оценивания, согласованная всеми маркерами и придерживающаяся ее (хотя она может меняться по мере того, как встречаются разные действительные ответы).
@DaveCousineau, может быть, но если вас попросят сделать одно упражнение на страницу или что-то подобное, я думаю, предыдущий комментарий совершенно прав...
Хотя это действительно решает практические вопросы получения учащимися одинаковых оценок по одному и тому же вопросу, это, в первую очередь, не решает проблему неудовлетворительности схемы оценок другого человека; это также не решает проблему, стоящую сейчас под рукой: два человека оценивают один и тот же вопрос разными методами. Это решение предотвратит эту проблему, но не решит ее после того, как это произошло.

Окончательную ответственность за проведение курса, включая выставление оценок*, несет зарегистрированный инструктор. Поскольку это звучит так, как будто вы не являетесь зарегистрированным инструктором, а просто кто-то, кто помогает оценивать, на самом деле не вам решать, что является или не является подходящей оценкой.

Если у вас есть разногласия с другим оценщиком по поводу того, как выставлять оценки за экзамены, и вы не можете решить его, используя уже предоставленную вам информацию (вы сказали, что шаблона оценок недостаточно для этого), то уместно обсудить это с этим человеком. ответственный за этот курс (зарегистрированный инструктор), и посмотрите, что они говорят об этом.

Конечно, вы не хотите беспокоить их из-за каждой мелочи оценивания, но если речь идет о крупномасштабных различиях, когда философские различия в том, как проводить оценивание, могут существенно изменить оценки учащихся, это именно то, что человек ответственный за курс должен быть посредником.

Обратите внимание, что все становится немного сложнее, когда это групповой курс, где есть несколько «основных» инструкторов. Однако в таких ситуациях обычно каждый инструктор берет на себя инициативу по определенной теме. Как таковые, их следует считать основным мнением по вопросам, относящимся к их теме. (Вопросы, затрагивающие несколько тем, должны решаться по обоюдному согласию «основных» инструкторов.)


*) При условии, что некоторые курсы должны соответствовать стандартам отдела или аккредитации. Но даже в этих случаях именно инструктор несет ответственность за соблюдение этих стандартов.

Этот ответ, кажется, смешивает административное понятие ответственности с академическим понятием ответственности. Проще говоря, мне не нравятся несправедливые оценки и плохая академическая практика в моих модулях, даже если я не являюсь формальным руководителем модуля.
@DmitrySavostyanov Я, конечно, не имею в виду, что вы должны мириться с несправедливой практикой или что вы не должны брать на себя академическую ответственность за свои действия, если вы не являетесь зарегистрированным инструктором. Я просто говорю, что человек, который несет полную ответственность за то, как проводится курс, — это человек, чье имя указано в каталоге курсов. - Вопрос ОП - один из двух людей, имеющих честные философские разногласия по поводу того, как интерпретировать неоднозначную рубрику. Я просто указал, что они должны проконсультироваться с лицом, ответственным за рубрику.

В моем учреждении принято дважды отмечать 20% представленных материалов в целях стандартизации/модерации.

Это может означать, что 80 % получают одиночную маркировку, а 20 % — двойную, или это может означать, что два маркера оценивают по 60 % каждый (двойное перекрытие 10 %). Для оценок с низким весом это считается рекомендуемой передовой практикой, но обязательной для оценок с большим весом.

Если в вашем учреждении не существует таких механизмов стандартизации/модерации оценок, возможно, стоит предложить реализовать это (или что-то подобное).

Не зная вашего отдела, трудно сказать, уместно ли (или возможно ли) предложить это реализовать для вашей текущей когорты заявок, иначе это будет частью толчка к внедрению более широких изменений.


Несколько заметок о процессе, для любопытных:

Если есть разница между несколькими маркерами для какой-либо отдельной заявки, то маркеры должны установить согласованную оценку. Если согласованная оценка не может быть достигнута, она передается в отдел для посредничества.

Если выявляется значительная разница между несколькими маркерами в нескольких представлениях, тогда вся когорта должна быть отмечена дважды (и любые различия в оценках должны быть согласованы, как описано выше). Наша точка отсчета для «существенной разницы» — это среднее отклонение (коррекция) >= 7%.

Ответы, которые вы уже получили, действительно превосходны. Я просто хотел добавить одно небольшое наблюдение. Вы говорите, что оценивали эти экзамены

с коллегой из другого отдела

и что

Курс проводится их отделом , и с этого года я помогаю, потому что он пересекается с моим опытом.

По вашему собственному признанию, вы более или менее гость в их отделе, оказывая им услугу, помогая. Это означает, что оценки, в конечном счете, не являются вашей ответственностью .

Во-первых, предложение @Ben разделять оценки по вертикали, а не по горизонтали - вопросы, а не студенты - хорошо и практично независимо от всего остального.

При этом предлагаю вам рассмотреть следующее:

  1. Откажитесь от фантазии или, лучше сказать, от тщеславия, что оценки последовательны. Это не так из-за миллиона факторов: экзамены не всегда одинаковой сложности; распределение способностей учащихся не синхронизировано с формированием кривой оценок; чувство серьезности ошибок различно для одного и того же человека при первых встречах и при поздних встречах; меняется настроение; неосознанные предубеждения (например: против людей с неаккуратным почерком); и так далее.
  2. Постарайтесь запланировать обсуждение политики выставления оценок всеми оценщиками и авторами экзамена до того, как будет сдан следующий экзамен (в следующем семестре?). В этом обсуждении поднимите некоторые конкретные сценарии, требующие более точного суждения, а не просто «сколько баллов за какой вопрос».
  3. Рассмотрите аргументы в пользу более грубой детализации оценок в курсе. Я фанат зачетов/незачетов (или зачет/незачет/отлично) и не люблю числовые шкалы, особенно от 0 до 100 или дробные оценки. Я могу с уверенностью смотреть на кого-то и говорить: «Да, вы поняли, чему мы здесь учили, вы прошли». или «Нет, ты не понимаешь — ты терпишь неудачу». И если кто-то находится на грани, то это вопрос политики, пройти его или провалить (лично я склоняюсь к провалу). Но я действительно не могу объяснить, почему у кого-то 63, а у другого 64,7. Я чувствую, что только помогаю какому-то произвольному промышленному механизму массового манипулирования, присваивая людям такие номера.

PS - Эти три предложения в основном ортогональны.

« Откажитесь от [фантазий/тщеславия] о том, что оценки постоянны. Это не так ». Действительно. Это недостаточно представлено в этой теме, но также и в университетах. Оценки могут повлиять на годы чьей-то жизни: не все получают либо прямую пятерку, либо полный провал, поэтому для многих учащихся эти отклонения имеют значение. Лично у меня это обычно шло хорошо, но я видел так много студентов, которые усердно работали, а затем провалили курс, в то время как их сверстники сдали экзамен, хотя эти сверстники с одинаковой вероятностью были лучше, чем хуже. Не только стиль оценивания/предубеждения, даже изучение правильных страниц создает дисперсию.
@Luc: Я думаю, вы объясняете, что оценка не всегда уместна , а не непротиворечива . Я говорил об оценке представленной работы, которая, как можно утверждать, имеет одинаковое качество и представляет собой одинаковое владение материалом.
Оценка непостоянна, но это плохо. Лучше попытаться увеличить согласованность, чем уменьшить ее.

Если значительное количество полных работ было оценено разными людьми, вы можете рассмотреть возможность внесения исправления, чтобы работы, выполненные каждым оценщиком, имели одинаковую среднюю оценку (и, в идеале, одинаковую дисперсию). Это не устраняет все несоответствия, но, по крайней мере, делает оценку статистически справедливой.

Звучит хорошо в теории, но как этого добиться?
Статистическая справедливость хороша только для статистических отчетов. Студентам необходимо объяснить, за что начисляются/снимаются баллы, а также давать полезные отзывы и предложения по улучшению.

Отличная дискуссия, с удовольствием читаю комментарии. Будучи студентом, я столкнулся с предвзятостью, крайней в двух случаях, при выставлении оценок в течение первых двух лет. Только благодаря настойчивости и наставничеству двух профессоров я смог это преодолеть. Таким образом, руководящим принципом в моей преподавательской карьере было позволить ученикам преуспеть или потерпеть неудачу в зависимости от их собственных заслуг .

Как и @einpokum, я ненавидел кривую нормального распределения, считая ее устаревшей и несправедливой. Одна горилла в комнате - это тот факт, что некоторые студенты в каждом кампусе, в основном через различные организации, особенно с греческими буквами, имеют доступ к экзаменам и работам, чем студенты, не подключенные к сети. Будучи аспирантом, я потерял ряд работ, оцененных профессорами, которые оставили их за пределами ведомственных кабинетов. И, как профессор, я определил, что пара представленных мне статей была плагиатом. Защита справедливости оценивания учащихся является обязанностью учреждения.

По моему собственному опыту, после первого года преподавания в колледже я ввел то, что я назвал оценкой развития , полагая, что учителя несут ответственность за создание условий, в которых все ученики имеют возможность добиться успеха. Это понятие я усвоил в детском саду от двух очень умных воспитателей, и с тех пор оно осталось в моем сознании. Их применение было исключительно экологическим. Подход, который я использовал, также был экологическим, но был сосредоточен на оценке учащихся и состоял из трех этапов:

  1. Студенты сдавали экзамен, который оценивался мной, а затем и другими, по мере того как число студентов на моих общих курсах увеличивалось с менее 20, когда я начинал, до более 100.

  2. После того, как оценки были известны, студенты могли подать заявку на повторную сдачу экзамена, получив половину баллов за каждый вопрос, который они «пропустили» на начальном экзамене. Они будут добавлены к их более раннему классу.

  3. Если они все еще не удовлетворены, они могут сдать устный экзамен перед всем классом, который затем оценит их работу.

Хотя было несколько человек, выбравших вариант № 2, никто не подал заявку на вариант 3. Я надеялся, что хотя бы один из них определит, как отреагируют студенты.

Только после того, как 2-й этап был завершен, класс прошел экзамен вместе, чтобы поделиться своими мыслями о каждом вопросе и ожидаемых ответах. Позже это было изменено, чтобы студенты могли сдавать экзамен с помощниками студентов или другими профессорами в зависимости от курса.

Второй принцип моей оценки, который студенты в конечном итоге усвоили, заключался в том, что три предыдущих экзамена оказали меньшее влияние на их итоговую оценку, чем то, как они повлияли на общий выпускной экзамен; и что эти экзамены и последующее обсуждение были разработаны, чтобы помочь им лучше выступить в финале. На самом деле, учащийся может плохо сдать все остальные экзамены (за исключением плохой посещаемости или других несоответствий минимальным параметрам), получить пятерку на выпускном и получить пятерку за оценку. Для некоторых студентов это, несомненно, оказалось подарком, но они заработали более высокую оценку. Почему? Я считал, что финалы были созданы не для того, чтобы набрать процент оценки по всем остальным критериям, а для того, чтобы всесторонне проверить то, что они дают.в целом узнали о предмете курса. Выставление оценок на выпускных экзаменах было одним из моих основных удовольствий, как и кофе для гурманов, который я пил, чтобы справиться с ними. :)

Я мог бы добавить, что экзамены были не единственными факторами, влияющими на итоговую оценку, но рецензии на книги, отчеты о спикерах или мероприятиях в кампусе, имеющих отношение к классу, или викторины, которые они запускали, не задавая вопросов, когда меня подсказывал мой вопрос в конце каждого урока. Класс - есть вопросы? Как и многие из вас, я подозреваю, что преподавание включает в себя изучение сложных понятий и сокращение их до уровня 8-го класса, чтобы большинство студентов первого и второго курсов могли понять, о чем мы говорим.

Отличным ответом является разделение оценок по вопросам, а не по ученикам. Но если это невозможно, попробуйте договориться о рубрике, т. е. о том, сколько баллов присваивается каждому аспекту ответа, который вы ищете.