Зачем университету ограничивать публикацию работ из-за опасений плагиата, если используется TurnItIn?

Раньше я публично размещал код, написанный для университетских заданий, в своей учетной записи GitHub (конечно, после того, как сроки истекли). Вскоре я получил электронное письмо от отдела с просьбой удалить его из-за опасений плагиата (если студенты получили такие же или похожие задания в последующие годы).

Я так и сделал, но недавно задумался — мой университет использует Turnitin для обнаружения плагиата, что, как я понимаю, означает, что мой код уже есть в базе данных Turnitin, как показано в приведенной ниже выдержке из этого FAQ :

Заблуждение 7: Каждая представленная студенческая работа навсегда становится частью базы данных Turnitin.

Реальность : У Turnitin есть много вариантов, в том числе возможность предложить студентам «отказаться» от базы данных и возможность иметь институциональную базу данных студенческих работ. Студенческие работы могут быть удалены только по требованию преподавателя класса.

Я не помню, чтобы отказывался от чего-либо, поэтому, если мой код находится в базе данных Turnitin, наверняка незамеченный плагиат не будет проблемой? Конечно, мораль предоставления отчаявшемуся студенту как искушения, так и средств для плагиата — это совсем другой вопрос.

Проверка слишком большого количества опубликованного кода может привести к ложным срабатываниям. Как правило, существует всего несколько подходов к решению данного студенческого задания. Это ограниченное пространство может быть заполнено опубликованным кодом, так что даже полностью независимое решение будет соответствовать хотя бы одному опубликованному решению.
TurnItIn в лучшем случае сомнительна. Я помню, как мы тестировали TurnItIn, когда он был впервые выпущен. Каждому было поручено написать статью на одну страницу, используя один и тот же источник на полстраницы. И это был день, когда весь наш класс получил «50% сходство» друг с другом. С кодом практически невозможно остановиться, с открытым исходным кодом и ограниченным количеством способов написать оператор if.
@Compass Ваши доказательства только подтверждают вывод «Turnitin был в лучшем случае сомнительным, когда он был впервые выпущен». Это было почти 20 лет назад .
Это не имеет отношения к вопросу, но это заставляет меня задаться вопросом, может ли университет на самом деле «ограничить публикацию работы из-за опасений плагиата». Похоже, они попросили вас удалить код GitHub, но мне не ясно, что вы должны чувствовать себя обязанными выполнить запрос, или что университет уместно просить об этом, учитывая тот факт, что ваш код может помогите многим другим людям, у которых нет желания заниматься плагиатом, и что это может быть полезным способом продемонстрировать свои способности программирования (и щедрость) и, таким образом, помочь своей карьере.
Я разместил отдельный вопрос , вызывающий опасения, в моем комментарии выше.
@DavidRicherby В моем предыдущем заявлении утверждается, что оно было плохим, когда оно вышло. Мое последнее утверждение утверждает, что компьютерный код (все еще) практически невозможно проверить, поскольку операторы кодирования относительно неизменны. import java.util.Date;будет таким же в 100% программ, как и Date date = new Date();. Если я решу зарегистрировать и правильно использовать всю библиотеку Apache с открытым исходным кодом, она будет соответствовать 100% этого кода, необходимого для запуска. Это ненадежно в области компьютерных наук из-за того, какова информатика.

Ответы (3)

Эти средства проверки на плагиат могут обнаруживать только определенные виды плагиата. Например, они обнаружат, совпадают ли текстовые части. Они не обнаружат отсутствующие ссылки или плагиат идей.

Так что, если вы разместите свое задание там, то другие могут быть «вдохновлены» этим, и если они перепишут все своими словами и изменят код определенным образом, но не процитируют ваш проект GitHub, то это будет плагиатом. Но Turnitin может не признать его таковым. Тем более, что я предполагаю, что вам нужно было бы установить уровень обнаружения довольно низким, потому что для таких заданий всегда будет определенное совпадение результатов, если все решают одну и ту же проблему.

Это - он предлагает обфускацию кода, чтобы заставить его «читаться» по-другому, мало что делая для изменения основного кода.

В таком случае я не думаю, что это был бы плагиат копирования и вставки, который был бы проблемой. Просто учащиеся могли прочитать вашу работу и точно знать, как решить свою проблему, и им не нужно было бы цитировать вашу работу и просто разыгрывать ее, как будто они сами до нее додумались.

С другой стороны, я не думаю, что это очень хороший способ справляться с вещами, особенно в задачах кодирования. Частично это просто природа кодирования, где очень важно научиться читать чужой код, и еще важнее научиться адаптировать существующий код для новых и разных целей. В задании потребуются лишь небольшие изменения, чтобы учащиеся не могли просто использовать существующую работу, поэтому кажется, что беспокойство может быть преувеличено, но я не могу сказать наверняка, не зная точного характера задания и оценки. методы.

Другая проблема заключается в том, что если вы просто попросите вас удалить общедоступный, совместно используемый ресурс, где и студенты, и преподаватели могут быть в равной степени осведомлены о работе, это не означает, что студенты в любом случае не будут распространять версии работ прошлых лет. За исключением этого, доступ к ресурсам будет только у ограниченного подмножества учащихся (в определенных социальных группах и т. д.), и неясно, кто видел, а кто не видел предыдущие наборы решений.

Я знаю, что многие преподаватели хотели бы, чтобы их студенты были настолько горды своей работой, чтобы захотели поделиться ею и дать другим людям прочитать ее, и особенно чтобы студенты, испытывающие затруднения, изучали работы таких студентов и видели, как они что-то делают. Похоже, отличный результат, правда. И кажется довольно общепризнанным тот факт, что в этот исторический момент с большим количеством связей нельзя полагаться на простую секретность в тестах — вам нужно каждый раз что-то настраивать и менять, чтобы студенты могли извлечь пользу из работы предыдущих лет, в то время как в то же время по-прежнему необходимо выполнять свою новую работу.

Я трижды терпел неудачу при приеме на работу в TurnItIn, поэтому я не знаю, достаточно ли они умны, чтобы пометить исходный код компьютера как требующий особого отношения. Глупое средство проверки на плагиат будет побеждено глобальным поиском и заменой имен переменных.

Конечно, это так. Университет опасается, что TurnItIn не выявит плагиат исходного кода так же хорошо, как плагиат естественного языка .