Я вижу много заявлений о том, что тексты связаны друг с другом или зависят друг от друга во многих публикациях. Например:
Хотя Павел не писал Послания к Евреям, тем не менее этот текст имеет чрезвычайно важное отношение к неоспоримым посланиям Павла. Один только постскриптум (Евр. 13:20-25) не только свидетельствует о литературной опоре на бесспорный корпус Павла, но также, как аспект этой опоры, присваивает себе личность Павла как автора собственного еврейского текста. - Клэр К. Ротшильд, Евреи как псевдоэпиграф: история и значение атрибуции Павла евреям.
Однако мне любопытно, существуют ли объективные модели для определения взаимозависимости текстов. Это связано с подсчетом слов, подсчетом морфов, подсчетом лемм или просто общим ощущением их родства? Есть ли другая модель, по которой это установлено?
Несколько методов, которые люди используют для установления литературной зависимости, включают:
Хорошим вводным источником для изучения некоторых из этих вещей является учебник Гудакра по синоптической проблеме .
Хотя я думаю, что было бы несправедливо называть эти методы субъективными, они носят скорее качественный, чем количественный характер. Этого и следовало ожидать, поскольку образовательная подготовка библеистов обычно не включает большого количества сложной статистики и математики. Однако в век компьютеров все чаще предпринимаются попытки применить количественные методы к литературным вопросам. Замечательный недавний пример, о котором я слышал (который не имеет прямого отношения к вопросу о литературной зависимости), — это филогенетический анализ текстовой истории Послания к галатам , проведенный Стивеном Карлсоном .
Было предпринято несколько попыток дать количественную оценку вопросам литературной зависимости и направления литературной зависимости. Я думаю, что самые ранние Евангелия были в « Синоптическом резюме » Тайсона и Лонгстаффа . Но я не могу найти много информации об их выводах. Но даже несмотря на то, что были некоторые попытки, мне кажется, что до сих пор не создана действительно убедительная и удовлетворительная количественная модель, построенная для решения вопросов литературной зависимости. Хотя мне интересно, используют ли компании, обнаруживающие плагиат эссе, хорошие алгоритмы для такого рода вопросов.
В ответ на вопрос swasheck, позвольте мне попытаться еще немного раскрыть разницу между действительным/недействительным, объективным/субъективным и количественным/качественным. Пожалуйста, отнеситесь к этому с недоверием, потому что я не эксперт и могу говорить совершенно неверные вещи.
Давайте для конкретности предположим, что мы рассматриваем следующую ситуацию: эксперт выбрал набор выдержек из газетных статей и поставил перед различными экспертами задачу определить, какие статьи зависят от каких других. Эксперт знает ответы (потому что она знает, какие из них пришли из телеграфных служб и в какое время были написаны статьи, и подтвердила часть этой информации у авторов), но эксперты не знают ответов. Каждый эксперт использует свой метод (возможно, с помощью компьютера) для определения своих ответов, которые затем передаются экзаменатору.
Здесь «валидность» спрашивает, как часто эксперт получает правильный ответ (при условии, что у нас достаточно большая выборка, чтобы игнорировать удачу). Если эксперт дает правильный ответ в подавляющем большинстве случаев, то его техника почти наверняка является действенным способом получения правильных ответов.
«Объективность» или «субъективность» — это мера, отличная от действительности. Если одна экспертная техника — это просто «Я эксперт, и я узнаю это, когда увижу это», это может быть правильным, но также будет очень субъективным, потому что у другого человека может быть другая интуиция. Тем не менее, может существовать очень успешная и действенная субъективная техника.
«Количественный» и «качественный» снова являются описанием используемого метода. Количественная мера включает в себя подсчет вещей и выполнение расчетов, тогда как «качественная» включает менее численные подходы. Например, вероятно, довольно сложно превратить «редакционную усталость» в количественный метод, потому что он включает в себя рассмотрение значения, а не только используемых слов, в то время как подсчет длин самых длинных строк является количественным. У вас может быть метод «количественный», но совершенно недействительный, потому что он не измеряет правильные вещи. Точно так же вы могли бы иметь качественный, но вполне действительный.
У вас могут быть техники, которые являются качественными, но, тем не менее, объективными, если им можно обучить человека, но трудно запрограммировать. Скажем, у вас есть некая качественная техника, на обучение которой уходит семестр аспирантов, но как только вы обучите ей этих студентов, они согласятся друг с другом в 99% случаев. Тогда хоть эта методика и качественная, тем не менее она объективна. И наоборот, вы могли бы иметь очень количественную технику, которая включала бы только подсчет слов, что, тем не менее, было бы довольно субъективным, поскольку, скажем, не давало бы ясности, когда считать два спряжения или склонения как «одно и то же слово».
В социальных науках распространенным методом анализа человеческого поведения является создание «системы кодирования», в которой вы заменяете видео людей набором конкретных событий, вписывающихся в некоторую систему. Цель такой системы всегда состоит в том, чтобы превратить что-то качественное в нечто количественное. Но только потому, что он количественный, не означает, что он объективный или достоверный. Вы должны убедиться, что разные кодеры, просматривая одно и то же видео, дают одинаковые результаты, и вы должны быть осторожны, чтобы измерять то, что вы намеревались измерить, а не что-то подобное.
Джон Эриксон