Я нахожусь в процессе создания своего собственного языка, и на данный момент я создал базовый словарный запас примерно из 200 слов. Отсюда, однако, я несколько не уверен в том, какой словарный запас мне следует добавить в первую очередь. Очевидно, что создание языка со словарем полного естественного языка, состоящего из сотен тысяч слов, маловероятно и непрактично. Тем не менее, я хочу иметь возможность выражать различные мысли и идеи на своем языке, как на любом другом естественном языке, поэтому для достижения этого эффекта я использую Wordcount , который отслеживает частоту английских слов и ранжирует их.
По данным Nation & Waring (1997) ,
Как видите, знание первых 2000 слов языка составляет почти 80% использования в повседневном общении. Из-за этой статистики я склонен продолжать использовать списки частотности слов. Однако я не уверен, что это самый эффективный способ сделать это.
Есть ли более эффективный способ пополнения словарного запаса вымышленного языка, чем список частоты слов? (Кстати, я не хочу просто просматривать словарь! в качестве ответа.)
У меня нет ссылки, но некоторые филологи и лингвисты предположили, что вы можете выжить (объяснить, кто вы, попросить работу, еду и т. д.) в чужой стране, используя всего лишь 500 слов. Генри С. Фенн, автор нескольких языковых текстов, считал, что словарного запаса в 5000 слов достаточно для изучения новых слов в контексте, например, в ходе общения с туземцами и чтения газет. По моему собственному опыту лингвиста и переводчика, я обнаружил, что 5000 общих слов плюс около 2000 актуальных слов (тех, которые популярны всего несколько лет) достаточно, чтобы не отставать от текущих событий. Это дает вам некоторое представление о размере словарного запаса, который вам следует учитывать.
Я согласен с тем, что создание словаря путем простого составления альтернатив 5000–7000 самых популярных слов в вашем родном языке утомительно и медленно. Хуже того, это не весело. Что еще хуже, получившийся язык подвергается повышенному риску быть безвкусным и, возможно, глупым.
Я предлагаю вам сначала составить список словесных элементов, а затем составить большую часть словарного запаса, изменяя и соединяя эти элементы. Если вы читали о законе Гримма и о том, как реконструировался протоиндоевропейский язык (ПИЕ), вы поймете, что я имею в виду.
Найдите в Интернете «список протоиндоевропейских слов» и создайте список значений элементов. Выбросьте слова PIE и замените их своими. Вам, вероятно, потребуется всего около 300 корней слов.
Составьте несколько правил соединения корней в слова. Вам не нужно быть совершенным или завершенным, потому что вы подражаете процессу, который происходит на протяжении тысячелетий, в течение которого правила меняются.
Составьте несколько правил о том, как звуки могут меняться со временем, и последовательно применяйте их ко всем словам. Например: после создания 1000 или 1500 слов измените все звуки «P» в вашем списке элементов на «B», а все «T» на «D».
Теперь — вот как вы избавите себя от скуки и труда, в чем и заключается смысл всего этого: Поскольку вы уверены, что у вас есть рациональный метод создания правдоподобных слов, не придумывайте сразу все 7000 слов. Начните с нескольких сотен, а затем создавайте новые словарные статьи по мере необходимости.
Всякий раз, когда вам нужно слово, вы ищете его в словаре. Если его там нет, вы создаете его и добавляете в словарь в это время. Поскольку у вас уже есть множество правил для образования слов, составить новое будет быстро.
Если вы не хотите быть единственным авторитетом в словообразовании, вы можете бросить кости или написать компьютерную программу рандомизации. Если язык используется в ролевой игре, правило может быть таким: «Первый игрок, открывший словарь, должен сгенерировать новое слово».
А как насчет 200 слов, которые у вас уже есть? Хорошо подумайте об этом. Английский язык, хотя и является языком группы PIE, на самом деле происходит от двух отдельных ветвей, тевтонской и романской. (Вот почему английское правописание такое сложное. Почти половина наших слов происходит из нижненемецкого, англоязычного, датского и т. д. и имеет германское написание, а почти половина происходит из латыни, французского и норманнского языков и имеет старофранцузское написание. )
Итак, если у вас есть какие-либо слова из ваших исходных 200, которые вы хотите сохранить, которые не могут быть рационально получены из вашего списка элементов, просто объявите, что они возникли из отдельной ветви или даже отдельного праязыка.
Я не понимаю, как это может не быть забавным.
Я бы порекомендовал провести мысленный разговор между двумя говорящими, типичными для рассматриваемой культуры.
Некоторые вещи, которые следует иметь в виду:
Используя это представление, два типичных оратора говорят об относительно общей теме. Прокрутите его в уме на своем родном языке и выясните, какие слова вам понадобятся. Многие диалоги будут иметь некоторые общие черты, даже если точное содержание различается. Опять же, будут общие речевые паттерны и общие фразы.
Причина, по которой я бы предпочла беседу списку слов, заключается в том, что самые распространенные слова в английском языке могут быть не самыми необходимыми словами в этом языке. Различные факторы будут влиять на то, какие слова необходимы для каждого разговора (поэтому я привел в качестве примера приветствия), а какие нет. Частота не всегда является лучшим определением важности.
Человек по имени Марк Розенфельдер написал три хорошо зарекомендовавшие себя книги о создании конланга. Наиболее релевантным для вашего запроса является The Conlanger's Lexipedia . Среди прочего он содержит «Список слов о частоте фэнтези, список из 1500 пунктов наиболее распространенных корней из корпуса фэнтези и научной фантастики из 1,1 миллиона слов». Что не менее важно, есть также материал о том, как сделать ваш выбор слов и определений правдоподобно отличным от английского и/или человеческого языка в целом.
Признаюсь, я не проделал тяжелой работы, необходимой для того, чтобы сделать что-то большее, чем просто поэкспериментировать с созданием конланга, но я нашел все три книги очень интересными для чтения. Два других — The Language Construction Kit и Advanced Language Construction , в обоих из которых также есть разделы, посвященные расширению словарного запаса. Если вам нужна более легкая книга, « Создание языковой клиники » Холли Лайл — это доступное введение в предмет. Это гораздо менее научно, чем книги Розенфельдера, но поможет вам начать прямо сейчас.
По моему опыту, с бумажными версиями сводных книг работать легче, чем с электронными.
Естественный семантический метаязык (НСМ) — это своего рода мини-язык, на который можно разбить любой другой язык (по крайней мере, те, которые они изучали, а их, как я понимаю, множество). Например, перевод английского слова «счастливый».
кто-то X счастлив (в это время) -переводится на->
Он содержит 56 примитивных «слов» или простых чисел, из которых можно составить фразы, подобные приведенным выше. Поскольку это не полноценный язык, этим «словам» не было дано правописание или что-то в этом роде. У него также нет грамматики. Если вы предоставите слова на своем языке, соответствующие им, вы сможете сказать все, что вам нужно, хотя это может быть долго. Это хорошо, если в вашем языке отсутствуют некоторые слова.
Опять же, я бы не стал полностью основывать ваш язык на этом, но это хорошее начало, и оно может заполнить любые пробелы, пока вы их не заполните.
Если все слова в языке совпадают 1 к 1 с английскими словами, это в основном просто код для английского языка.
Например, у Pitjantjatjara нет слова, которое означает то, что означает английское слово brother
.
Даже европейские языки различаются контекстами. Если я хочу перевести немецкое слово Wahrscheinlichkeit
, польский предлагает мне один вариант с prawdopodobieństwo
помощью Лео . С другой стороны, английский предлагает мне 8 вариантов : probability
, verisimilitude
, chance
, plausibility
, presumption
и feasibility
.likeliness
Английский позволяет делать гораздо больше различий, чем польский, когда речь идет о вероятностях.
С другой стороны, в английском языке слова типа to feel
or используются to be
по-разному. Быть по существу служит цели четырех терминов естественного семантического метаязыка : местоположение, существование, спецификация и обладание.
Предоставление 4 из 56 наиболее важных понятий языка одним и тем же словом кажется очень расточительным, и тем не менее английский отлично работает. Это означает, что ваш язык также может повторно использовать слова, если вам не хватает слов.
В зависимости от цели вашего языка вам не нужно добавлять все слова в начале. Когда вы обнаружите, что в настоящее время не можете говорить о чем-то важном, вы можете просто добавить новые слова.
Не делайте список слов общего назначения, если вы создаете свой собственный язык, вы, вероятно, создаете его для какой-то цели (я полагаю, для какой-то книги, игры или какого-то художественного произведения). Поэтому сначала создайте слова для предложений, которые на самом деле используются в вашей работе (вот и все, сделайте свою работу стоящей, не тратьте время на придумывание вещей, которые вы, вероятно, не будете использовать).
Бессмысленно, например, составлять самые распространенные 5000 слов, если вы пишете историю о волшебнике, работающем в своей волшебной башне, используя технические имена.
Также будьте изобретательны и повторно используйте существующие слова, которые больше не используются, для обычного читателя эти слова будут выглядеть как новый язык, но, по крайней мере, некоторые из них будут иметь значение для человека выше среднего. Как программист я обнаружил, что на самом деле существует множество терминов, связанных с информатикой, которые могли бы быть использованы в реальной жизни, но, к сожалению, большинство не-программистов не знают значения этих слов (например, понятие «местность кэша» и эффективность объясняет, почему беспорядочные люди более продуктивны: когда я вижу беспорядок других людей, я думаю, что «это просто их тайник», но для обычных людей беспорядок — это просто беспорядок).
Также придумайте немного этимологии, должно быть легко использовать несколько слов, чтобы сделать из них новые слова, которые придадут вашему языку историю и сделают его более реалистичным. Язык очень сильно зависит от того, как ведет себя его мир, поэтому убедитесь, что у вас очень реалистичный мир, попытайтесь выяснить возможные ситуации в этом мире, возьмите пример с авторов, которые уже пытались это сделать, и найдите ошибки и сильные стороны в их языки.
язык развивается в контексте, например, для большинства животных на ферме у нас есть разные имена для детенышей, мужские и женские версии, в то время как для животных вне ферм у нас есть просто уникальное имя, это из-за нашей прошлой работы на фермах).
Я заранее извиняюсь, потому что я чувствую, что это лучше подходит в качестве комментария, но у меня нет необходимой репутации.
Я думаю, что все остальные ответы великолепны, но я просто хочу добавить еще одно соображение, которое я использовал сам в своем последнем конланге и нашел действительно полезным. Если вы учитываете семантические домены при формировании словарного запаса, вам будет намного легче избежать переназначения английского (или любого другого предпочитаемого вами языка). Раньше у меня был PDF-файл, в котором было несколько десятков веб-сайтов семантических доменов, которые охватывали множество базовых слов и также подсказывали более непонятные слова, но сейчас ссылка мертва, и я не могу найти хорошую замену через беглое гугление. Но я уверен, что если вы проведете собственный поиск, вы сможете найти несколько хороших базовых примеров для изучения.
По сути, это означает, что у вас есть сеть связанных понятий, и разные языки будут назначать разные лексемы разным группам этих понятий. Например, в английском языке у нас есть: облако, туман, туман, пар, дым; и, не утруждая себя поиском их этимологий, все эти слова кажутся несвязанными. Глядя на концептуальные сети, подобные этой, вы можете подумать о том, хотите ли вы, чтобы одно слово охватывало «облако» и «туман», но два разных слова для пара из кипящей воды и пара из теплой воды (например, в горячем источнике зимой). ).
Я бы хотел, чтобы у меня были готовые веб-сайты или карты семантической области, на которые можно было бы связать вас, но мне трудно найти что-то лучше, чем общие примеры. Тем не менее, в качестве дополнительного инструмента я думаю, что это не должно быть слишком сложно сделать самостоятельно на вашем родном языке, просто чтобы использовать его в качестве отправной точки для генерации словарного запаса. Я не думаю, что вы наберете 10 000 таких слов, но я могу лично засвидетельствовать, что это может значительно повысить скорость генерации ваших первых нескольких сотен слов, если вы привыкнете немедленно рассматривать все концептуально связанные лексемы для каждого слова. основное слово. Вы можете объединить некоторые из них в одно слово и добавить дополнительные различия для других. Уму непостижимо, как много разных слов люди используют для обозначения вещей, которые почти не отличаются друг от друга. (Конечно,
Изобретая язык, вы в основном изучаете язык (своего собственного языка). Вы должны выяснить, какие слова необходимы для использования языка. Поэтому я предлагаю вам не изобретать велосипед, а посмотреть, что уже сделали другие в этой области.
Ваш мир - типичный позднеримский/раннесредневековый стиль? Тогда словарный запас изучающего латынь или греческий язык будет именно тем, что вам нужно: он обычно содержит от 1500 до 5000 (в зависимости от уровня) очень распространенных слов из повседневной жизни (например, названия блюд, торговля и т. д.), политической жизни. (например, «карьера», «взятка» и т. д.), религиозная жизнь (слова, обозначающие «храм», «обряд» и т. д.) и военная жизнь (например, слова, обозначающие оружие и другое военное снаряжение).
Ваш мир скорее стимпанк ? Тогда словарный запас французско-английского или англо-французского учащегося конца 19-го века может покрыть то, что вам нужно. Я знаю, что их трудно достать, но есть вероятность, что http://www.archive.org или http://books.google.com содержат несколько отсканированных изображений. В противном случае проверьте антикварные магазины (всех видов: книги, мебель и т. д.). Такие книги обычно имеют довольно небольшую (денежную) ценность, поэтому они не должны стоить вам слишком дорого. Я купил словарь французского языка 19-го века всего за 8 швейцарских франков (около 8,50 долларов США).
Если ваш мир научно-фантастический , то словарного запаса современного изучающего язык будет достаточно. Он содержит бытовые термины, технологические термины и т. д.
Этот метод очень помог мне в создании первых нескольких языков. Словарный запас (и грамматика) учащихся всегда идеально охватывает основы, чтобы сделать язык пригодным для использования.
в основном резюме других ответов:
Как обычно для такого типа вопросов, обычный отказ от ответственности. То, как вы будете создавать язык, сильно зависит от цели, для которой вы хотите его использовать. Если ваша цель состоит в том, чтобы просто поместить пару инопланетных слов в художественное произведение, вы можете просто придумать их по ходу дела. Если вы хотите общаться на конланге, вы можете использовать список частот - это будет скорее код подстановки, чем язык.
Однако если ваша цель состоит в том, чтобы создать язык, полунезависимый от художественного произведения, которое вы пишете, я бы предложил пойти по другому пути. Теперь я буду опираться как на свой опыт работы с обработкой естественного языка, так и на хобби-интерес к языкам Толкина.
Во-первых, вам нужны фонология и грамматика в любом порядке. Если вы создаете реалистичный язык с нуля, вы будете работать с корнями, а не с отдельными словами. Итак, прежде чем идти туда, нужно разобраться, какие фонемы есть в вашем языке, какие фонетические правила в нем работают. Вам нужно понять, какие части речи у вас есть и как корень может быть преобразован в другую часть речи.
Далее идут корни. Я бы рекомендовал использовать не список частот, а список Сводеша . Слова в списке были бы самыми архаичными, а это значит многое. Во-первых, просматривая этот список, вы можете внести коррективы, которые будут важны для вашего сеттинга и людей, говорящих на этом языке. Может быть, у них нет гендерных ролей и не было их с самого начала вида - тогда у них были бы отдельные корни для мужчины и женщины. Другой важной особенностью архаичных корней будет то, что они будут в основном неправильными в спряжении и склонении.
Когда вы пройдете эти этапы, имея базовую грамматическую основу, фонетические законы и базовый словарный запас (сводеш, а не частотность), вы почувствуете свой язык, его ритм и каденцию, поймете, как строятся фразы, и т.д. Теперь вы можете продолжать заполнять пробелы в словаре по мере необходимости, записывая тексты на этом языке.
Приятным бонусом к такому способу построения языка является то, что вы можете применить к нему законы глоттохронологии для создания родственных языков с разной степенью разделения — примерно так Толкин поступил с различными ответвлениями эльфийских языков.
Один из вариантов — взять настоящий, совершенно чужой вам язык (которого вы не знаете), а затем выучить его. (например, такие вещи, как изучение языка на пленке)
Однако каждое слово, которое вы узнаете из этого языка, заменяется вашим собственным словом.
Несколько недостатков, которые я знаю, например
Вы не получите правильной этимологии, и поэтому слова, которые «должны» звучат одинаково, не будут. (Хотя вы можете изменить историю и культуру вашего мира)
Вам придется жить с той же структурой предложений, что и в «фактическом» языке.
Вы можете в конечном итоге просто придумать способы спросить дорогу к пляжу ;)
У меня есть идея получше для тебя. Как насчет того, чтобы добавить слово, когда оно необходимо! Итак, скажите, что вы пишете письмо своей девушке, и вам нужно слово для любви, тогда составьте его! Таким образом, вам не нужно беспокоиться о необходимости создавать тысячи слов на месте и больше никогда их не использовать. Потому что помните, что самые частые слова — это не ваши самые частые слова!
Акшат Махаджан
Ксандар Зенон
Акшат Махаджан
Ксандар Зенон
Сорен Д. Птеус
Бент-Нильсен
Сепаратриса
Амиралпатат
ПиРулез
ПиРулез
фи12
ПиРулез
ААМ111
Нейт
А. И. Бревелери
Кингледион
jk - восстановить Монику