Списки слов для сконструированных языков

При построении языка для вашего мира слова «на удивление» важны. Во всех естественных языках есть слова того или иного рода, и только в крайне экспериментальных языках их не хватает.

Выбор слов и категории часто трудно создать с нуля, поэтому наверняка должен быть более простой способ создания слов?

Существуют ли какие-либо списки, включающие слова для создания словаря?


К примечаниям Корта: я ищу список, содержащий большое количество слов, различающихся по всем видам слов, поэтому списка Сводеша недостаточно .

Вы просите список словаря «это N наиболее распространенных слов, которые ваш новый язык захочет определить»?
@SRM, это был бы приемлемый ответ, ссылки на такой список тоже были бы хороши.
что- то вроде этого en.wikipedia.org/wiki/Swadesh_list ?
@MolbOrg этот список слишком прост, на мой вкус, так что нет
не имел в виду именно это, вроде как, ядро ​​языка вроде. На самом деле что-то вроде изучения языка за 14 дней, разговорника и т. д. В этом направлении есть словари разных размеров, например, разные минималки, которые нужно знать. В печатном формате это более очевидно и встречается довольно часто. Они включали слова, основанные на частотах. В онлайн-корпусе языков было мало ресурсов - вам следует спрашивать больше лингвистически ориентированных людей (переводчиков и тому подобное), у Google был какой-то онлайн-корпус с графиком времени, как часто и когда он использовался, сейчас не могу вспомнить ссылку и сомневаюсь, что его можно будет использовать в виде базы данных.
Можете ли вы расширить свои проблемы с рекомендацией MolbOrg по списку Сводеша? Кажется, это очень хорошее совпадение с тем, что вы написали в вопросе. Я думаю, что если вы сделаете список слишком сложным, вы начнете вдаваться в культурные вопросы, которые не являются универсальными.
@CortAmmon хорошо
Какой-то определенный вид языка, то есть звуки, алфавит? Похоже, вы ищете корни слов, как при обработке естественного языка. Также из любопытства, что вы подразумеваете под «экспериментальным» языком без слов - вы имеете в виду грамматику формального языка?
См. также этот вопрос и ответы на него: conlang.stackexchange.com/questions/459/…
Я начал составлять список базовых слов для Tune (более 3000 слов). Я приложил немало усилий, чтобы в этот список попали только «базовые» слова, но в нем все еще многого не хватает. Некоторые слова очень близки к другим («говорить, говорить, говорить, рассказывать»), поэтому вы можете их опустить.

Ответы (3)

Это списки лемматизированных корней слов. Просто выберите язык, который больше всего соответствует вашим потребностям.

http://www.lexiconista.com/datasets/lemmatization/

Редактировать:

Вышеупомянутая ссылка мертва. Соответствующие списки теперь доступны на Github:

https://github.com/michmech/лемматизация-списки/

интересный набор славянских языков))
Ссылка мертва
@Craef исправлено, спасибо!

В Lexipedia Conlanger на Zompist.com есть список слов Fantasy Frequency, который представляет собой список из 1500 очень распространенных слов, и его можно найти здесь (щелкните ссылку на текстовый файл вверху: http://www.zompist.com/resources/ lex.html

В конце Language Construction Kit есть также набор списков слов. Что касается назначения слов для них, есть также генератор словаря, доступный здесь: http://www.zompist.com/gen.html

Надеюсь, это поможет!

Я не думаю, что он на самом деле опубликовал список на данный момент (похоже, это долгосрочная работа), но вы могли бы подумать о том, чтобы проверить базовый словарь Ландау . Я думаю, что это в конечном итоге превзойдет Список Сводеша, по крайней мере, на порядок.