Существуют ли списки слов, проиндексированные по домену?

Существуют ли какие-либо компиляции списков слов по доменам?

Например, может быть домен «Литература», и он будет включать слова

писатель, читатель, критик, книга, эссе, роман, издатель, вдохновение, изложение, кульминация, художественная литература, Набоков и т. д.

Этот конкретный домен, вероятно, будет включать многие слова или понятия, обсуждаемые на этом конкретном сайте. Тогда может быть домен «Япония», который будет включать слова, относящиеся к Японии.

Это похоже на списки ассоциаций, но очень широкое. Например, слово « чай » может быть в списке «Япония», но я подозреваю, что у большинства людей это не будет первой ассоциацией с Японией.

Эти списки можно использовать для формирования метафор в данной области, поэтому вопрос здесь.

Удовлетворит ли вас что- то вроде Словаря ассоциаций ?
Найдите словосочетание. В Интернете доступны текстовые корпуса, которые анализируют, например, все газеты на определенном языке и выводят, помимо прочего, лингвистический интерес, словосочетания слова, то есть другие слова, которые регулярно появляются рядом с этим словом в тексте. Например, вот страница результатов для немецкого слова «Рука»: dwds.de/?qu=Hand На этой странице (если вы не просматриваете мобильную версию) есть раздел, озаглавленный «Überblick zu 'Рука'». - это словосочетания. Я немец, поэтому я знаю ресурсы для этого, но, вероятно, аналогичные существуют для английского языка.
@СФ. Это недостаточно широко. Я только что попытался объяснить, почему в комментарии к ответу TuringTest. С другой стороны, WordNet, база данных конкретного сайта, который вы указали, вероятно, можно было бы использовать для создания лучших списков. Пока не знаю как.
@какие словосочетания могут быть полезны. просто слово особенно полезно, так как оно просто показывает необработанные предложения с данным словом, а не, скажем, прилагательные до или после слова. Недостаточно представителей, чтобы проголосовать за комментарий...

Ответы (1)

Такой справочник называется тезаурус . Это похоже на словарь синонимов, но слова, сгруппированные вместе, не означают одно и то же — они просто имеют связанные значения по сходству или контексту.

Чтобы получить слова только из определенного домена, вы можете найти тематический тезаурус, специализирующийся на словах, относящихся к нему. Используя ваш пример, вот онлайн-тезаурус по литературе .

Тезаурус — хорошее направление, но я ищу что-то более широкое, с большим количеством слов. Представьте, что человек отвечает на вопрос: «Что для вас литература?», используя набор слов. Я хочу этих слов (от многих людей). Возможно, если бы был ресурс, открывающий пройденный тезаурус (то есть сразу все родственные слова, а слова, связанные с родственными, два-три раза) он мог бы подойти. Это интересный вопрос сам по себе, будет ли это подходящим или нет.