Программы, анализирующие частотность слов?

Мне нужна утилита, которая могла бы анализировать документ и давать мне такую ​​статистику:

WORD:           FREQUENCY:
a               47,268
the             37,201
gross           215
irregardlessly  1  

Кто-нибудь знает, доступно ли это?

Кстати, я бы предпочел не использовать онлайн-инструмент. Назовите меня параноиком, но загрузить мой неопубликованный роман в интернет для меня было бы все равно, что пройтись по главной улице в одном презервативе. :)

Я не понимаю твоей метафоры. Кроме того, я бы сказал, что этот вопрос следует задавать в рекомендациях по программному обеспечению.
@Ooker Слово «похожий» делает это сравнением, верно? :)
Я знаю, что вы делаете сравнение, но я все еще не понимаю, как не использовать онлайн-инструмент сродни тому, чтобы ходить голым, надев только презерватив :-s
@Ooker Я говорю, что буду чувствовать себя обнаженным, голым. Что я беру эту личную, личную, драгоценную вещь и потенциально позволяю миру увидеть ее. Его могут украсть, сплагиатить, даже распространить целиком в электронном виде до того, как у меня появится шанс опубликовать его в печати, что сделает любую печатную версию менее ценной. Опять же, можете называть меня параноиком, если хотите.
ок, ты наполовину параноик :)

Ответы (4)

Мой любимый Scrivener прекрасно справляется со своей задачей. Вставьте свой текст, а затем перейдите в раздел «Проект» -> «Статистика текста», и он даст вам список, который вы ищете.

Другие люди на этом форуме рекомендовали Word Counter (Mac) и Primitive Word Counter и yWriter (Windows), но я не могу говорить об их полезности, так как никогда ими не пользовался.

Я начал пробную версию, и, хотя программа в целом впечатляет, отчет о текстовой статистике немного слаб. Он создает небольшое поле, показывающее слово, количество и процент этого слова во всем документе. Размер окна отчета не изменяется, что означает, что все, кроме маленьких слов, обрезается: «производство», «производитель» и «производительность» регистрируются как отдельные слова, которые встречаются только один раз, но все они отображаются только как «производство». .», пока слово не будет наведено на секунду, затем всплывающее окно покажет слово. Я также не вижу, как можно экспортировать отчет, что было бы неплохо.
Предостережение! В Mac AppStore есть приложение под названием Word-Counter , а не Word Counter . (Обратите внимание на тире). Не покупайте это. Это не то же самое, что упоминается в ссылке в этом ответе, и не определяет частоту слов.

Notetab Light (и платная версия тоже) для Windows предлагал эту функцию, когда я в последний раз ей пользовался. Это старый текстовый редактор с множеством функций, которыми я пользовался до перехода на Linux, что произошло где-то в 2007 году.

Сейчас я использую редактор, который сделал сам, с этой и многими другими функциями, которые мне нравятся.

Если у вас есть доступ к Linux или Cygwin для Windows, вы можете заставить его рассказать вам практически все, что вы хотите знать о вашем тексте, с помощью нескольких строк кода оболочки. Вот один подход.

Вот еще одна статья, которая объясняет процесс более подробно.

В этом случае вам, вероятно, придется сначала скопировать текст из его исходного формата, а затем вставить его без форматирования в текстовый файл, чтобы внутренние коды форматирования и т. д. не мешали логике.

Преимущество такого подхода заключается в том, что, приложив небольшие усилия, вы можете заставить свой инструмент сообщать обо всем, что вы хотите, именно в том формате, в котором вы хотите.

Microsoft также говорит о добавлении таких возможностей оболочки в предстоящий выпуск Windows 10.

Если вы работаете на Mac, у вас, вероятно, уже установлены все необходимые инструменты.

Большинство редакторов Tex и LaTeX используют анализ текста, который дает вам количество использований каждого слова в блоке, в таблице и т. д. Например, популярна TEXstudio.