Я читал сообщения редакторов журналов на Academia Stack Exchange о том, что первое, что они делают, это проверяют количество слов в представленных статьях.
Как редакторы журналов проверяют количество слов присылаемых статей, учитывая, что авторы могут присылать статьи в формате pdf с большим количеством таблиц и рисунков?
Чтобы проверить свои собственные статьи, PDF-файлы, созданные в LaTeX, я открываю свой PDF-файл, выбираю все, а затем копирую и вставляю в Microsoft Word. Этот метод завышает количество слов, поскольку он включает все номера страниц и все числа внутри таблиц, но я предпочитаю его TeXcount ( http://app.uio.no/ifi/texcount/online.php ), поскольку он включает ссылки и библиографию. .
Я подозреваю, что во многих случаях, когда авторы отправляют PDF-файл, а редакторы не используют Linux (как это может быть во многих дисциплинах, включая большинство гуманитарных и художественных дисциплин), точное количество слов получить невозможно. Вместо этого можно определить приблизительное количество слов на основе длины и форматирования рукописи.
Один из способов сделать это
$ pdftotext paper.pdf | туалет -ш
Эта команда работает в большинстве систем Linux, и в основном она преобразует PDF-файл в текст, а затем подсчитывает слова.
Солнечный Майк
Бенедикт Исто
пользователь64845
пользователь 25112
Андреас Бласс