Программное обеспечение для поиска по файлам (в основном PDF)

Я хотел бы знать, есть ли активные проекты с открытым исходным кодом для разработки альтернатив Google Desktop или Regain для Windows 7.

Ситуация следующая:

  • У меня есть папка, полная PDF-документов (организованных во многих подпапках). Каждый день обновляется или создается как минимум один документ,
  • Мне часто приходится искать некоторые слова и предложения в этих документах,
  • Поиск Windows и Agent Ransack слишком медленные, и их интерфейсы не соответствуют моим потребностям,
  • Интерфейс Regain почти идеально подходит для моих нужд: я ввожу критерии поиска и получаю список результатов с кратким обзором, но я не могу ограничить периметр поиска определенным каталогом,
  • Последнее обновление для восстановления было 2014-07-30 - это заставляет меня задаться вопросом, устарело ли оно или использует устаревшие компоненты (и я не хотел бы ставить под угрозу безопасность моего компьютера),
  • Я искал на многих веб-сайтах, прежде чем опубликовать здесь ( эта тема привела меня к Regain).

Вот пример результатов поиска с Regain:Regain: пример результатов поиска

Ответы (3)

Раньше я использовал Recoll, и это было очень удобно: http://www.lesbonscomptes.com/recoll/ Он использует поплер, известную библиотеку PDF.

Современные ОС часто имеют такие функции поиска по умолчанию, например, Fedora предоставляет Nepomuk. Однако они могут быть очень ресурсоемкими.

Спасибо! Однако я не упомянул: программное обеспечение должно работать в Windows. Я обновил свой пост, чтобы добавить недостающую информацию.
Ой. Может кто сделает порт. Судя по всему, Poppler доступен и в Windows, так что об этом можно не беспокоиться.
Recoll теперь имеет почти родной порт для Windows; смотрите новости на lesbonscomptes.com/recoll ... возможно, вам придется компилировать из исходников. Следите за установщиком, скорее всего, он уже в пути.

Из ответа Брайана З .: DocFetcher - это кросс-платформенное решение под лицензией Eclipse Public License и, судя по документации, кажется очень мощным.

Как бы то ни было, вы упомянули, что все документы разложены по папкам, в таком случае попробуйте функцию расширенного поиска Adobe Reader.

После того, как вы открыли Adobe Reader, Shift+Ctrl+F должен вызвать интерфейс [или вы можете перемещаться с помощью Правка (меню) -> Расширенный поиск] Я заметил, что для Regain вы используете сервер (он должен быть легким один, но все же это дополнительный процесс) Скриншот из версии Adobe Reader XI.Интерфейс расширенного поиска