Бесплатное программное обеспечение для анализа CV/резюме

Я ищу программное решение для извлечения данных из резюме/CV в различных форматах (PDF, Microsoft Word и т.д.).

Что мне нужно:

  1. извлечение имени, фамилии, электронной почты, телефонных номеров, сегментированного почтового адреса (улица, почтовый индекс и т. д.) в пригодный для эксплуатации структурированный вывод
  2. бесплатное программное решение
  3. извлечение других типичных записей резюме (название предыдущей работы и т. д.)
  4. решение, которое напрямую интегрирует предыдущие результаты в OpenERP (обратите внимание, что OpenERP теперь известен как odoo ).

В идеале он должен легко интегрироваться с OpenERP , но любого решения, обеспечивающего вывод по ключу/значению, будет достаточно, поскольку я могу разработать интеграционный клей самостоятельно. Это просто должно позволить мне получать результаты на сервере Linux, поэтому программное обеспечение, совместимое с Linux, было бы лучше, но даже веб-служба с разумным временем отклика для интерактивного использования может подойти.

Из моего собственного исследования Open Applicant мог быть хорошим кандидатом, поскольку он обеспечивал «анализ резюме» и был бесплатным программным обеспечением. Но, к сожалению, похоже, что он исчез из сети.

Несвободные программы, которые могут выполнять эту работу, включают DaXtra Parser , ResumeGrabber, Rchilli Resume Parser , Automated Hr Software Resume Parser.

OrangeHRM объявляет, что он интегрирует « Короткий список с использованием анализа резюме для чтения резюме и ключевых слов », но я пока не знаю , является ли это собственным решением или оно опирается на какое-то SaaS .
Вы когда-нибудь приходили к этому? Вы нашли решение? Если да, не могли бы вы опубликовать ответ?
Извините, я не нашел удовлетворительного ответа в то время, и я не планирую проводить дальнейшие исследования по этой теме.
Хотя код OpenApplicant исчез из Sourceforge sourceforge.net/projects/openapplicant/files , похоже, он сохранился здесь: en.pianshen.com/1360840
Я бы посоветовал вам опубликовать это как ответ. Молодец, что нашел. Насколько я вижу на машине «Путь назад», на этой странице никогда не было ссылки для скачивания web.archive.org/web */ linuxlinks.com/article/20091006152306344/ OpenApplicant.html

Ответы (5)

Учитывая, что тон вашего вопроса предполагает некоторый опыт программирования, я бы предположил, что это, вероятно, может быть достигнуто в python с помощью:

  1. Преобразование каждого CV в общий формат, такой как уценка или обычный текст:
    • Word .docx Используйте встроенный модуль docx
    • Word .doc Вызов антислова для преобразования в обычный текст
    • Pdf, ( не отсканированные документы), pdfminer
  2. Либо : выберите соответствующие данные, используя набор регулярных выражений Python, используя re / regex , это, вероятно, даст вам самые быстрые результаты, но, возможно, не самые полные, или :
  3. Разбирать и анализировать с помощью nltk — возможно, это более мощное решение, но его реализация потребует много времени и усилий.

    • извлечение имени, фамилии, адреса электронной почты, телефонных номеров, сегментированного почтового адреса (улица, почтовый индекс и т. д.) в пригодный для использования структурированный вывод — да . Для этого должно быть достаточно хорошего набора регулярных выражений.
    • Бесплатно - Да , за исключением затрат на разработку
    • извлечение других типичных записей резюме . Зависит от приложенных вами усилий и, вероятно, потребует решения nltk .
    • Интеграция с OpenERP - поскольку вы можете выводить в любом формате, который вам нужен, я бы сказал да, или вы можете использовать клиент OpenERP .
    • Запускать на Linux-сервере - однозначно .

Я наткнулся на еще одну компанию по разбору резюме www.candidatezap.com , они утверждают, что могут загружать резюме во многие ATS / CRM без кодирования / программирования и без необходимости интеграции.

Привет! Не могли бы вы расширить свой ответ, чтобы сделать его автономным? Попробуйте структурировать его так, чтобы он отвечал на 4 пункта в вопросе OP!

Вот бесплатный сервис API для анализа резюме / CV, который вы можете использовать, довольно простой для интеграции с вашими приложениями или веб-сайтами. Имеет пример интеграции кода .net на веб-сайте.

Похоже, что эта ссылка уже мертва :-(

Если вы ищете бесплатный анализатор резюме, посетите https://affinda.com/resume-parser/ .

Вывод в форматах XLS, JSON и XML. Это решение было создано с использованием последних достижений в области обработки естественного языка, чтобы гарантировать, что оно может обрабатывать самый широкий набор форматов резюме.

Вам нужно будет разработать описанную интеграцию самостоятельно, и это должно быть просто, учитывая, что вывод может быть в файле JSON.

Поля включают имя, местоположение, телефон, адрес электронной почты, веб-сайты, опыт работы (работа, работодатель, местоположение, даты), образование (учреждение, степень, местоположение, даты), навыки и многое другое.

Надеюсь, это поможет!

Звучит интересное решение, но не бесплатное, как в свободном программном обеспечении. На самом деле, скорее наоборот, поскольку кажется, что облако — единственное решение.

Наше программное обеспечение для анализа резюме поможет вам извлечь детали из резюме. Обычно он поддерживает все форматы резюме/резюме.

Не могли бы вы дать некоторые подробности. Например, каков выходной формат? XML? Может ли он писать прямо в мою базу данных? Кроме того, какова цена (не обязательно отвечать на вопрос, но приятно знать). Я предполагаю, что он поддерживает Linux, как спросил ОП. Винда тоже?
Кроме того, есть ли где-нибудь на вашем веб-сайте пример выходного файла, чтобы мы могли точно увидеть, как он выглядит?
Вывод доступен в форматах XML и JSON. Поможет хранить прямо в вашей базе данных, CRM или АТС. Чтобы обслуживать лучше, пожалуйста, предоставьте свои данные здесь. ( rchilli.com/контакты ).
Если бы вы разместили подробности здесь, вы могли бы помочь многим людям и получить много запросов. Как бы то ни было, я хотел бы такую ​​услугу, но не буду спрашивать, если вы не дадите здесь никаких подробностей.