Нужна новая структура автоматизации

Я написал скрипт для входа на веб-сайт и загрузки данных о клиентах в виде csv, используя пакет selenium для python. К сожалению, веб-сайт совсем недавно добавил капчу для входа в систему. Меня бы это не сильно беспокоило, так как я мог бы добавить часть кода, который ждет, пока я решу капчу, но на ее решение уходит почти 10 минут. Я думал, что смогу запустить селен на веб-сайте после входа в него, но не смог найти способ подключить селен к уже открытому браузеру. Кажется, что использование селена — это то, что в первую очередь также запускает капчу, поскольку вход на веб-сайт без него не является проблемой. Я ищу другую структуру, которая предпочтительно имеет простую настройку и может автоматизировать уже открытые браузеры, поэтому я могу открыть браузер вручную, а затем запустить код. Чтобы добраться до CSV-файла,

Ответы (1)

Лучше всего, вероятно, использовать инструменты, имитирующие нажатия клавиш и щелчки мыши, чтобы ваш сценарий был неотличим от физического ввода человека. Обычно такой инструмент также нуждается в «визуальном распознавании» для обработки определенных возникающих ситуаций. Я не говорю о CAPTCHA, которая все еще слишком сложна для любых инструментов автоматизации, о которых я знаю. Дело в том, что такие инструменты смогут делать то, чего не может Selenium, и в вашем случае они не должны запускать CAPTCHA в первую очередь, потому что они будут использовать тот же браузер, который вы используете вручную.

Канту, похоже, все это делает. Обратите внимание, что я не использовал его лично. Но похоже, что он был разработан именно для той автоматизации, которую вы пытаетесь сделать.

SikuliX следует аналогичному плану игры, но был разработан для автоматизации всего на рабочем столе, а не конкретно браузера. (Канту изначально задумывался как инструмент веб-автоматизации, но предположительно его можно использовать и для рабочего стола.) У меня также нет опыта в этом.

Существует связанный с этим вопрос о переполнении стека, который может предоставить еще один или два варианта.

Что я использовал лично, так это AutoHotkey , который может служить своего рода Sikuli «сделай сам». «Визуальное распознавание» в AutoHotkey очень примитивно; вам нужно много делать, создавая свои собственные изображения, обрезая скриншоты или проверяя пиксели в определенных координатах. Я должен представить, что и Kantu, и SikuliX намного проще в использовании, но я чувствовал, что должен по крайней мере включить что-то, с чем у меня есть личный опыт. Единственная причина, по которой у меня нет опыта работы с Kantu или SikuliX, заключается в том, что мои собственные потребности в автоматизации до сих пор были довольно простыми, и я уже использовал AutoHotkey для горячих клавиш и других разных сценариев вне браузера.

Существует очень грубое сравнение трех инструментов, которые я упомянул. Он размещен на том же сайте, что и Канту, так что вы можете догадаться, что он отдает предпочтение Канту, но информация, представленная там, кажется в основном справедливой.