Я ищу бесплатное программное обеспечение, желательно с открытым кодом, которое обнаруживает основные объекты на изображениях.
Это означает, что если я прогоню его по изображению (gif, jpg и т. д.), система найдет основные объекты, такие как стол, небо, человек и т. д., и их расположение на изображении.
То, что вы просите, — это программное обеспечение для классификации изображений, и оно доступно с открытым исходным кодом как часть глубокого обучения с помощью сети изображений. Необходимо установить довольно много программного обеспечения, поэтому, прежде чем читать дальше, вы должны знать, что распознавание частей изображения требует времени — вы не сможете прокрутить новое изображение и распознать в нем элементы — вместо этого вы необходимо запустить классификатор, желательно в автономном режиме, и предварительно классифицировать ваши изображения. Также обратите внимание, что то, о чем вы просите, требует большой мощности компьютера, достаточной для того, чтобы большинство использовало его на образе AWS Amazon EC2 g2.2xlarge или лучше. В блоге PyImageSearch есть серия руководств по настройке и использованию такой настройки.
pip install pillow
pip install scikit-learn
pip install h5py
pip install --upgrade --no-deps git+git://github.com/Theano/Theano.git
pip install keras
git clone https://github.com/fchollet/deep-learning-models
Существует учебник по фактическому запуску этого здесь или ряд доступных книг.
Веснушка
Ави
Веснушка