Решения для распознавания объектов на мобильных устройствах

Я собираюсь написать мобильное приложение, которое распознает изображения внутри закрытой целевой группы. Я предполагаю, что группа содержит от 20 до 50 подобных комиксов изображений .

Приложение реагирует, если какая-либо из этих целей захвачена камерой устройства. Вот и все.

Однако есть некоторые ограничения.

  • Он должен распознавать повернутые цели.
  • Следует распознавать тех, у кого разная перспектива и уровень освещенности .
  • Если он может справиться с препятствиями, такими как пальцы, я буду доволен этим. (по желанию)
  • Тренироваться должно быть легко. (по желанию)
  • Я бы предпочел неточные, но быстрые решения. (не более 3 секунд, может быть?)

У меня недостаточно времени для этой задачи, и я новичок в обработке изображений, поэтому, по-видимому, запуск OpenCV требует много времени.

Я с нетерпением жду ваших предложений.

Кроме того, решения не обязательно должны быть бесплатными.


Редактировать:

Что касается нашего бюджета, мне, возможно, придется спросить своего начальника, не связанного с технологиями, который, вероятно, не знает общей цены. Просто дайте мне предложения / предложения независимо от цены, тогда он выберет одно.

Обучить классификатор Хаара для OpenCV на самом деле не так уж сложно. Например, см. youtube.com/watch?v=WEzm7L5zoZE . . . трудоемкая часть проблемы — поиск достаточного количества образцов изображений для завершения обучения.
@NeilSlater, хорошее видео. Таким образом, само обучение с OpenCV кажется простым. Удивительно! Я попробую. Большое спасибо.

Ответы (1)

[ Отказ от ответственности: я работаю в Moodstocks ]

Вам следует взглянуть на SDK Moodstocks . Он соответствует большинству ваших требований:

  • он устойчив к молниям и изменениям перспективы,
  • допускает частичную окклюзию, например, пальцами,
  • вообще не требует обучения: вы просто загружаете ( индексируете ) изображение, чтобы сделать его мгновенно узнаваемым,
  • это очень быстро: сопоставление изображений выполняется локально, поэтому на современном смартфоне вы получите результат менее чем за 300 мс.

Единственная проблема связана с устойчивостью к повороту: SDK Moodstocks поддерживает только небольшой поворот (~30°). При этом, учитывая тот факт, что у вас есть ограниченное количество изображений, это можно легко решить довольно грубо, проиндексировав несколько экземпляров каждого изображения при разных поворотах!

Надеюсь это поможет!

Спасибо за предложение, Ренон. Я получаю удовольствие от испытания, оно очень простое и действительно способно к частичной окклюзии, как вы сказали. Отличная работа!