En esta entrada voy a describir dos métodos de seguir
visualmente objetos (tracking), y su adaptación al sistema operativo Android para
usar que en robot dirigido por un móvil. El ejemplo con el que contamos en OpenCV está basado en seguir colores y no da buenos resultados en cuanto la luz empieza a cambir o se mezcla con colores del fondo
Georg Nebehay es la
persona que ha adaptado uno de los métodos y desarrollado el otro, por lo que suyos
son los créditos de este trabajo.El primero de los métodos se denomina openTLD
que proviene e de Tracking-Learning-Detection (TLD) desarrollado por Zdenek Kalal.
TLD rastrea simultáneamente el objeto, aprende de su aspecto y lo detecta cada
vez que aparece en el video. El resultado es un seguimiento en tiempo real que
a menudo mejora con el tiempo.
El segundo es CMT, desarrollado por Nebehay. La idea principal detrás de CMT es
descomponer el objeto de interés en partes más pequeñas, conocidas como puntos
clave. Vemos cómo funciona:
En cada cuadro, trata
de encontrar de nuevo los puntos clave que ya estaban allí en la selección
inicial del objeto de interés. Esto se hace mediante el empleo de dos tipos
diferentes de métodos. En primer lugar, se hace un seguimiento de puntos
significativos de la trama anterior a la trama actual mediante la estimación de
lo que se conoce como su flujo óptico. En segundo lugar, emparejamos puntos
clave a nivel mundial mediante la comparación de sus descriptores. Como estos
dos métodos son propensos a errores, se emplea una nueva forma de buscar el
consenso en los puntos clave que se encuentran al permitir que cada voto punto
clave para el centro del objeto.
El resultado es un algoritmo que puede funcionar en
teléfonos Android de potencia de cálculo media alta.
Disponiendo de dos métodos para seguir objetos, el problema
está en cómo decir al robot cómo seguir un determinado objeto. La primera forma
puede ser el reconocimiento de una forma y después seguir a la forma
encontrada. El coste de seguir una forma
con OpenTLD o CMT es mucho menor que el reconocimiento continuo de la
forma en un vídeo. En este vídeo se ve cómo se reconoce una persona y se sigue
después sin tener que volver a buscar la forma de persona que es bastante
costoso
La segunda forma de explotar esta capacidad es identificar
un objeto en movimiento, restando el fondo a las imágenes y seguir al objeto
que se mueve con estos métodos.
Aquí se ve al pequeño robot siguiendo cualquier cosa que se
mueva.