Translate

sábado, 7 de marzo de 2015

Seguimiento de objetos con TLD y CMT




En esta entrada voy a describir dos métodos de seguir visualmente objetos (tracking), y su adaptación al sistema operativo Android para usar que en robot dirigido por un móvil. El ejemplo con el que contamos en OpenCV está basado en seguir colores y no da buenos resultados en cuanto la luz empieza a cambir o se mezcla con colores del fondo

 Georg Nebehay es la persona que ha adaptado uno de los métodos y desarrollado el otro, por lo que suyos son los créditos de este trabajo.El primero de los métodos se denomina openTLD que proviene e de Tracking-Learning-Detection (TLD) desarrollado por Zdenek Kalal. TLD rastrea simultáneamente el objeto, aprende de su aspecto y lo detecta cada vez que aparece en el video. El resultado es un seguimiento en tiempo real que a menudo mejora con el tiempo.
El segundo es CMT, desarrollado por Nebehay.  La idea principal detrás de CMT es descomponer el objeto de interés en partes más pequeñas, conocidas como puntos clave. Vemos cómo funciona:

 En cada cuadro, trata de encontrar de nuevo los puntos clave que ya estaban allí en la selección inicial del objeto de interés. Esto se hace mediante el empleo de dos tipos diferentes de métodos. En primer lugar, se hace un seguimiento de puntos significativos de la trama anterior a la trama actual mediante la estimación de lo que se conoce como su flujo óptico. En segundo lugar, emparejamos puntos clave a nivel mundial mediante la comparación de sus descriptores. Como estos dos métodos son propensos a errores, se emplea una nueva forma de buscar el consenso en los puntos clave que se encuentran al permitir que cada voto punto clave para el centro del objeto.



El resultado es un algoritmo que puede funcionar en teléfonos Android de potencia de cálculo media alta.
Disponiendo de dos métodos para seguir objetos, el problema está en cómo decir al robot cómo seguir un determinado objeto. La primera forma puede ser el reconocimiento de una forma y después seguir a la forma encontrada. El coste de seguir una forma  con OpenTLD o CMT es mucho menor que el reconocimiento continuo de la forma en un vídeo. En este vídeo se ve cómo se reconoce una persona y se sigue después sin tener que volver a buscar la forma de persona que es bastante costoso

La segunda forma de explotar esta capacidad es identificar un objeto en movimiento, restando el fondo a las imágenes y seguir al objeto que se mueve con estos métodos.

Aquí se ve al pequeño robot siguiendo cualquier cosa que se mueva.

No hay comentarios:

Publicar un comentario