¿Cuáles son algunas áreas de investigación actuales en localización y mapeo simultáneo (SLAM)? La Ciencia y la Tecnología mejoran el futuro

SLAM se considera cada vez más como “resuelto”, por lo que algunos de los principales desafíos de investigación en los que se centró una gran comunidad durante las últimas dos décadas ya han desaparecido. Puede ver esto como sistemas SLAM bastante robustos que se convierten en productos de consumo: Google Project Tango, Dyson 360 Eye entre otros, vehículos autónomos, proyecto Microsoft Hololens, etc. Algunos de los grupos SLAM más importantes ahora están dirigiendo su atención a otros dominios problemáticos: por ejemplo , El profesor Andrew Davison, del Imperial College de Londres, que ahora trabaja más en la comprensión de la escena y los problemas de manipulación robótica, y el profesor Wolfram Burgard, de la Universidad de Friburgo, que trabaja en todo tipo de problemas diversos. Algunos otros laboratorios líderes de antaño, como los de la Universidad de Zaragoza, parecen seguir trabajando en SLAM, pero el trabajo se centra más en la construcción de sistemas como ORB-SLAM que integran ideas ya existentes.

Recientemente se organizó un taller en RSS 2015, donde tratamos de argumentar que todavía hay problemas abiertos importantes en pie. Puede encontrar material relevante en las diapositivas por mí mismo y otros oradores en lo siguiente:

El problema de mover sensores

Puedo enumerar algunos problemas, que algunos consideran que son más desafíos de ingeniería que problemas de investigación, y otros encuentran fuera del ámbito de lo que consideran (SLAM):

¿Cómo manejar escenas dinámicas? Por ejemplo, una escena interior poblada por muchos humanos en movimiento, o una escena callejera con muchos automóviles en movimiento. ¿Es posible manejar estos casos dentro del propio marco SLAM, en lugar de depender de técnicas de reconocimiento? Por ejemplo, es posible que no pueda “reconocer” todos los objetos en movimiento que pueden aparecer en una escena de la carretera, pero aún así desea realizar un seguimiento de ellos.
Cierre de bucle: ¿Cómo hacer el cierre de bucle para sistemas SLAM densos como KinectFusion o DTAM? ¿Cuál es la mejor manera de hacer un cierre de bucle en sistemas visual-inerciales?
¿Cómo pueden hacerse los frontales SLAM semidensos o densos tan robustos como los sistemas basados en puntos de interés codificados por descriptor? Tales front-end arrojan menos información visual contenida en cada fotograma, y debería haber formas de hacer coincidir esa información de manera sólida entre fotogramas. ¿Podemos usar el aprendizaje profundo para establecer correspondencias entre marcos?
¿Cómo podemos evitar la necesidad de SLAM por completo? Por ejemplo, hay un trabajo que demuestra el aprendizaje de red neuronal de extremo a extremo para la conducción autónoma o el aprendizaje de refuerzo profundo de extremo a extremo para un agente autónomo en un entorno de juego 3D. O, alternativamente, ¿SLAM explícito sigue siendo útil en ese contexto? ¡Tenemos mucha maquinaria matemática para SfM / SLAM, y uno espera que las formulaciones matemáticas precisas superen las funciones de navegación aprendidas implícitamente sobre los datos!
SLAM de baja potencia, “siempre encendido” en un dispositivo integrado que utiliza la entrada de algo como el Google Glass. O si SLAM está realmente resuelto, decidiendo los subcomponentes claramente mejores (basados en estudios comparativos y estudios exhaustivos), y construyendo una tubería estándar para SLAM, como tenemos OpenGL para gráficos.
Representaciones de mapas que pueden estar estrechamente vinculadas a técnicas de reconocimiento y explotar conceptos de alto nivel (reconocimiento que ayuda a la reconstrucción y reconstrucción que ayuda al reconocimiento). Como SLAM a nivel de objetos, “cosas”, por ejemplo, paredes, edificios, bordillos, así como puntos de referencia.

InvestigaciónLista de preguntasRobóticaVisión por computadora