¡Robots que navegan casi a la perfección y sin mapa!

La comunidad de IA tiene el objetivo a largo plazo de construir máquinas inteligentes que interactúen de manera efectiva con el mundo físico, y un desafío clave es enseñar a estos sistemas a navegar a través de entornos complejos y desconocidos del mundo real para llegar a un destino específico, sin un mapa proporcionado previamente. Facebook AI ha creado un nuevo algoritmo de aprendizaje de refuerzo distribuido (RL) a gran escala llamado DD-PPO, que ha resuelto efectivamente la tarea de navegación hacia de punto-objetivo utilizando solo una cámara RGB-D, GPS y datos de brújula . Los agentes capacitados con DD-PPO (que significa optimización descentralizada de políticas proximales distribuidas) logran casi el 100 % de éxito en una variedad de entornos virtuales y reales, tales como casas y edificios de oficinas.

Un hecho desafortunado sobre los mapas es que se vuelven obsoletos en el momento en que se crean. La mayoría de los entornos del mundo real evolucionan: los edificios y las estructuras cambian, los objetos se mueven y las personas y las objetos están en constante cambio. Al aprender a navegar sin un mapa, los agentes entrenados por DD-PPO acelerarán la creación de nuevas aplicaciones de IA para el mundo físico.

La navegación es esencial para crear agentes y asistentes de inteligencia artificial que ayuden a las personas en el mundo físico, desde robots que pueden recuperar un objeto desde un escritorio en el piso de arriba, hasta sistemas que ayudan a personas con discapacidades visuales, a asistentes con tecnología de inteligencia artificial que presentan información relevante a las personas que usan Gafas de realidad aumentada. Facebook AI espera aprovechar el éxito de DD-PPO mediante la creación de sistemas que logren la navegación de punto a objetivo con solo la entrada de la cámara, y sin brújula o datos GPS. Esto ayudará a los investigadores a crear agentes que trabajen en entornos comunes, como dentro de edificios de oficinas o laboratorios, donde estos puntos de datos adicionales no están disponibles.

Facebook AI entrenó y evaluó DD-PPO utilizando la plataform AI Habitat. Habitat es un framework modular con un simulador estable y de alto rendimiento, lo que lo convierte en ideal para simular miles de millones de pasos de experiencia. Habitat se ejecuta a 10K cuadros / segundo (multiproceso) y puede trabajar con una amplia variedad de conjuntos de datos, incluido Replica, el entorno virtual más realista para la investigación de IA actualmente disponible.

Conclusión

Los modelos pueden aprender rápidamente nuevas tareas (superando a las CNN preentrenadas con ImageNet) y pueden utilizarse como controladores de punto-objetivo casi perfectos, un recurso universal para otras tareas de navegación de alto nivel, como maximizar la distancia del agente desde su punto de partida . Facebook AI espera aprovechar este trabajo para crear sistemas que realicen tareas más semánticas y de mayor nivel, como navegación por objetivos («Ir a una silla»), seguir las instrucciones («Salir de la habitación, girar a la izquierda, bajar por el pasillo y subir las escaleras, y deténgase en el escritorio «), la respuesta a la pregunta incorporada (» ¿Está mi computadora portátil en mi escritorio? «), y eventualmente manipulando objetos en respuesta a solicitudes como» Tráeme mi computadora portátil de mi escritorio «.

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Accedé al descuento del15%

Suscribiéndote a Nuestro Newsletter, y recibí el cupón para tu inscripción.