Los trabajos de investigación se publican con demasiada frecuencia para que cualquiera pueda leerlos todos. Eso es especialmente cierto en el campo del aprendizaje automático, que ahora afecta (y produce artículos en) prácticamente todas las industrias y empresas. Esta columna tiene como objetivo recopilar algunos de los descubrimientos y artículos recientes más relevantes, en particular, entre otros, en inteligencia artificial, y explicar por qué son importantes.
En esta edición, tenemos muchos elementos relacionados con la interfaz entre la IA o la robótica y el mundo real. Por supuesto, la mayoría de las aplicaciones de este tipo de tecnología tienen aplicaciones del mundo real, pero específicamente esta investigación trata sobre las inevitables dificultades que ocurren debido a las limitaciones a ambos lados de la división real-virtual.
Un problema que surge constantemente en robótica es qué tan lentas van las cosas en el mundo real. Naturalmente, algunos robots entrenados en ciertas tareas pueden realizarlas con una velocidad y agilidad sobrehumanas, pero para la mayoría ese no es el caso. Necesitan comparar sus observaciones con su modelo virtual del mundo con tanta frecuencia que tareas como recoger un artículo y dejarlo pueden llevar unos minutos.
Lo que es especialmente frustrante sobre esto es que el mundo real es el mejor lugar para entrenar robots, ya que en última instancia, operarán en él. Un enfoque para abordar esto es aumentar el valor de cada hora de pruebas en el mundo real que realiza, que es el objetivo de este proyecto en Google.
En una publicación de blog bastante técnica, el equipo describe el desafío de usar e integrar datos de múltiples robots que aprenden y realizan múltiples tareas. Es complicado, pero hablan de crear un proceso unificado para asignar y evaluar tareas, y ajustar las asignaciones y evaluaciones futuras en base a eso. De manera más intuitiva, crean un proceso mediante el cual el éxito en la tarea A mejora la capacidad de los robots para realizar la tarea B, incluso si son diferentes.
Los humanos lo hacen: saber cómo lanzar bien una pelota te da una ventaja para lanzar un dardo, por ejemplo. Es importante aprovechar al máximo la valiosa capacitación del mundo real, y esto muestra que hay mucha más optimización que hacer allí.
Otro enfoque es mejorar la calidad de las simulaciones para que estén más cerca de lo que encontrará un robot cuando lleve su conocimiento al mundo real. Ese es el objetivo del entorno de entrenamiento THOR del Instituto Allen para la IA y su nuevo habitante, ManipulaTHOR.
Los simuladores como THOR proporcionan un análogo al mundo real donde una IA puede aprender conocimientos básicos como cómo navegar por una habitación para encontrar un objeto específico, ¡una tarea sorprendentemente difícil! Los simuladores equilibran la necesidad de realismo con el costo computacional de proporcionarlo, y el resultado es un sistema en el que un agente robot puede pasar miles de “horas” virtuales probando cosas una y otra vez sin necesidad de enchufarlas, engrasar sus articulaciones, etc. en.