Mano robótica puede hacer malabares con un cubo _ con mucho entrenamiento
La mano, llamada Dactyl, aprendió a moverse, el equipo de dos docenas de investigadores dio a conocer esta semana.
¿Cuánto tiempo lleva una mano robótica aprender a hacer malabarismos con un cubo?
Alrededor de 100 años, más o menos.
Ese es el tiempo de computación virtual que les tomó a los investigadores de OpenAI, el laboratorio de inteligencia artificial sin fines de lucro financiado por Elon Musk y otros, entrenar su mano incorpórea. El equipo pagó a Google $ 3,500 para ejecutar su software en miles de computadoras simultáneamente, calculando el tiempo real en 48 horas. Después de entrenar al robot en un entorno virtual, el equipo lo puso a prueba en el mundo real.
La mano, llamada Dactyl, aprendió a moverse, el equipo de dos docenas de investigadores dio a conocer esta semana. Su trabajo es simplemente ajustar el cubo de manera que una de sus letras, "O", "P", "E", "N", "A" o "I", mire hacia arriba para coincidir con una selección aleatoria.
Ken Goldberg, profesor de robótica de la Universidad de California en Berkeley, que no está afiliado al proyecto, dijo que el logro de OpenAI es importante porque demuestra cómo los robots entrenados en un entorno virtual pueden operar en el mundo real. Su laboratorio está intentando algo similar con un robot llamado Dex-Net, aunque su mano es más simple y los objetos que manipula son más complejos.
"La clave es la idea de que puedes avanzar tanto en la simulación", dijo. "Este es un camino plausible, cuando hacer experimentos físicos es muy difícil".
Robotic handiwork: @rnakashi explains how _ and why _ artificial intelligence researchers taught a robot to juggle a cube. READ MORE: https://t.co/NH9JGJF4PR pic.twitter.com/nNVgE5Dxkw — AP Business News (@APBusiness) 31 de julio de 2018
Los dedos del mundo real de Dactyl son rastreados por puntos infrarrojos y cámaras. En el entrenamiento, cada movimiento simulado que acercó el cubo a la meta le dio a Dactyl una pequeña recompensa. Dejar caer el cubo causaba que sintiera una penalización 20 veces mayor.
El proceso se llama aprendizaje de refuerzo. El software del robot repite los intentos millones de veces en un entorno simulado, intentándolo una y otra vez para obtener la mayor recompensa. OpenAI usó aproximadamente el mismo algoritmo que usó para vencer a jugadores humanos en un videojuego, "Dota 2".
En la vida real, un equipo de investigadores trabajó aproximadamente un año para obtener la mano mecánica hasta este punto.
LEE TAMBIÉN: Descenso de acciones de Facebook: ¿retroceso breve o presagio de problemas?
¿Por qué?
Por un lado, la mano en un entorno simulado no comprende la fricción. Así que, aunque sus dedos reales son correosos, Dactyl carece de la comprensión humana sobre los mejores agarres.
Los investigadores inyectaron su entorno simulado con cambios en la gravedad, el ángulo de la mano y otras variables para que el software aprenda a funcionar de una manera adaptable. Eso ayudó a reducir la brecha entre los resultados del mundo real y los simulados, que eran mucho mejores.
Las variaciones ayudaron a que la mano tuviera éxito poniendo la letra correcta boca arriba más de una docena de veces seguidas antes de soltar el cubo. En la simulación, la mano generalmente tuvo éxito 50 veces seguidas antes de detener la prueba.
El objetivo de OpenAI es desarrollar inteligencia artificial artificial, o máquinas que piensen y aprendan como seres humanos, de una manera que sea segura para las personas y ampliamente distribuida.
Musk ha advertido que si los sistemas de IA son desarrollados solo por compañías con fines de lucro o gobiernos poderosos, algún día podrían superar la inteligencia humana y ser más peligrosos que la guerra nuclear con Corea del Norte.