Google ha desarrollado un programa que, por primera
vez, es capaz de aprender a jugar por su cuenta y de forma
independiente, lo cual supone un salto muy importante con respecto al
tipo de inteligencia artificial existente hasta el momento.
Deep Blue,
por poner un ejemplo conocido, ganó al ajedrez a Kasparov en el año 1997
gracias a haber sido programado previamente por humanos con las reglas
del juego y con estrategias específicas, lo cual sumado a su potencia de
cálculo le dio la ventaja necesaria. No aprendió solo.
En el caso de este nuevo
“agente”, como lo llaman en Google, estamos hablando de dejar al programa que juegue por sí mismo y
aprenda de forma independiente cuál es la mejor estrategia para ganar.
La nueva IA ha aprendido a jugar sola a 49 títulos retro
El año pasado Google compró una compañía llamada
DeepMind cuyo objetivo es construir máquinas inteligentes. Ha sido este grupo el encargado de desarrollar el nuevo agente, el cual
ha aprendido a jugar sin ayuda a 49 títulos retro distintos.
En este vídeo podemos ver cómo la IA aprende a jugar al clásico
‘Breakout’
de Atari. Fijaos cómo en las primeras partidas va perdidísimo y no sabe
qué hacer.
El agente sigue entrenando y aprendiendo y, tras 600 rondas,
da con una estrategia ganadora. Decide que la mejor forma de superar
los niveles es atacando los laterales de la barrera para que la bola se
sitúe al otro lado y acabe con ella desde arriba:
Cuando el agente empieza a jugar por primera vez a un juego se
produce algo similar a cuando un recién nacido abre los ojos y ve el
mundo por primera vez. En este caso la IA observa la información en
pantalla y
presiona botones de forma aleatoria para comprobar qué sucede.
Utiliza un método llamado
Aprendizaje profundo que
le permite convertir los inputs visuales básicos en conceptos con
significado, de la misma forma que el cerebro humano es capaz de
transformar la información sensorial bruta en una comprensión rica del
mundo.
Gracias, por otro lado, al
Aprendizaje por refuerzo,
el agente es capaz de detectar aquello que tenga valor. Y de ahí surgen
una serie de nociones básicas como esta: ganar puntos es bueno;
perderlos es malo.
El agente es muy bueno, pero le queda mucho para ser perfecto
En el estudio, publicado en la revista Nature, figura que el agente
tuvo un rendimiento del 75% del nivel de un tester profesional de
videojuegos, o incluso superior, en la mitad de los juegos probados,
entre los cuales había desde shooters de scroll lateral hasta juegos de
conducción en entornos 3D.
En juegos como ‘Space Invaders’, ‘Pong’ o
‘Breakout’,
el agente logró superar a los humanos, mientras que en otros juegos lo hizo mucho peor.
Los investigadores aseguran que esto es así principalmente por la
falta de memoria real
por parte del agente, lo cual no le permite establecer estrategias a
largo plazo que requieran planificación.
Por esta razón, el equipo de
DeepMind
está intentando construir un componente de memoria para añadirlo al
sistema y aplicarlo en juegos más realistas en entornos
tridimensionales.
Elon Musk, CEO de Tesla, fue uno de los primeros
inversores de DeepMind y asegura que los avances en el campo de la
Inteligencia Artificial se producen a tal velocidad que el riesgo de que
pueda suceder algo realmente peligroso está en un marco de tiempo
situado entre los próximos cinco o diez años a lo sumo. Estáis pensando
en Skynet, lo sé.
Hemos hablado del agente en términos de juego, pero es evidente que
este tipo de IA capaz de aprender de forma independiente
tiene muchas más aplicaciones: coches que conduzcan solos, asistentes
personales en smartphones, investigación científica en varios campos y
más, mucho más.