Una IA analizó más de 700 mil horas de videos de 'Minecraft’ para tener la experiencia de un jugador después de 24 mil movimientos

Una IA analizó más de 700 mil horas de videos de 'Minecraft’ para tener la experiencia de un jugador después de 24 mil movimientos
Sin comentarios

El campo de desarrollo en inteligencia artificial cada día va expandiendo más sus horizontes, y en esta ocasión OpenIA ha creado una red neuronal llamada VPT (Video PreTraining) que aprendió a jugar 'Minecraft'. Su aprendizaje fue tan bueno que no solo puede hacer construcciones sencillas sino que también puede craftear herramientas de diamante. A un humano normalmente le toma 20 minutos (o 24 mil movimientos), lograr ese diseño.

Lo anterior se logró después de entrenar a esta red neuronal con miles de horas de videos de gameplay disponible en internet. Hay que recordar que casi todo proyecto de Machine Learning necesita como base una gran cantidad de datos etiquetados, sean imágenes, palabras, sonidos o video, para aprender a realizar su trabajo.

Es por ello que se hizo uso de algo así como 70 mil horas de video de 'Minecraft' en el que se etiquetaron las acciones realizadas por los jugadores. Esto significa que registraron en que momento la persona presionó tal o cual botón para realizar tal o cual acción. VPT es un algoritmo de clonación de movimiento por lo que aprende de las acciones realizadas en las 70K horas de video.

Pillarjumping1
Esta IA logró aprender 'pillaring' o saltar haciendo una columna de bloques, además de cazar, craftear y nadar.

Pero no todo se realiza con un mismo algoritmo, para llegar al punto en que la IA pudo craftear un pico de diamante necesitaron hacerle varios ajustes a una misma red. Lograron lo anterior haciendo uso de algo llamado fine-tuning, proceso bajo el cual lo aprendido por una red general anterior se incorpora a una nueva red con datos un poco más focalizados con el fin de que mejore su desempeño en una tarea en específico.

Además, también esta IA no solo sorprende por lo que puede hacer, sino por la velocidad a la cual lo puede hacer. Logra completar tareas en un tiempo igual de bueno que un humano jugando 'Minecraf', lo cual es sorprendente teniendo en cuenta que esta red ni siquiera a logrado todo su potencial. En todo proyecto de Machine Learning siempre se busca tener un desempeño equiparable al de un humano, por lo que es un primer avance en este modelo.

Mc Caves And Cliffs Carousel Lush Cave 440x250
Otra de las cosas que sorprendió fue la facilidad con la que aprendió a construir

La presentación de este modelo cierra con el anuncio de un concurso de OpenIA en asociación con MineRL NeurIPS. Este concurso intenta animar a la gente para que intenten optimizar estos algoritmos utilizados para 'Minecraft' con el fin de realizar todo tipo de tareas dentro del juego. El premio gordo es de 100 mil dólares, con posibilidades de ganar hasta 20 mil si se hace un buen trabajo.

Y hablando de 'Minecraft', en Xataka México tuvimos la oportunidad de platicar con desarrolladores de Mojang para que nos contaran un poco más sobre la última gran actualización del juego: 'The Wild Update'. Esta actualización pretende llevar "lo salvaje y misterioso" a este popular juego.

Temas
Inicio