Microsoft ha revelado su nuevo modelo de inteligencia artificial, Muse, que tiene la capacidad de generar demostraciones de juego consistentes a partir de una sola captura de pantalla. Este modelo, conocido como el «World and Human Action Model» (WHAM), está diseñado para ayudar a los desarrolladores de videojuegos a visualizar y experimentar con ideas de jugabilidad, permitiendo que las demostraciones de juego puedan durar varios minutos.
El modelo de Muse cuenta con 1.6 mil millones de parámetros y ha sido entrenado utilizando 500,000 horas de datos de juego de Bleeding Edge, un título de acción multijugador. La tecnología permite que, al recibir una imagen del juego, genere múltiples ejemplos de jugabilidad. Esto representa un avance significativo en la industria de los videojuegos, ya que combina imágenes y acciones del control, proporcionando una coherencia temporal y calidad sin precedentes.
Cómo funciona Muse
A diferencia de modelos anteriores como Genie de Google DeepMind, que se centraron en datos públicos, Muse toma en cuenta la entrada del controlador, lo que le permite generar experiencias más realistas. Utiliza una arquitectura de transformador autorregresiva, lo que es poco común en modelos que producen imágenes, ya que permite que la jugabilidad sea generada como secuencias de tokens discretos, mezclando imágenes y acciones.
Los investigadores han creado una herramienta llamada WHAM Demonstrator que exhibe la consistencia del modelo. Los usuarios pueden interactuar con el modelo a través de un controlador y tienen la capacidad de insertar objetos en la jugabilidad, los cuales permanecen en el mundo del juego con un éxito que varía entre el 85% y el 98%, dependiendo del objeto.
Limitaciones y futuro de Muse
A pesar de sus innovaciones, Muse no es un generador de videojuegos completo. Los clips de juego generados están limitados a una resolución de 380 por 180 píxeles y 10 fotogramas por segundo, lo que impide una experiencia de juego agradable. Además, el modelo solo puede generar jugabilidad similar a Bleeding Edge, lo que limita su aplicabilidad en otros títulos.
Sin embargo, Muse es una herramienta para desarrolladores que buscan iterar sobre ideas de juego, creando un bucle iterativo donde pueden realizar modificaciones sobre la marcha. Además, apunta hacia un futuro donde modelos más avanzados puedan capturar dinámicas de entornos reales o simulados, lo que abriría nuevas posibilidades en el diseño de videojuegos y en otros campos.