En un avance significativo en la intersección de la inteligencia artificial y el diseño de juguetes, los investigadores de la Universidad Carnegie Mellon han presentado LegoGPT, un modelo de IA capaz de crear estructuras de Lego físicamente estables a partir de descripciones textuales. Este sistema no solo diseña modelos de Lego que coinciden con las descripciones proporcionadas, sino que también garantiza que puedan ser construidos, ya sea a mano o con asistencia robótica.
Creación de modelos estables
Según el equipo de investigación, para lograr este objetivo, se construyó un conjunto de datos de gran escala que contenía diseños estables de Lego junto con sus descripciones. Esto permitió entrenar un modelo de lenguaje autorregresivo que predice el siguiente ladrillo a agregar mediante una técnica conocida como «next-token prediction». Los modelos generados son simples y utilizan un número limitado de tipos de ladrillos, lo que da lugar a formas primitivas que son, no obstante, estables.
En su artículo titulado «Generando diseños de Lego físicamente estables y construibles a partir de texto», el equipo liderado por Ava Pun expone que muchos modelos de generación 3D existentes se centran en crear objetos diversos con geometría detallada, pero que a menudo son difíciles de realizar físicamente. En contraste, LegoGPT se enfoca en la integridad estructural, produciendo instrucciones paso a paso para construir creaciones de Lego que no se desmoronan.
Cómo funciona LegoGPT
Para crear LegoGPT, el equipo reutilizó la tecnología de los grandes modelos de lenguaje para predecir la colocación de ladrillos en lugar de palabras. Además, ampliaron el modelo de predicción de ladrillos con una herramienta de verificación que utiliza modelos matemáticos para simular fuerzas estructurales y la gravedad. Para entrenar el modelo, el equipo ensambló un nuevo conjunto de datos llamado «StableText2Lego», que incluía más de 47,000 estructuras de Lego estables emparejadas con descripciones generadas por otro modelo de IA, GPT-4o. Cada estructura fue sometida a un análisis físico para asegurar que pudiera ser construida en el mundo real.
La metodología de LegoGPT implica generar secuencias de ladrillos colocados con precisión. El sistema verifica que cada ladrillo nuevo no colida con los existentes y que encaje dentro del espacio de construcción. Si alguna parte del diseño se considera inestable, el sistema identifica el ladrillo problemático y retrocede para eliminarlo, lo que mejora significativamente la estabilidad de las estructuras.
Pruebas con humanos y robots
Para validar sus diseños, los investigadores hicieron que robots ensamblaran los modelos de Lego creados por la IA. Utilizaron un sistema de brazos robóticos con sensores de fuerza para manipular los ladrillos conforme a las instrucciones generadas por la IA. Además, se realizaron pruebas manuales con humanos, quienes pudieron construir algunos de los diseños, evidenciando que los modelos eran verdaderamente realizables.
El equipo también está trabajando para expandir el número de tipos de ladrillos utilizados y aumentar la diversidad de objetos en su conjunto de datos, que actualmente incluye 21 categorías. Los investigadores han liberado su conjunto de datos, código y modelos en su sitio web, permitiendo que otros puedan trabajar sobre su investigación.
Conclusión
LegoGPT representa un gran paso adelante en la creación de modelos de Lego que son no solo creativos, sino también físicamente realizables. Con un enfoque en la estabilidad estructural, tiene el potencial de revolucionar la forma en que los niños y adultos piensan acerca de combinar la tecnología con el juego.