El anuncio reciente de OpenAI sobre su modelo de generación de imágenes, 4o Image Generation, marca un nuevo hito en la creación de medios visuales mediante inteligencia artificial. Esta herramienta, integrada en su modelo de lenguaje GPT-4o, ha mejorado significativamente la precisión en la generación de imágenes a partir de texto, superando las limitaciones de versiones anteriores como DALL-E 2 y DALL-E 3.
Desde su lanzamiento, DALL-E 2, en la primavera de 2022, había permitido que un grupo selecto de usuarios explorara un nuevo mundo de creación visual automatizada. Sin embargo, este modelo enfrentó críticas debido a la inconsistencia en el renderizado de texto y su incapacidad para seguir instrucciones complejas. OpenAI abordó estas limitaciones en su nueva iteración, 4o IG, anunciada el pasado 25 de marzo de 2025.
Mejoras y capacidades del nuevo modelo
4o Image Generation permite que los usuarios obtengan resultados más precisos al seguir indicaciones textuales y ha mejorado en el renderizado de texto dentro de las imágenes. Con esta herramienta, los usuarios pueden proporcionar instrucciones de modificación en un contexto conversacional, lo que agrega una nueva dimensión a la edición de imágenes generadas.
Durante las pruebas, el modelo demostró su capacidad para crear imágenes de alta calidad, como un gato bebiendo cerveza en un coche, o una versión ficticia de Abraham Lincoln sosteniendo un cartel de «Ars Technica». Además, se observó que el proceso es notablemente lento, tardando entre 30 segundos y un minuto por imagen, pero ofrece una calidad que podría justificar este tiempo.
Implicaciones y controversias
La llegada de 4o IG está destinada a provocar un nuevo debate sobre la manipulación de medios. Con su capacidad para crear imágenes que pueden alterar nuestra percepción de la realidad, se anticipan discusiones sobre la propiedad intelectual y posibles conflictos con los artistas y diseñadores gráficos que podrían sentir que sus trabajos están en riesgo debido a esta tecnología.
A pesar de los avances, OpenAI reconoce limitaciones como la tendencia del modelo a producir contenido inexacto en situaciones complejas, y la dificultad para manipular texto en imágenes. Estas fallas son parte de un amplio conjunto de desafíos que enfrenta la inteligencia artificial en la generación de contenido visual.
Un futuro incierto para la creación de imágenes
A medida que OpenAI avanza en el desarrollo de modelos de generación de imágenes más sofisticados, la discusión sobre los riesgos y beneficios de esta tecnología se intensificará. “Este modelo representa un nuevo umbral en la libertad creativa”, dijo Sam Altman, CEO de OpenAI, anticipando que los usuarios producirán tanto obras asombrosas como potencialmente ofensivas.
Se espera que 4o IG fomente una era en la que la generación de imágenes altamente manipuladas esté al alcance de cualquiera, planteando preguntas sobre la autenticidad en los medios y la creciente necesidad de alfabetización mediática en la sociedad actual.