La startup china DeepSeek, que causó conmoción en los mercados globales este año, lanzó silenciosamente una versión mejorada de su modelo de inteligencia artificial de razonamiento. La compañía no hizo un anuncio oficial, pero la actualización de DeepSeek R1 fue publicada en el repositorio de modelos de IA Hugging Face.
El fenómeno DeepSeek continúa
DeepSeek saltó a la fama este año después de que su modelo de razonamiento R1 gratuito y de código abierto superara las ofertas de rivales incluyendo Meta y OpenAI. El bajo costo y el corto tiempo de desarrollo impactaron los mercados globales, generando preocupaciones de que las gigantes tecnológicas estadounidenses estaban gastando excesivamente en infraestructura y eliminando miles de millones de dólares del valor de las principales acciones tecnológicas de EE.UU. como Nvidia, el referente en IA. Estas compañías se han recuperado ampliamente desde entonces.
Tal como ocurrió con el debut de DeepSeek R1, el modelo mejorado también fue lanzado con poca fanfarria. Es un modelo de razonamiento, lo que significa que la IA puede ejecutar tareas más complicadas a través de un proceso de pensamiento lógico paso a paso.
Rendimiento competitivo
El modelo mejorado DeepSeek R1 está justo detrás de los modelos de razonamiento o4-mini y o3 de OpenAI en LiveCodeBench, un sitio que evalúa modelos contra diferentes métricas.
DeepSeek se ha convertido en el ejemplo paradigmático de cómo la inteligencia artificial china sigue desarrollándose a pesar de los intentos estadounidenses de restringir el acceso del país a chips y otras tecnologías. Este mes, los gigantes tecnológicos chinos Baidu y Tencent revelaron cómo están haciendo sus modelos de IA más eficientes para lidiar con las restricciones de exportación de semiconductores de EE.UU.
Críticas a los controles de exportación
«Estados Unidos ha basado su política en la suposición de que China no puede fabricar chips de IA», dijo Huang. «Esa suposición siempre fue cuestionable, y ahora es claramente incorrecta».
Jensen Huang, CEO de Nvidia, que diseña las unidades de procesamiento gráfico requeridas para entrenar enormes modelos de IA, criticó duramente los controles de exportación estadounidenses el miércoles.
«La pregunta no es si China tendrá IA», agregó Huang. «Ya la tiene».
El lanzamiento silencioso de esta actualización de DeepSeek demuestra que la competencia en el campo de la inteligencia artificial continúa intensificándose, con China posicionándose como un actor cada vez más prominente en el desarrollo de modelos de IA avanzados, desafiando el dominio tradicional de las empresas estadounidenses en este sector crítico.