La firma china de inteligencia artificial DeepSeek ha conseguido acceso a decenas de miles de GPUs NVIDIA H100, a pesar de las restricciones impuestas por Estados Unidos, según ha declarado el CEO de la compañía. Este acceso les permite entrenar uno de los modelos de IA más avanzados del mundo, el DeepSeek R1, que compite con modelos de renombre como el o1 de OpenAI y el Llama de Meta. En una reciente entrevista con CNBC, Alexander Wang, fundador y CEO de Scale AI, afirmó que el DeepSeek R1 ha igualado o superado a los modelos de IA más destacados en las pruebas más exigentes de su empresa.

Durante la entrevista con Andrew Ross Sorkin de CNBC, Wang habló sobre una nueva prueba de IA de DeepSeek llamada «Humanity’s Last Exam». Esta prueba incluye las preguntas más difíciles formuladas por profesores de matemáticas, física, biología y química, todas relevantes para las investigaciones más recientes. Tras evaluar los modelos de IA más avanzados, el equipo de Wang concluyó que el nuevo modelo de DeepSeek es el mejor en rendimiento, o al menos comparable a los mejores modelos estadounidenses, como el o1.

En cuanto a la competencia en IA entre Estados Unidos y China, Wang reconoció que históricamente Estados Unidos ha estado por delante. Sin embargo, destacó que los nuevos modelos de DeepSeek intentan cambiar esta dinámica. Según Wang, es simbólico que el laboratorio chino lance un modelo revolucionario el día de Navidad, mientras el resto del mundo celebra las festividades. Esto subraya la ambición de China de cerrar la brecha tecnológica con Estados Unidos.

DeepSeek está utilizando la arquitectura Hopper de NVIDIA con GPUs H100 y H200 para entrenar sus modelos de IA, a pesar de las restricciones impuestas por la administración Biden para evitar que GPUs avanzadas lleguen a China. Wang comentó que, aunque las restricciones existen, no parece tan difícil conseguir chips avanzados en China. Según él, DeepSeek posee alrededor de cincuenta mil H100, aunque no pueden hablar abiertamente de ello debido a los controles de exportación de Estados Unidos.

Marina Zhang, profesora asociada en la Universidad de Tecnología de Sídney, que estudia innovaciones chinas, señaló que, a diferencia de muchas firmas chinas de IA que dependen en gran medida del acceso a hardware avanzado, DeepSeek se ha centrado en maximizar la optimización de recursos impulsada por software. Han adoptado métodos de código abierto, fomentando la innovación colaborativa. Este enfoque no solo mitiga las limitaciones de recursos, sino que también acelera el desarrollo de tecnologías de vanguardia, diferenciando a DeepSeek de sus competidores más insulares.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí