El 22 de mayo de 2025, se presentó la siguiente generación de modelos Claude: Claude Opus 4 y Claude Sonnet 4, los cuales establecen nuevos estándares para la codificación, el razonamiento avanzado y los agentes de IA.

Claude Opus 4 se posiciona como el mejor modelo de codificación del mundo, con rendimiento sostenido en tareas complejas y flujos de trabajo de agentes. Por otro lado, Claude Sonnet 4 representa una mejora significativa respecto a Claude Sonnet 3.7, ofreciendo una codificación y razonamiento superiores, y respondiendo con mayor precisión a las instrucciones.

Entre las innovaciones presentadas se destacan:

  • Uso de herramientas para un pensamiento extendido (beta): Ambos modelos pueden utilizar herramientas, como búsqueda en la web, durante el proceso de pensamiento extendido, permitiendo alternar entre razonamiento y uso de herramientas para mejorar las respuestas.
  • Nuevas capacidades del modelo: Son capaces de utilizar herramientas en paralelo, seguir instrucciones con mayor precisión y, cuando los desarrolladores les dan acceso a archivos locales, demostrar mejoras significativas en memoria, extrayendo y guardando datos clave para mantener la continuidad y construir conocimiento tácito con el tiempo.
  • Claude Code ahora disponible de forma general: Luego de recibir comentarios positivos durante una vista previa de investigación, se amplían las formas en que los desarrolladores pueden colaborar con Claude. Claude Code ahora permite tareas en segundo plano a través de GitHub Actions e integraciones nativas con VS Code y JetBrains.
  • Nuevas capacidades de API: Se lanzan cuatro nuevas capacidades en la API de Anthropic que permiten a los desarrolladores construir agentes de IA más potentes: herramienta de ejecución de código, conector MCP, API de archivos y la capacidad de almacenar solicitudes durante hasta una hora.

Los modelos Claude 4 ofrecen dos modos: respuestas casi instantáneas y pensamiento extendido para un razonamiento más profundo. Los planes de Claude Pro, Max, Team y Enterprise incluyen ambos modelos y el pensamiento extendido, siendo Sonnet 4 también accesible para usuarios gratuitos. Ambos modelos están disponibles en la API de Anthropic, Amazon Bedrock y Google Cloud’s Vertex AI, manteniendo precios equivalentes a sus predecesores: Opus 4 a $15/$75 por millón de tokens (entrada/salida) y Sonnet 4 a $3/$15.

Claude Opus 4 es el modelo más potente hasta la fecha y lidera en las métricas SWE-bench (72.5%) y Terminal-bench (43.2%). Muestra un rendimiento continuo en tareas prolongadas que requieren un esfuerzo concentrado, superando drásticamente a todos los modelos Sonnet y ampliando lo que los agentes de IA pueden lograr.

En cuanto a Claude Sonnet 4, mejora significativamente las capacidades de su predecesor, subiendo a un 72.7% en SWE-bench. Este modelo equilibra rendimiento y eficiencia para casos de uso internos y externos, con una mejor capacidad de dirección para un mayor control en las implementaciones.

Entre los elogios recibidos, GitHub señala que Claude Sonnet 4 sobresale en escenarios de agente y será el modelo base para un nuevo agente de codificación en GitHub Copilot. Por su parte, Replit informa sobre una mejor precisión y avances dramáticos para cambios complejos a través de varios archivos. Rakuten validó sus capacidades mediante un exigente proceso de refactorización de código abierto durante siete horas con rendimiento sostenido.

Adicionalmente, ambos modelos han reducido en un 65% el comportamiento donde los modelos utilizan atajos o trucos para completar tareas, superando así las limitaciones de versiones anteriores.

Las mejoras en la memoria son dramáticas con Claude Opus 4, ya que permite a los desarrolladores construir aplicaciones que le otorguen acceso a archivos locales, creando y manteniendo «archivos de memoria» que almacenan información clave, lo que mejora su desempeño en tareas a largo plazo.

En conclusión, los modelos Claude 4 no solo avanzan en las capacidades de codificación y razonamiento, sino que también ofrecen una perspectiva innovadora para futuras aplicaciones de inteligencia artificial, marcando un importante legado en el desarrollo de agentes colaborativos en el ámbito tecnológico.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí