En los últimos dos años, la inteligencia artificial (IA) ha logrado avances significativos, superando a los humanos en diversas pruebas fundamentales, lo que lleva a cuestionar la necesidad de desarrollar nuevos métodos de evaluación. Según la séptima edición del informe del Índice de IA de la Universidad de Stanford, realizada por un equipo interdisciplinario de expertos académicos e industriales, la IA está integrándose cada vez más en nuestras vidas diarias y su evolución es palpable en diversos sectores.
Desde la clasificación de imágenes en 2015 hasta la inferencia del lenguaje natural en 2021, la IA ha demostrado capacidades sorprendentes que, hasta hace poco, eran dominio exclusivo de los seres humanos. Este progreso rápido ha hecho que muchas de las pruebas tradicionales ahora se consideren obsoletas, y los investigadores se ven en la necesidad de crear benchmarks más desafiantes que no solo midan la competencia, sino que destaquen las diferencias cruciales entre humanos y máquinas.
El informe de 2023 destaca áreas donde la IA aún enfrenta desafíos, como la resolución de problemas matemáticos avanzados y el razonamiento visual con sentido común (VCR). Aunque la IA ha mostrado mejoras significativas —por ejemplo, la capacidad de resolver problemas matemáticos de competencia aumentó del 6.9% en 2021 al 84.3% en 2023—, aún existe un margen para alcanzar y superar el rendimiento humano, que se sitúa en el 90%.
El VCR, que evalúa cómo la IA aplica el conocimiento del sentido común en contextos visuales, también ha visto incrementos notables. Entre 2022 y 2023, la habilidad de IA para realizar VCR aumentó un 7.93%, alcanzando un 81.60% frente al 85% de la línea base humana.
Estos datos subrayan la necesidad urgente de desarrollar nuevos estándares de evaluación que reflejen no solo la competencia, sino también las capacidades únicas humanas en comparación con las de la IA. A medida que avanzamos en esta nueva era de la IA, es crucial seguir evaluando y entendiendo estas tecnologías para garantizar que complementen las habilidades humanas de manera efectiva y ética.