China está desaprovechando una gran parte de sus vastos recursos de datos debido a que sus capacidades de almacenamiento y procesamiento de datos no se mantienen al ritmo de su generación. Según un nuevo informe, menos del 3% de los datos generados en el país el año pasado fueron almacenados y procesados.
El Informe Nacional de Recursos de Datos 2023, la primera encuesta nacional sobre recursos de datos realizada por las autoridades chinas, fue presentado el 24 de mayo en una cumbre sobre economía digital en Fuzhou, provincia de Fujian. Impulsada por el rápido desarrollo de tecnologías 5G, IA y la disponibilidad de dispositivos inteligentes, China generó 32,85 zettabytes (ZB) de datos el año pasado. Un zettabyte equivale a mil millones de terabytes.Sin embargo, mientras la producción de datos aumentó un 22%, el almacenamiento de datos solo creció en 0,95 ZB el año pasado, menos del 3% de la cantidad de datos generados en el mismo período.
El informe reconoció que la relación de conversión entre la generación y el almacenamiento de datos en China sigue siendo baja, y que «el valor potencial de los datos necesita ser explorado más a fondo». También destacó que el uso de los datos almacenados es escaso: casi el 40% de los datos almacenados por las empresas el año pasado no fueron leídos ni reutilizados después de ser almacenados.
“La insuficiencia de las capacidades de procesamiento de datos conduce a una subestimación y dificultades para descubrir y reutilizar una gran cantidad de datos”, señala el informe.
El profesor Andy Chun, de la Facultad de Negocios de la Universidad de la Ciudad de Hong Kong, afirmó que la cifra del 3% de China para el almacenamiento de datos es coherente con las medidas globales que indican que solo una fracción de los datos generados se preserva. Según el portal de estadísticas alemán Statista, el 2% de los datos creados y consumidos en 2020 se almacenaron para su uso en 2021.
Chun explicó que almacenar grandes cantidades de datos no solo presenta vulnerabilidades de seguridad, sino que también implica costos significativos y desafíos tecnológicos. «La infraestructura necesaria para almacenar tales volúmenes de datos en tiempo real exige avances continuos en soluciones de almacenamiento, lo que puede resultar prohibitivo en costos».
Sin embargo, Chun prevé un aumento sustancial en las tasas de retención de datos en China, impulsado por la adopción de tecnologías de IA generativa en todo el mundo. Señaló que el éxito de la IA depende tanto del volumen como de la calidad de los datos subyacentes, y que es probable que se conserve más datos personales para entrenar modelos de IA a medida que la tendencia se incline hacia aplicaciones de IA generativa más personalizadas.
El informe también instó a las grandes empresas chinas a invertir en la transformación digital. Aproximadamente el 22% de las empresas encuestadas indicaron que aún no tenían un sistema de gestión de datos. Entre las que habían experimentado una transformación digital, solo el 8% reutilizó sus datos y obtuvo un valor adicional de ellos.
China debe acelerar la construcción de su sistema nacional integrado de potencia computacional para satisfacer la creciente demanda de computación, especialmente para el entrenamiento de grandes modelos de IA y necesidades de sectores como instituciones científicas, asuntos gubernamentales y finanzas.
El informe predijo que la producción de datos en China aumentará más del 25% en 2024, impulsada por la aplicación a gran escala de nuevas tecnologías como las comunicaciones satelitales, los coches autónomos y la IA generativa.