Apple, Nvidia y Anthropic utilizaron miles de videos de YouTube para entrenar IA

En la carrera por desarrollar modelos de inteligencia artificial cada vez más avanzados, las empresas tecnológicas han recurrido a tácticas controvertidas, recopilando sin permiso datos de libros, sitios web, fotos y publicaciones en redes sociales. Una investigación de Proof News revela que algunas de las empresas más ricas del mundo han utilizado subtítulos de más de 173,000 vídeos de YouTube, infringiendo las normas de la plataforma.

Anthropic, Nvidia, Apple y Salesforce están entre las compañías que han utilizado subtítulos de vídeos educativos y de aprendizaje online, como los de Khan Academy, MIT y Harvard, así como de medios como The Wall Street Journal, NPR y la BBC. Incluso programas de entretenimiento como The Late Show With Stephen Colbert y Last Week Tonight With John Oliver fueron usados para entrenar IA sin consentimiento.

La investigación destaca la magnitud de esta práctica, señalando que se utilizaron vídeos de populares creadores de YouTube como MrBeast, Marques Brownlee, Jacksepticeye y PewDiePie, entre otros. David Pakman, con más de 2 millones de suscriptores, expresó su frustración por no haber sido consultado ni compensado, destacando el impacto económico negativo en su negocio.

Dave Wiskus, CEO de Nebula, criticó la falta de respeto hacia los creadores, destacando el riesgo de que la IA sea utilizada para reemplazar a los artistas. Las empresas mencionadas no han respondido a las solicitudes de comentarios, aunque la postura general es que estos datos están disponibles públicamente y son utilizados para fines académicos y de investigación.

Jennifer Martinez, portavoz de Anthropic, defendió el uso de estos datos afirmando que YouTube Subtitles es solo una pequeña parte de un conjunto de datos más amplio llamado the Pile, utilizado por múltiples empresas para entrenar sus modelos de IA.

Creadores como los hermanos Hank y John Green, de los canales Crash Course y SciShow, expresaron su frustración al enterarse de que su contenido educativo fue usado sin su consentimiento. Alex Reisner, de Proof News, también descubrió que libros de autores como Margaret Atwood y Michael Pollan fueron utilizados sin permiso, lo que ha llevado a demandas por violaciones de derechos de autor.

Fuente

Comentarios

No hay comentarios aún. ¿Por qué no comienzas el debate?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.