«Es un regalo. Lo robaron sin mi permiso»

En el mundo en línea de los escritores de fanfiction, quienes escriben historias inspiradas en sus películas, libros y juegos favoritos y las comparten de forma gratuita, existen códigos de conducta no escritos. Entre los más importantes: nunca cobrar dinero por tu fanfic y nunca robar el trabajo de otras personas.

Tiene sentido entonces que los escritores de fanfic estuvieran entre los primeros creadores en dar la voz de alarma sobre el hecho de que su trabajo estaba siendo alimentado a modelos de lenguaje que impulsan la IA generativa sin su conocimiento o permiso. Pero sus esfuerzos por detener la intrusión de la IA en los espacios de fans es una batalla cuesta arriba.

La última ofensiva contra el robo de fanfiction

La última ofensiva llegó a principios de abril, cuando el usuario nyuuzyou extrajo 12.6 millones de fanfics del repositorio online Archive of Our Own (AO3) y subió el conjunto de datos a Hugging Face, una empresa que aloja modelos de IA de código abierto y software.

La subida de Nyuuzyou fue rápidamente descubierta por la comunidad de Reddit r/AO3, donde cientos de usuarios publicaron reacciones furiosas. Una cuenta de Tumblr, ao3scrapesearch, construyó un motor de búsqueda que permitía a los autores buscar sus nombres de usuario y ver si su trabajo había sido extraído por Nyuuzyou.

Los escritores de fanfic inundaron la sección de comentarios del conjunto de datos en Hugging Face, entrando en discusiones con defensores de la IA. Dckchili defendió el scraping de nyuuzyou, alegando que no importaba porque los bots rastreadores de Big Tech ya habían extraído el archivo numerosas veces. RaraeAves argumentó que «los creeps» dependen de que los escritores de fanfic no luchen cuando su trabajo y creatividad están siendo explotados.

El impacto personal en la comunidad Reylo

Cuando Nikki, una escritora de fanfic de Star Wars que va por infinitegalaxies online, escribió su nombre en el motor de búsqueda, vio que más de 70 de sus fics habían sido extraídos. Pero uno saltó a la vista. Era un ensayo colectivo que había co-escrito con 11 otros escritores para crear conciencia sobre la amenaza de la IA al fandom y subido a AO3. La ironía no se le escapó.

Nikki escribe principalmente fanfiction sobre Reylo, el emparejamiento romántico (o «ship») de los personajes Rey y Kylo Ren de la trilogía secuela de Star Wars. El fandom Reylo es muy unido y prolífico, con más de 30,000 historias Reylo publicadas en AO3. Aproximadamente la mitad están ambientadas en el universo canónico de Star Wars de sables de luz y aventuras espaciales, pero la otra mitad tiene lugar en universos alternativos y explora todo desde romances de café y dramas laborales hasta caballeros medievales y reinos de hadas.

Para Nikki, el fandom Reylo ofreció un nuevo sentido de pertenencia. Encontró un hogar en la comunidad solidaria de escritores y lectores y disfrutó la libertad de escribir lo que quisiera.

«El fandom es en gran medida una economía del regalo. Solo estamos aquí para divertirnos y hacer cosas por la bondad de nuestro corazón. Y para darnos cosas unos a otros y hacer trabajo en comunidad», dice Nikki.

El impacto emocional de la IA generativa

Este sentimiento es compartido por muchos otros en la comunidad Reylo, incluyendo Em, quien escribe bajo el seudónimo okapijones. Em se enamoró de los personajes de Rey y Kylo Ren porque representaban los arquetipos de enemigos a amantes luz/oscuridad que le recordaban a La Bella y la Bestia y Orgullo y Prejuicio.

«El fic cambió mi vida. He conocido a algunos de los mejores amigos que he tenido a través del fic y de la comunidad de fanfiction», dice Em. «No hay reglas, no hay editores. Es un parque de juegos creativo puro, y eso va a generar innovación».

En 2023 llegó Story Engine de Sudowrite, impulsado en parte por ChatGPT de OpenAI. Nikki recuerda haber visto un video sobre el nuevo software de IA «asistente de escritura» que permite a los usuarios ingresar detalles sobre personajes y puntos de trama y generar una novela completa. Estaba tan horrorizada que la hizo llorar.

«Esto es algo que toma tiempo y esfuerzo y tu corazón y tu alma, y haces esto en una comunidad», dice Nikki. «Y luego me dices que simplemente lo vas a defecar en dos segundos en una pantalla. Y yo estaba como, ¿quién pidió esto? Esto es asqueroso».

La evidencia del robo de fanfiction

Más tarde ese año, la prevalencia de términos sexuales altamente específicos relacionados con el tropo de fanfiction de biología de lobos de Omegaverse apareció en Sudowrite, revelando que ChatGPT probablemente había sido entrenado en fanfic sin el conocimiento de los autores.

Desde entonces, Nikki y muchos otros han estado abogando contra la IA en todas sus formas en el fandom, incluyendo usar IA para generar fanfic o fanart.

«Es robo en su núcleo. No hay uso ético de algo que está construido sobre trabajo robado», dice Nikki.

La respuesta de la comunidad

Los escritores de fanfic se coordinaron online para presentar avisos de eliminación bajo la Digital Millennium Copyright Act (DMCA), y la Organization for Transformative Works (OTW), la organización sin fines de lucro que administra AO3, también presentó una eliminación. El 9 de abril, Hugging Face deshabilitó el conjunto de datos.

Nyuuzou permaneció impenitente, presentando una contranotificación y volviendo a subir el conjunto de datos a sitios alojados en Rusia y China, que son mucho menos receptivos a las quejas de DMCA.

Contactado por The Verge a través de una cuenta de Telegram vinculada en su perfil de Hugging Face, nyuuzou dijo que era un estudiante de 18 años y trabajador de TI en Rusia que «no está interesado en fanfiction» y subió el conjunto de datos para «propósitos legítimos de investigación».

«Mi objetivo era apoyar la investigación comunitaria en áreas como moderación de contenido, herramientas anti-plagio, sistemas de recomendación y preservación de archivos», escribió nyuuzou vía Telegram.

La perspectiva de los expertos

Alex Hanna, directora de investigación en el Distributed AI Research Institute, es escéptica de la idea de que cualquier conjunto de datos subido a Hugging Face no sería usado finalmente para entrenar LLMs.

«¿Por qué tendrías una gran cantidad de datos no estructurados disponibles en la web si no es para entrenar un modelo de lenguaje?»

Aunque los extractores individuales como nyuuzou son peces pequeños en la economía más amplia de la IA generativa, dominada por empresas de miles de millones de dólares como OpenAI, Hanna dice que todavía depende de sitios como AO3 proteger agresivamente el trabajo de sus usuarios.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí