El término “IA de código abierto” suscita un nuevo debate para formalizar su definición

La Open Source Initiative (OSI) ha presentado un nuevo borrador de definición para lo que denomina «IA de código abierto», con el objetivo de clarificar el uso ambiguo de este término en un campo en constante evolución. Este movimiento surge en respuesta a las críticas hacia compañías como Meta, que han lanzado modelos de lenguaje de IA con restricciones de uso, pero etiquetándolos como «código abierto». Esta práctica ha generado debates intensos entre los defensores del software libre sobre lo que realmente constituye el «código abierto» en el contexto de la inteligencia artificial.

Por ejemplo, el modelo Llama 3 de Meta, aunque está disponible gratuitamente, no cumple con los criterios tradicionales de código abierto definidos por la OSI, ya que impone restricciones de licencia en función del tamaño de la empresa o del tipo de contenido que se genere con el modelo. Otro caso es el generador de imágenes Flux, que, a pesar de ser etiquetado como «abierto», tampoco se considera verdaderamente de código abierto. Para enfrentar estas ambigüedades, se han comenzado a utilizar términos alternativos como «open-weights» o «source-available» para describir modelos de IA que incluyen código o pesos con restricciones.

Un hombre con una expresión de sorpresa o curiosidad se asoma detrás de un panel translúcido en una oficina. Sus ojos están muy abiertos, y parece estar observando algo con atención o precaución.

La OSI, conocida por su defensa de los estándares de software abierto, ha reunido un grupo de unos 70 participantes, incluidos investigadores, abogados, legisladores y activistas, además de representantes de grandes compañías tecnológicas como Meta, Google y Amazon. Este grupo ha trabajado en una definición preliminar (versión 0.0.9) de IA de código abierto, basada en cuatro libertades fundamentales: permitir a los usuarios utilizar el sistema de IA para cualquier propósito, estudiar su funcionamiento, modificarlo y compartirlo con o sin modificaciones.

Al establecer criterios claros para la IA de código abierto, la OSI pretende crear un punto de referencia que ayude a desarrolladores, investigadores y usuarios a tomar decisiones informadas sobre las herramientas de IA que crean, estudian o utilizan. La transparencia que ofrece un modelo de IA verdaderamente abierto podría, además, ayudar a descubrir vulnerabilidades en los sistemas de IA, algo que no es posible con sistemas opacos como ChatGPT de OpenAI, cuyo diseño y funcionamiento interno son secretos bien guardados.

El proyecto de la OSI prevé la presentación de una versión estable de la definición de «IA de código abierto» en octubre, durante el evento All Things Open 2024 en Raleigh, Carolina del Norte. En un comunicado de mayo, Stefano Maffulli, director ejecutivo de la OSI, destacó la importancia de definir claramente lo que significa IA de código abierto, subrayando que la IA es diferente del software tradicional y que requiere una revisión de cómo se aplican los principios del código abierto en este ámbito.

El borrador de la OSI no se limita al modelo de IA o sus pesos, sino que abarca todo el sistema y sus componentes. Para que un sistema de IA sea considerado de código abierto, debe proporcionar acceso a lo que la OSI denomina la «forma preferida para hacer modificaciones», incluyendo información detallada sobre los datos de entrenamiento, el código fuente completo utilizado para entrenar y ejecutar el sistema, y los pesos y parámetros del modelo, todo bajo licencias o términos aprobados por la OSI.

Un aspecto notable del borrador es que no exige la publicación de los datos brutos de entrenamiento, sino que se requiere «información sobre los datos», es decir, metadatos detallados sobre los datos y métodos de entrenamiento. Esta información incluye detalles sobre las fuentes de datos, criterios de selección, técnicas de preprocesamiento y otros aspectos relevantes que permitirían a una persona capacitada recrear un sistema similar. Este enfoque busca proporcionar transparencia y replicabilidad sin comprometer la privacidad o derechos de autor, aunque es probable que este punto siga siendo objeto de debate.

Desde que comenzó el proceso de definir la IA de código abierto en 2022, la OSI ha organizado talleres en todo el mundo para reunir a grupos diversos. Según la OSI, el 53 % de los participantes en estos grupos de trabajo han sido personas de color, y el 28 % mujeres. Aunque el proceso aún está en marcha, la OSI invita a una participación más amplia a través de foros públicos, reuniones abiertas y comentarios sobre las versiones borrador de la definición, que se pueden encontrar en su sitio web.

Una vez finalizado el proceso y presentada la definición final en octubre, es probable que esta tenga profundas implicaciones para la industria de la IA, influyendo en la forma en que las empresas lanzan sus modelos de IA y dando forma a futuras regulaciones. La OSI espera que la nueva definición unifique a los miembros de la industria bajo un estándar común de transparencia en el software.

Comentarios

No hay comentarios aún. ¿Por qué no comienzas el debate?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.