GPT y los LLM, ¿piratas digitales del siglo XXI?

Un nuevo estudio ha destapado una realidad inquietante en el mundo de la Inteligencia Artificial (IA): los modelos de lenguaje gigantes (LLM), como el famoso Chat GPT, podrían estar entrenándose, sin permiso, con material protegido por derechos.

En un artículo titulado “Copyright Traps for Large Language Models” (2024) (Trampas de Derechos de Autor para Modelos de Lenguaje Extenso), M. Meeus , I. Shilov, M. Faysse e Y.A de Montjoye dan cuenta de un ingenioso método para detectar esta práctica. Mediante la inserción, en el material de entrenamiento de los LLM, de secuencias únicas de texto , que designan como “trampas de derechos de autor” (algunas incluso pueden contener información ficticia o falsa), los desarrolladores pueden rastrear si estas “trampas” aparecen en las salidas del modelo, evidenciando así el uso de contenido protegido.

Esta revelación plantea serias dudas sobre la ética y legalidad de los procedimientos y datos que se emplean para el entrenamiento de los LLM. Los autores, músicos, periodistas, científicos, los creadores de contenido en general podrían estar viendo su trabajo utilizado sin su consentimiento ni compensación para alimentar a estas poderosas herramientas de IA.Uno de los casos más sonados al respecto es el juicio del New York Times contra Open IA.

El estudio, además de su aporte científico, es un llamado a la acción. Los creadores, los verdaderos autores, y particularmente los organismos responsables de la supervisión de extracción, sustracción y tráfico de datos, deben estar alertas y tomar medidas para proteger el trabajo de creación humano. Ello implica exigir transparencia a los desarrolladores de LLM, implementar medidas de protección como marcas de agua digitales y abogar por leyes más estrictas como condiciones impostergables en esta batalla por los derechos de autor en la encrucijada de la IA.

La clonación o apropiación del trabajo autoral comporta a la vez un avasallamiento de la producción del creador, así como una manipulación de su identidad y libertad personal y creativa. El enorme esfuerzo creativo de los autores humanos se difumina y queda reducido al estatuto de dato, actual mercancía/moneda de la economía planetaria de las grandes empresas informáticas que, a partir de estas apropiaciones subliminales, generan las nuevas formas de la plusvalía de esta naciente “Era de la IAcracia”. Habría que replantearse seriamente una regulación tanto en relación a los derechos de autor como una actualización del derecho humano a la libre expresión formulado en la Declaración Universal de 1948. Robarles a otros su expresión, sus ideas, sus creaciones para manipularlas arbitrariamente constituye una forma solapada de esclavizarlas y enajenar un derecho básico de todo ser humano.

Tomar conciencia de las nuevas estrategias de colonización digital y violación de derechos y libertades fundamentales, que ponen en juego las empresas de IA, es una tarea que nos compete a todos y principalmente a las instituciones nacionales o transnacionales responsables de resguardarlas y resguardarnos. Pero también, y más acá, a educadores, investigadores y profesionales que no están -no estamos- dispuestos a regalar los océanos creativos del planeta a los piratas más poderosos del siglo XXI. Si la IA, como fomentan las empresas desarrolladoras, es un salto tecnológico cualitativo sin precedentes en nuestra especie, debiera serlo en la misma medida en relación a los derechos

Por Alejandro Urueña y María S. Taboada / Magíster en Inteligencia Artificial./ Lingüista y Mg. en Psicología Social. Profesora Titular de Lingüística General I y Política y Planificación Lingüísticas de la Fac. de Filosofía y Letras de la UNT.

GPT y los LLM, ¿piratas digitales del siglo XXI?

{{titulo}}