Un revés judicial para OpenAI en Alemania preanuncia lo que vendrá para la IA y el arte
Ganaron los creadores, aunque no todos.
Hacia finales de la semana pasada una organización de músicos de Alemania se anotó una victoria en los tribunales, y OpenAI perdió. Es que el tribunal dice que el entrenamiento de los modelos GPT 4 y 4o incluyó infracción de la ley de derechos de autor, y que incluso parte de lo que los modelos responden constituye infracción también. Es una victoria para los que protestan diciendo que “es tan solo una máquina de plagiar”.
Los detractores unen fuerzas
Los experimentados odiadores de OpenAI estarán de acuerdo, creo, al menos con parte del reciente análisis legal de la sentencia del académico en leyes de propiedad intelectual Andres Guadamuz de la Universidad de Sussex. Guadamuz señala que la decisión y sus implicancias podrán tener aspectos a mejorar, pero que en el largo plazo podrá beneficiar a los propietarios de derechos de autor.
Eso quiere decir que los peces gordos de los derechos de autor, como las estrellas del pop, los actores de Hollywood y los autores de bestsellers ahora podrán percibir que esta tecnología podría beneficiarles en lo económico, aunque los creadores de menor cuantía tal vez no tengan la misma suerte.
El contexto es este: GEMA es una organización de Alemania que no tiene equivalente en EE.UU., un colectivo de derechos de autor que representa los intereses de compositores, autores de letras de canciones, y editoriales. Presentaron una demanda contra OpenAI para proteger los derechos sobre nueve canciones famosas e indiscutiblemente alemanas. Sería como denunciar en la justicia para defender a compositores y autores de letras de nueve canciones estadounidenses que abarcarían algo así como “Soak Up the Sun” de Sheryl Crow o “Happy” de Pharrell Williams.
Eso significa que no son letras de canciones que OpenAI tomó del sitio web de una banda musical de garaje para usarlas como datos de entrenamiento. Más bien, usaron hitos culturales que aparecían en los datos de entrenamiento en diversas formas, con modificaciones, o como parodias, como fragmentos, extractos, frases, etc.
Los argumentos
La base de la demanda fue que después de desactivar la capacidad de ChatGPT para navegar Internet, los usuarios podían preguntar cosas como “¿Cuál es la segunda línea de [el equivalente alemán de “No Scrubs” de TLC]?”. Y entonces ChatGPT respondería con una respuesta fragmentada o con errores, pero de todos modos correcta.
La sentencia del Tribunal Regional de Munich está en alemán, naturalmente, pero la versión traducida por Google me brinda, a grandes rasgos, una interpretación de lo que determinó la corte:
El modelo almacenó reproducciones ilegales de las letras de esas canciones. Al regurgitar las letras en respuesta a preguntas, aunque las producía de forma incompleta o alucinando errores, se trató de otro acto de infracción. Lo importante es que algún hipotético usuario de ChatGPT que intenta obtener letras de ChatGPT no es quien infringe la ley, sino que quien viola las leyes es OpenAI. Y como las respuestas de ChatGPT tienen links que se pueden compartir, OpenAI estaba poniendo a disposición del público este material, sin autorización.
Ahora OpenAI en algún momento tendrá que revelar con qué frecuencia se usaron los textos de estas canciones como datos de entrenamiento y si la compañía ganó dinero con esa acción. Además tienen que dejar de almacenarlas y no volver a utilizarlas en sus respuestas. Más adelante podría haber multas monetarias también.
Este mes, un caso similar en los tribunales de Reino Unido dio como resultado todo lo contrario: Getty Images perdió contra Stability AI porque en ese caso el juez escribió: “Un modelo de IA como Stable Diffusion no almacena ni reproduce obras con derechos de autor (nunca lo ha hecho) y por eso no se trata de una copia en infracción”.
El análisis gde Guadamuz es interesante porque apunta a lo que pensaba la corte: el tribunal alemán, señala Guadamuz, se apoyó en la investigación de la ‘memorización’ de la máquina, algo que un modelo puede hacer fácilmente con las letras de las canciones, más que con – por ejemplo – una foto de Getty Images utilizada para entrenarlo.
Por lo tanto, y en contraste con la determinación en el caso Getty, la nueva sentencia se mantiene consistente con gran parte del pensamiento legal sobre propiedad intelectual en la era digital, y esas mismas reglas de derechos de autor se aplican a un CD o CD-Rom.
Lo que significa
Mientras el material con derechos de autor pueda volver a reproducirse, se le considera copia monetizable de una creación artística. Es lo que sucede con las letras que “contiene” un gran modelo de lenguaje.
Sin embargo, Guadamuz señala que la sentencia tiene fallas en cuanto al concepto de “memorización”, porque parece indicar que la norma legal sería el entrenamiento sin memorización, utilizando una ley de la Unión Europea sobre minar datos. En el aspecto local Guadamuz tiene en cuentra que eso es un problema porque presume una situación que no se condice con lo que expresa la ley. Lo más importante es que sugiere que la memorización es algo que siempre ocurre al entrenar al modelo, y Guadamuz dice que no es invariablemente así.
También podría haber un problema con la desprolijidad en lo legal según interpreten la ley las compañías en el futuro. Pero Guadamuz presenta una conclusión positiva: muy probablemente todo termine en alguna forma de mercado de licencias.
La IA generativa
Así como sucede con Sora 2 en cuanto a copias y derechos de autor, un tratamiento que eventualmente aprobaron muchos actores y propietarios de derechos de autor, se va materializando un marco en cuanto a los ingresos monetarios compartidos con los propietarios de los textos bajo derechos de autor. OpenAI dejó atónito al mundo de los propietarios de esos derechos al crear todo un universo nuevo de infracciones a derechos de autor percibidos, ya que tanto los artistas como los creadores sintieron – comprensiblemente – que les robaban.
Con todo, los más poderosos se están amoldando a la idea de la IA generativa porque empiezan a ver que podrían obtener beneficios. Hoy lo vemos con las grandes discográficas de EE.UU., que están empezando a trabajar con compañías a las que habían denunciado antes, como Udio.
Sin embargo, para los creadores que no son tan grandes, como los artistas, escritores y creadores no tan conocidos, la preocupación de que su trabajo será irrelevante en este nuevo universo de contenido persiste, y no hay claridad en cuanto a qué podría resultar beneficioso para ellos.
Nota original en: GIZMODO




