La demanda contra ChatGPT presentada por el periódico The New York Times por el uso no autorizado de sus artículos para entrenar al sistema de inteligencia artificial conversacional está generando un acalorado debate sobre los derechos de propiedad intelectual en la era de la IA generativa.
Si bien la ley actual establece que la IA no puede ser poseedora de derechos de autor, no existen suficientes precedentes legales sobre el uso de grandes volúmenes de textos con copyright para entrenar sistemas de IA. ChatGPT fue entrenado con un enorme corpus de texto de internet, incluyendo millones de artículos del NYT según la demanda.
Se abre la discusión sobre el uso de contenido con copyright para entrenar IA
El diario argumenta que OpenAI se beneficia económicamente de años de trabajo periodístico sin compensación alguna. Por su parte, la empresa defiende que ChatGPT genera contenidos nuevos y originales a partir de esos textos.
Se abre así un complejo dilema entre la inversión humana en contenidos y la capacidad algorítmica de recombinarlos y sintetizarlos.
¿Puede un autor reclamar por el impacto formativo de sus obras?
Si bien el entrenamiento de la IA no es directamente comparable al aprendizaje humano mediante la lectura, en ambos casos se utilizan obras previas como insumo. Esto lleva a preguntarse hasta qué punto un autor puede reclamar derechos por el impacto formativo de sus obras en mentes humanas o artificiales.
La demanda contra ChatGPT podría sentar un precedente para reclamos masivos
La demanda del Times podría sentar un precedente y abrir la puerta a reclamos masivos contra gigantes tecnológicos que entrenan sistemas de IA con contenido ajeno. Pero también es probable que para cuando la justicia se expida, la tecnología ya haya avanzado a auto-entrenarse con sus propios contenidos.
La necesidad de nuevas reglas y consensos
Más allá del resultado legal de la demanda contra ChatGPT, el caso destaca la necesidad de establecer nuevas reglas y consensos para la era de la IA generativa. La colaboración entre empresas tecnológicas y creadores de contenido será clave para que ambos se beneficien de estas poderosas herramientas.
Si no se llegan a acuerdos, este tipo de demandas millonarias podrían proliferar, generando una gran incertidumbre sobre los usos aceptables de contenido con copyright para entrenar sistemas de IA que imitan la creatividad humana.
Posibles soluciones para la demanda contra ChatGPT
Algunas posibles soluciones que se han propuesto son el pago de regalías o licencias para el uso de contenidos protegidos, establecer límites en la cantidad de texto utilizado, o desarrollar modelos entrenados solo con contenidos de dominio público.
Otra propuesta es entrenar modelos por industria o campo de conocimiento, de modo que se use principalmente contenido relevante a la especialidad de la IA y no genérico de toda la web.
Lo que queda claro es que se necesita una nueva legislación o directrices éticas para regular estos usos y equilibrar los intereses de las partes. De lo contrario, aumentarán las críticas por los peligros alrededor de la IA y los tribunales se verán inundados de demandas mientras la IA sigue su imparable avance.