Google y OpenAI: la batalla por los derechos de autor
Google y OpenAI se encuentran en una carrera por el dominio de la IA, pero ambas empresas se enfrentan a desafíos regulatorios y legales relacionados con los derechos de autor.
Google ha sido multado por la Unión Europea por no ser transparente en la forma en que utiliza el contenido de los medios de comunicación para entrenar su modelo de IA, Bard (ahora conocido como Gemini). Esta multa es la primera de su tipo y pone de relieve la creciente preocupación por el uso de datos con derechos de autor en el desarrollo de la IA.
Los medios de comunicación proporcionan el contenido que alimenta a los modelos de IA. Sin embargo, la forma en que Google y otras empresas tecnológicas utilizan este contenido es objeto de debate. Los editores de noticias exigen una compensación justa por su trabajo, mientras que las empresas tecnológicas argumentan que necesitan acceso a los datos para desarrollar la IA.
Encontrar un equilibrio entre los derechos de los propietarios de contenido y las necesidades de las empresas de IA es un desafío complejo. La Unión Europea está trabajando en una Ley de IA que abordará este tema, pero aún no está claro cómo se resolverá.
Google y OpenAI: diferentes estrategias
Google ha optado por un enfoque de “datos abiertos”, utilizando grandes cantidades de datos de diversas fuentes para entrenar sus modelos de IA.
OpenAI, por otro lado, ha adoptado un enfoque más selectivo, trabajando con un grupo más pequeño de socios para obtener acceso a datos de alta calidad.
En la columna Data Sheet (hoja de ruta), de la revista Fortune, el especialistas David Meyer habla sobre esta controversia:
“Hace casi cinco años, informé sobre cómo los editores de noticias de Francia habían entrado en guerra con Google por la cuestión de las tarifas de “derechos de autor auxiliares”: pagos por incluir fragmentos de texto de artículos en los resultados de búsqueda de Google. Escribí que era poco probable que los medios de comunicación ganaran. Bueno, simplemente lo hicieron. Y como ocurre con todo lo demás hoy en día, la IA de repente se convirtió en parte de la ecuación.
Esta mañana, la autoridad de competencia francesa multó a Google con 250 millones de euros (US$ 271 millones) por no cumplir con los compromisos que asumió hace un par de años sobre cómo negociaría las tarifas con los medios de comunicación franceses. Google ya recibió una multa de 500 millones de euros por el asunto en 2021. Esta vez no se retractará, lo que probablemente le haya ahorrado una multa aún mayor.
No voy a entrar en detalles del proceso de negociación revisado al que Google aceptó; es tan aburrido como parece y, si realmente quieres profundizar, aquí tienes la declaración de Google en francés e inglés. La parte interesante de este episodio es sobre Bard AI de Google, que actualmente se llama Gemini.
Hasta donde yo sé, esta es la primera multa que se impone a una empresa de inteligencia artificial, al menos parcialmente, debido a su incorporación libre de todo lo que puede capturar en sus datos de entrenamiento.
Según la Autoridad Francesa de Competencia (FCA), la multa tiene en cuenta el hecho de que Google “utilizó contenidos de agencias de prensa y editores para entrenar su modelo de fundación [Bard], sin notificarles ni a ellos ni a la [FCA]”.
Como dice Google, la FCA “no cuestiona la forma en que se utiliza el contenido web para mejorar productos más nuevos como la IA generativa”.
Google afirmó que esta cuestión “ya está abordada” en el artículo 4 de la Directiva de Derechos de Autor de la UE, que establece una excepción para la minería de textos y datos, y en la próxima Ley de IA de la UE, que exige a las empresas de IA que respeten la Directiva de Derechos de Autor (y que publiquen “resúmenes suficientemente detallados de sus datos de entrenamiento).
Pero según la FCA, la cuestión de si las empresas de inteligencia artificial que extraen artículos califican para esa excepción de minería de textos y datos, “aún no se ha resuelto”. Dijo que Google había “al menos” roto su compromiso de ser transparente en sus tratos comerciales con los editores de noticias franceses, lo que convertía este asunto en una multa.
Ahora, Google lanzó recientemente un nuevo control en el archivo robots.txt que los editores web utilizan para enviar señales a los rastreadores web de Google. La configuración se llama Google-Extended y se supone que permite a los editores optar por la preferencia de que sus datos no se conviertan en material de entrenamiento de Bard/Gemini sin que sus artículos desaparezcan de la Búsqueda de Google y de Google News.
Pero sólo añadió ese control a finales de septiembre, más de 2 meses después del lanzamiento europeo de Bard.
Durante ese período, los editores franceses efectivamente tuvieron que permitir la aspiración irrestricta de su producción en Bard si también querían que apareciera en Search and News, que, recuerden, es la forma en que luego pueden reclamar tarifas de Derechos de Autor auxiliares a Google. Eso rompió otro de los compromisos de Google, contribuyendo nuevamente a la multa de hoy.
La FCA también le pidió a Google que explicara a los editores cómo funciona el mecanismo de exclusión voluntaria.
En resumen, el nuevo control de Google para los editores ha solucionado tardíamente uno de los problemas con la incorporación no remunerada de artículos de noticias en su material de capacitación sobre IA / AI, pero la legalidad general de esta práctica según la ley de derechos de autor de la UE sigue siendo una cuestión abierta.
No es difícil ver por qué el gran rival de Google, OpenAI, ha comenzado a cerrar acuerdos de licencia con editores de prensa europeos como Axel Springer y Le Monde.
Una nota final, ya que hablamos del tema de las grandes tecnologías y los reguladores antimonopolio europeos: Margrethe Vestager, jefa de competencia de la Comisión Europea, acaba de decir a Reuters que Apple podría enfrentar una investigación sobre la “tarifa de tecnología central” de 0,50 euro por instalación de aplicación.
“Está cobrando a los desarrolladores que se atreven a utilizar las tiendas de aplicaciones iOS de terceros que Apple debe permitir según la nueva Ley de Mercados Digitales de la UE. “Hay cosas que nos interesan mucho, por ejemplo, si la nueva estructura de tarifas de Apple de facto hará nada atractivo el uso de los beneficios de la DMA”, dijo.
Dado que Microsoft y Meta se han quejado ante Vestager de que la tarifa hace que las tiendas de aplicaciones de terceros sean inviables, se avecina una tormenta y debo decir que te lo anticipé.”