Hay correos que revelan que Meta descargó 81TB de libros por BitTorrent para entrenar su IA

La inteligencia artificial ha llegado a nuestras vidas para quedarse, aunque no sin polémicas y cuestionamientos. Hay un tema en especial que ha llevado a los tribunales a muchas de las grandes empresas tecnológicas y es la forma en la que estas extraen los datos de la web para entrenar a sus modelos de IA. Uno de los casos más recientes es el de Kadrey contra Meta.

El pasado diciembre varios autores interpusieron una demanda colectiva en contra de la compañía detrás de Facebook, Instagram y WhatsApp, a la cual acusan de piratear libros protegidos por derechos de autor para entrenar a la IA. Recientemente, el tribunal desclasificó información que confirma la descarga de 81.7 TB de datos de libros a través de sitios ilegales, informó Business Insider.

Correos de empleados confirman saqueo

El material desclasificado forma parte del apéndice A del caso. Este incluye correos electrónicos entre empleados de Meta. En estos mostraban su preocupación sobre las descargas masivas de libros protegidos por derechos de autor. Por ejemplo, en octubre de 2022, Melanie Kambadur, una de las trabajadoras, rechazó hacer recolección de datos diciendo: “Descargar vía torrents usando una laptop de la empresa no parece buena idea“.

En septiembre de 2023, Nikolay Bashlykov, uno de los responsables de llevar a cabo esta recolección de datos, advirtió que el uso de torrents implicaría actuar como “semillas” para que otras empresas descargasen libros de esta manera, algo que “podría no estar bien legalmente“. Los autores demandantes usaron estos comentarios como prueba de que Meta sabía que actuaba de forma ilegal.

Frank Zhang, investigador interno de la compañía, indicó en un mensaje que la empresa evitaba usar sus propios servidores para que nadie pudiera rastrear de dónde provenían las descargas. Ars Technica señala que las pruebas muestran que Meta descargó vía torrent al menos 81.7 TB de datos de diversas bibliotecas que ofrecen acceso a libros protegidos por derechos de autor, y que al menos 35.7 TB provenían de sitios como Z-Library o LibGen.

Meta busca desestimar cargos

Por su parte, la compañía de Zuckerberg presentó una moción para desestimar los cargos. Asegura que no existe evidencia real de que sus empleados  hayan descargado ni distribuido estos libros. Además, según informa Reuters, pidió al tribunal que dictamine que no violó la ley de derechos de autor puesto que, alega, su actividad se enmarca dentro del concepto de “uso justo” (fair use).

Como explica Entrepreneur, esta es una doctrina legal que permite utilizar sin autorización material protegido por derechos de autor en casos específicos. De acuerdo con esto, los abogados de Meta alegan que el uso de las obras de los demandantes en el entrenamiento de su modelo lingüístico fue legítimo y que además servirá para ayudar a los usuarios en una amplia gama de tareas.

Sin embargo, los creadores no ven con buenos ojos que Meta y otras empresas tomen su trabajo sin permiso. Por ello han tomado medidas legales para evitar que estas continúen saltándose las normas para “saquear” el internet. En el caso Kadrey contra Meta, otros grupos han mostrado su apoyo a los demandantes a través de escritos amicus. Entre estos se encuentran la Association of American Publishers, la Copyright Alliance y la STM Publishers.

Cortesía de Xataka



Dejanos un comentario: