El Responsable de IA de Microsoft, Mustafa Suleyman, cree que está bien utilizar cualquier contenido publicado en abierto en la web, ya que según The Register cree que desde el momento en el que se sube algo a la web, se convierte en una especie de freeware que cualquiera puede usar y copiar.
Así lo ha manifestado en una entrevista, en la que un periodista de CNBC, Andres Ross Sorkin preguntó al directivo de Microsoft si las empresas dedicadas a la IA han robado»la propiedad intelectual del mundo». A esta pregunta, el directivo ha contestado que cree que «con respecto al contenido que ya está en la web abierta, el contrato social de ese contenido desde los años 90 ha sido que es un uso justo. Cualquiera puede copiarlo, recrearlo o reproducirlo. Esto ha sido considerado freeware. Así se ha entendido«.
Pero evidentemente no es así. En general, lo que se publica online está protegido automáticamente por derechos de autor. Hay quienes publican con licencias que entre otras cosas requieren atribución si se utiliza o comparte, o que no autorizan su uso con fines comerciales. Pero sus derechos de autor no quedan eliminados solo por publicarlo en la web.
El uso justo, además, no está garantizado por medio de una especie de «contrato social» como alega Suleyman, sino por los tribunales, ya que en muchos casos se ha tenido que recurrir a la justicia para aclararlo. Esto no ha hecho que muchas empresas dedicadas a la Inteligencia Artificial se corten en utilizar el contenido accesible en la red sin respetar ninguna licencia de uso, ni por supuesto pagar a los autores en caso de tener que hacerlo. Han utilizado material protegido por derechos de autor, alegando que el entrenamiento de modelos de IA generativa con contenido protegido por derechos de autor es un «uso justo» del mismo.
Suleyman, de Microsoft, distingue entre empresas con abogados y público en general
Es probable que muchas empresas relacionadas con la IA y el entrenamiento de modelos piensen exactamente lo mismo que Suleyman, pero de momento sólo este directivo de Microsoft se ha atrevido a decirlo públicamente. Además, sí ha reconocido que hay otro tipo de contenido, el que publican empresas con abogados. Es decir, que si eres un particular que publica una web, para él tus contenidos se pueden usar para entrenar modelos con total libertad, básicamente porque no tienes un grupo de abogados que te defienda o que busque problemas a quien use tu contenido.
Según Suleyman, «hay una categoría aparte con las empresas de noticias o editores que han dicho de manera explícita «no cojas mi contenido ni lo registres para nada que no sea indexarme», para que otras personas puedan encontrar ese contenido«. Aún así, ve esta categoría «es una zona gris«, y cree que el concepto «va a llegar a los tribunales«. Lo cierto es que en muchos casos los límites de lo legal con respecto al entrenamiento de modelos y a las respuestas que dan a preguntas no están claras.
La mayoría de personas que publican contenido online ya está viendo sus derechos comprometidos en el caso de hacerlo en ciertas plataformas, al aceptar sus términos de licencias de usuario y servicios. Especialmente en el caso de las redes sociales.
Es lo que ha pasado por ejemplo con Reddit, que ha llegado a un acuerdo con OpenAI, de la que Microsoft es el accionista mayoritario, para que la empresa use los post de sus usuarios para entrenar sus modelos, y a quienes ha impedido incluso que puedan eliminar sus cuentas y borrar sus contenidos publicados. No solo cuando se enteraron del acuerdo, sino incluso meses antes, cuando se produjeron varios cambios drásticos en la plataforma que no gustaron a muchos de sus usuarios.
La prueba de que lo que piensa Suleyman con respecto al contenido publicado por empresas lo piensan más del sector se pone de manifiesto también en los acuerdos que varias empresas dedicadas a la IA están firmando con editoras y medios de comunicación. Todas tienen equipos legales sólidos y vieron claro que se usaban sus contenidos, por lo que en algunos casos han demandado a OpenAI y otras startups de IA generativa. En ciertos casos, estos acuerdos echarán tierra sobre las actuales o futuras demandas que puedan interponer contra las empresas de IA, a cambio de una compensación económica.
Necesario regular la IA y el uso que hace de los contenidos online
Por otro lado, en un artículo firmado por el Profesor de Derecho de Cornell Tech y la Escuela de Leyes Cornell Frank Pasquale; y por el Profesor Asociado de Derecho de la Universidad de Hong Kong Haochen Sun sobre la incertidumbre legal del uso de datos con derechos de autor para entrenar a la IA, se señala que es necesario regular la IA a nivel de políticas, porque las leyes actuales no están pensadas para responder las dudas que hay que abordar necesariamente.
Ambos expertos aseguran que los legisladores tendrán que articular un nuevo escenario para equilibrar los derechos y las responsabilidades sobre obras protegidas por derechos de autor, debido a la incertidumbre sobre la legalidad del uso que hacen de ellas de los proveedores de IA.
Los autores señalan que el uso continuado y sin compensación de los trabajos creativos no solo amenaza a los escritores, compositores, periodistas, actores y otros profesionales creativos. También a la IA generativa, que acabará no teniendo datos de entrenamiento suficientes. La gente dejará de publicar sus trabajos libremente online si se usan para entrenar modelos de IA sin compensación, que además reducen el coste de la creación de obras a cero y hacen que los creadores no tengan posibilidad alguna de recibir una recompensa por su trabajo.
Justo el futuro que ve Suleyman, que señala que «la economía de la información va a cambiar de manera radical, porque podemos reducir el coste de producción de conocimiento a costes marginales cercanos a cero«. No parece un futuro muy prometedor para quienes publican contenidos online si las leyes no intervienen para regular, como mínimo, lo que empresas como Microsoft consideran un uso justo de los contenidos publicados en Internet.