Conecta con nosotros

Noticias

Reddit comenzará a cobrar por su base de datos a las empresas que posean herramientas de IA

Publicado el

Reddit lleva años demostrando su éxito como plataforma de código abierto en la que los usuarios pueden verter sus contenidos e imágenes libremente, calificándolos en función de su utilidad. Desde su origen en 2005, de la mano de Steve Huffman, ha recibido la visita de una media de 57 millones de usuarios diarios, pero ahora quieren comenzar a cobrar a quienes se lucran por utilizar sus datos a partir de junio.

En una entrevista reciente ofrecida a The New York Times, Huffman aseguraba que tras 18 años de trabajo, había llegado el momento de cobrar a las empresas que acceden a su API y entrenan sus herramientas de IA con subreddit u/420NarutoConspiracy. Ese entrenamiento de modelo de lenguaje grande (LLM) tendrá un importe, aún por determinar en las próximas semanas.

La API y otras herramientas de Reddit seguirán siendo gratuitos para los desarrolladores que trabajan en bots y para los investigadores que promueven proyectos académicos o no comerciales. El propio Huffman considera que es un buen momento para reajustar las cosas y que se le devuelva algo a la plataforma a cambio de ese valor añadido.

Para controlar todo esto, Reddit establecerá un cambio en el acceso a la API. Ahora las aplicaciones iOS y Android de Reddit determinarán rápidamente el historial de un usuario, actualizarán las reglas de la comunidad y mejorarán el manejo de las colas de modificación.

La fuente de las potencias de IA

El papel de Reddit en el desarrollo de la inteligencia artificial durante los últimos meses ha pasado por completo desapercibido para el público en general. Tanto OpenAI como Google se han servido de éste para el desarrollo y entrenamiento de ChatGPT y Bard, respectivamente.

Gracias a Reddit, estas herramientas han podido comprender el lenguaje natural con mayor precisión y generar respuestas más sofisticadas a las consultas de los usuarios. Por consiguiente, resulta lógico que ahora Reddit quiera empezar a monetizar su trabajo después de ver el incipiente aumento de la demanda de modelos de lenguaje de alta calidad en numerosos sectores, desde la atención al cliente hasta la creación de contenido.

OpenAI también ha entrenado su modelo de lenguaje Generative Pre-trained Transformer 4 utilizando datos de Reddit, algo que le permite analizar consultas y generar respuestas basadas en texto. Ya a comienzos de año, la Autoridad de Protección de Datos de Italia prohibió ChatGPT alegando a motivos de seguridad y privacidad de los usuarios debido a la opacidad de la procedencia de sus datos.

De hecho, en una investigación reciente de The Washington Post se aprecia que GPT-3 incluye una serie de textos y enlaces calificados positivamente por los usuarios de Reddit. Ahora Reddit deberá consultar a sus usuarios qué opinión les respecta este hecho, ya que ellos han sido los encargados de proporcionar todos esos contenidos de forma plenamente desinteresada.

Su proyección a corto plazo

Este cambio en la política de acceso a su API es acometido por Reddit justo cuando busca salir a bolsa en la segunda mitad de 2023. En principio, se solicitó una oferta pública inicial en diciembre de 2021, aunque únicamente obtuvo una valoración de 15.000 millones de dólares. Por todo ello, decidió posponer su presentación hasta que las condiciones del mercado y la valoración de las tecnológicas mejorasen, algo que parece que ahora sí que se produce.

La IA no para de crecer

Es un problema latente, y a pesar de que una serie de expertos tecnólogos se uniese en un comunicado hace ya unas semanas, parece ser que no existen límites. A esta conclusión se llega no solo por el comunicado emitido por Reddit en las últimas horas, sino también por la decisión del magnate y CEO de Twitter, Elon Musk, de lanzar su propia herramienta de IA llamada TruthGTP. Ahora anuncia el lanzamiento de la empresa X.AI con el objetivo de desarrollar este tipo de recursos sin sesgos ni censuras por contenido tóxico u ofensivo.

Lo más leído