Conecta con nosotros

Noticias

Una startup belga desarrolla un LLM que detectará discurso de odio en todos los idiomas de la UE

Publicado el

Una startup belga desarrolla un LLM que detectará discurso del odio en todos los idiomas de la UE

La startup belga Textgain está desarrollando un modelo grande de lenguaje (LLM) capaz de detectar discurso de odio online en los 24 idiomas oficiales de la Unión Europea. La compañía, que nació en 2016 como una spinoff de la Universidad de Antwerp, se dedica al desarrollo de herramientas de análisis y gestión de datos basadas en IA para empresas, y sus servicios van desde la analítica de texto hasta la medición del sentimiento en redes sociales y páginas web. También se dedica al análisis del discurso del odio, según EdTech Innovation Hub.

El pasado mes de junio, la compañía fue una de las cuatro ganadoras del Gran Desafío Large AI de la UE, en el que participaban empresa y organizaciones con innovaciones relacionadas con la IA generativa y los modelos grandes de lenguaje. Textgain fue galardonada con un cuarto de millón de euros y dos millones de horas de tiempo de desarrollo en Lumi y Leonardo, dos de los superordenadores de la UE, lo que le ha permitido conseguir acceso a sistemas que aceleran el entrenamiento de sus modelos.

En los próximos 12 meses, la compañía empleará estos recursos en el desarrollo de su propio modelo multiidioma, que especializará en detección del discurso de odio. Eso sí, aunque será capaz de reconocerlo, no podrá generarlo. Así, Textgain se une a otras empresas y centros de investigación que intentan acabar con el discurso de odio con la tecnología con la que desarrollan los LLMs.

Guy de Pauw, CEO de Textgain, ha destacado que «los modelos grandes de lenguaje, especialmente los comerciales, rechazan procesar el lenguaje tóxico. Esto hace que sea casi imposible utilizarlos para procesar el discurso del odio. Nosotros estamos desarrollando un modelo de lenguaje desde cero que pueda procesar ese tipo de contenidos, pero sin generarlo«.

El directivo cree que la compañía no corre peligro de entrar en un mercado saturado de proveedores de IA, dado que están desarrollando su propio modelo, tal como hacen las principales empresas del sector. Además, no es el único factor diferencial que tiene la startup en su opinión. Según su opinión, este es su enfoque académico, así como su colaboración con organizaciones sociales y legisladores.

Su COO, Redouan el Hamouchi, ha subrayado la importancia de que el modelo en el que trabajan tenga capacidades multiidioma: «en nuestro mundo digitalizado, hay cada vez más necesidad de herramientas avanzadas para moderar contenido. El multilingüismo es esencial al respecto. Estamos encantados de poder entrenar nuestra aplicación más rápido, para que pueda gestionar distintos idiomas y culturas en la UE».

La compañía está comprometida con el desarrollo de la IA ético y responsable, ya que «la Unión Europea ha fijado unos estándares estrictos. La tecnología debe ser transparente, explicable y ética. Estos valores están también en nuestro ADN. Es la única manera de dar a la gente confianza en la tecnología nueva».

Otro de los factores que pueden hacer que la compañía tenga éxito es el momento en el que se encuentra desarrollando su modelo. Después de la entrada en vigor de la Ley de Servicios Digitales, la DSA, en la UE, el pasado mes de febrero, todas las plataformas online necesitan tomar medidas para acabar con el contenido dañino. Entre los tipos de contenidos que tienen que reducir, está el discurso del odio.

Pero Textgain no se queda únicamente en el desarrollo de este modelo, que quiere lanzar a lo largo de 2025. Tiene más planes para el futuro, entre los que está su internacionalización y el desarrollo de más aplicaciones de software como servicio.

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.

Lo más leído