Noticias

Una startup belga desarrolla un LLM que detectará discurso de odio en todos los idiomas de la UE

Publicado el

10 julio, 2024

por

Una startup belga desarrolla un LLM que detectará discurso del odio en todos los idiomas de la UE

La startup belga Textgain está desarrollando un modelo grande de lenguaje (LLM) capaz de detectar discurso de odio online en los 24 idiomas oficiales de la Unión Europea. La compañía, que nació en 2016 como una spinoff de la Universidad de Antwerp, se dedica al desarrollo de herramientas de análisis y gestión de datos basadas en IA para empresas, y sus servicios van desde la analítica de texto hasta la medición del sentimiento en redes sociales y páginas web. También se dedica al análisis del discurso del odio, según EdTech Innovation Hub.

El pasado mes de junio, la compañía fue una de las cuatro ganadoras del Gran Desafío Large AI de la UE, en el que participaban empresa y organizaciones con innovaciones relacionadas con la IA generativa y los modelos grandes de lenguaje. Textgain fue galardonada con un cuarto de millón de euros y dos millones de horas de tiempo de desarrollo en Lumi y Leonardo, dos de los superordenadores de la UE, lo que le ha permitido conseguir acceso a sistemas que aceleran el entrenamiento de sus modelos.

En los próximos 12 meses, la compañía empleará estos recursos en el desarrollo de su propio modelo multiidioma, que especializará en detección del discurso de odio. Eso sí, aunque será capaz de reconocerlo, no podrá generarlo. Así, Textgain se une a otras empresas y centros de investigación que intentan acabar con el discurso de odio con la tecnología con la que desarrollan los LLMs.

Guy de Pauw, CEO de Textgain, ha destacado que «los modelos grandes de lenguaje, especialmente los comerciales, rechazan procesar el lenguaje tóxico. Esto hace que sea casi imposible utilizarlos para procesar el discurso del odio. Nosotros estamos desarrollando un modelo de lenguaje desde cero que pueda procesar ese tipo de contenidos, pero sin generarlo«.

El directivo cree que la compañía no corre peligro de entrar en un mercado saturado de proveedores de IA, dado que están desarrollando su propio modelo, tal como hacen las principales empresas del sector. Además, no es el único factor diferencial que tiene la startup en su opinión. Según su opinión, este es su enfoque académico, así como su colaboración con organizaciones sociales y legisladores.

Su COO, Redouan el Hamouchi, ha subrayado la importancia de que el modelo en el que trabajan tenga capacidades multiidioma: «en nuestro mundo digitalizado, hay cada vez más necesidad de herramientas avanzadas para moderar contenido. El multilingüismo es esencial al respecto. Estamos encantados de poder entrenar nuestra aplicación más rápido, para que pueda gestionar distintos idiomas y culturas en la UE».

La compañía está comprometida con el desarrollo de la IA ético y responsable, ya que «la Unión Europea ha fijado unos estándares estrictos. La tecnología debe ser transparente, explicable y ética. Estos valores están también en nuestro ADN. Es la única manera de dar a la gente confianza en la tecnología nueva».

Otro de los factores que pueden hacer que la compañía tenga éxito es el momento en el que se encuentra desarrollando su modelo. Después de la entrada en vigor de la Ley de Servicios Digitales, la DSA, en la UE, el pasado mes de febrero, todas las plataformas online necesitan tomar medidas para acabar con el contenido dañino. Entre los tipos de contenidos que tienen que reducir, está el discurso del odio.

Pero Textgain no se queda únicamente en el desarrollo de este modelo, que quiere lanzar a lo largo de 2025. Tiene más planes para el futuro, entre los que está su internacionalización y el desarrollo de más aplicaciones de software como servicio.

Relacionados:Discurso de odio LLM Textgain

A continuación

AMD comprará a Silo para ampliar su catálogo de soluciones de IA empresarial

No te pierdas

Denuncian la explotación de los «expertos en datos» en los países en desarrollo

Celia Valdeolmillos

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.

A FondoHace 6 días

Seguridad Gestionada: casi todo lo que tienes que saber y un extra

CrowdStrike espera esquivar los problemas legales derivados de su incidente del pasado julio

NoticiasHace 6 días

CrowdStrike espera esquivar los problemas legales derivados de su incidente del pasado julio

Anthropic presenta Claude Enterprise, un plan para el uso en empresas de su modelo de IA

NoticiasHace 6 días

Anthropic presenta Claude Enterprise, un plan para que las empresas grandes usen su LLM

Más problemas para Google: otro juicio por monopolio en EEUU y pierde la apelación de una multa en la UE

NoticiasHace 6 días

Más problemas para Google: otro juicio por monopolio en EEUU y pierde la apelación de una multa en la UE

MuyComputerPRO

Una startup belga desarrolla un LLM que detectará discurso de odio en todos los idiomas de la UE

Noticias

Una startup belga desarrolla un LLM que detectará discurso de odio en todos los idiomas de la UE

Ericsson crea una empresa conjunta con una docena de operadoras para vender software de red

Nextcloud Hub 9: más automatización y descentralización con interfaz rediseñada

AMD quiere ser una compañía data center first

Telefónica llega a acuerdos sobre fibra óptica con Vodafone España y MasOrange

El fin de la era de los modelos de IA gigantes: eficiencia y precisión se imponen al tamaño

Salesforce Agentforce, agentes de IA autónomos que gestionan tareas de servicio, ventas, marketing y comercio

Webinar: Cómo evitar que una caída global como la reciente de CrowdStrike te afecte

Los despidos en tecnológicas se multiplican en 2024

Entornos multicloud: aliados para el trabajo con datos e IA generativa

Varios autores demandan a Anthropic por entrenar su IA con libros pirateados

Microsoft lo intentará de nuevo con Recall: en octubre lo lanzará en la comunidad Windows Insider

Microsoft celebrará un evento sobre el incidente de CrowdStrike

Ericsson crea una empresa conjunta con una docena de operadoras para vender software de red

AMD se queda con el fabricante de servidores ZT Systems por 4.900 millones

Microsoft hará obligatoria la autenticación multifactor en Azure

El fondo estadounidense Carlyle compra el 60% de la tecnológica Seidor

La inversión en IA alcanzará en 2028 los 632.000 millones de dólares

La mitad de empresas españolas creen que su nivel de digitalización es mayor que el de antes de 2020

Lo más leído

MuyComputerPRO

Una startup belga desarrolla un LLM que detectará discurso de odio en todos los idiomas de la UE

También te puede gustar

Ericsson crea una empresa conjunta con una docena de operadoras para vender software de red

Nextcloud Hub 9: más automatización y descentralización con interfaz rediseñada

AMD quiere ser una compañía data center first

Telefónica llega a acuerdos sobre fibra óptica con Vodafone España y MasOrange

El fin de la era de los modelos de IA gigantes: eficiencia y precisión se imponen al tamaño

Salesforce Agentforce, agentes de IA autónomos que gestionan tareas de servicio, ventas, marketing y comercio

Webinar: Cómo evitar que una caída global como la reciente de CrowdStrike te afecte

Los despidos en tecnológicas se multiplican en 2024

Entornos multicloud: aliados para el trabajo con datos e IA generativa

Varios autores demandan a Anthropic por entrenar su IA con libros pirateados

Microsoft lo intentará de nuevo con Recall: en octubre lo lanzará en la comunidad Windows Insider

Microsoft celebrará un evento sobre el incidente de CrowdStrike

Ericsson crea una empresa conjunta con una docena de operadoras para vender software de red

AMD se queda con el fabricante de servidores ZT Systems por 4.900 millones

Microsoft hará obligatoria la autenticación multifactor en Azure

El fondo estadounidense Carlyle compra el 60% de la tecnológica Seidor

La inversión en IA alcanzará en 2028 los 632.000 millones de dólares

La mitad de empresas españolas creen que su nivel de digitalización es mayor que el de antes de 2020

Lo más leído