Conecta con nosotros

Noticias

Granite 3.0, la nueva generación de modelos de Inteligencia Artificial para empresas de IBM

Publicado el

IBM

IBM ha actualizado su familia de modelos de IA de tamaño compacto para empresas Granite con el lanzamiento de su tercera generación. Granite 3.0, con licencia open source Apache 2.0, incluye modelos para empresas de propósito general (Granite 3.0 8B-Instruct, Granite 3.0 2B-Instruct, Granite 3.0 8B Base y Granite 3.0 2B Base), de barreras de protección y seguridad (Granite Guardian 3.0 8B y Granite Guardian 3.0 2B) y de arquitectura MoE, o Mixture of Experts (Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base y Granite 3.0 1B A400M Base).

Granite 3.0 8B y 2B están creados para IA empresarial, con especial enfoque en tareas como la regeneración aumentada de recuperación (RAG), clasificación, resumen, extracción de entidades y uso de herramientas. Son de tamaño compacto y están pensados para amoldarse de manera precisa a los datos de empresa, así como para integrarse en entornos profesionales y flujos de trabajo.

La combinación de uno de los modelos pequeños Granite con datos de empresa hace que, según IBM, sea posible alcanzar un rendimiento en el caso de tareas concretas similar al que conseguirían modelos más grandes pero con un coste menor. Para ello estos modelos emplean una técnica de alineación presentada por IBM y RedHat el pasado mes de mayo, InstructLab.

Los modelos Granite de esta nueva generación se han lanzado con más de 12.000 millones de tokens de datos a partir de 12 lenguajes naturales y 116 lenguajes de programación. Emplean un método de entrenamiento en dos fases, que aprovecha los resultados de miles de experimentos pensados para optimizar la calidad y la selección de datos y parámetros de entrenamiento. Antes de que termine el año, IBM espera incluir soporte para una ventana de contexto ampliada de 128K y capacidades de comprensión multimodal de documentos para los modelos lingüísticos 8B y 2B de Granite 3.0.

En cuanto a los modelos de Arquitectura de mezcla de expertos (MoE) Granite, Granite 3.0 1B A400M y Granite 3.0 3B A800M, IBM los ha desarrollado pensando en su despliegue, como modelos más pequeños y ligeros, en aplicaciones de baja latencia, así como para despliegues basados en CPU.

Además de esta familia de modelos, IBM también ha actualizado sus modelos Granite Time Series preentrenados, después de su lanzamiento a principios de 2024. Ahora estos modelos se han entrenado con tres veces más datos, ofreciendo también una flexibilidad mayor de modelización y con soporte para valirables externas y previsiones continuas.

La gama de modelos Granite 3.0 Guardian está pensada para que los desarrolladores de aplicaciones puedan poner en marcha barreras de seguridad mediante la comprobación de los avisos al usuario y las respuestas LLM para detectar diversos riesgos. Además de las dimensiones de daño, como prejuicios sociales, odio, toxicidad, blasfemia, violencia o técnicas de jailbreak, entre otras, estos modelos también ofrecen comprobaciones específicas de RAG. Entre ellas, el fundamento, la relevancia del contexto y la relevancia de la respuesta.

Aunque los modelos Granite Guardian se derivan de los correspondientes modelos de lenguaje Granite, pueden utilizarse para implementar medidas de seguridad junto a cualquier modelo de IA, ya sea abierto o propietario. Todos los modelos de la nueva versión de Granite y los modelos actualizados de series temporales pueden descargarse ya de Hugging Face.

Las variantes instructivas de los modelos lingüísticos 3.0 8B y 2B, y los modelos Granite Guardian 3.0 están también disponibles para uso comercial en la plataforma watsonx de IBM. También habrá una selección de estos modelos como microservicios Nvidia NIM, así como a través de las integraciones Vertex AI model Garden de Google Cloud con Hugging Face. También habrá un paquete seleccionado de ellos en Ollama y Replicate.

Además, IBM también integrará diversos modelos Granite en las ofertas de servicios de varios de sus partners, como AWS, Docker o Qualcomm. Lo hará a través de su Hub de IA, así como de Salesforce o SAP, entre otros.

Aparte de estos nuevos modelos, IBM ha anunciado también una nueva versión de watsonx Code Assistant, basada en los modelos de código Granite, pensada para ofrecer asistencia a la programación de uso general en lenguajes como C, C++, Go, Java y Python. Además, ofrece capacidades avanzadas de modernización de aplicaciones para Enterprise Java Applications. Por otra parte, ya es posible acceder a las funciones de código de Granite a través de IBM Granite Code, una extensión de Visual Studio Code.

IBM Consulting Advantage, la plataforma de prestación de servicios apoyada en IA de IBM, también cuenta con novedades, y una expansión que incluye la integración de los modelos de lenguaje Granite 3.0 como sus modelos por defecto. Otra parte importante de la expansión es la llegada de IBM Consulting Advantage for Cloud Transformation and Management e IBM Consulting Advantage for Business Operation.

Ambas incluyen agentes de IA específicos para varios campos, aplicaciones y métodos. Con ellas, los consultores de IBM podrán acelerar las transformaciones cloud y de IA de los clientes, en tareas como la modernización de código o la ingeniería de calidad. También para transformar y ejecutar operaciones a través de dominios relacionados con las finanzas, los recursos humanos o las adquisiciones.

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.

Lo más leído