Noticias

Habana Labs presenta Gaudi2: Un salto enorme frente a la primera generación

Publicado el

14 mayo, 2022

por

Isidro Ros

En 2019 Intel compró a Habana Labs, un movimiento muy importante con el que el gigante del chip reforzó su apuesta por la inteligencia artificial, y queda claro que desde luego fue todo un acierto, especialmente tras ver lo que han sido capaces de conseguir con Habana Gaudi2, una de las novedades más importantes que hemos visto, en materia de hardware profesional, en el evento Intel Vision de este año, al que tuvimos la suerte de asistir. Durante el evento Intel anunció también Habana Greco.

Ambas soluciones están diseñadas para acelerar cargas de trabajo centradas en aprendizaje profundo e inferencia. Habana Gaudi2 está especializado en aprendizaje profundo y es el sucesor de Habana Gaudi, mientras que Habana Greco está diseñado para tareas de inferencia y sucede a Habana Goya. No debemos confundir el aprendizaje profundo con la inferencia, ya que no son lo mismo aunque algunos caigan en el error de utilizarlos como si lo fuesen.

El aprendizaje profundo comprende el proceso de entrenamiento de una inteligencia artificial, es decir, esa etapa en la que se produce el suministro de datos que el sistema utilizará para aprender. En él se utilizan modelos jerárquicos complejos destinados con los que se intenta conseguir que la inteligencia artificial aprenda de una manera similar a como lo hacen los seres humanos. La inferencia, por contra, es el paso inmediatamente posterior, es decir, consiste en que la inteligencia artificial utilice lo aprendido.

Habana Gaudi2: 7 nm y hasta el doble de rendimiento que una GPU NVIDIA A100 con 80 GB

En el vento Intel Vision 2022 pudimos ver algunos datos de rendimiento de Habana Gaudi2, y los números fueron impresionantes. En primer lugar tenemos un salto enorme en el nodo de fabricación frente al modelo de primera generación, ya que este estaba fabricado en 16 nm y su sucesor viene en el avanzado nodo de 7 nm. Por lo que respecta al rendimiento, Gaudi2 es capaz de superar en un 90% a la NVIDIA A100 de 80 GB bajo ResNet 50, donde alcanza 5.425 imágenes por segundo, y la dobla en BERT con 685 secuencias por segundo.

Sandra Rivera, Vicepresidente ejecutivo de Intel y gerente general de Datacenter and AI Group, comentó que:

«Gaudi2 puede ayudar a los clientes de Intel a entrenar cargas de trabajo de aprendizaje profundo cada vez más grandes y complejas con mayor velocidad y eficiencia, y Greco también traerá mejoras importantes».

Comparado con la primera generación, Gaudi2 es capaz de triplicar el rendimiento en ResNet 50, y en BERT Phase-2 la ventaja que obtiene sobre la NVIDIA A100 de 80 GB es todavía mayor, ya que alcanza el 180%. A nivel de especificaciones, Gaudi2 cuenta con 24 núcleos de procesadores Tensor (Gaudi contaba con 10 núcleos), dispone de 96 GB de memoria HBME, el triple de la cantidad que montaba el modelo de primera generación, suma 48 MB de SRAM y 24 NIC RoCE RDMA de 100 GbE.

Gaudi2 tiene un TDP es de 600 vatios, pero según Eitan Medina, COO de Habana Labs, puede funcionar sin problemas con un sistema de refrigeración pasiva, lo que significa que puede integrarse sin problemas en infraestructuras ya existentes. Ya se encuentra disponible para los clientes de Habana Labs, y tienen una integración total en la suite de software Habana SynapseAI, que está optimizada para el desarrollo de modelos de aprendizaje profundo y facilita la migración de los modelos existentes basados en GPU al hardware de la plataforma Gaudi.

En cuanto a Habana Greco, esta solución centrada en la inferencia también ha recibido mejoras muy importantes, entre las que podemos destacar el uso de memoria LPDDR5, lo que se traduce en un mayor ancho de banda frente a la generación anterior, que utilizaba memoria DDR4. También ha aumentado la cantidad, pasando de 50 MB a 128 MB, se ha reducido el TDP de 200 vatios a 75 vatios y se ha adoptado un diseño monoslot. Estará disponible a mediados de este año.

Relacionados:Gaudi2 Intel Vision 2022

A continuación

HP Spectre x360 15, análisis a fondo de uno de los mejores convertibles

No te pierdas

Nokia lanza servicios SaaS de gestión de dispositivos domésticos y eficiencia energética de redes

Isidro Ros

Editor de la publicación on-line líder en audiencia dentro de la información tecnológica para profesionales. Al día de todas las tecnologías que pueden marcar tendencia en la industria.

Click para comentar

10 predicciones para los proveedores de servicios gestionados en 2025

OpiniónHace 6 días

10 predicciones para los proveedores de servicios gestionados en 2025

La Comisión Europea multa a Meta con 798 millones por perjudicar a la competencia de Marketplace

NoticiasHace 6 días

La Comisión Europea multa a Meta con 798 millones por perjudicar a la competencia de Marketplace

AMD despedirá al 4% de su plantilla mientras se centra en la IA y los centros de datos

NoticiasHace 6 días

AMD despedirá al 4% de su plantilla mientras se centra en IA y centros de datos

El Capitan es el nuevo superordenador más potente y rápido del mundo

NoticiasHace 2 días

El Capitan es el nuevo superordenador más potente y rápido del mundo

MuyComputerPRO

Habana Labs presenta Gaudi2: Un salto enorme frente a la primera generación

Noticias

Habana Labs presenta Gaudi2: Un salto enorme frente a la primera generación

Habana Gaudi2: 7 nm y hasta el doble de rendimiento que una GPU NVIDIA A100 con 80 GB

Microsoft Ignite 2024: más versatilidad para la IA, mejoras en Teams y aumento de la seguridad

«Los agentes autónomos de Salesforce nos ayudan a hacer mejor nuestro trabajo»

IBM sigue avanzando en la corrección de errores en sistemas cuánticos

«En un futuro podremos saber desde el primer momento si estamos siendo atacados»

NVIDIA y Microsoft potencian el desarrollo con IA en PCs con RTX

Soberanía de datos: hacia la privacidad total en la mensajería instantánea empresarial

Salesforce lidera la tercera ola de la IA con Agentforce

Inteligencia artificial, agilidad y desarrollo de aplicaciones seguras

“Los datos son la base para transformar cualquier organización”

Microsoft acusa a Google de «operaciones encubiertas» para influir en la regulación cloud en la UE

Responder al riesgo con IA y Machine Learning

Salesforce Agentforce World Tour Madrid 2024: donde la innovación te espera

Microsoft Ignite 2024: más versatilidad para la IA, mejoras en Teams y aumento de la seguridad

Pure Storage nombrada Líder en el Cuadrante Mágico de Gartner para plataformas de almacenamiento de archivos y objetos

Arm y Qualcomm van a la guerra

Penguin Random House cambia su copyright para proteger de la IA a los autores

Arquitecturas multiagente: la colaboración entre agentes de IA, más cerca

¡No te pierdas nada! ¡Sigue aquí el streaming del eFactura Fórum II!

Lo más leído

MuyComputerPRO

Habana Labs presenta Gaudi2: Un salto enorme frente a la primera generación

Habana Gaudi2: 7 nm y hasta el doble de rendimiento que una GPU NVIDIA A100 con 80 GB

También te puede gustar

Microsoft Ignite 2024: más versatilidad para la IA, mejoras en Teams y aumento de la seguridad

«Los agentes autónomos de Salesforce nos ayudan a hacer mejor nuestro trabajo»

IBM sigue avanzando en la corrección de errores en sistemas cuánticos

«En un futuro podremos saber desde el primer momento si estamos siendo atacados»

NVIDIA y Microsoft potencian el desarrollo con IA en PCs con RTX

Soberanía de datos: hacia la privacidad total en la mensajería instantánea empresarial

Salesforce lidera la tercera ola de la IA con Agentforce

Inteligencia artificial, agilidad y desarrollo de aplicaciones seguras

“Los datos son la base para transformar cualquier organización”

Microsoft acusa a Google de «operaciones encubiertas» para influir en la regulación cloud en la UE

Responder al riesgo con IA y Machine Learning

Salesforce Agentforce World Tour Madrid 2024: donde la innovación te espera

Microsoft Ignite 2024: más versatilidad para la IA, mejoras en Teams y aumento de la seguridad

Pure Storage nombrada Líder en el Cuadrante Mágico de Gartner para plataformas de almacenamiento de archivos y objetos

Arm y Qualcomm van a la guerra

Penguin Random House cambia su copyright para proteger de la IA a los autores

Arquitecturas multiagente: la colaboración entre agentes de IA, más cerca

¡No te pierdas nada! ¡Sigue aquí el streaming del eFactura Fórum II!

Lo más leído