A Fondo
Como preparar los centros de datos para la expansión de la IA generativa
La adopción en la empresa de la IA generativa, en cualquiera de sus formatos, está todavía dando sus primero pasos. Pero a juzgar por la expectación que genera, y las posibilidades que ofrece, todo indica que va a crecer de manera exponencial en los próximos meses y años. Sobre todo, según Network World, a medida que se vayan encontrando nuevos casos de uso para ella.
Su aumento va a ser tan fuerte que, tal como apuntan en Bloomberg Intelligence, el mercado de la IA generativa crecerá nada menos que un 42% anual a lo largo de la próxima década, pasando de los 40.000 millones a los 1,3 billones de dólares.
La IA generativa puede ayudar mucho a los equipos de TI. Además de para escribir código y scripts para redes, puede servir también para ofrecer soluciones a problemas, automatizar procesos, ayudar en onboardings y formaciones, crear documentación y planificar y gestionar proyectos. También puede transformar todo tipo de divisiones del negocio. Desde los call centers y centros de atención al cliente hasta el mantenimiento de procesos, volviéndolo preventivo. También puede cambiar áreas como diseño, desarrollo, analíticas de datos o creación de contenidos.
Pero para poder hacerlo, es necesario contar con una infraestructura que pueda soportar las cargas de trabajo que genera la IA generativo. Y estas cargas no paran de aumentar. Por eso, es muy importante que los responsables de TI y de red de las empresas se aseguren de que su infraestructura IT, así como sus equipos de profesionales, están preparados para la llegada y expansión de la IA generativa.
El primer efecto en la expansión de la Inteligencia Artificial generativa va a ser la necesidad de contar con más centros de datos, así como con centros con mayor capacidad y potencia. Según KPMG, debido a ella, «la demanda a los centros centros de datos aumentará con respecto a la actual, y cambiará de manera drástica cómo serán los centros de datos y sus tecnologías asociadas en el futuro».
Las dos fases de la demanda de potencia de computación
Las aplicaciones de IA generativa generarán una demanda notable de potencia de computación en dos fases. La primera, para entrenar a los modelos grandes de lenguaje, que constituyen la parte central de los sistemas de Inteligencia Artificial que generan texto e imágenes. Se necesita para hacer funcionar las aplicaciones que incorporan estos modelos.
Raul Martynek, CEO del operador de centros de datos DataBank, ha señalado que «el entrenamiento de modelos grandes de lenguaje requiere un nivel de computación denso, en forma de redes neuronales, en las que miles de millones de ejemplos de lenguaje o de imágenes se introducen en un sistema de redes neuronales y se refinan de manera repetitiva hasta que el sistema las reconoce tan bien como lo haría un humano«.
Estas redes neuronales necesitan ingentes clústeres de computación de alto rendimiento con procesadores y GPUs en ejecución continua durante meses y años, y que se ejecutan de manera más eficiente en infraestructura dedicada que se puede situar cerca de los conjuntos de datos que se usan para el entrenamiento.
A la segunda fase de la demanda se la conoce como «proceso de inferencia», y consiste en el uso de aplicaciones de IA generativa para hacer preguntas y obtener resultados. En ella, se necesita una infraestructura más dispersa geográficamente, que pueda escalar con rapidez y dar acceso a las aplicaciones con una latencia baja. Esto se debe a que los usuarios que estén haciendo las preguntas al sistema querrán tiempos de respuesta rápidos para recibir las respuestas, o en cualquier caso de uso en el que estén utilizándolo.
Esto hará necesario contar con centros de datos en diversos puntos, en lugar de utilizar el modelo de nube pública centralizado que actualmente da soporte a la mayoría de las aplicaciones. En esta segunda fase, la demanda de potencia de computación será todavía alta, pero con respecto a la primera, por las necesidades de dispersión, esta demanda se podrá repartir en más centros de datos.
La IA generativa necesita refrigeración líquida
Además de en cuanto a potencia de computación, la IA generativa también va a ocasionar cambios en otros aspectos relacionados con los centros de datos. Debido sobre todo a que tendrá bastante impacto en la densidad de los servidores, habrá impacto en la refrigeración necesaria para reducir su temperatura, lo que a su vez también influirá en la sostenibilidad de los centros de datos y en su demanda de energía.
Incluso con los esfuerzos que hacen muchas empresas y proveedores de este tipo de instalaciones para mantener el consumo de energía y la temperatura de los centros y los servidores bajo control, el presupuesto para consumo de energía sigue creciendo. Y con el ritmo de crecimiento de las cargas de trabajo, llegará un momento en el que si no se hacen cambios, será insostenible en muchos casos.
La densidad de servidores, por un lado, no tiene que crecer de manera infinita. Hay muchas innovaciones tecnológicas en chips y GPUs, así como en áreas relacionadas con el hardware y la computación cuántica, e incluso en el desarrollo de software basado en modelos y pensando en el hardware, permitirán sacar más partido a éste, y frenarla. Por otro lado, el sector ya lleva tiempo experimentando con diversas técnicas innovadoras de refrigeración líquida, más eficientes que el aire. Incluso hay proveedores, como Microsoft, que han puesto en marcha centros de datos submarinos, gracias al Proyecto Natick.
La refrigeración por aire, independientemente del sistema utilizado, no basta para cubrir las necesidades de refrigeración de los componentes hardware de computación de alto rendimiento, como sucede con las GPUs. Por tanto, las técnicas de refrigeración que utilizan líquido están ganando presencia. Esto se debe a que los líquidos tienen una conductividad del calor más elevada que el aire, lo que permite una transferencia del calor mejor y más eficiente.
Dado que las necesidades de refrigeración de los futuros centros de datos serán mayores que las actuales, sus diseñadores ya están trabajando en sistemas para que cuenten con nuevos métodos de refrigeración. Entre ellos la integración de puertas traseras frías, aplicación de agua a los chips o tecnologías de inmersión que permitan dar con el equilibrio necesario entre potencia, sostenibilidad y refrigeración.
Los centros de datos deben prepararse para la necesidad creciente de energía
A la vista de los requisitos de energía de las cargas de trabajo de IA generativa para el futuro, puede que los operadores de centros de datos tengan que valorar la construcción de sus propias subestaciones de energía. También porque hay cierta incertidumbre en cuanto al suministro de energía relacionado con el paso a la energía renovable.
Contar con una fuente de energía fiable y escalable será cada vez más importante para los operadores de centros de datos. Tanto para cubrir la demanda de energía generada por los clústeres de computación de alto rendimiento como para vadear las limitaciones en el suministro de energía.
En el futuro, el diseño de tecnología para centros de datos tendrá que adaptarse a demandas de potencia de computación todavía más elevada, por lo que es importante que los equipos de centros de datos y de redes empiecen ya a prepararse para ello, de cara a hacer los cambios que sea necesario para no tener problemas.
Los proveedores de hardware también tendrán que adaptarse a unas necesidades crecientes de potencia y cargas de trabajo, ofreciendo distintas opciones a los equipos encargados de la gestión, planificación y operación de centros de datos a medida que tengan que ir adaptándose a los cambios en lo que necesitan.
La colaboración entre ellos va a ser muy importante para que los centros de datos sigan el ritmo de la demanda. Pero en general, para prepararse para el crecimiento de la IA generativa, y de la demanda de computación y energía de los centros de datos, sus operadores van a tener que adoptar las estrategias de negocio y presupuestos necesarias para poder invertir en la infraestructura necesaria, así como en las herramientas adecuadas para mejorar las habilidades que necesitarán sus plantillas.
-
OpiniónHace 6 días
10 predicciones para los proveedores de servicios gestionados en 2025
-
NoticiasHace 2 días
El Capitan es el nuevo superordenador más potente y rápido del mundo
-
NoticiasHace 6 días
AMD despedirá al 4% de su plantilla mientras se centra en IA y centros de datos
-
NoticiasHace 6 días
La Comisión Europea multa a Meta con 798 millones por perjudicar a la competencia de Marketplace