La refrigeración líquida es el siguiente paso en la computación acelerada para las GPU (Unidad de Procesamiento Gráfico), refrigeradas por aire de NVIDIA, que ya ofrecen hasta 20 veces más eficiencia energética en trabajos de Inteligencia Artificial y computación de alto rendimiento que las CPU (Unidad Central de Procesamiento).
Con el fin de colaborar en el esfuerzo mundial por detener el cambio climático, Zac Smith forma parte de un movimiento creciente para construir data centers que brinden alto rendimiento y eficiencia energética. Zac es el jefe de infraestructura de edge de Equinix, un proveedor de servicios global que administra más de 240 data centers y que se ha comprometido en ser el primero de su sector en generar un efecto neutro para el clima.
“Tenemos 10,000 clientes que cuentan con nosotros para obtener ayuda en este proceso. Exigen más datos y más inteligencia, a menudo con IA, y lo quieren de una manera sustentable”, dijo Smith.
Hasta abril, Equinix emitió 4,900 millones de dólares en bonos verdes, los cuales son instrumentos de nivel de inversión que aplicará para reducir el impacto ambiental mediante la optimización de la eficacia del uso de energía (PUE), una métrica de la industria sobre la cantidad de la energía utilizada por un data center que se destina directamente a las tareas de computación.
Los operadores de data centers intentan llevar ese índice cada vez más cerca del ideal de 1.0 PUE. Las instalaciones de Equinix tienen un promedio de 1.48 PUE en la actualidad, mientras que sus mejores data centers nuevos logran menos de 1.2.
En otro paso hacia adelante, Equinix abrió en enero una instalación dedicada a buscar avances en la eficiencia energética. Una parte de ese trabajo se centra en el enfriamiento líquido, nacido en la era del mainframe y que está madurando en la era de la IA. Ahora se usa ampliamente en las supercomputadoras más rápidas del mundo, en una forma moderna llamada enfriamiento directo del chip.
Si se cambiaran todos los servidores solo de CPU que ejecutan IA en todo el mundo por sistemas acelerados por GPU, se podrían ahorrar nada menos que 11 billones de vatios-hora de energía al año. Eso equivale a ahorrar la energía que consumen 1.5 millones de hogares en un año.
NVIDIA aumenta sus esfuerzos de sostenibilidad con el lanzamiento de la primera GPU PCIe para centros de datos que utiliza refrigeración directa del chip. Equinix califica a la GPU A100 80GB PCIe con enfriamiento líquido para usarla en sus data centers a finales de este año como parte de un enfoque integral para lograr el enfriamiento sostenible y la captura de calor. Las GPU ya están disponibles como muestras y estarán disponibles de forma general este verano.
“Esta es la primera GPU con enfriamiento líquido que se presentó en nuestro laboratorio. Esto es emocionante para nosotros porque nuestros clientes buscan formas sustentables de aprovechar la IA”, comentó Smith.
El objetivo de los operadores de data centers es eliminar las refrigeradoras que evaporan millones de galones de agua al año para enfriar el aire dentro de los data centers. El enfriamiento líquido promete sistemas que reciclen pequeñas cantidades de fluidos en sistemas cerrados y que estén centrados en los puntos calientes clave. “Convertiremos un desperdicio en un recurso”, afirmó Zac Smith.
En pruebas separadas, tanto Equinix como NVIDIA descubrieron que un data center que usaba enfriamiento líquido podía ejecutar las mismas cargas de trabajo que una instalación de enfriamiento por aire con un 30% menos de energía. NVIDIA estima que el data center con enfriamiento líquido podría llegar a 1.15 PUE, muy por debajo del 1.6 de su par con enfriamiento por aire.
Los data centers con enfriamiento líquido también pueden lograr el doble de computación en el mismo espacio. Esto se debe a que las GPU A100 usan solo una ranura PCIe mientras que las GPU A100 con enfriamiento por aire necesitan dos.
NVIDIA nota un ahorro de energía y ganancias de densidad con el enfriamiento líquido.
Al menos una docena de fabricantes de sistemas planean incorporar estas GPU a sus ofertas a finales de este año. Entre ellos se encuentran ASUS, ASRock Rack, Foxconn Industrial Internet, GIGABYTE, H3C, Inspur, Inventec, Nettrix, QCT, Supermicro, Wiwynn y xFusion.
Las regulaciones que establecen normas de eficiencia energética están pendientes en Asia, Europa y los Estados Unidos. Eso también motiva a los bancos y otros grandes operadores de data centers a evaluar el enfriamiento líquido. Además, la tecnología no se limita a los data centers. Los automóviles y otros sistemas la necesitan para enfriar los sistemas de alto rendimiento integrados dentro de espacios confinados.
“Este es el comienzo de un viaje”, dijo Smith sobre el debut de los aceleradores convencionales con enfriamiento líquido. De hecho, NVIDIA lanzará una nueva versión de la tarjeta A100 PCIe el próximo año utilizando la GPU H100 Tensor Core basada en la arquitectura NVIDIA Hopper. Planeamos respaldar el enfriamiento líquido en nuestras GPU para data centers de alto rendimiento y nuestras plataformas NVIDIA HGX para el futuro predecible.
A fin de acelerar la adopción, las GPU actuales con enfriamiento líquido ofrecen el mismo rendimiento con menos energía. En el futuro, esperamos que estas tarjetas ofrezcan una opción para obtener más rendimiento con la misma energía, algo que los usuarios quieren. “La medición de vatios por sí sola no es relevante, el rendimiento que obtienes para el impacto de carbono que logras tiene que ser nuestro objetivo”, concluyó Zac Smith.