El Capitán domina el Top500 con una gran victoria HPE y AMD
18/11/2024
La última lista Top500 ya está disponible y la antigua supercomputadora número uno, Frontier, ha sido destronada. En esta lista, la supercomputadora Aurora con tecnología Intel superó el 1EF, pero luego El Capitán subió al primer puesto. Esta es una gran victoria para HPE y AMD al ofrecer un sistema con un rendimiento superior a 2 exaflops FP64.
El Capitán domina el Top500 con una gran victoria HPE y AMD
La cobertura de STH sobre El Capitán comenzó desde la sede de HPE durante una conferencia de prensa y analistas que capturamos en HPE-Cray y AMD Win Again con El Capitan 2 Exaflop Supercomputer. Entre la pandemia que cerró el Área de la Bahía a finales de ese mes y una serie de esfuerzos de ingeniería, surgió El Capitán.
Mencionaremos rápidamente la supercomputadora Aurora en el tercer lugar del Top500 de noviembre de 2024. Aurora combina procesadores Intel Xeon Max con Ponte Vecchio (Intel GPU Max) en la plataforma HPE Cray Shasta. Frontier, Aurora y El Capitan son sistemas HPE Cray Shasta Slingshot refrigerados por líquido a un nivel mucho más allá de lo que vemos a menudo en el lado del clúster de IA. Es bueno que Intel alcance 1EF, pero tampoco es un buen resultado si no pueden reclamar el primer puesto por un tiempo. Parece que AMD está por delante.
Sin embargo, la gran estrella del espectáculo es el sistema AMD Instinct MI300A, El Capitan. Con un rendimiento HPL sostenido de 1.742EF y una velocidad máxima de 2.79EF de rendimiento FP64, este es un gran paso adelante con respecto a los sistemas de la generación anterior.
El Capitan tiene una arquitectura única porque utiliza APU que combinan CPU y GPU en un paquete con memoria de gran ancho de banda. Aquí está uno de los paquetes:
Ya hemos hablado de la GPU AMD Instinct MI300X y las APU MI300A, pero en un nivel alto, considérelo como una GPU MI300X donde algunos de los recursos informáticos de la GPU han sido reemplazados por CPU. U otra forma de verlo es como una versión altamente mejorada de la serie AMD Ryzen AI 300 que puede encontrar en mini PC como el Beelink SER9. Una ventaja de este enfoque es que las partes de CPU y GPU comparten memoria en el mismo paquete.
Luego, más de 44.000 de estas APU MI300A se integran en la plataforma HPE Cray Shasta refrigerada por líquido y se conectan a través de la interconexión Slingshot. Agregue unos 35 MW aproximadamente y tendrá el Top500 más eficiente del mundo. Nos dijeron que HPL en realidad sólo consume 28,9 MW. Hay 11.136 nodos HPE Cray EX255a con cuatro MI300A cada uno. Incluso para un sistema grande, todavía ocupa el puesto 18 en el Green500, lo que lo hace relativamente eficiente desde el punto de vista energético.
El Capitán está diseñado para comenzar misiones clasificadas en el primer trimestre de 2025 para el gobierno de Estados Unidos. Hay otro sistema LLNL hermano de El Capitan, Tuoloumne, que es un sistema 208.1 EF. En Italia, HPE Cray también tiene un nuevo sistema nº 6 a 477,9EF basado en AMD MI250X. Frontier se encuentra ahora en 1.353EF en HPL, lo que lo coloca en segundo lugar detrás del Aurora 1.012EF.
Últimas palabras
Por un lado, un sistema a exaescala de 35 MW con decenas de miles de aceleradores es enorme. Por otro lado, los nuevos sistemas de IA están diseñados para ser mucho más grandes que los actuales líderes Top500. La pregunta es qué tan grande es un sistema para ejecutar Linpack. Una vez que haya invertido miles de millones de dólares en la próxima generación de supercomputadoras con inteligencia artificial, la pregunta es si ejecutar Linpack y enviarlo al Top500.
En cierto modo, Microsoft dijo que su supercomputadora más exitosa de hace tres años ahora tiene el tamaño de clúster mínimo para la inferencia de IA, ya que implementa supercomputadoras de inferencia para la inferencia distribuida. Microsoft y otros hiperescaladores tienen enormes clusters que no están en el Top500. Más allá de eso, recientemente presentamos el sistema xAI Colossus con más de 100.000 GPU. Linpack no se ejecutó en este sistema, a pesar de que es mucho más grande que las tres primeras supercomputadoras exaescala Top500.
Sin embargo, todavía queda mucho trabajo científico por hacer y, en trabajos que requieren cálculos de doble precisión, HPE y AMD ocupan ahora la cima con El Capitan.
Si quieres conocer otros artículos parecidos a El Capitán domina el Top500 con una gran victoria HPE y AMD puedes visitar la categoría Noticias MiniPC.
Deja una respuesta