Nyheter

European Exascale superdator JUPITER sätter nya energieffektivitetsstandarder

Den första modulen i exascale superdator JUPITER, som heter JEDI, är rankad på första plats i Green500-listan över de mest energieffektiva superdatorerna världen över, som tillkännages av Forschungszentrum Jülich och EuroHPC Joint Undertaking, tillsammans med ParTec-Eviden superdatorkonsortium vid International Supercomputing Conference (ISC) i Hamburg.

JUPITER Exascale Development Instrument installerades i april av det tysk-franska konsortiet och har samma hårdvara som boostermodulen JUPITER, som för närvarande byggs vid Forschungszentrum Jülich.

Den snabba digitaliseringen och den ökande användningen av artificiell intelligens kräver en ökad mängd datorkraft och i sin tur energi. Datacenter står nu för 4 % av den tyska elförbrukningen, och denna trend ökar. Som ett resultat av detta har effektiv datoranvändning blivit en allt viktigare fråga de senaste åren. Såväl forskning som åtgärder för att öka energieffektiviteten har varit på frammarsch.

Superdatorn JUPITER som upphandlats av det europeiska superdatorinitiativet EuroHPC Joint Undertaking är en verklig pionjär inom detta område. Den första modulen som installerades i april, JUPITER Exascale Development Instrument (JEDI), kan utföra 72 miljarder flyttalsoperationer per sekund och watt. Däremot uppnådde den tidigare ledaren cirka 65 miljarder.

Den avgörande faktorn för modulens enastående effektivitet är dess användning av grafikprocessorer (GPU) och det faktum att det är möjligt att optimera vetenskapliga applikationer för beräkningar på GPU:er. Idag är praktiskt taget alla ledande system på Green500-rankingen starkt beroende av GPU:er, som är designade för att utföra beräkningar med mycket högre energieffektivitet än konventionella centralprocessorer (CPU).

JEDI-utvecklingssystemet är ett av de första systemen i världen som använder den senaste generationens acceleratorer från NVIDIA: NVIDIA GH200 Grace Hopper Superchip, som kombinerar NVIDIA Hopper GPU och NVIDIA Grace CPU på en enda modul. Baserat på Evidens senaste BullSequana XH3000-arkitektur, inkluderar systemet dess högeffektiva varmvattenkylningssystem, Direct Liquid Cooling, som kräver betydligt mindre energi än konventionell luftkylning och gör att värmen som genereras kan återanvändas nedströms.

JUPITER-prekursorn JEDI har redan samma utrustning som den efterföljande JUPITER-boostermodulen. Forskare kan komma åt hårdvaran på ett tidigt stadium av utvecklingen som en del av JUPITER Research and Early Access Program (JUREAP) för att optimera sina koder. Därmed får de stöd av experter från Jülich Supercomputing Centre.

JUPITER exascale superdator

JUPITER kommer att bli den första superdatorn i Europa som överträffar tröskeln på en exaflop, vilket motsvarar en kvintiljon (”1” följt av 18 nollor) flyttalsoperationer per sekund. Det slutliga systemet kommer att installeras i etapper under andra halvan av detta år och kommer initialt att göras tillgängligt för vetenskapliga användare som en del av programmet för tidig åtkomst innan det går i allmän användardrift i början av 2025.

JUPITERs enorma datorkraft kommer att hjälpa till att tänja på gränserna för vetenskapligt simuleringar och att träna stora AI-modeller. Det modulära exascale-systemet använder den dynamiska modulära systemarkitekturen (dMSA) som utvecklats av ParTec och Jülich Supercomputing Centre. JUPITER-boostermodulen, som för närvarande är installerad, kommer att ha cirka 125 BullSequana XH3000-rack och cirka 24 000 NVIDIA GH200 Superchips, sammankopplade med NVIDIA Quantum-2 InfiniBand-nätverk. För 8-bitars beräkningar, som är vanliga för träning av AI-modeller, är beräkningskraften inställd på att öka till långt över 70 exaflops. Från och med idag skulle detta göra JUPITER till världens snabbaste dator för AI.

Enligt uppskattningar kommer JUPITERs energibehov att vara i genomsnitt omkring 11 megawatt. Ytterligare åtgärder kommer att bidra till att använda energin ännu mer hållbart. Det modulära datacentret där JUPITER kommer att inrymmas är designat för att utvinna värmen som genereras under kylning och sedan använda den för att värma upp byggnaderna på campus Forschungszentrum Jülich.

Alla hård- och mjukvarukomponenter i JUPITER kommer att installeras och hanteras av den unika JUPITER Management Stack. Detta är en kombination av ParaStation Modulo (ParTec), SMC xScale (Eviden) och mjukvarukomponenter från JSC.

JUPITER utvecklingssystem JEDI

JUPITER-utvecklingssystemet JEDI är mycket mindre än den slutliga exascale-datorn. Den består av ett enda rack från den senaste BullSequana XH3000-serien, som för närvarande innehåller 24 individuella datorer, så kallade beräkningsnoder.

Dessa är anslutna till varandra via fyra NVIDIA Quantum-2 InfiniBand-switchar och kommer att kompletteras med 24 ytterligare beräkningsnoder under loppet av maj

Under mätningar för Green500-rankningen av de mest energieffektiva superdatorerna, uppnådde JEDI-systemet en beräkningskraft på 4,5 kvadriljoner flyttalsoperationer per sekund, eller 4,5 petaflops, med en genomsnittlig strömförbrukning på 66 kilowatt. Under optimerad drift reducerades strömförbrukningen till 52 kilowatt.

Foto: Panumas Nikhomkhai