alunablue - stock.adobe.com

So will sich Europa im Exascale-Rennen behaupten

High Performance Computing schwingt sich weltweit in immer größere Höhen. Im Rennen um Exascale haben Japan, China und die USA die Nase vorn. Doch Europa verfolgt eigene Pläne.

In den vergangenen Jahren haben wir einen enormen Fortschritt bei der Einführung digitaler Technologien erlebt, vom High Performance Computing (HPC) und der Big-Data-Analytik hin zu künstlicher Intelligenz (KI) und Machine Learning (ML). Das Potential dieser Technologien, bisher undenkbare wissenschaftliche Berechnungen zu bewältigen, trifft mit dem Wettbewerbsdruck aus der Wirtschaft zusammen, neue Produkte schneller zu entwickeln und testen.

Supercomputer, auch Rechen- oder Parallelcluster genannt, verarbeiten komplexe Simulationen, indem sie Rechenprobleme in kleinere Jobs aufteilen – diese laufen gleichzeitig auf mehreren Serverknoten, die über ein schnelles Netz miteinander verbunden sind. Das Preis-Leistungs-Verhältnis solcher Systeme verbessert sich stetig, so dass HPC erschwinglicher wird. Heutzutage schafft ein mit Rechen-GPUs ausgestatteter Server eine Berechnung, die vor zwanzig Jahren auf einem Multi-Millionen-Euro-System Wochen gedauert hätte, in nur wenigen Stunden.

HPC war früher nur Bildungseinrichtungen und Großunternehmen vorbehalten. Heute ist es auch für kleinere Unternehmen zugänglich, da Public Clouds und Community-Rechenzentren Kapazitäten auf Abruf anbieten und Kunden nur für die tatsächliche Rechenzeit der Kerne und die damit verbundenen Services bezahlen.

IT-Teams lösen mit HPC ein breites Spektrum komplexer Probleme, zum Beispiel im Bereich der Produktoptimierung und im Elektronikdesign, bei Kreditanalysen und der Betrugserkennung, Pharmakologie und Medizin, Öl- und Gasexploration, Klimaforschung und Wettervorhersage, Rendering, Vor- und Nachbearbeitung von Filmen und so weiter.

Die heute im HPC-Bereich verwendete Hardwarearchitektur mit mehreren GPUs weist viele Ähnlichkeiten mit KI- und ML-Implementierungen auf – die Überschneidung zwischen diesen Technologien bringt fortschrittlichere KI-Lösungen in den Mainstream. Optimierte Rechencluster bewältigen das Erstellen von Trainingsmodellen auf Basis immer größerer Datensätze.

So wie Cloud Computing Unternehmen neue Möglichkeiten eröffnet hat, mit ihren Kunden in Kontakt zu treten und ihre Prozesse zu beschleunigen, wird die nächste Generation des Supercomputing weitere Innovationen auf den Weg bringen. Die Geschwindigkeit von Forschung und Entwicklung sowie die Produktentwicklung wird weiterhin zunehmen.

Eine neue Ära des Supercomputing

Von 2002 bis 2009 verdoppelte sich die Leistung von Supercomputern fast alle 12 Monate. Von 2009 bis 2019 sank diese Rate auf alle 2,3 Jahre – dies ist auf verschiedene Faktoren wie die Verlangsamung des Mooreschen Gesetzes und technische Einschränkungen wie die Dennard-Skalierung zurückzuführen.

Doch Technologen haben innovative Wege gefunden, um diese Faktoren zu überwinden und das so genannte Exascale-Zeitalter der Datenverarbeitung einzuleiten. Ein Exascale-System ist ein System, das eine Quintillion Gleitkommaoperationen pro Sekunde (FLOPS) ausführen kann. Das sind eine Milliarde Milliarden – oder 1.000.000.000.000.000.000. Exascale-Maschinen führen somit Berechnungen fünfmal schneller als die heutigen Spitzen-Supercomputer und bewältigen auch komplexere Modelle mit höherer Genauigkeit.

Um diese neuen Höchstleistungen zu erreichen, verfolgen Ingenieure einen heterogenen Ansatz, der aus integrierten CPUs und GPUs und einer iterativen Optimierung sowohl der Hardware als auch der Software besteht, um neue Leistungs- und Effizienzniveaus bei geringeren Kosten pro FLOPS zu erreichen.

Nirgendwo wird dies besser demonstriert als mit dem Supercomputer Frontier, der in der Oak Ridge Leadership Computing Facility in den USA entwickelt wird und der als erster betriebsbereiter Exascale-Supercomputer der Welt Geschichte schreiben wird, wenn er im Laufe dieses Jahres in Betrieb wird. Die Maschine, die Innovationen in Wissenschaft und Technologie beschleunigen und den USA helfen wird, ihre Führungsrolle in den Bereichen Hochleistungsrechnen und KI zu behaupten, wird eine Spitzenrechenleistung von mehr als 1,5 Exaflops bieten. Ein noch leistungsfähigeres System der Exascale-Klasse, genannt El Capitan, wird voraussichtlich 2023 in den Lawrence Livermore National Labs in den USA gebaut.

Roger Benson, AMD

„Europa will nun Hardware, die die Leistung des weltweit schnellsten Supercomputers Fugaku in Japan übertrifft. Das ist ein ehrgeiziges und komplexes Projekt, das Zeit braucht. Deshalb ist die Demokratisierung von HPC so wichtig.“

Roger Benson, AMD

Japan war mit seinem eigenen Supercomputer FUGAKU mit einer Spitzenleistung von 1,42 Exaflops als erstes auf dem Markt, und China betreibt Berichten zufolge ein weniger bekanntes Sunway-Oceanlite-System mit 1,32 Exaflops Spitzenleistung. Wo steht also Europa in diesem Rennen?

Die europäische Exascale-Mission

Europa ist dafür bekannt, dass es in fast allen Bereichen eigene Wege geht. Und das ist auch beim Supercomputing nicht anders.

Während China und die USA versuchen, die Führung im Supercomputing zu übernehmen, verfolgt Europa mit dem staatlich finanzierten European High-Performance Computing Joint Undertaking (EuroHPC) – das von der Partnership for Advanced Computing in Europe (PRACE) initiiert und vorangetrieben wird – einen eher kooperativen Ansatz. Die Initiative bündelt Ressourcen, um eine integrierte europäische HPC- und Dateninfrastruktur von Weltklasse zu finanzieren und ein innovatives Supercomputing-Ökosystem zu schaffen.

Die Bemühungen des Kontinents in Sachen Supercomputing werden auch von Horizon Europe unterstützt, einem auf sieben Jahre angelegten Rahmenprogramm der Europäischen Union für wissenschaftliche Forschung. Fast 80 Milliarden Euro werden investiert, um Entdeckungen und Weltneuheiten voranzutreiben, darunter auch die Entwicklung von Exascale-Rechnern in der EU.

Dieser einzigartige Ansatz hat zu einer Reihe von Durchbrüchen auf dem europäischen Supercomputing-Markt geführt und ermöglicht es Forschern auf dem ganzen Kontinent, Projekte in Angriff zu nehmen, die früher als unerreichbar galten.

Ein Beispiel ist der Hawk-Supercomputer, der derzeit auf Platz 24 der TOP500-Liste der schnellsten Supercomputer der Welt steht und an der Universität Stuttgart (HLRS) installiert ist. Diese Maschine – ein HPE Apollo 9000 System mit 5.632 Knoten, die sich auf 44 Schränke verteilen – liefert eine Spitzenleistung von rund 26 Petaflops und dient der akademischen und industriellen Spitzenforschung in einem breiten Spektrum von Kontexten. So ermöglicht das HLRS beispielsweise Kunden aus der Automobilbranche die Durchführung von Strukturanalysen und Strömungssimulationen.

Außerdem gibt es Lumi, eine Pre-Exascale-Maschine im IT Centre for Science (CSC) in Kajaani, Finnland, welche die Leistungsfähigkeit dieser nächsten Ära des Supercomputing demonstriert. Lumi nutzt eine ähnliche Technologie wie Frontier und wird in der Lage sein, mehr als 375 Petaflops oder mehr als 375 Millionen Milliarden Berechnungen pro Sekunde auszuführen, mit einer theoretischen Spitzenleistung von mehr als 550 Petaflops pro Sekunde.

Was Pre- und Exascale-Maschinen besonders interessant macht, ist die Speicherkohärenz. Diese Technologie, die noch nicht für den allgemeinen Markt verfügbar ist, bedeutet, dass es eine einzige Kopie der Daten gibt, auf die sowohl die CPU als auch die GPUs zugreifen, ohne dass für beide getrennte Versionen vorhanden sein müssen. Das wiederum reduziert den Programmieraufwand, verbessert die Leistung und setzt Systemressourcen frei, so dass Spitzensysteme wie Lumi effizienter arbeiten können.

Lumi verfügt außerdem über eine innovative Free-Cooling-Technologie, durch die überschüssige Wärme in Kajaani genutzt werden kann, um so die Kosten und den CO2-Fußabdruck weiter zu senken. Es wird erwartet, dass diese Technologie den jährlichen CO2-Fußabdruck der gesamten Stadt um 13 500 Tonnen reduzieren wird – eine Menge, die dem Ausstoß von 4000 PKWs entspricht.

Dank dieser enormen Rechenkapazität ermöglicht die Maschine, die bereits zu den weltweit besten Supercomputern gehört, europäischen Forschern die Lösung von Problemen in verschiedenen Bereichen, vom Wetter über Cybersicherheit bis hin zur Arzneimittelentdeckung und personalisierten Medizin. Mit Lumi erstellen Klimawissenschaftler hochauflösende Modelle, die genauere Erkenntnisse über die Auswirkungen des Klimawandels liefern.

Auf dem Weg zu Exascale erkennt Europa das enorme Potential dieses Leistungsniveaus. Diese Systeme werden dazu beitragen, die komplexesten wissenschaftlichen Forschungsfragen zu lösen, sie werden es den Wissenschaftlern ermöglichen, genauere geologische und Klimamodelle zu erstellen, und sie werden neue Studien über das Universum, von der Teilchenphysik bis zur Entstehung von Sternen, voranbringen.

Europa will nun Hardware, die die Leistung des weltweit schnellsten Supercomputers Fugaku in Japan übertrifft. Das ist ein ehrgeiziges und komplexes Projekt, das Zeit braucht. Deshalb ist die Demokratisierung von HPC so wichtig.

Mit Technologien, die bereits in einigen der schnellsten Rechner der Welt zum Einsatz kommen, sowie mit dem Zugang zu einer Reihe von Standard-Open-Source-Software-Tools zur Optimierung und Skalierung von Supercomputing-Workloads, ist Europa bereits in der Lage, komplexe Probleme zu lösen und die Vorteile des Exascale-Computing zu nutzen. Allerdings müssten sich mehrere europäische Länder weiterhin auf die Entwicklung der Hardware, Tools und skalierbarer Software konzentrieren und in diese investieren, wenn Europa ernsthaft eigene, einzigartige Systeme der Exascale-Klasse betreiben will.

Über den Autor

Roger Benson leitet das AMD Data Center- und Embedded Solutions-Business in Europa. Er verfügt über mehr als 20 Jahre Erfahrung in der Optimierung der Markt- und Kundenmöglichkeiten mithilfe neuer, hochleistungsfähiger Technologien.

Die Autoren sind für den Inhalt und die Richtigkeit ihrer Beiträge selbst verantwortlich. Die dargelegten Meinungen geben die Ansichten der Autoren wieder.

Erfahren Sie mehr über Data-Center-Infrastruktur