nikkytok - stock.adobe.com
LHC CERN: Die Datenmengen mit performanten Disks beherrschen
Drei Generationen von Toshiba-Festplatten helfen dabei, die Hunderte von Terabytes an Daten zu meistern, die der Teilchenbeschleuniger in Genf in jeder Sekunde produziert.
Der Large Hadron Collider (LHC) am Europäischen Kernforschungszentrum CERN in Genf steht an der Spitze der physikalischen Forschung. Die Daten, die die beiden Hadronenstrahlröhren „Run 1“ und „Run 2“ produzieren, sind bereits verwendet worden, um die Existenz eines zuvor unbekannten subatomaren Partikels aufzuzeigen. 2012 gelang es zum Beispiel, die Existenz des Higgs-Boson zu bestätigen.
Die Ausmaße des CERN, der größten physikalischen Versuchsanordnung der Welt, sind beeindruckend. Der kreisförmige Teilchenbeschleuniger hat einen Radius von 4,3 Kilometern; in den Detektoren des LHC können bis zu einer Milliarde Partikelkollisionen pro Sekunde stattfinden. Aber das Beeindruckendste sind die Daten: Die Kollisionen erzeugen jede Sekunde ein Datenvolumen von rund einem Petabyte. Auch nach dem Herausfiltern nur der interessantesten Ereignisse benötigt die Forschungsanlage eine Speicherkapazität von zehn Petabyte pro Monat, um neue Daten für die spätere Analyse zu speichern.
Diese Daten werden im Rechenzentrum des CERN abgespeichert und für die wissenschaftliche Analyse mit 170 Rechenzentren über das Worldwide LHC Computing Grid geteilt. Die aktuelle Speicherlandschaft am CERN besteht aus Festplattenpuffern mit 3.200 JBODs (Just a Bunch of Disks), also Festplatten-Bündeln, die insgesamt 100.000 Festplatten (HDDs) enthalten und auf eine Gesamtspeicherkapazität von 350 Petabyte kommen.
Die Experimente am CERN werden fortgeführt und mit jeder neuen „Runde“ erhöht sich das Datenvolumen beträchtlich. Die Inbetriebnahme einer dritten Hadronenstrahlröhre „Run 3“ ist für 2021 geplant.
Drei Festplatten-Generationen von Toshiba Electronics Europe werden vom CERN eingesetzt, um die riesigen Datenvolumina zu verwalten. Fortschritte in der Speichertechnologie haben die Kapazität der Festplatten erhöht, um mit den steigenden Datenmengen Schritt halten zu können. Fraglich ist jedoch, ob das so weiter gehen kann. Eric Bonfillou, Leiter der Abteilung Anlagenplanung und -beschaffung in der IT-Abteilung, erklärt: „Die geplanten Erweiterungen der LHC-Versuchsanordnung erfordern eine Ausweitung der Rechen- und Speicherkapazitäten, die weit über das hinausgeht, was die heutige Technologie zu bieten hat.“
Zeitraffer: das CERN und skalierender Speicher von Toshiba
Das CERN hat seit 2014 Festplatten des Herstellers im Einsatz. Zentral für die Anforderungen am CERN sind serverbasierte HDDs mit hoher Performance und hoher Zuverlässigkeit, optimiert für höchste Speicherkapazitäten. In den Jahren 2014 bis 2015 setzte das CERN seine Experimente aus, um die Hadronenstrahlröhre „Run 2“ vorzubereiten. In dieser Abschaltphase wurden auch die Speichersysteme ausgebaut; hinzu kamen 24-fache 4HE JBoDs, die mit Festplatten vom Typ MG03SCA400 bestückt sind.
Mit einer Kapazität von vier TByte pro Festplatte, die sich jeweils mit 7.200rpm (Umdrehungen pro Minute) drehen und Daten über eine 6-GBit/s-Schnittstelle empfangen, hat das CERN ein Speichervolumen von 96 TByte pro JBOD-Erweiterungseinheit gewonnen. Die durchschnittliche Betriebsdauer der Festplatten (Mean Time to Failure) betrug 1,2 Millionen Stunden, was einer durchschnittlichen jährlichen Ausfallrate von 0,72 Prozent entspricht.
Mit der Inbetriebnahme von „Run 2“ stiegen die Anforderungen an das Speichervolumen massiv. Das CERN baute sein Speichervolumen aus und nutzte die neuen 6-TByte-SATA-Platten vom Typ MG04ACA600E.
Nochmals, installiert in einem 24-fachen 45HE Frontlader-JBOD, wurde die Speicherkapazität um 144 TByte pro Einheit erhöht. Die durchschnittliche Betriebsdauer dieses Speichertyps hatte sich auf 1,4 Millionen Stunden verbessert, was einer jährlichen Ausfallrate von 0,62 Prozent entspricht.
Ab 2016 beschleunigte Toshiba die Entwicklung und Markteinführung neuer, hochkapazitiver Enterprise-Festplatten, um die Nachfrage nach Cloud-Storage bedienen zu können, und brachte die beiden Generationen MG05 und MG06 auf den Markt. Die MG06 war mit Speicherkapazitäten von bis zu zehn TByte pro Laufwerk verfügbar, und obwohl die Konstruktion noch mit Luft statt mit Helium versiegelt war, ist es dem Hersteller gelungen, die durchschnittliche Betriebsdauer auf 2,5 Millionen Stunden hochzuschrauben. Das entspricht einer jährlichen Ausfallrate von 0,35 Prozent, der niedrigsten damals auf dem Markt verfügbaren Ausfallrate für luftgefüllte HDDs.
In konventioneller magnetischer Aufzeichnungstechnologie gefertigt und mit einem Formfaktor von 3,5 Zoll erreicht die luftversiegelte HDD-Technologie ihre Grenze bei einer Kapazität von sieben Platten, also zehn TByte. Theoretisch ist es zwar möglich, die Kapazität durch den Einsatz dünnerer Platten weiter zu erhöhen, aber Luft ist ein zu schweres Gas und würde zu ernsthaften Störungen bei den Drehbewegungen der Platten führen.
Als Alternative bietet sich Shingled-Magnetic-Recording-Technologie (SMR) an, aber diese Platten erfordern eine besondere Handhabung, um Performance-Probleme zu vermeiden. Ihr Einsatz ist außerdem durch spezielle Dateisysteme begrenzt, die auf die Besonderheiten der Technologie zugeschnitten sind.
Der Speicherausbau am CERN im Jahr 2018 fiel mit der Markteinführung der MG07 vom Anbieter zusammen, der weltweit ersten Server-Festplatte mit bis zu 14 TByte. Mit dem Erwerb der 12-TByte-Variante verdoppelte das CERN seine Speicherkapazität auf 288 TByte pro JBOD. Die MG07 erhöht die Kapazität, ohne den Formfaktor zu ändern, setzt aber Helium statt Luft ein. Dadurch können dünnere Platten ohne die üblichen Störungen mit bis zu neun Platten pro Laufwerk verbaut werden.
Durch den Einsatz des Schreibverfahrens CMR ist die MG07 für jeden Workload geeignet, ohne die Performance-Verluste aufzuweisen, die normalerweise mit SMR einhergehen. Außerdem erzeugt Helium weniger Reibung als Luft und reduziert dadurch die Energie, die benötigt wird, um den Festplatten-Stack zu rotieren. Durch eine präzise Optimierung des Spindel-Motors konnte die für die Helium-basierende MG07 benötigte Betriebsenergie um ein Drittel reduziert werden, von elf Watt auf weniger als sieben Watt. Die Betriebsdauer der MG07 stieg auf 2,5 Millionen Stunden.
Höhere Speicher-Anforderungen durch die „Run 3“
2019 wurde der LHC erneut außer Betrieb genommen, um vor der Inbetriebnahme der „Run 3“ im Jahr 2021 zusätzliche Erweiterungen vorzunehmen. Erwartet wird ein massiver Anstieg der Speicheranforderungen, weil Daten schneller generiert werden. Eric Bonfillou stellt fest: „Die Produkte und der Support von Toshiba haben die strengen Anforderungen des CERN erfüllt. Unsere IT-Infrastruktur, Rechenleistung und Speicherkapazität, konnte mit den Anforderungen der Wissenschaftler gut Schritt halten und hat die hochkapazitiven und zuverlässigen Festplatten optimal genutzt.“
„Die HDDs der nächsten Generation von Toshiba werden dazu beitragen, die Herausforderungen am CERN zuverlässig zu lösen.“
Rainer Käse, Toshiba
Die geplante Markteinführung von 3,5-Zoll-Laufwerken, die auf Conventional Magnetic Recording (CMR, auch als Perpendicular Magnetic Recording, PMR, bekannt) und Shingled Magnetic Recording (SMR) basieren, wird durch den Einsatz von 16-TByte- und 18-TByte-Laufwerken die Kapazität auf 432 TByte pro JBoD steigern.
Langfristig ist der Festplattenhersteller dabei, eine Magnetic-Recording-Technologie der nächsten Generation zu entwickeln, die den 3,5-Zoll-Formfaktor beibehält, aber die Kapazitätsgrenze von 20 TByte pro Laufwerk überschreitet.
Über den Autor:
Rainer Käse, ist Senior Manager Business Development Storage Products bei Toshiba Electronics Europe. Er arbeitet seit über 25 Jahren für Toshiba und startete als Entwickler für ASICs, übernahm dann die Leitung des europäischen ASIC Design Centers und führte schließlich das Team für die Geschäftsfeldentwicklung der ASIC- und Foundry-Produkte. Heute ist er verantwortlich für die Einführung der Toshiba Enterprise Festplatten bei Rechenzentren, Cloud-Service-Providern und Enterprise-IT-Systemen.
Die Autoren sind für den Inhalt und die Richtigkeit ihrer Beiträge selbst verantwortlich. Die dargelegten Meinungen geben die Ansichten der Autoren wieder und entsprechen nicht unbedingt denen von ComputerWeekly.de.