Definition

Petabyte (PByte, PB)

Was ist ein Petabyte?

Ein Petabyte ist ein Maß für die Memory- oder Storage-Kapazität, das 2 hoch 50 Bytes entspricht. Ein Petabyte besteht aus 1.024 Terabyte (TB) und ein Exabyte aus etwa 1.024 PB.

Herkömmliche Netzwerkspeicher (NAS) sind skalierbar und in der Lage, Petabytes an Daten zu verarbeiten, aber es kann zu viel Zeit in Anspruch nehmen und zu viele Ressourcen verbrauchen, wenn man den organisierten Speicherindex des Systems durchgeht.

Was den Arbeitsspeicher (Memory) betrifft, so enthält ein typischer Laptop oder Desktop-Computer häufig 16 GigabyteArbeitsspeicher (RAM). Ein Highend-Server kann bis zu 6 TB RAM enthalten. Das bedeutet, dass 170 Spitzen-Server – oder etwa 61.000 Desktops – erforderlich wären, um ein einziges Petabyte RAM zu erreichen.

Ein weiteres Beispiel dafür, wie groß ein Petabyte ist: Eine typische DVD enthält 4,7 GB an Daten. Das bedeutet, dass ein einziges Terabyte Speicherplatz für 217,8 Filme in DVD-Qualität bieten könnte, während ein einziges Petabyte dem Speicherplatz für 223.101 Filme in DVD-Qualität entspricht.

Abbildung 1: Petabyte im Vergleich zu anderen Maßeinheiten für Speicherkapazität.
Abbildung 1: Petabyte im Vergleich zu anderen Maßeinheiten für Speicherkapazität.

Anbieter von Petabyte-Speicherlösungen

Noch vor einem Jahrzehnt rühmten sich die Anbieter von Datenspeichern damit, dass sie insgesamt ein oder zwei Petabyte in allen verkauften Speichersystemen an Kunden veräußerten. Aufgrund des anhaltenden rasanten Anstiegs der Anforderungen an die Datenspeicherkapazität ist es mittlerweile üblich, dass einzelne Unternehmen und sogar einzelne Speichersysteme mehr als ein Petabyte Speicherkapazität haben.

Zu den Speicheranbietern, die Storage auf Petabyte-Ebene anbieten, gehören unter anderem die folgenden:

  • Fujitsu
  • Qnap
  • Spectra Logic
  • StoneFly
  • Vast Data

Backups und Storage im Petabyte-Bereich

Andere Datenspeichertechnologien können Backups und Archivierungen im Petabyte-Bereich durchführen. Das umfasst die nachstehenden:

  • Snapshots und andere festplattenbasierte Backup-Technologien liefern eine lokale Kopie der Daten und ermöglichen eine schnelle Wiederherstellung.
  • Bänder und die Cloud bieten relativ kostengünstige Backup-Optionen für Daten im Petabyte-Bereich, werden aber eher als externe Archivierungsspeicher und nicht als Primärspeicher verwendet.
  • Solid-State-Speicher können Petabytes an Daten mit viel höherer Geschwindigkeit verarbeiten und vorhalten, ohne die Datenintegrität zu beeinträchtigen.
  • Beim Object Storage wird jedem Objekt eine eindeutige Kennung zugewiesen, so dass das System große Datenmengen in einem flachen Bereich durchsuchen kann, anstatt einen kompletten Speicherindex zu durchsuchen, um eine bestimmte Datei zu finden.
Abbildung 2: Ein Vergleich verschiedener Maßeinheiten an realen Beispielen.
Abbildung 2: Ein Vergleich verschiedener Maßeinheiten an realen Beispielen.

Petabytes und große Datenmengen

Es gibt keine bestimmte Datenmenge, die als Big Data gilt, aber der Begriff bezieht sich oft auf Informationen im Petabyte- oder sogar Exabyte-Bereich. Die Suche nach Informationen in Petabyte großen Datenmengen ist eine zeitaufwändige Aufgabe. Unternehmen, die mit Big Data arbeiten, verwenden häufig das verteilte Dateisystem Hadoop, da es die schnelle Datenübertragung erleichtert und einen unterbrechungsfreien Betrieb des Systems bei der Arbeit mit Petabytes von Daten ermöglicht.

Um ein Gefühl dafür zu bekommen, wie groß manche Datenspeicher geworden sind, gab das europäische Forschungszentrum CERN im Juli 2017 bekannt, dass sein Rechenzentrum 200 PB in seiner Bandbibliothek archiviert.

Angesichts der zunehmenden Verwendung von 4K-Videos und dem Aufkommen des Internets der Dinge prognostizierte IDC, dass bis 2025 175 Zettabytes – oder etwa 175.000.000 PB – an Daten gespeichert werden müssen.

 

Diese Definition wurde zuletzt im April 2024 aktualisiert

Erfahren Sie mehr über Disk-Systeme