escapejaja - stock.adobe.com

Vier Probleme bei NVMe-Storage verhindern

SSDs finden sich in immer mehr Storage-Geräten. NVMe ist die geeignete Plattform für diese neue Generation von Arrays und kann mehr Performance und geringere Latenzen garantieren.

NVMe setzt sich rasch durch, da die Unternehmen von seinen Vorteilen bei Performance und niedrigen Latenzen profitieren wollen.

SSDs mit NVMe machen laut G2M Research bereits mehr als die Hälfte aller Auslieferungen von Enterprise-SSDs aus. Wie G2M berichtet, bieten nun außerdem alle größeren Hersteller von All-Flash Arrays NVMe- und NVMe-oF-basierte All-Flash-Arrays (AFAs) an. Und das gesamte NVMe-Ökosystem soll bis 2021 65 Milliarden Dollar umfassen.

Die Storage-Industrie entwickelte NVMe vom Beginn an für SSDs, wobei besonderer Fokus auf die Verbesserung von Durchsatz und IOPS sowie auf die Reduzierung der Latenzen gelegt wurde. Deshalb ist das Protokoll hilfreich dabei, bestehende Bottlenecks der Speicherinfrastruktur zu überwinden, die aus dem Einsatz von SSDs mit traditionellen Interfaces wie zum Beispiel SATA und SAS stammten, die früher für Festplatten entwickelt worden waren. Aber mit diesen Vorteilen sind auch Schwierigkeiten verbunden, da die neue Technologie Schwachstellen in anderen Teilen der Speicherinfrastruktur aufdeckt. Die vollen Auswirkungen von NVMe auf die Unternehmen kommen nun richtig zum Tragen – sowohl in positiver als auch in problematischer Hinsicht.

Man sollte auf mögliche Probleme gefasst sein, wenn sich das eigene Unternehmen weiterhin in Richtung Installation von NVMe bewegt. Im Folgenden gehen wir auf einige Speicherprobleme mit NVMe näher ein, wie man sie verhindern kann und wie man sie in den Griff bekommt, wenn es doch passiert.

Bescheid wissen darüber, was man einkauft

Man sollte sich davor hüten, zu glauben, alle NVMe-SSDs wären gleich. Sie sind es nicht, und es zahlt sich aus zu wissen, was man bekommt, bevor man sich zum Kauf entschließt.

NVMe-SSDs unterscheiden sich in der Haltbarkeit oder Lebensdauer, in der I/O-Konsistenz und in der Quality of Service. Und während die Preise heruntergehen, kann ein niedriger Preis auch geringere Lebensdauer oder weniger Performance bedeuten. Man sollte deshalb das Kleingedruckte studieren und jede Menge an Fragen stellen. Bei Arrays sollte man darauf achten, welche Art von Management-Software integriert ist, welchen Support-Level man für NVMe bekommt und wie das die Performance tangiert.

Zusätzlich sollte man jedes neue geplante Produkt daraufhin überprüfen, ob es voll NVMe-konform ist. Zum Beispiel sind einige eher proprietäre Produkte als konform ausgegeben worden, bieten aber eventuell nicht die erwartete Performance, Lebensdauer und Kostenersparnis. Man sollte sicherstellen, dass alle in Erwägung gezogenen Produkte den NVMe-Spezifikationen entsprechen und Tests für NVMe-Compliance bestanden haben.

In diesem Artikel kann man überprüfen, auf welche anderen Probleme man bei NVMe-Storage achten sollte.

Vorsicht bei der Performance-Lücke

Was NVMe-AFAs angeht, hängt die Performance-Verbesserung von der eingesetzten Architektur ab. Herkömmliche AFAs, die das NVMe-Protokoll nutzen, verbessern im allgemeinen die Performance um etwa 20 Prozent, aber neuere Entwicklungen sollten eine deutlich höhere Performance-Verbesserung liefern.

Diese Performance-Lücke bei NVMe-Umgebungen gibt es, weil nicht alle AFA-Controller die vollen Performance-Vorteile von NVMe-SSDs zur Entfaltung bringen. Unternehmen können optimale Performance erhalten, wenn sie AFAs mit End-to-End-Connectivity für NVMe benutzen. Diese Arrays verwenden NVMe-oF, um Hosts über Netzwerke mit Fibre Channel (FC) und Ethernet am Frontend zu verbinden und sie stellen Backend-Verbindungen mit NVMe-SSDs zur Verfügung.

Dieser Ansatz versetzt Hosts in die Lage, das ursprüngliche NVMe-Protokoll zu verwenden, um sich direkt mit den NVMe-SSDs zu verbinden und eigene NVMe-Kommandos über Ethernet- und FC-Netzwerke zu versenden, die die Array-Controller passieren.

Die Storage-Industrie entwickelte NVMe vom Beginn an für SSDs, wobei besonderer Fokus auf die Verbesserung von Durchsatz und IOPS sowie auf die Reduzierung der Latenzen gelegt wurde.

Mit einer Composable Infrastructure aus verschiedenen Elementen wird es auch weitere Optionen geben, die NVMe-Performance zu verbessern. Siehe hierzu auch diesen Artikel.

Die Struktur der File-Systeme sollte nicht NVMe-Storage ausbremsen

Mit NVMe besteht das Problem, dass diese Technologie nicht Schwachstellen in anderen Teilen der Speicherinfrastruktur verstecken kann. Jede schwache Stelle irgendwo wird dazu fūhren, dass die Latenzen zunehmen werden und so die eigentliche Stärke von NVMe bei Latenzen außer Kraft gesetzt wird.

Das File-System ist eine dieser Schwachstellen, die einen Bottleneck verursachen kann. Die meisten NVMe-Speichersysteme sind für Block Storage entwickelt worden, um die Performance-Probleme von File-Systemen zu umgehen. Aber die meisten modernen Anwendungen wie zum Beispiel Artificial Intelligence (AI), Machine Learning (ML) oder Data Analytics sind auf ein File-System angewiesen, so dass ein solches oft zu Block Storage hinzugefügt wird. Bei allen traditionellen File-Systemen gehen alle I/O-Prozesse durch einen primären Knoten hindurch, den sehr schnelle Workloads leicht überwinden können.

Es gibt zwei Arten von File-Systemen, um dieses Problem zu vermeiden. Man sollte sich nach solchen umsehen, die direkt auf NVMe-Laufwerke schreiben, anstatt den Weg über den I/O-Stack des Betriebssystems zu wählen. Als Alternative sind jene geeignet, die über NVMe-oF kommunizieren, wodurch sie effizienter mit Metadaten zurechtkommen.

Mehr Details über das Design von File-Systemen und wie man es verhindert, dass sie zu einem Problem von NVMe-Storage werden, gibt es hier nachzulesen.

Wie man das Management-Problem von NVMe-Storage bewältigt

Wenn man alle NVMe-SSDs und -Arrays  vor Ort aufgestellt hat, braucht man eine Methode, um sie zu verwalten. Glücklicherweise stellt die vor kurzem verabschiedete Spezifikation NVMe Management Interface (NVMe-MI) eine Infrastruktur für das Management von NVMe-Geräten zur Verfügung, und zwar sowohl für die direkte Out-of-Band- als auch für die In-Band-Verwaltung von NVMe-Subsystemen. Die Spezifikation definiert einen Kommandosatz und eine Architektur zur Kontrolle von NVMe-Storage. Sie ermöglicht auch entfernte Management-Applikationen, um NVMe-Geräte zu erkennen, zu überwachen und Updates aufzuspielen.

NVMe-MI erfordert keine spezifischen NVM-Speichergeräte, Systemprozessoren oder Betriebssysteme. Die Spezifikation empfiehlt auch keine besonderen Anwendungsmodelle. Ihr Ziel ist es, ein allgemeines Management-Interface zur Verfügung zu stellen, das von den jeweiligen Installationsdetails abstrahiert. Die NVMe-MI-Infrastruktur umfasst vier Schichten – Anwendung, Protokoll, Transport der Botschaften und physische Struktur –, die zusammenarbeiten, um den gesamten managementbezogenen Nachrichtenverkehr zu erledigen.

Mehr Informationen über diesen wesentlichen Schritt vorwärts beim effektiven Management von NVMe-Geräten gibt es hier in diesem Bericht.

Nächste Schritte

Darum eignet sich NVMe für KI-Anwendungen

Weitere Tipps zur Fehlervermeidung beim NVMe-Einsatz

So funktioniert NVMe over TCP

Erfahren Sie mehr über Storage-Hardware