Sergey Nivens - stock.adobe.com

Tipps für den Speicher für Künstliche-Intelligenz-Workloads

Firmen mit KI-Projekten benötigen effektive Optionen, große Mengen komplexer Daten zu speichern, abzurufen und gemeinsam zu nutzen. Wir geben Tipps für Storage-Implementierung.

Trotz der zunehmenden Akzeptanz in Unternehmen bleibt die KI-Technologie (Künstliche Intelligenz, KI) ein sich entwickelndes und anspruchsvolles Konzept. Für die meisten Unternehmen gibt es noch viel über KI und ihre Speicheranforderungen zu lernen.

Glücklicherweise gibt es bestimmte Richtlinien und Best Practices, die IT-Teams befolgen können, um effizientes Storage für KI-Workloads zu gewährleisten.

Der Bedarf an KI-Speicher

Da sich KI-Anwendungen branchenübergreifend ausbreiten, wird die Technologie immer allgegenwärtiger werden, so Adrian Zidaritz, Autor von AIbluedot.com, einer Website, die sich mit KI-Themen befasst, und ehemaliger Leiter des Bereichs Data Science bei Collective[i], einem KI-Beratungsunternehmen.

„Deshalb ist es für Unternehmen wichtig, ihre KI-basierten Projekte mit einer kompatiblen und effizienten Speichertechnologie abzustimmen“, so Zidaritz.

Storage für KI sorgt für eine bessere Nutzung von KI-basierten Workloads und verbessert das Nutzererlebnis durch einfach zu teilende Daten, so Anthony Ciarlo, AI Leader, Ecosystems and Alliances, bei der Unternehmens- und Technologieberatungsfirma Deloitte Consulting.

„Firmen mit der richtigen Datenstrategie haben schnellere Berichtszeiten, eine höhere Agilität und eine breitere Datentiefe, die sie im Vergleich zu traditionellen Umgebungen analysieren können“, so Ciarlo.

Zu den wichtigsten Vorteilen gehören:

  • Die Fähigkeit, große Datenmengen in einem Bruchteil der Zeit des traditionellen Reportings zu analysieren und zu nutzen.
  • Verbesserte Sicherheitsmaßnahmen und Zugriffsprotokolle. Mit Storage für KI können Unternehmen Regeln aufstellen, die festlegen, wer wann Zugriff hat. Dies ermöglicht einen einfachen Datenaustausch und sorgt für einen sichereren Datensatz, was sowohl die Betriebs- als auch die Compliance-Kosten reduziert.
Abbildung 1: Nach Schätzungen werden sich die Ausgaben für KI bis zum Jahr 2023 nahezu verdreifachen.
Abbildung 1: Nach Schätzungen werden sich die Ausgaben für KI bis zum Jahr 2023 nahezu verdreifachen.

Eine ausgereifte Data-Engineering-Infrastruktur ermöglicht es Anwendern, die benötigten Informationen schneller zu finden, so John Langton, Director of Applied Data Science beim Management-Beratungsunternehmen Wolters Kluwer.

„Sie ermöglicht auch die Nutzung von Daten für verschiedene Zwecke, vom Berichtswesen über Analysen bis hin zu fortgeschrittenen KI-Projekten“, so Langton.

Effektive Speicher- und Datenmodelle – sowie Extrahier-, Transformierungs- und Ladeprozesse – helfen Anwendern dabei, Aktivitäten zu rationalisieren, so dass sich Unternehmen auf Analysen konzentrieren können, anstatt Daten zu transformieren.

Speicher für KI bereitstellen

Die meisten KI-Projekte verwenden eine Kombination aus Block- und Objektspeicher, so Goutham Belliappa, Vice President für KI-Engineering beim Business- und IT-Beratungsunternehmen Capgemini.

„Ein Blockspeicher funktioniert am besten für direkte Benutzerinteraktion, wie ein Dateisystem, eine Datenbank oder jede Anwendung, die hoch performante Lese- und Schreibvorgänge erfordert“, so Belliappa.„Ein Objektspeicher hingegen bietet Haltbarkeit und Flexibilität, wo Anwendungen – wie ein Graphenspeicher, ein Videoplayer oder ein anderer Mechanismus, der den Index und die Speicherorte versteht – auf Daten zugreifen können, die einmal geschrieben und viele Male gelesen werden.“

Deswegen sollten Anwender den Speichertyp an den Verwendungszweck anpassen.

„Vermeiden Sie Abstraktionen, die Ihnen beispielsweise eine Blockspeicher-ähnliche Struktur über einem Objektspeicher geben, wo Sie am Ende das Schlechteste von beiden bekommen“, erklärt Beliappa.

Arbeiten Sie daran, die Dateigrößen in komplexen Umgebungen zu begrenzen, zum Beispiel in Umgebungen, die Spark für die Parallelverarbeitung und Parquet-Dateien verwenden. Die Art und Weise, wie Dateien partitioniert werden, wirkt sich ebenfalls drastisch auf die Leistung aus und führt zu einem schnelleren Abruf von Daten.

Berücksichtigen Sie die Cloud

Die Cloud – genauer gesagt, die Public Cloud – sollte bei der Evaluierung von KI-Speicherstrategien ganz oben auf der Liste stehen, so Ciarlo.

„Hier finden Sie die neuesten Innovationen und Fähigkeiten, die nur in der Cloud nativ verfügbar sind“, betont er.

Objektspeicher beispielsweise sind auf die Cloud ausgerichtet, und die Cloud ermöglicht die gemeinsame Nutzung und den Austausch von Daten. „Ohne die Weiterentwicklungen der Cloud-Technologien wäre KI-Storage keine effiziente oder vollständige Strategie“, meint Ciarlo.

Erfahren Sie mehr über Storage Management