alunablue - stock.adobe.com

Kann künstliche Intelligenz Mehrwert für kalte Daten schaffen?

Unternehmen nutzen gespeicherte kalte Daten, zum Trainieren von KI-Modellen, um mehr Wert aus Daten zu ziehen. Informationen, die eigentlich ihren Zweck erfüllt zu haben schienen.

Die rasante Entwicklung der künstlichen Intelligenz (KI) eröffnet eine neue Welt der Möglichkeiten rund um Daten, die selbst das Lebenselixier für den KI-Erfolg sind. Auch wenn der Fokus zunächst verständlicherweise auf aktiven Daten liegt, bietet sich die Möglichkeit, die riesigen Mengen an kalten Daten, die viele Unternehmen langfristig aufbewahren, anzuzapfen, um Modelle zu trainieren und auf neue Art und Weise Werte zu gewinnen. Es ist noch zu früh, aber die jüngsten Innovationen sollten Unternehmen ermutigen, umfassend und kreativ darüber nachzudenken, wie sie ihre vorhandenen Daten auf neue Art und Weise nutzen können, sowohl für schnelle KI-Erfolge als auch für längerfristige strategische Erfolge.

Die Frage, wie mit kalten Daten umgegangen werden soll, die ihren ursprünglichen Zweck erfüllt haben, aber immer noch im Unternehmen verbleiben, stellt die IT-Abteilungen oft vor eine schwierige Aufgabe, ganz zu schweigen von den Compliance- und Sicherheitsteams. Diese Abteilungen sind sich oft uneins darüber, wie sie diese Daten aufbewahren sollen. Meistens werden diese Daten aus der Not heraus aufbewahrt, zum Beispiel um die Einhaltung von Vorschriften oder gesetzlichen Auflagen zu erfüllen. Viele Unternehmen löschen routinemäßig ältere Daten, um die Kosten niedrig zu halten, die Vorschriften einzuhalten und um ein Problem mit unzulässiger Datenvorhaltung zu vermeiden.

KI treibt die Speichernutzung 

In der Vergangenheit bestand eine der größten Herausforderungen darin, dass Unternehmen oft keinen zwingenden geschäftlichen Grund hatten, alte Daten aufzubewahren- es sei denn aus Compliance-Gründen. Mit dem Aufkommen von KI und anderen Innovationen beginnt sich dies jedoch zu ändern. Einige Unternehmen beginnen damit, ihre kalten Daten quasi aufzuwärmen, da sie zu einem potenziellen Differenzierungsmerkmal werden können.

Dieses große Interesse an der Nutzung kalter Daten für KI wird durch eine aktuelle Studie der Enterprise Strategy Group von TechTarget mit dem Titel Navigating the Cloud and AI Revolution: The State of Enterprise Storage and HCI belegt. KI wurde als die wichtigste Initiative für neue Speicher- und HCI-Projekte im Jahr 2024 genannt.

Einige der jüngsten Entwicklungen sind auffällig. Die erste war die Veröffentlichung von AiR, einem neuen Service des Cloud Object Storage-Spezialisten Wasabi. AiR basiert auf der kürzlich erfolgten Übernahme von Curio durch das Unternehmen und wird als intelligenter Medienspeicherdienst bezeichnet, der mithilfe von KI automatisch Metadaten-Tags zu Rich-Media-Inhalten hinzufügt. Dadurch werden die Inhalte nach Personen, Marken, Logos und anderen Schlüsselwörtern durchsuchbar, und die Nutzer können direkt und schnell auf relevante Inhalte zugreifen.

Mit der Erkenntnis, dass die Speicherung von Objekten ohne Metadaten wie das Internet ohne Suche ist, richtet sich AiR direkt an Medienunternehmen, und Wasabi hofft, dass es dazu beiträgt, kalten Medieninhalten neues Leben einzuhauchen. Die Anwendungsmöglichkeiten scheinen zahlreich zu sein. Beispiele hierfür sind unter anderem ein Vermarkter, der für einen Sponsor arbeitet und ein Bild des Star-Fußballspielers mit dem Logo des Sponsors im Hintergrund finden möchte, oder ein Medienunternehmen, das für bestimmte Regionen möglicherweise anstößige Inhalte finden und ersetzen möchte. Diese Funktionen sind zwar an sich nicht neu, aber Wasabi bietet nicht nur eine moderne Technologie, sondern geht auch auf Kostenfragen ein. Die Abonnenten von AiR zahlen nur für die Speicherung, unabhängig davon, wie oft sie auf ihre Daten zugreifen, sie abfragen oder verschieben. Dies ist ein interessanter Ansatz, um Mediennutzer zu ermutigen, sich mit ihren Archivinhalten zu beschäftigen, ohne dabei übervorteilt zu werden.

Verwendung von Backup-Daten zum Trainieren von KI-Modellen

Ein weiteres Beispiel stammt aus dem Bereich der Data Protection und betrifft eine neue Funktion des SaaS-Backup-Spezialisten Own Company, ehemals OwnBackup. Backup ist der klassische Anwendungsfall für eine Versicherungs-Police, und obwohl Backup-Firmen seit langem über das Potenzial sprechen, diesen zahlreichen Daten für andere Zwecke als die Wiederherstellung nach einem Ausfall oder, in jüngster Zeit, nach Ransomware-Angriffen zu nutzen, sind die Fortschritte nur langsam. Aber KI könnte das Blatt wenden.

Own hat einen Plan, um genau das zu erreichen. Own Discover ist eine neue Funktion, die Kunden dabei helfen soll, ihre Backup-Daten zu aktivieren, indem sie diese zum Trainieren von KI-Modellen verwendet. Dies ist vielleicht kein offensichtlicher Anwendungsfall für Backups, aber Own weist auf mehrere Attribute hin, die sie für eine solche Aufgabe gut geeignet machen: Sie liegen in einem Zeitreihenformat vor, sind organisiert und vollständig zusammengestellt, aktuell und geschützt. Darüber hinaus weist Own Discover darauf hin, dass in historischen SaaS-Daten eine Fülle von Werten steckt, die das Geschäftspotenzial vorantreiben könnten, wie zum Beispiel Umsatz- und Ertragsvorhersagen und die Vorhersage der Kundenabwanderung. Dies ist besonders interessant, wenn man die engen Verbindungen von Own zu Salesforce bedenkt. Own Discover ist nur in begrenztem Umfang verfügbar, und es wird interessant sein zu sehen, wie Kunden auf solche Funktionen reagieren, da sie weiterhin nach schnellen und einfachen KI-Gewinnen suchen.

Nachfrage nach langfristiger Speicherung

Schließlich sollte auch das Speichermedium selbst in Betracht gezogen werden. Unternehmen hatten noch nie eine so große Auswahl an groß angelegten, kostengünstigen Objektspeichern – sowohl für den eigenen Standort als auch in der Cloud. Da jedoch die großen Hyperscale-Cloud-Anbieter die Ausstiegsgebühren (Egress) für Kunden, die diese Plattformen verlassen möchten, senken und viele Unternehmen ihre wertvollsten Daten lieber vor Ort behalten möchten, könnte sich die KI als Katalysator für Alternativen erweisen.

Eine Option, die hier zunehmend ins Spiel kommt, ist Bandspeicher. Obwohl es leicht ist, Bänder als eine veraltete Technologie zu betrachten, spielen sie in vielen Rechenzentren weiterhin eine wichtige Rolle, auch in einigen der größten Rechenzentren der Welt. Wenn wir davon ausgehen, dass die Möglichkeiten der künstlichen Intelligenz im Zusammenhang mit kühlen oder kalten Daten mehr Unternehmen dazu veranlassen werden, ihre Daten länger aufzubewahren, dann folgt daraus, dass angesichts steigender Speicherkosten, Energiebeschränkungen und Umweltaspekte auch die Nachfrage nach kosteneffizienter Langzeitspeicherung in großem Umfang steigen wird.

Dementsprechend reagieren die Anbieter von Bandsystemen auch hier mit zunehmend integrierten Systemen, die bandbasierte Archivierung mit festplattenbasierten Objekt- oder Dateispeichersystemen kombinieren. Angebote wie das Glacier-Produkt von Spectra Logic kombinieren beispielsweise das BlackPearl-Datei- und Objektspeichersystem des Bandspezialisten mit Amazon S3-API-Kompatibilität mit seiner Palette an Bandbibliotheken. Spectra Logic hat kürzlich seine Bibliotheksverwaltungssoftware überarbeitet und eine neue Spectra-Cube-Bibliothek hinzugefügt. Ziel ist es, Kunden anzusprechen, die keine Erfahrung mit Bandbibliotheken haben und die Unterstützung für moderne, Cloud-basierte und KI-Anwendungen benötigen.

Dies sind nur einige Beispiele aus der jüngsten Vergangenheit, die das enorme Potenzial kalter, langfristig gespeicherter Daten verdeutlichen. Zweifelsohne werden auf dem Weg dorthin Hürden auftauchen – nicht zuletzt regulatorische –, aber die Chance, neuen Wert aus aufbewahrten Daten zu erschließen, scheint beträchtlich.

Die Autoren sind für den Inhalt und die Richtigkeit ihrer Beiträge selbst verantwortlich. Die dargelegten Meinungen geben die Ansichten der Autoren wieder.

Die Enterprise Strategy Group ist ein Geschäftsbereich von TechTarget. Ihre Analysten unterhalten Geschäftsbeziehungen zu Technologieanbietern.

Erfahren Sie mehr über Künstliche Intelligenz (KI) und Machine Learning (ML)