So optimiert Cohesity Turing Data Protection und Backups
In Partnerschaft mit Google und Vertex AI entwickelte der Anbieter Turing, eine Sammlung an KI- und ML-Technologien, die das Backup und so die Data Protection optimieren sollen.
Cohesity Turing ist eine Sammlung von KI/ML-Fähigkeiten und -Technologien, die in die Multi-Cloud-Datenplattformund -Lösungen des Herstellers integriert sind. Mit dem Aufkommen neuer KI-Bedürfnisse plant Cohesity, das Portfolio der von Cohesity Turing angebotenen und betriebenen Technologien weiter auszubauen und gleichzeitig seinen Kunden eine verantwortungsvolle und sichere Nutzung von künstlicher Intelligenz (KI) zu ermöglichen. Dabei wird laut Anbieter die Leistungsfähigkeit der KI mit der Datensicherheit und den Verwaltungsprozessen und -prinzipien verbunden.
Mit Turing sollen Unternehmen KI-Funktionen nutzen, um effizientere Abläufe voranzutreiben, einen besseren Einblick in Sicherheitsrisiken zu erhalten und mehr Wert aus Daten zu schöpfen. Diese Tools können für eine Vielzahl von Zwecken eingesetzt werden, zum Beispiel für die Erkennung und Löschung von Backups und Ransomware sowie für die Gewinnung tieferer Einblicke aus Kundendaten. Die Lösung ist sowohl am eigenen Standort als auch in der Cloud verfügbar. Turing ist Teil der erweiterten Partnerschaft von Cohesity mit Google Cloud.
Eine Auswahl von KI/ML-Funktionen des Tools umfasst:
- Erkennung von Ransomware-Anomalien: Verwendet fortschrittliche Modellierung und Datenentropie-Erkennung, um Anomalien in den aufgenommenen Daten zu erfassen, was frühe Warnungen vor einer versteckten Bedrohung mit geschützten Daten liefern kann.
- Retrieval Augmented Generation (RAG): Eine Technologie zur Verarbeitung natürlicher Sprache (NLP), die dazu verwendet werden kann, textbasierte Antworten auf Kundenanfragen zu generieren.
- Maschinelles Lernen: Turing nutzt Algorithmen des maschinellen Lernens, um Kunden dabei zu helfen, tiefere Einblicke aus ihren Daten zu gewinnen.
- Verarbeitung natürlicher Sprache (NLP): Turing nutzt Natural Language Processing, um Kunden bei der Analyse und dem Verständnis unstrukturierter Daten zu unterstützen.
- Suche und Erkennung von Bedrohungen: Bietet hochgradig kuratierte und verwaltete Bedrohungs-Feeds, die in Verbindung mit Modellen für maschinelles Lernen verwendet werden, die auf Millionen von Beispielen trainiert wurden, um Bedrohungen genau zu erkennen und Unternehmen automatisch auf dem neuesten Stand zu halten. Turing setzt KI ein, um Datensätze zu hinterfragen und ermöglicht so die Suche nach Bedrohungen, deren Erkennung und die Erstellung von Push-Warnungen.
- Datenklassifizierung: Sorgt dafür, dass Unternehmen ihre sensibelsten Daten und deren Speicherort identifizieren können.
- Vorausschauende Kapazitätsplanung: Ermöglicht Kunden die Einhaltung aktueller und zukünftiger SLAs mit maschinengesteuerten Empfehlungen, einschließlich eines Was-wäre-wenn-Simulators und einer Vorhersage der Kapazitätsauslastung auf der Grundlage der bisherigen Nutzung.
Darüber hinaus können sich Kunden in Zukunft an Turing wenden, um noch mehr Einblicke aus ihren Daten zu erhalten, und zwar über die KI-Modell-Workflows der Retrieval Augmented Generation (RAG). Der Hersteller ist davon überzeugt, dass RAG-Technologien den Kunden helfen können, tiefere Einblicke und Erkenntnisse aus Daten zu gewinnen oder schnell Inhalte in Petabytes von Daten zu finden.
Retrieval Augmented Generation (RAG)
Eine zentrale Komponente des Turing-Tools ist die Retrieval Augmented Generation (RAG), was die Verwendung von KI-Daten vereinfachen und effizienter machen soll. RAG ist eine Technologie zur Verarbeitung natürlicher Sprache (NLP), die hier eingesetzt wird, um textbasierte Antworten auf Kundenanfragen zu generieren. RAG kombiniert die Stärken von großen Sprachmodellen (LLMs) mit kontextbezogener Suche, um sachkundigere, vielfältigere und relevantere Antworten zu erzeugen. RAG ist ein effizienterer Ansatz zur Feinabstimmung von LLMs und kann verwendet werden, um Inhalte in Petabytes von Daten schneller zu finden. Die RAG-Plattform akzeptiert eine benutzer- oder maschinengesteuerte Eingabe, zum Beispiel eine Frage oder eine Abfrage, und extrahiert Schlüsselwörter, die zum Filtern der Sicherungsdaten eines Unternehmens auf eine kleinere Teilmenge von Daten verwendet werden. Anschließend werden aus diesen Dokumenten oder Objekten die Darstellungen ausgewählt, die für die Anfrage des Benutzers oder der Maschine am relevantesten sind. Durch den Einsatz von RAG auf dem unternehmenseigenen Datensatz muss der Kunde kein zusätzliches Training des Modells durchführen, was Zeit und Ressourcen spart. RAG kann bei der Suche und Entdeckung eingesetzt werden, um umfassende Erkenntnisse aus Kundendaten zu gewinnen.
- Verbesserte Effizienz: RAG bietet einen effizienteren Ansatz für die Feinabstimmung großer Sprachmodelle (LLMs) und kann verwendet werden, um Inhalte in Petabytes von Daten schneller zu finden.
- Tiefere Einblicke: RAG kann Kunden helfen, tiefere Einblicke und Erkenntnisse aus Daten zu gewinnen.
- Relevante Antworten: RAG ermöglicht es LLMs, sachkundigere, vielfältigere und relevantere Antworten zu generieren.
- Keine zusätzliche Schulung erforderlich: Durch die Verwendung von RAG auf der Grundlage eines unternehmenseigenen Datensatzes muss ein Kunde kein zusätzliches Training für das Modell durchführen, was Zeit und Ressourcen sparen kann.
- Kontextrelevante Ergebnisse: RAG kombiniert die Fortschritte in der generativen KI und der kontextbezogenen Suche zu einer leistungsstarken neuen Methode, um kontextrelevante Ergebnisse zu finden und abzurufen.
Beispiele für textbasierte und kontextgetriebene Anfragen wären unter anderem für Backup und Datenmanagement denkbar:
Wie wissen wir, welche Daten wir haben?
Wie können wir verstehen, was das für Daten sind und wo sie sich befinden?
Wie viele Backups sind fehlerhaft oder fehlgeschlagen?
Darüber hinaus ist auch die Erstellung von Chat-ähnlicher Reports möglich. Diese können an verschiedene IT-Verantwortliche gesendet werden, die dann eine weitaus größere Analysetiefe über ihre daten erhalten. Turing soll es Unternehmen leichter machen, KI-fähige Daten zu erstellen, die sicher und bei Bedarf verfügbar sind. Ganz gleich, ob die Anwender Daten über Jahrzehnte hinweg nach Mustern durchsuchen, Konversationsberichte erstellen oder Probleme autonom überwachen und beheben wollen.
Die RAG-Technologie ist derzeit noch in Entwicklung, aber das Unternehmen verspricht sich einen
Verantwortungsvolle KI und Governance
Der Hersteller will seinen Kunden aber nicht nur künstliche Intelligenz offerieren, damit sie im Rennen um die Kundschaft im KI- und ML-Bereich nicht hinten anstehen. Vielmehr verspricht Cohesity den Einsatz von verantwortungsvoller KI. Verantwortungsvolle KI ist die Praxis der Nutzung von KI in guter Absicht - mit anderen Worten, um Mitarbeitern und Unternehmen zu helfen, die Macht ihrer Daten auf faire und verantwortungsvolle Weise zu nutzen, die ethisch vertretbar ist und Menschen nicht schadet.
Die verantwortungsvolle KI konzentriert sich auf drei Kernprinzipien:
- Vertrauen und Verantwortlichkeit: Das bedeutet, dass Ihre Daten mit KI auf verantwortungsvolle Weise genutzt werden. Die Daten verlassen das Unternehmen nicht, die Nutzung ist transparent, und sie ist richtlinien- und RBAC-gesteuert.
- Datenschutz und Kontrolle darüber, welche Daten verwendet werden und wer Zugriff darauf hat.
- Umfassend und effizient: Cohesity erschließt das Potenzial der Daten mithilfe von KI über eine einheitliche Multi-Cloud-Plattform.
Ein weiterer wichtiger Bestandteil ist die KI-Governance, die die Sicherheit und den Datenschutz der von KI-Modellen und Mitarbeitern genutzten Daten gewährleistet, damit die richtigen Daten nur den richtigen Personen (und Modellen) mit den richtigen Berechtigungen zugänglich sind. Darüber hinaus wird der Zugriff mittels rollenbasierter Zugriffskontrollen (RBAC) gesteuert.
Darüber nutzt die Lösung ein Zero-Trust-Modell und unveränderliche (immutable) Daten. Dies wird mit Netscope Intelligence Security Service Edge umgesetzt. Das Tool verfügt über eine Zero Trust Engine. Damit soll die Angriffsfläche von Unternehmen verkleinert werden. Die gesamte Verwaltung von Turing erfolgt über ein Dashboard und benötigt keinen Agenten.
Data Security Alliance: Partnerschaften für mehr Sicherheit
Die Data Security Alliance wurde im November 2022 angekündigt und umfasst BigID, Cisco, CyberArk, Mandiant, Okta, Palo Alto Networks, PwC UK, Qualys, Securonix und Splunk. Dazu kommen noch Netskope, ServiceNow und Zscaler.
Die Dynamik von Cohesity hin zu KI-gesteuerten Funktionen spiegelt die Entwicklungen im gesamten Backup-Bereich wider - und natürlich auch darüber hinaus - bei der Anwendung von maschinellem Lernen zur Entdeckung, Erkennung, Berichterstattung von Störungen der Datensicherung und Bedrohungen wie Ransomware.
Dies wird durch die wachsende Komplexität der Daten angetrieben, die geschützt, klassifiziert, wiederhergestellt und gemeldet werden müssen, wobei Multi-Cloud- und Hybrid-Cloud-Betrieb eine tägliche Realität sind, zusammen mit Containern und Microservices und der Anforderung, dass sich die Datensicherung anpassen muss, um die Daten zu schützen, die während der Komplexität eines solchen Betriebs erzeugt und gespeichert werden.
Von den neuen Partnern bietet (wie erwähnt) die Intelligent Security Service Edge-Plattform von Netskope eine KI-gestützte Sichtbarkeit und Kontrolle sensibler Daten über das Web, Software-as-a-Service (SaaS) und private Apps; ServiceNow bringt Vorfallsdaten von Cohesity in eine strukturierte Reaktionsmaschine ein, die Workflow-Automatisierung nutzt, um Bedrohungen zu priorisieren und zu beheben; und Zscaler bietet Zero-Trust-Schutz mit Benutzerauthentifizierung und Zugriffskontrollen.