putilov_denis - stock.adobe.com
Hohe Kosten von KI in der Cloud mit FinOps minimieren
Bereitstellung und Verwaltung von KI-Anwendungen ist kostspielig, insbesondere wenn es sich um Ihre erste generative KI-Initiative handelt. Wie Sie die Kosten im Griff behalten.
Die Cloud bringt KI in den Fokus von immer mehr Unternehmen, hat aber auch Auswirkungen auf die Cloud-Ausgaben. Ihre erste generative KI-Initiative erfordert eine erhebliche Rechenleistung und Datenspeicherung, die über das hinausgeht, was Ihr Unternehmen bereits in der Cloud betreibt.
Es liegt an Ihnen, sich auf den Anstieg der Cloud-Kosten vorzubereiten, den KI mit sich bringt. Untersuchen Sie im Folgenden, wie Sie die möglichen Auswirkungen auf Ihre Cloud-Kosten mit Hilfe von FinOps-Praktiken (Cloud Financial Operations) auffangen können.
Auswirkungen von KI auf die Cloud-Ausgaben
KI-Workloads können ressourcenintensiv sein und unterschiedliche Nutzungsmuster aufweisen. Es ist wichtig, FinOps-Strategien entsprechend anzupassen. KI kann die Cloud-Ausgaben auf verschiedene Weise beeinflussen:
- Sie verbraucht mehr Ressourcen und Zeit: Komplexe und nicht optimierte KI-Modelle erfordern mehr Rechenressourcen und Zeit für die Datenverarbeitung in der Cloud, was zu höheren Cloud-Kosten führt.
- Es erfordert mehr Rechenleistung und Speicherplatz: Das Training von KI-Modellen ist ressourcenintensiv und kostspielig, da mehr Rechen- und Speicherplatz benötigt wird.
- Es werden häufige Datenübertragungen durchgeführt: Zusätzliche Datenübertragungskosten können entstehen, weil Ihre KI-Anwendungen häufigere Datenübertragungen zwischen Edge-Geräten und Ihrem Cloud-Service-Provider (CSP).
FinOps-Praktiken für KI
FinOps für KI erfordert eine kontinuierliche Zusammenarbeit zwischen IT, Finanzen und den KI-Entwicklungsteams, um eine kontinuierliche Optimierung und Kosteneffizienz zu erreichen. Die Berücksichtigung von KI in Ihren Cloud-Kostenoptimierungsstrategien erfordert besondere Aufmerksamkeit, insbesondere zu Beginn. Unternehmen müssen ihre FinOps-Strategie regelmäßig überprüfen und verfeinern, je nachdem, wie sich neue KI-Anforderungen auf die Cloud-Leistung und -Kosten auswirken:
- Provisionierung und Dimensionierung: KI-Workloads wirken sich auf die Bereitstellung und Größe von Ressourcen aus, da KI-Workloads häufig Grafikprozessoren und andere beschleunigte Recheneinheiten erfordern. Bereiten Sie sich darauf vor, diese Anpassungen zu berücksichtigen.
- Instanztypen: Ihre KI-Anforderungen bestimmen, wie Sie die Ressourcenbereitstellung durch die Auswahl der richtigen Instanztypen optimieren können. Mit Spot-Instanzen können Unternehmen bei unkritischen KI-Workloads Geld sparen. So können Unternehmen beispielsweise die Ausführung von KI-Trainingsaufgaben auf Zeiten außerhalb der Stoßzeiten oder auf Zeiten mit geringerer Nachfrage legen.
- Skalierung: KI-Workloads können Spitzenwerte erreichen. Autoscaling passt die Anzahl der Ressourcen dynamisch an den Bedarf an und vermeidet eine Überbelegung in Leerlaufzeiten.
- Monitoring: Die Überwachung der KI-Infrastruktur und -Nutzung erfordert Anpassungen, wie zum Beispiel neue Berichte von Ihren Cloud-Überwachungs-Tools, um weitere Kostentrends, Ressourcennutzungsmuster und potenzielle Kostenoptimierungen zu ermitteln. Fügen Sie Ihrem aktuellen Tagging-Schema Kostenzuordnungs-Tags hinzu, um Ausgaben bestimmten KI-Projekten oder -Teams zuzuordnen.
- Storage: KI-Modelle erzeugen oft große Datenmengen. Das führt zu einem unerwarteten und erheblichen Anstieg der Speicherkosten, vor allem, wenn es sich um Ihr erstes größeres KI-Projekt als Unternehmen handelt. Überprüfen Sie die aktuellen Storage-Optionen auf der Grundlage der Zugriffsmuster kontinuierlich, bevor und nachdem Sie ein KI-Projekt in Produktion geben.
- Datenübertragungen: KI-Workloads können die Übertragung von Daten zwischen verschiedenen Cloud-Diensten oder Regionen beinhalten. Content-Delivery-Netzwerke können Sie unterstützen, diese Kosten mit Ihrem aktuellen CSP zu optimieren. Datenübertragungen in einer Multi-Cloud-Umgebung bedeutet, dass Sie durch Automatisierung die Effizienz der Datenübertragung zwischen Ihren Cloud-Umgebungen sicherstellen.
Erstellen Sie eine kostenbewusste KI-Strategie
Wenn Ihr KI-Projekt die Entwicklung von Algorithmen beinhaltet, ist es wichtig, mit Datenwissenschaftlern und KI-Entwicklern zusammenzuarbeiten, um kostenbewusste Algorithmen zu erstellen, die den Ressourcenverbrauch reduziere und die Effizienz priorisieren, ohne die Leistung Ihrer KI-Anwendung zu beeinträchtigen.
Angenommen, Ihr Unternehmen startet und betreibt mehrere KI-Projekte, die Cloud-Dienste und Ressourcen gemeinsam nutzen. In diesem Fall sollten Sie eine nutzungsbasierte Kostenzuweisung in Erwägung ziehen, um sicherzustellen, dass Ihr FinOps-Team die Kosten genau zuordnen und erkennen kann, welches Ihrer KI-Projekte die meisten Ausgaben verursacht.
Implementieren Sie bei der Planung Ihrer ersten KI-Projekte Richtlinien und Vorgaben für die Nutzung von KI-Ressourcen, Kostenlimits und Genehmigungsprozesse, um verantwortungsvolle KI-Ausgaben zu gewährleisten. Die frühzeitige Einführung einer solchen Dokumentation gibt auch den KI- und Cloud-Experten Ihres Unternehmens die Möglichkeit, Einblicke und Rückmeldungen zu geben, um sicherzustellen, dass die von Ihnen eingeführten Richtlinien und Vorgaben der Realität entsprechen.
Wenn Ihr Unternehmen vorhersehbare KI-Workloads hat, können Sie die reservierten Instanzen oder Sparpläne Ihres CSP nutzen, um sich für eine langfristige Nutzung zu verpflichten und von den Rabatten zu profitieren. Wenn Ihr Unternehmen jedoch bereits von diesen Strategien profitiert, wissen Sie, dass das keine sofortige Lösung für Ihre KI-Workload-Kosten ist. Sie müssen Ihre KI-Ausgaben verfolgen, bis Sie historische Trends erkennen können, bevor Sie reservierte Instanzen oder Sparpläne implementieren. Achten Sie auf Rabattaktionen oder Anreize Ihres CSP, die zur Optimierung Ihrer Cloud-Kosten beitragen können.