vegefox.com - stock.adobe.com

Open Source: Schlüssel zur KI-Souveränität in Europa

Die Leistung von Open-Source-Modellen nähern sich weiter den geschlossenen Modellen wie Chat-GPT an und sind so zu einer Alternative mit höherer KI-Souveränität für EU-Firmen.

Wer erinnert sich noch an 3-D-Fernseher? Oder an das Metaverse? Es gab schon unzählige technologische Trends, die sich als vorübergehende Hypes herausgestellt haben und folglich auch schnell wieder in Vergessenheit geraten sind. Künstliche Intelligenz (KI) gehört definitiv nicht dazu. Im Gegenteil: Ihre disruptive Relevanz rückt zunehmend in den Fokus, wie der diesjährige Physik-Nobelpreis zeigt, der erstmals an zwei Pioniere der KI-Forschung verliehen wird. 

Bemerkenswert ist darüber hinaus, dass es der KI gelungen ist, unsere Gesellschaft in nur wenigen Monaten in zahlreichen Bereichen zu durchdringen. Im Vergleich hierzu haben technologische Innovationen in der Vergangenheit, wie etwa die Dampfmaschine, oft Jahrzehnte gebraucht, um sich zu etablieren.

Natürlich spielt KI aktuell auch in vielen Unternehmen aller Größen und Branchen eine zentrale Rolle und ist als transformative Kraft zur Effizienzsteigerung sowie zur Entwicklung neuer Produkte und Dienstleistungen, um letztlich wettbewerbsfähig zu bleiben, einfach nicht mehr wegzudenken.

Künstliche Intelligenz in modernen Unternehmen

Die Vorteile und Einsatzmöglichkeiten von künstlicher Intelligenz in Unternehmen sind zahlreich und vielschichtig. Bei vielen steht die generative KI daher ganz oben auf der Agenda – und spielt im besten Fall sogar eine strategische Rolle. Nachfolgend werfen wir gemeinsam einen Blick auf einige Anwendungsgebiete und Beispiele – die, genau betrachtet, für uns doch gar keine wirklichen Unbekannten mehr sind.

Bestimmt sind viele bereits schon einmal mit einem sogenannten Large Language Model (LLM) in Berührung gekommen. ChatGPT, entwickelt von OpenAI, ist ein besonders populäres Beispiel. LLMs sind darauf ausgelegt, natürliche Sprache zu verarbeiten und menschliche Kommunikation in Textform, basierend auf statistischen Mustern, die aus Trainingsdaten gelernt wurden, zu imitieren. Sei es bei Übersetzungen, im Drive-In bei der Bestellannahme (Umwandlung von Sprache in Text) oder auf Unternehmenswebseiten, wenn ein KI-gestützter Chatbot einfache FAQs klärt – LLMs helfen Unternehmen, schnell, effizient und rund um die Uhr ihren Kundenservice zu verbessern – und dabei Personalkosten einzusparen.

Ein weiteres faszinierendes Teilgebiet der künstlichen Intelligenz ist das maschinelle Lernen beziehungsweise Deep Learning. Durch Datenanalysen können Muster in großen Datenmengen erkannt und darauf basierend fundierte Entscheidungen getroffen werden. Hast Du Dich auch schon einmal gewundert, warum Du plötzlich Produktempfehlungen für Gartenmöbel oder Vorschläge für einen neuen Handy-Tarif bekommst? Es hat doch niemand mitbekommen, dass Du genau diese Stichwörter vor ein paar Stunden gegoogelt hast, oder doch? Was wie Zauberei wirkt, ist in Wirklichkeit Machine beziehungsweise Deep Learning und wird von zahlreichen Unternehmen im E-Commercegenutzt, um ihre Kunden besser zu verstehen, die Kundenbindung zu fördern und personalisierte Erlebnisse zu schaffen.

Noch eine Stufe weiter geht die generative KI (GenAI). Anders als die vorab beschriebenen klassischen KI-Modelle, die auf das Erkennen von Mustern oder Vorhersagen spezialisiert sind, generieren diese Modelle eigenständigen kreativen Output wie Texte, Bilder, Musik oder sogar Videos. Generative KI-Technologie ist in der Lage, basierend auf Daten, mit denen sie trainiert wurde, gänzlich neue Inhalte zu erstellen. Bekannte Beispiele finden sich im Conversational UI für die Beratung zu Reisen oder bei der Kampagne eines spanischen Mode-Labels, bei dem ab sofort alle Models nur noch mit Hilfe der KI generiert werden. Auch hier stehen bei der kommerziellen Nutzung Effizienz und Einsparpotenziale im Fokus. Beispiel Modebranche: Keine Models, kein Foto-Shooting, keine Musterteile – Zeit, Aufwand und Geld gespart - und, das Beste: Keiner bemerkt den Unterschied.

Stefan Rotsch, AOE GmbH

„Open-Source- oder Open-Weight-Modelle sind frei zugänglich und bieten Entwicklern volle Transparenz über zugrunde liegende Algorithmen, Modellarchitekturen und Daten. Sie ermöglichen eine größere Anpassungsfähigkeit an spezifische Unternehmensbedürfnisse, sind kosteneffizienter, erfordern jedoch oft mehr technisches Know-how für Implementierung und Wartung.“

Stefan Rotsch, AOE GmbH

Darüber hinaus fördert künstliche Intelligenz Innovationen und die Weiterentwicklung von Forschung und Gesellschaft. Ein gutes Beispiel hierfür ist ihre Nutzung in der Gesundheitsbranche, wo Algorithmen zur Diagnose von Krankheiten oder Big-Data-Analysen zur Entwicklung personalisierter passgenauer Behandlungspläne, unter anderem in der Onkologie, eingesetzt werden. Dies geht fast schon in die Richtung der Artificial General Intelligence (AGI), momentan noch Zukunftsmusik. AGI steht für eine Weiterentwicklung der Künstlichen Intelligenz, die in der Lage wäre – vergleichbar zum Menschen – kognitive Aufgaben zu übernehmen. Der Weg zur AGI bleibt jedoch spekulativ und es gibt noch viele ungelöste Herausforderungen, vor allem im Bereich des Verständnisses von Bewusstsein, der Ethik und der Flexibilität des Lernens.

Kommerzielle Modelle vs. Open Source: Globale KI-Landschaft im Überblick

Kommerzielle KI-Modelle, wie sie von großen Technologieunternehmen (wie zum Beispiel OpenAI, Google DeepMind, Anthropic oder Microsoft) entwickelt werden, sind in der Regel proprietär und bieten spezialisierte Funktionen, umfassenden Support sowie hohe Leistungsfähigkeit, allerdings zu einem beachtlichen Preis und unter strengen Nutzungsbedingungen. Sie eignen sich für Unternehmen, die Stabilität, Skalierbarkeit und sofort einsatzbereite Lösungen benötigen und dominieren aktuell den globalen KI-Markt mit Abstand. 

Auffällig ist, dass es nur ganz wenige kommerzielle europäische KI-Modelle gibt, die mit den großen Technologieanbietern aus USA und China mithalten können. Die Hauptprobleme für europäische Unternehmen, die auf der Suche nach der für sie passenden KI-Lösung im Dschungel dieser Strukturen sind, sind die unerwünschten geopolitischen Abhängigkeiten von US-amerikanischen oder chinesischen Firmen und damit verbundene eventuelle Lock-in Effekte sowie die Herausforderung, europäische Datenschutzbestimmungen einzuhalten und dabei die Datensouveränität zu bewahren.

Hingegen sind Open-Source- oder Open-Weight-Modelle (zum Beispiel LLaMA, BLOOM oder GPT-Neo) frei zugänglich und bieten Entwicklern die volle Transparenz über zugrunde liegende Algorithmen, Modellarchitekturen und Daten. Sie ermöglichen eine größere Anpassungsfähigkeit an spezifische Unternehmensbedürfnisse, sind kosteneffizienter, erfordern jedoch oft mehr technisches Know-how für Implementierung und Wartung. Der Vorteil besteht in der flexiblen Anpassung und der Möglichkeit, die Modelle nach den eigenen Bedürfnissen zu optimieren, allerdings ohne den umfassenden Support, den kommerzielle Anbieter bieten. Ein weiterer Asset für in Europa ansässige Unternehmen ist die Datensouveränität, da keine Abhängigkeiten von externen Anbietern aus dem nicht-europäischen Ausland bestehen. Darüber hinaus besteht die Möglichkeit, das Modell DSGVO-konform zu konfigurieren, falls man es im eigenen Data Center selbst betreiben möchte oder auch an einem DSGVO-konformen Provider outzusourcen. Allerdings dürfen die Betriebskosten an dieser Stelle nicht außer Acht gelassen werden – unabhängig davon, ob ein kommerzielles oder ein Open-Source-Modell zum Einsatz kommt. Die Inferenz mit einem Large Language Model kann nämlich erhebliche Kosten verursachen: Unternehmen müssen entweder in Kapitalkosten (Capex) für eigene spezialisierte Hardware investieren oder Betriebsausgaben (Opex) für Cloud-Dienste einplanen. 

Zieht man nun noch einen Vergleich in Bezug auf die Leistungsentwicklung zwischen kommerziellen und Open-Source-KI-Modellen, insbesondere im Bereich des MMLU-Scores (Massive Multitask Language Understanding), zeigt sich ein spannender Trend. Kommerzielle Modelle wie GPT-4 oder Claude von Anthropic haben traditionell die Spitzenplätze in den MMLU-Benchmarks belegt, da sie in großem Umfang trainiert wurden und durch hohe finanzielle Ressourcen unterstützt werden. Ihre Ergebnisse in den MMLU-Tests, die über 50 verschiedene Aufgaben abdecken, zeichnen sich durch hohe Genauigkeit und Konsistenz aus.

Im Vergleich dazu hatten Open-Source-Modelle anfangs deutliche Leistungsnachteile, da sie in der Regel auf weniger umfangreichen Datensätzen trainiert und weniger stark optimiert waren. Doch in den letzten Jahren haben Open-Source-Modelle durch Verbesserungen in den Trainingsmethoden und effizientere Architekturen aufgeholt. Die Modelle nähern sich zunehmend den kommerziellen Lösungen an, was zu einer erhöhten Wettbewerbsfähigkeit führt. Dieser Aufholprozess wird durch die offene Verfügbarkeit der Modelle beschleunigt, die eine breite Anpassung und Optimierung durch die Community ermöglicht. Es gibt immer mehr Fälle, in denen Open-Source-Modelle in spezifischen MMLU-Tasks ähnliche oder sogar bessere Ergebnisse erzielen als ihre kommerziellen Gegenstücke, besonders in spezialisierten Anwendungen. Die zunehmende Wettbewerbsfähigkeit der Open-Source-Modelle deutet darauf hin, dass die Lücke zwischen kommerziellen und offenen Modellen weiterhin schrumpfen wird, da die freien Alternativen immer robuster und leistungsfähiger werden. Die nachfolgende Grafik verdeutlicht dies anschaulich.

Abbildung 1: Das Center for Research on Foundation Models der Stanford Univerität zeigt, dass sich die Leistungen der offenen KI-Modelle immer mehr den der geschlossenen Modelle annähern. (Quelle: AEO GmbH/Stanford University CRFM)
Abbildung 1: Das Center for Research on Foundation Models der Stanford Univerität zeigt, dass sich die Leistungen der offenen KI-Modelle immer mehr den der geschlossenen Modelle annähern. (Quelle: AEO GmbH/Stanford University CRFM)

Zusammenfassend zeigt sich, dass Open-Source-KI-Modelle insbesondere für europäische Unternehmen zahlreiche strategische Vorteile bieten, indem sie Flexibilität, Kosteneffizienz und Souveränität ermöglichen. Allerdings gehen ihre Nutzung und Implementierung auch mit spezifischen Herausforderungen einher, die es zu berücksichtigen gilt. 

Im zweiten Teil dieses Artikels werden wir uns eingehender mit den regulatorischen Anforderungen innerhalb der EU und den ökologischen Aspekten der KI-Nutzung beschäftigen. Diese Aspekte sind von zentraler Bedeutung, um die Zukunft von KI in europäischen Unternehmen nachhaltig und rechtskonform zu gestalten. Der zweite Teil zum Thema KI-Souveränität für europäische Firmen erscheint am 3. Dezember 2024.

Über den Autor:
Stefan Rotsch ist Solution Architect bei der AOE GmbH. Rotsch besitzt umfangreiche Kenntnisse in der Entwicklung und Architektur komplexer Softwareprojekte. In seiner Rolle als Solution Architect bei der AOE GmbH konzentriert er sich darauf, Kunden und Entwicklungsteams von der ersten Idee bis zum erfolgreichen Go-Live zu begleiten. Sein Fokus liegt dabei besonders auf nachhaltigen und ressourcenschonenden Lösungen. Mit seiner langjährigen Expertise in der Entwicklung komplexer Webapplikationen, insbesondere im Telekommunikations-bereich, analysiert und entwirft er maßgeschneiderte Softwarelösungen. Stefan teilt sein reichhaltiges Wissen über agile Softwareentwicklungsprozesse nicht nur innerhalb seiner Projekte, sondern auch durch Artikel, Vorträge auf Konferenzen und Bar Camps sowie in Schulungen, wodurch er einen wertvollen Beitrag zur Fachgemeinschaft leistet.

Die Autoren sind für den Inhalt und die Richtigkeit ihrer Beiträge selbst verantwortlich. Die dargelegten Meinungen geben die Ansichten der Autoren wieder.

Erfahren Sie mehr über Softwareentwicklung