Dmitry - stock.adobe.com
eArchiving Initiative: Big Data dauerhaft aufbewahren
Die eArchiving Initiative der Europäischen Kommission stellt Spezifikationen, Software, Schulungen und Wissen zur Verfügung, damit Informationen länger aufbewahrt werden können.
Wichtige Informationen von Behörden, öffentlichen Institutionen und Regierungen müssen über Jahrzehnte hinweg zugänglich und nutzbar bleiben, unabhängig vom verwendeten Speichersystem.
Die eArchiving Initiative der Europäischen Kommission möchte hierfür Lösungen entwickeln und fördert die interoperable Archivierung und Datenverwaltung in Europa. Dafür werden Standards festgelegt und Best Practices entwickelt sowie eine Gemeinschaft von Anwendern und Interessensgruppen aufgebaut.
Zusammen mit dem E-ARK-Konsortium, das von der E-ARK Foundation repräsentiert wird, strebt die Europäische Kommission damit an, zentrale Spezifikationen, Software, Schulungen und Wissen bereitzustellen, um Organisationen und Einzelpersonen bei der langfristigen Bewahrung von Informationen zu unterstützen. Ziel ist es, einen offenen, transparenten, rechtskonformen und nachhaltigen Zugang zu digitalen Aufzeichnungen sicherzustellen.
Die Verwaltung der Initiative obliegt dem E-ARK-Konsortium, das im Auftrag der Europäischen Kommission arbeitet. Dieses Konsortium besteht aus der AIT Austrian Institute of Technology GmbH (Hauptpartner), dem DLM Forum MTÜ, Gabinete Umbus SL, Highbury Research & Development Limited und KEEP Solutions LDA.
„Die Notwendigkeit zur Bewahrung digitaler Aufzeichnungen und zur Sicherstellung der langfristigen Zugänglichkeit von Langzeitdokumenten ist die treibende Kraft hinter der eArchiving Initiative“, sagt Gregor Završnik, Berater für Geodatenarchivierung bei Geoarh und einer der beteiligten Akteure der Initiative.
Eine vertrauenswürdige und langfristig effektive Informationsbewahrung setzt laut Završnik die Klärung der Authentizität und Herkunft der Daten voraus. Wichtige Fragen sind:
- Wie wissen wir, dass die Daten authentisch sind?
- Wie stellen wir sicher, dass wir die Daten korrekt interpretieren?
- Welche Veränderungen wurden an den Daten vorgenommen?
Ziele der eArchiving Initiative
Die eArchiving Initiative der EU strebt die Interoperabilität europäischer Organisationen und Behörden an und schafft ein Umfeld, in dem Unternehmen ungehindert miteinander kommunizieren können. Sie ist damit Teil der europäischen Initiative Europas digitale Dekade.
„Jede Organisation benötigt ein Archiv, um nachvollziehen zu können, was vor fünf oder zehn Jahren geschehen ist, etwa in Bezug auf Wasserrechte oder Landgenehmigungen und -vermessungen. Was passiert beispielsweise, wenn Grundstücke neu aufgeteilt werden?“, fragt Završnik. „Wenn Daten das neue Öl sind, wie funktionieren dann Datenraffinerien und -tankstellen? Es gibt viele Datensilos, die man anzapfen muss, um an die Informationen zu gelangen.“
Die Lösung liegt in gemeinsamen europäischen Datenräumen, die als „Tankstellen für Daten fungieren“, erläutert der Berater. Ziel ist es, Bausteine für Archive, Daten und Wissensplattformen so zu speichern, dass sie auch in Zukunft verständlich bleiben. Dadurch werden Mehrwerte für entstehende Datenräume geschaffen und „Archive by Design“ ermöglicht. Die Langzeitverfügbarkeit der Daten erlaubt es, aus der Vergangenheit Prognosen für die Zukunft zu erstellen.
Entwicklung der europäischen Initiativen
Die E-ARK-Initiative startete am 1. Oktober 2022 für zunächst zwei Jahre. Sie wurde 2024 um ein Jahr verlängert und wird voraussichtlich bis mindestens 2026 gefördert. Das Konsortium, bestehend aus 15 Organisationen, dient als Sicherheitsnetz, falls die Finanzierung durch die Europäische Kommission eingestellt wird.
Die eArchiving Initiative ging aus dem E-ARK-Forschungsprojekt (2014 bis 2017) und dem Archiving Building Block (2018 bis 2021) hervor. Seit 2022 wird die eArchiving Initiative unter diesem Titel vorangetrieben. Die Mitglieder verwenden das ISO 14721 Open Archival Information System und speichern die Daten in Archivpaketen. Diese Pakete, einschließlich der Metadaten, werden in einem SAP-System gespeichert.
Das E-ARK-Forschungsprojekt, das von 2014 bis 2017 lief und von der Europäischen Kommission kofinanziert wurde, war ursprünglich ein multinationales Big-Data-Forschungsprojekt, das die Methoden und Technologien der digitalen Archivierung verbesserte, um eine europaweite Konsistenz zu erreichen.
„Dies ist erst der Beginn der Reise zur digitalen Bewahrung“, ist sich Završnik sicher. „Viele Organisationen und staatliche Archive haben sich bereits angeschlossen, wodurch zusätzliche Metadaten verfügbar werden. Wir benötigen ein Format, das diese Daten über Jahrzehnte hinweg bewahren kann. In der heutigen Welt der großen Sprachmodelle (LLMs) ist es schwierig, Quellen zu finden, was die Dokumentation von Karten und deren Genauigkeit erschwert.“
Die eArchiving Initiative wurde im Rahmen der IT Press Tour (in Istanbul) vorgestellt, die mehrmals im Jahr Besuche bei Start-ups und IT-Unternehmen organisiert.