DB Podcast

Datenmanagement

Digitale Souveränität: Anspruch und Realität klaffen auseinander

< zurück

Seite: 2/2

Anbieter zum Thema

Digitale Souveränität und Daten – ein (oft) ignoriertes Problem

Neben der Software rückt zwangsläufig ein weiterer Aspekt in den Fokus: die Daten. Denn Programme sind am Ende auch nur Daten. Aus vielen Gründen ist es daher sinnvoll, nicht nur über die Software, sondern auch über die Souveränität anderer Daten nachzudenken: seien es Forschungsergebnisse, auf denen andere aufbauen, kritische Artikel zu undemokratischen Regierungen, oder aktuell: Trainingsdaten für KI-Modelle.

Auch hier haben wir ein ähnliches Problem und das ist zurzeit durchaus konkret. Wenn die US-Regierung etwa beschließt, ein Klimaforschungsinstitut zu schließen, verschwinden nicht nur die Tools, sondern auch die Daten. Doch gerade diese globale Datenvielfalt ist entscheidend – für viele Analysen, aber auch für das Training von LLMs. Müssen wir also anfangen, alle wichtigen (oder einfach nur diversen) Daten auf EU-Server zu kopieren? 

Bei Forschungspublikationen und einigen Datensätzen passiert das tatsächlich schon, aber für echte Souveränität müsste das viel, viel umfassender geschehen. Und auch hier besteht noch ein zentrales Risiko: Manipulation. Wer kontrolliert, was in diese Datensätze reinfließt oder, was weggelassen wurde? Mit geschickten Änderungen/Auswahl von auch nicht wissenschaftlichen Daten und Informationen lässt sich massiv beeinflussen, was KI-Systeme lernen – und damit, welche Antworten sie später geben.

Was bedeutet Souveränität überhaupt?

Digitale Souveränität scheitert weniger an fehlendem Willen als an der globalen Verwobenheit von Software, Daten und Infrastruktur. Vollständige Kontrolle ist kaum realisierbar, sondern allenfalls eine fallbasierte Teil-Souveränität. Wir sollten also erst einmal klären, was wir unter Souveränität in einem bestimmten Kontext verstehen.

Geht es darum, dafür zu sorgen, dass meine E-Mail auch noch funktioniert, wenn jemand in den USA meinen Account sperrt? Das ist relativ einfach zu verhindern, indem man seinen E-Mail Provider wechselt.

Geht es darum, meine persönlichen Daten oder die meiner Firma vor Regierungszugriffen zu schützen: auch hier ist ein Umzug auf einen europäischen Provider möglich, wird aber schon mühsamer. Microsoft- oder Google-Dienste sind weitverbreitet und erheblich besser integriert als viele Alternativen. Das zeigt sich bereits an einigen Bundesländern, die auf Open Source Software wechseln (wollen): Nicht nur die Migration selbst verursacht Aufwand, auch der Betrieb ist nicht immer ganz so reibungslos, wie man das von Microsoft und Co. gewohnt ist.

Geht es darum, Software einzusetzen, die in der EU entwickelt oder wenigstens hier validiert wurde? Das wird schon erheblich schwieriger und wird sich nur für wenige, wichtigen Anwendungen wirklich durchführen lassen. Für die wirklich kritischen Anwendungen müsste man sich wohl vom World-Wide Web abnabeln und auf eine reine EU-Infrastruktur wechseln. In diesen Fällen schlägt Sicherheit klar Innovationsgeschwindigkeit.

Bei Daten ist allerdings Alarmstufe rot: Die EU sollte zügig beginnen, wichtige Daten (Forschungs- aber auch schlicht historisch relevante Informationen) zu kopieren und innerhalb der EU zu hosten. Programm-Repositories liegen oft ohnehin schon an vielen Stellen als Kopie vor und sind im Notfall meist wieder auffindbar. Forschungsdaten, Publikationen oder historische Archive sind allerdings oftmals wirklich nur innerhalb von bestimmten Landesgrenzen verfügbar und im Ernstfall verloren.

Digitale Souveränität nur eingeschränkt durchsetzbar

Digitale Souveränität ist deutlich komplexer, als es auf den ersten Blick erscheint. Wirklich ernst genommen, ist es in den meisten Fällen auch gar nicht durchsetzbar. Ein rein europäischer Ansatz könnte zwar Abhängigkeiten eliminieren, ist jedoch aufwändig, schränkt das Innovationspotenzial ein und ist damit nur in Ausnahmefällen überhaupt realisierbar. 

Realistischer ist ein differenzierter Ansatz: eine fallbasierte Analyse und die sorgfältige Abwägung des Aufwands und der Kosten einer teilweisen digitalen Souveränität gegenüber den tatsächlichen Risiken.Einen kleinen Lichtblick bietet gerade die KI: mit Hilfe geschickt aufgesetzter Agenten lassen sich die regelmäßigen Überprüfungen externer Programm- oder Datenquellen deutlich besser skalieren.

Digitale Souveränität Michael BertholdProf. Dr. Michael Berthold
ist Informatiker und international anerkannter Experte für Data Science, künstliche Intelligenz und maschinelles Lernen. Er war Mitgründer der Open-Source-Plattform Knime, die heute Hunderttausenden Anwendern genutzt wird. Als Forscher und Unternehmer unterstützt er Organisationen dabei, Daten zu analysieren und datenbasierte Entscheidungen zu treffen. Er ist Autor von über 250 Publikationen, IEEE Fellow und international für seine Forschung ausgezeichnet. 

Bildquelle: Michael Berthold

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung