Eine Hybrid-Cloud-Umgebung ist fast schon Standard für Einzelhändler, Gesundheitsdienstleister, Banken oder Versorger. Um nicht im Datensumpf unterzugehen, entscheiden sich immer mehr Unternehmen für die neue und offene Architektur des Data Lakehouse.
(Bild: Getty Images)
Bei einer aktuellen Umfrage von Cloudera gaben 70 Prozent der deutschen Unternehmen an, eigene Rechenzentren und Public- oder Private-Cloud-Umgebungen zu nutzen. Dadurch steigt die Komplexität und Unternehmen laufen Gefahr, sich im Datensumpf zu verlieren. Spürbar wird das, sobald Unternehmen nicht mehr in der Lage sind, ihre strukturierten und unstrukturierten Daten auszuwerten, die On-Premises, in der Cloud oder beim Edge Computing im gesamten Netzwerk verteilt sind, wie zum Beispiel in der Produktion. Außerdem entstehen in Bezug auf Governance und Compliance neue Risiken. Mit einem Data Lakehouse lassen sich diese Anforderungen erfüllen.
Effektive Steuerung von Governance und Compliance
Aktuelle Prognosen gehen davon aus, dass bereits dieses Jahr weltweit 154 Zettabyte an Daten erstellt, erfasst, kopiert und verarbeitet werden – eine Erhöhung um fast 50 Prozent gegenüber 2022. Die Fähigkeit eines Unternehmens, sämtliche Daten als Grundlage für Entscheidungen sinnvoll zu nutzen, kann den Unterschied zwischen Erfolg und Misserfolg ausmachen. Dabei ist der erste Schritt, Daten effizient über den gesamten Lebenszyklus zu verwalten: Von der Aufnahme zur Aufbereitung über Analyse und Vorhersage sowie Veröffentlichung.
Nicht weniger wichtig ist neben vorausschauender Planung und Strategie eine effektive Governance. Auch hier ist ein Lebenszyklusmanagement erforderlich, vor allem in der Analysephase, und insbesondere für Unternehmen in stark regulierten Branchen wie Telekommunikation und Finanzdienstleistungen. Denn schlecht verwaltete Daten können Unternehmen schnell in einem Sumpf aus Compliance-Risiken und Entscheidungen auf unzureichender, unpassender oder gar falscher Datenbasis versinken lassen.
Ebenso entscheidend beim Datenmanagement ist eine gewisse Flexibilität, wie sie ein Data Lakehouse biete. Nicht nur wegen der wachsenden Menge an Daten und dezentralen Infrastrukturen, sondern auch aufgrund der komplexen und sich ändernden Compliance-Anforderungen. Die Marktanalysten von Gartner prognostizieren, dass bis Ende dieses Jahres die Daten und Privatsphäre von drei Viertel der Weltbevölkerung von modernen Bestimmungen wie der Datenschutz-Grundverordnung (DSGVO) geschützt werden.
Data Lakehouse: Vielfalt und Veränderungen der Gesetzeslage
Um Vertrauen zu gewinnen und langfristige sowie nachhaltige Beziehungen aufzubauen, ist Datenschutz essenziell. Doch die neuen Gesetze zum Schutz von Daten und Privatsphäre können sich von Land zu Land und Fall zu Fall unterscheiden und einige sehen bei schweren Verstößen sogar strafrechtliche Konsequenzen vor. Neue Gerichtsurteile sorgen dafür, dass sich die digitalen Grenzen ständig verschieben, was die Sache noch komplizierter macht.
In der Geschichte der Datenübermittlung zwischen Europa und USA wurden mehrere neue Richtlinien angewandt, später aber von Richtern wieder verworfen. Zusätzlich existieren branchenspezifische Datenschutz- und Geheimhaltungsvorschriften wie zum Beispiel im Gesundheitswesen das Patientendaten-Schutz-Gesetz (PDSG) in Deutschland. Kurzum, Unternehmen müssen sicherstellen, dass sie diesem Flickenteppich an Vorschriften und Gesetzen gerecht werden und flexibel auf Änderungen reagieren können.
Dies stellt vor allem viele große Unternehmen vor Herausforderungen, die in eine heterogene Dateninfrastruktur verschiedener Anbieter mit jeweils unterschiedlichen Sicherheitsvorkehrungen und Governance investiert haben. Vor dem Hintergrund verschiedener Datenschutzgesetze weltweit, die Unternehmen einhalten müssen, ist allerdings eine Zentralisierung nicht zwangsläufig die bessere Lösung.
Wie Unternehmen einen Datensumpf vermeiden
Abhilfe schaffen kann eine Data Fabric, also eine Datenservice-Architektur, die die Daten aller Endpunkte in On-Premises- und Cloud-Umgebungen verbindet. Diese unterstützt die globalen Sicherheitsrichtlinien, Policy Management und Governance über einen Open Data Lakehouse hinweg. So können Assets wie Dokumente, Webseiten, Anwendungen oder Datenbanken weiterhin in mehreren Clouds gespeichert werden. Durch den einheitlichen Plattformansatz werden Sicherheit und Governance konsistent gehandhabt. Es besteht jedoch genügend Flexibilität, um Governance-Regeln und Sicherheitskontrollen individuell auf jede Cloud individuell anzuwenden, je nach den lokalen Anforderungen der Branche, der Rechtslage und der Kunden. Denn Governance und Sicherheit, die für eine Public-Cloud-Instanz in den USA gelten, können sich deutlich von denen unterscheiden, die im Gesundheitswesen oder der Finanzbranche in Deutschland gelten.
Die Architektur des Data Lakehouse kann sensible Daten im gesamten Unternehmen automatisch erkennen sowie katalogisieren, unabhängig davon, wo sie sich befinden, und je nach Richtlinien die entsprechenden Kontrollen anwenden. Dazu gehören Zugangskontrollen für Benutzer, Verschlüsselung für gespeicherte Daten und bei der Übertragung dieser, sowie Datenklassifizierung, Herkunft, Modellierung und Prüfung. Das System kann dynamisch aktualisiert werden, wenn sich Anforderungen ändern, zum Beispiel durch Replikation oder Zugriff auf vorhandene Daten und Arbeitslasten in verschiedenen Clouds beziehungsweise Standorten.
Stand: 16.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die WIN-Verlag GmbH & Co. KG, Chiemgaustraße 148, 81549 München einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://kontakt.vogel.de/de/win abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
Am wichtigsten ist, dass all dies nahtlos und ohne Beeinträchtigung kritischer Geschäftsprozesse erfolgen kann, so dass Unternehmen weiterhin wichtige Erkenntnisse gewinnen und gleichzeitig das Compliance-Risiko minimieren. Dieselben Funktionen für Maschinelles Lernen, die für diese Erkenntnisse genutzt werden, können auch für die Erstellung von Compliance-Berichten eingesetzt werden – unabhängig vom Speicherort oder dem Format.
Data Lakehouse: Konsistenz über Clouds hinweg
Eine effektive Governance trägt dazu bei, einen Mehrwert zu erzielen und Vorschriften einzuhalten. Aber nur, wenn sie von vornherein und nicht nachträglich angegangen werden. Da Unternehmen heute riesige Datenmengen generieren und einer sich ständig ändernden, wachsenden Anzahl neuer Datenschutzbestimmungen unterworfen sind, ist Konsistenz der Schlüssel zum Erfolg.
Der Weg zur Vermeidung eines isolierten Ansatzes für Sicherheit und Governance führt über eine einheitliche Datenarchitektur. Auf diese Weise können sich Unternehmen aus dem Datensumpf befreien und ihr Potenzial voll ausschöpfen.
Benjamin Bohne Benjamin Bohne ist Group Vice President Sales Central EMEA bei Cloudera, Anbieter einer Enterprise Data Cloud. Mit dieser können Unternehmen vorhandene Daten, unabhängig vom Ablageort, vom Edge bis hin zu KI-Anwendungen, verarbeiten.