Serie | Data Governance – Einführung in Microsoft Purview
Das Governanceportal Microsoft Purview bietet umfassende Lösungen zur Datenverwaltung, die helfen können, lokale, Multicloud- und Software-as-a-Service-Daten (SaaS) zu verwalten. Mit dem Microsoft Purview-Governanceportal kann man folgendes erreichen:
- Erstellung einer ganzheitlichen und aktuellen Übersicht über die aktuelle Datenlandschaft, mithilfe einer automatisierten Datenermittlung, Klassifizierung und Verfolgung der Daten nutzen.
- Befähigen Sie Data Owners, ihren Datenbestand effektiv zu verwalten und zu schützen.
Was kann Microsoft Purview?
Microsoft Purview bietet eine automatisierte Datenermittlung, indem es Datenscans und -klassifizierungen für Ihre gesamten Datenressourcen bereitstellt. Die Metadaten und Beschreibungen der gefundenen Datenbestände werden in eine umfassende Karte Ihres Datenbestands integriert. Die Microsoft Purview Data Map bildet die Grundlage für die Datenermittlung und Data Governance.
Die Microsoft Purview Data Map ist ein cloudnativer PaaS-Dienst, der Metadaten zu Unternehmensdaten in Analyse- und Betriebssystemen erfasst, sowohl lokal als auch in der Cloud. Durch das integrierte automatisierte Überprüfungs- und Klassifizierungssystem bleibt die Microsoft Purview Data Map automatisch auf dem neuesten Stand. Anwender können die Datenzuordnung über eine intuitive Benutzeroberfläche konfigurieren und nutzen.
Welche Funktionen bietet Microsoft Purview?
Data Map
Definition:
Eine Data Map ist eine grafische Darstellung der Datenlandschaft innerhalb eines Unternehmens. Data Maps bieten auch eine Lineage-Funktion, d.h. eine Repräsentation der Quelle der Daten und wohin sie bei ihrer Verarbeitung abzielen. Aus einer technischen Sicht bietet eine Data Map eine ganzheitliche Sicht darauf, wie Daten während ihres Lebenszyklus fließen und transformiert werden.
Workflow:
Zunächst wird ein Benutzer in Purview Collections erstellen, die lediglich hierarchische Strukturen darstellen, die es erlauben, Datenquellen mit mehreren Stufen zu ordnen. Dann muss man eine Datenquelle registrieren, indem man sie mit einem unterstützten Konnektor mit der Datenbank, Datalake, verknüpft. Nach der Registrierung kann man Scans einrichten, die alle Metadaten aus den Datenquellen abrufen. Das Ergebnis dieses Scans liefert alle Assets des Datenspeichers Ihres Unternehmens.
Vorteile:
- Gruppierung aller Quellen: entweder on-prem oder in der Cloud, in einem Portal dank vielen Konnektoren (Liste der unterstützten Quellen: LINK)
- Automatische Scans: regelmäßig für alle registrierten Quellen können Scans laufen, um Änderungen automatisch im Data Store des Unternehmens einfließen zu lassen
- (Preview) Labelling: Nicht alle Daten sind gleich oder sensible Daten können aus Sicherheitsgründen unterschiedlich gekennzeichnet und mit speziellen Rechteeinschränkungen behandelt werden
Data Catalog
Definition:
Ein Data Catalog fungiert als Knowledge Base, die es den Benutzern ermöglicht, die verfügbaren Datenbestände in ihrem Unternehmen leicht zu finden und zu verstehen. In einem Unternehmen bietet der Data Catalog ein zentrales Repository für die Speicherung von:
- Metadaten
- Beschreibungen und Anmerkungen zu Datenquellen, Datenbanken, Tabellen, Dateien
- Anderen datenbezogenen Artefakten.
Workflow:
Nachdem nun alle Datenquellen erfasst und gescannt wurden, kann man mit der Erstellung des Glossars beginnen, das die notwendigen Definitionen für die im Unternehmen verwendeten speziellen Bezeichnungen enthält. Zur Verwaltung des Data Catalog kann man verschiedene Informationen wie Spitzname, Status, Definition, Akronym, verwandte Begriffe usw. angeben. Andere Benutzer können nur das Glossar konsultieren, um Insights in die Daten zu bekommen.
Vorteile:
- Asset Normalisation: Bei gleich aussehenden Assets gruppiert Purview die Entitäten automatisch um: Schrägstriche, Großschreibung, Klammern oder andere Zeichen werden verarbeitet und gemeinsame Entitäten werden zusammengefasst, wodurch manuelle Arbeit entfällt.
- Templating: alle relevanten Begriffe, die z.B. von der gleichen Abteilung oder IT-Logik verwendet werden, können gruppiert werden, so dass ein Glossar von Begriffen auch Business-Logik enthält
Data Estate Insights
Definition:
Mittels Microsoft Purview’s Data Estate Insights können Chief Data Officers und andere Governance-Stakeholder einen Überblick über ihren Datenbestand erhalten und relevante Erkenntnisse zu Governance-Lücken gewinnen. Diese Lücken können anschließend vom Dienst selbst behoben werden.
Workflow:
Estate Insights hat die Form von Dashboards im Azure Portal, das es den C-Suite-Verantwortlichen ermöglicht, den aktuellen Status aller registrierten Datenquellen, den Zustand der aktuellen Scans und Glossare zu visualisieren und Fehler zu erkennen. Alle Dashboards sind bereits erstellt und werden automatisch über das Azure Portal aktualisiert.
Data Policy (Preview)
Definition:
Microsoft Purview Data Policy bietet zentrale, cloudbasierte Funktionen an, um den Zugriff auf Datenquellen und Datensätze sicher und in großem Umfang zu verwalten.
Workflow:
Ein Policy ist, wie RBAC in Azure, ein einfaches Dokument, das Rechte mit den folgenden Komponenten definiert:
Eine oder mehrere Policy Statement; pro Policy Statement werden definiert:
- Effect: Lesen oder Ändern
- Aktion: vorerst nur Allow (Deny ist geplant)
- Datenquelle
- Subjekt: eine Person oder eine Gruppe von Personen
Vorteile:
- Der Zugriff auf Datenquellen erfolgt über eine einheitliche, cloudbasierte Oberfläche. Ein neues Berechtigungsmodell auf Datenebene kann eingeführt werden, welches unabhängig von den Datenquellen ist.
- Es ist nahtlos in die Microsoft Purview Data Map und den Katalog integriert: Sie können nach Datenressourcen suchen und differenzierte Richtlinien festlegen, um nur den benötigten Zugriff zu gewähren.
- Sie können Richtlinien erstellen, die alle Metadaten nutzen, die den Datenobjekten zugeordnet sind.
- (Preview): Benutzer können die Owners einer Datenquelle über einen Self-Service-Workflow für den Datenzugriff um Zugang bitten
Data Sharing (Preview)
Definition:
Bei der Zusammenarbeit mit externen Partnern oder verschiedenen Abteilungen einer Organisation kann die gemeinsame Nutzung von Daten schwierig sein und manchmal die Duplizierung von Daten oder die Verwendung mehrerer unterschiedlicher Mechanismen für jede Datenquelle bedeuten. Mit Azure Purview kann die Freigabe von Daten für externe Partner über das Governance-Portal selbst und nicht auf der Ebene der Datenspeicherung erfolgen.
Workflow:
Der Data Curator für eine Datenquelle kann einen Data Share für die Datenquelle erstellen, die besondere Rechte über eine Datenquelle verleiht. Der Empfänger des Data Shares kann die Daten über das Azure-Portal, Azure Storage Explorer, Azure Storage SDK, PowerShell oder CLI abrufen. Derzeit wird nur ADLS Gen2 und Blob Storage unterstützt.
Vorteile:
– Die Freigabe kann auf dem Governance-Portal für alle Datenquellen auf einmal verwaltet werden. Wenn mehr Quellen unterstützt werden, wird die Verwaltung weniger Overhead bedeuten.
– Die Kosten für die Nutzung gemeinsam genutzter Daten werden automatisch berechnet und mit einer Pay-as-you-use-Policy von den externen Partnern getragen, so dass die Kosten für jeden Datennutzer differenziert werden können.
– Daten müssen nicht mehr dupliziert werden, was eine kostengünstigere Lösung darstellt.
– Die gemeinsame Nutzung von Daten oder die Beendigung der gemeinsamen Nutzung von Daten kann jederzeit mit kurzer Bereitstellungszeit erfolgen, was die gemeinsame Nutzung zu einem schnellen Prozess macht.
Vorteile von Microsoft Purview
- Microsoft Purview unterstützt Unternehmen bei der optimalen Nutzung ihrer vorhandenen Informationsressourcen.
- Der Data Map macht Datenquellen leicht auffindbar und verständlich für die Benutzer, die die Daten verwalten.
- Der Data Catalog ermöglicht es Benutzern, schnell nach relevanten Daten zu suchen, sie zu verstehen und in ihrem bevorzugten Tool zu nutzen. Benutzer können auch Beiträge zum Katalog leisten, indem sie Datenquellen taggen, dokumentieren und kommentieren, sowie neue Datenquellen registrieren.
- Data Policies erlauben den einfachen Zugang zu Datenquellen intern zu verwalten
- Data Sharing öffnet Purview für externe Nutzer und erweitert die Zusammenarbeit auf Firmenpartner
Fazit Microsoft Purview
Bereit, Ihre Daten optimal zu nutzen? Entdecken Sie das volle Potenzial Ihrer Informationsressourcen mit Microsoft Purview. Kontaktieren Sie uns noch heute, um mehr über die Vorteile von Microsoft Purview zu erfahren und wie wir Ihnen bei der Umsetzung helfen können. Lassen Sie uns gemeinsam Ihre Daten in wertvolle Erkenntnisse verwandeln.
Um einen tieferen Einblick in die Welt der Data Governance zu bekommen, empfehlen wir Ihnen unser Whitepaper: Wie Sie zum Data Governance Champion werden oder nehmen Sie direkt am Data Governance Assessment teil!
Übersicht der Data Governance Serie:
- Einführung in Microsoft Purview
- Wie Sie zum Data Intelligence Unternehmen werden
- Navigieren im Datenmeer: Die entscheidende Rolle von Data Literacy und ihre Auswirkungen auf Organisationen
- Data Governance – Dos and Don’ts
- Data Mesh vs. Data Fabric: Welche Lösung ist besser für Ihr Unternehmen?
- Datenbewusstsein und Datenreife als Schlüssel zur digitalen Transformation