Datenqualität und die Bedeutung von Data Stewardship
Verständliche, saubere und konforme Daten sind eine Voraussetzung für den Geschäftserfolg. Im Zeitalter von Big Data, stark verteilten Systemen und sich ständig ändernden Verordnungen und Vorschriften bewegen sich Unternehmen in einer Welt zunehmender digitaler Komplexität und wachsender Datenmengen. Leider bedeutet eine größere Menge an Daten keine höhere Qualität oder einen geringeren Bedarf an Fachwissen - oft ist das Gegenteil der Fall.
Es bedarf besonderer Sorgfalt, um sicherzustellen, dass Analysen die auf Grundlage von Daten durchgeführt werden, zuverlässig sind und einen Mehrwert schaffen. Leider ist es unglaublich einfach mit einer kleinen Unachtsamkeit eine Menge harter Arbeit vollständig wertlos zu machen.
Beispielsweise kann es vorkommen, dass…
- vergessen wird, Testkonten zu entfernen,
- die Auswirkungen von Crawlern auf die Anzahl der Besuche auf einer Webseite nicht berücksichtigt werden,
- Fehler beim Datenimport und -export übersehen werden,
- unterschiedliche Zeitzonen und Währungen Probleme bereiten,
- es zu gravierenden Fehlinterpretationen aufgrund mangelnder Dokumentation kommt.
Jedes dieser Probleme lässt sich leicht beheben, aber ohne ein sehr hohes Maß an Aufmerksamkeit können irreführende Schlussfolgerungen gezogen und Ressourcen verschwendet werden.
In diesem Zusammenhang wird die Rolle eines Data Steward immer wertvoller. Der Hintergrund eines Data Stewards ist eine Kombination aus Data Science und Data Management, wobei er für alle Aspekte der Datenerfassung, -pflege, -organisation und -konformität verantwortlich ist. Der Aufgabenbereich reicht von der Erstellung von Datenrichtlinien bis hin zur Verwaltung der Datenarchitektur, sowie der Kontrolle der Einhaltung von Vorschriften bei der Datenerfassung und -nutzung. Im Wesentlichen sind Data Stewards also die Anlaufstelle in einer Organisation für alle datenbezogenen Themen.
Data Stewards sind nicht nur eine wichtige Ressource bezüglich datenbezogener Fragen, sondern können einem Unternehmen auch auf verschiedene andere Arten einen enormen Mehrwert bieten:
- In Unternehmen mit weniger definierten Hierarchien und Rollen können Data Stewards Regeln und Verantwortlichkeiten rund um Daten schaffen.
- Data Stewards können dazu beitragen, eine datenorientierte Unternehmenskultur aufzubauen, die Verwendung qualitativ hochwertiger Daten im gesamten Unternehmen zu fördern und das Bewusstsein für die strategische Rolle von Daten für den Unternehmenserfolg zu schärfen.
- Klare und konsistente Richtlinien können die abteilungsübergreifende Kommunikation erleichtern. Die Sicherstellung von Datenkonsistenz und Vollständigkeit der Daten, beugt Missverständnissen und teuren Fehlentscheidungen vor.
- Hohe Datenqualität ist eine Voraussetzung für zuverlässige Analysen auf Basis ebendieser Daten. Data Stewards unterstützen das Data Science Team auf effiziente Weise zuverlässige Erkenntnisse für das Unternehmen zu gewinnen.
- Der Umgang mit Kundendaten ist Vertrauenssache und damit steht viel auf dem Spiel. Data Stewards verringern die Fehleranfälligkeit, welche sowohl die internen Systeme als auch die Reputation eines Unternehmens beeinträchtigen kann, wenn Datenschutzfehler auftreten. Neben der Vermeidung finanzieller Verluste und des Vertrauens von Kunden ist die Einhaltung des Datenschutzes im Zeitalter der DSGVO und anderer moderner Datenschutzanforderungen von entscheidender Bedeutung und lässt sich mit speziellem Fachwissen und besonderer Aufmerksamkeit viel einfacher und effizienter erreichen.
Die Rolle eines Data Steward kann viele verschiedene Formen annehmen. Einige verfügen möglicherweise über spezielle Fachkenntnisse oder konzentrieren sich auf einen bestimmten Bereich der Organisation (z. B. eine bestimmte Geschäftsfunktion, ein bestimmtes Projekt oder ein bestimmtes System).
Im Allgemeinen können die Aufgaben eines Data Steward jedoch Folgendes umfassen:
- Datenpflege: Die Datenpflege erfolgt über den gesamten Lebenszyklus der Daten. Hier kann ein Data Steward neue Datenquellen identifizieren, Integrationsprobleme beheben, Qualitätskontrollprozesse entwickeln, Anomalien analysieren und Korrekturen implementieren.
- Festlegung von Regeln: Eine wichtige Aufgabe ist die Erstellung und Durchsetzung interner Richtlinien zur Datennutzung, um nicht nur die interne Effizienz zu gewährleisten, sondern auch die Einhaltung gesetzlicher Auflagen. Interne Richtlinien können Aspekte wie Datenverarbeitung, Speicherung, an wen Daten wie gesendet werden können, ordnungsgemäße Dokumentation und einheitliche Terminologie abdecken. Extern stellen diese Regeln sicher, dass alle Anforderungen in Bezug auf Datenschutz, Speicherung, Archivierung und Entsorgung gemäß den lokalen und internationalen Vorschriften erfüllt werden.
- Verbesserte Nutzung von Daten: Data Stewards können die Datennutzung überwachen, Best Practice vermitteln und Teams dabei unterstützen, die verfügbaren Daten besser zu nutzen.
- Kommunikation erleichtern: Eine der Schlüsselfunktionen von Data Stewards besteht darin, die Kommunikation zwischen Abteilungen, insbesondere Business und IT, zu verbessern und die Integration zu fördern. Data Stewards sind auch eine wichtige Ressource für Mitarbeiter auf allen Ebenen, um Informationen zu ihren Daten abzurufen - z. B. welche Informationen verfügbar sind und warum, wo sich die Daten befinden, was die Daten bedeuten, ob sie vertrauenswürdig sind und mögliche Einschränkungen in Bezug auf Verwendung der Daten.
Data Stewardship ist nicht nur technisch, sondern kann auch eine wichtige Rolle bei der Erreichung der Unternehmensziele spielen, indem Daten effektiv genutzt werden.
Trotz des klaren Mehrwerts, den ein Data Stewards bieten kann, sind entsprechende Stellenausschreibungen immer noch relativ selten. Im August 2019 liefert eine Suche nach dem Begriff auf Indeed.com in Deutschland nur 29 Ergebnisse im Vergleich zu bekannteren Positionen wie Data Scientist (mit 1.161 Einträgen) oder Data Analyst (mit 2.365 Einträgen). Selbst in einem wichtigen Technologiezentrum wie San Francisco sind nur 213 Data Steward-bezogene Stellenausschreibungen zu verzeichnen, gegenüber 2.558 Data Scientist- und 3.942 Data Analyst-Stellen.
Ein(e) verantwortliche(s) Person oder Team hat sicherlich Vorteile, aber Data Stewards müssen nicht unbedingt eine einzige Person sein, die für alle Aspekte der Datenqualität und -pflege verantwortlich ist. Data Stewardship kann vielmehr in Form von verteilten Zuständigkeiten in einer Organisation oder einer Data Science-Abteilung erfolgen. Mit der richtigen Unternehmenskultur können und sollten die Grundsätze des Data Stewardships auch unternehmensweit eingehalten werden.
Der Schlüssel liegt darin, den hohen Stellenwert qualitativ hochwertiger Daten zu erkennen und die Einhaltung hoher Standards aktiv zu verfolgen und zu priorisieren - nicht nur, um die potenziellen Kosten durch fehlerhafte oder missbrauchte Daten zu vermeiden, sondern auch, um die Wettbewerbsfähigkeit und den langfristigen Erfolg eines Unternehmens in einer datenbasierten Welt sicherzustellen.