Blog

Pflege und Überwachung von Datenqualität

Wann lohnen sich Maßnahmen zur Qualitätssicherung?

Eine Verbesserung der Datenqualität ist mit Kosten verbunden. Bei Untätigkeit stehen dem jedoch kontinuierlich Opportunitätskosten gegenüber, da die Nutzung von schlechten Daten fortlaufend Kosten verursacht. Investitionen zur Verbesserung der Datenqualität lohnen sich, sobald die Kosten für die Verbesserung um X Prozent die Kosten durch Nicht-Verbesserung um diese X Prozent unterschreiten (siehe Grafik unten).

Kosten Datenqualitaet

Beispiel: Eine Firma investiert 1000 Euro in eine Software zum Aufspüren und Löschen von Kontaktduplikaten. Durch diese Maßnahme werden im Vertrieb der Firma Ressourcen eingespart, die je Monat einem Wert von 1100 Euro entsprechen. Die Investition hat sich damit nach weniger als einem Monat amortisiert.

Auswirkungen schlechter Datenqualität

Qualitativ schlechte Daten können sich im Unternehmen auf verschiedene Ebenen auswirken und je nachdem kurzfristige oder längerfristige Entscheidungen maßgeblich beeinflussen:

  • Operationale Ebene (Planungshorizont < 1 Jahr): In einem Callcenter können z.B. falsche Anrufzahlen dazu führen, dass an einem bestimmten Tag Über- oder Unterbesetzung von Callcenter-Mitarbeitern nicht erkannt wird.
  • Taktische Ebene (Planungshorizont 2 – 5 Jahre): Fehlerhafte Auftragsinformationen können zu fehlerhaften Entscheidungen beim Personalaufbau führen.
  • Strategische Ebene (Planungshorizont > 5 Jahre): Bei fehlerhaften Zahlen zum Kundenwachstum können z.B. falsche Budgetressourcen freigegeben werden.

Pflege und Überwachung von Datenqualität

Um oben genannte Fehlentscheidungen zu vermeiden, ist eine Überwachung und Steuerung der Datenqualität notwendig. Für die Durchführung eines entsprechenden Datenmanagements werden an dieser Stelle zwei Ansätze vorgestellt:

Systemorientierter Ansatz

Der systemorientierte Ansatz hat zum Ziel, dass die Daten mit der widergespiegelten Realität übereinstimmen. Im Zentrum des Ansatzes steht ein Informationssystem, bei dem Daten als Input einfließen, innerhalb des Systems umgewandelt werden, und danach als Output ausgegeben werden. Dieses System kann als Black-Box betrachtet werden, indem nur der Input mit dem Output in Beziehung gesetzt wird. Über eine ständige Anpassung des Informationssystems soll die Realität und deren Prozesse bestmöglich innerhalb der Daten abgebildet werden. Über diese Betrachtungsweise haben sich einige Empfehlungen herausgestellt:

  • Audits: Durchführung von Befragungen von Datennutzern zur Datenqualität.
  • Redesign: Überarbeitung des Systems bei Problemen mit der Datenqualität (ggf. auch mit einer Reduktion des Datenbestandes).
  • Training: Durchführung von Schulungen der Datennutzer zum Thema Datenqualität, um diese sensibler mit dem Umgang mit Daten zu machen.
  • Continuous Measurement: Etablierung von Mechanismen, die Datenqualität innerhalb des Systems selbstständig prüfen und sichern.

Produktorientierter Ansatz

Der produktorientierte Ansatz hat zum Ziel, dass qualitativ hochwertige Informationsprodukte hergestellt werden. Im Vordergrund steht die produzierte Information. Es wird versucht, Methoden zur Qualitätskontrolle und Qualitätssicherung auf den Informationsherstellungsprozess zu übertragen. Ausgangspunkt ist ein Informationssystem, in das Daten hineinfließen und Informationen als Produkt herauskommen. Für die Beurteilung eines solchen Systems ist es sinnvoll, folgenden Qualitätszyklus zugrunde zu legen:

Datenqualitaet Zyklus

  • Definition: Alle Beteiligten des Informationssystems werden bestimmt und definiert (Datennutzer, Anforderung der Nutzer, Inhalt und Art der Daten, Funktionsweise des Systems).
  • Messung: Messung der unter "Defintion“ definierten Kriterien (nachdem ein geeignetes Messinstrument entworfen wurde (z.B. "Wie wiele Datennutzer existieren?" oder "Spiegelt der Inhalt der Daten die Erfahrungen der Fachabteilung wider?"). Da Daten sowohl technische als auch inhaltliche Anforderungen erfüllen müssen, ist es von Vorteil, wenn bei der Entwicklung des Messinstruments technisch und fachlich ausgerichtete Mitarbeiter eng zusammenarbeiten. Eine komplett automatisierte Messung ist wegen der inhaltlichen Komponente nicht immer möglich.
  • Analyse: Analyse der Messergebnisse. Falls Qualitätsprobleme existieren, muss der Grund identifiziert werden.
  • Verbesserung: Ursachen für die schlechte Datenqualität werden behoben.

Beide Ansätze haben ihre Daseinsberechtigung. Sie sind bestrebt, die Datenqualität zu verbessern, wobei der erste Ansatz dies durch die Angleichung der Daten an den abgebildeten Sachverhalt versucht, der zweite Ansatz durch das Ziel, qualitativ hochwertige Informationsprodukte zu generieren.

Weitere Teile der Artikelreihe:

by Martin Badicke

Klassifikation der Datenqualität

by Martin Badicke

Datenqualität