Qualitätsprüfungen in SQL – So stellst du mit Kennzahlen (KPIs) deine Datenqualität sicher

Datenqualität ist das Fundament jeder Analyse.
Egal ob in Power BI, Data Warehouse oder Reporting-Systemen – wenn die zugrunde liegenden Daten fehlerhaft sind, helfen auch die besten Visuals nichts.

Mit SQL lassen sich einfache, aber wirkungsvolle Qualitätsprüfungen aufbauen, um Abweichungen frühzeitig zu erkennen und KPIs zuverlässig zu validieren.
In diesem Beitrag zeige ich dir praxisnah, wie du Qualitätsprüfungen direkt in SQL durchführst – ohne teure Tools oder komplizierte Frameworks.

Warum Datenqualitätsprüfungen in SQL wichtig sind

In vielen Unternehmen fließen Daten aus verschiedenen Systemen in ein zentrales Data Warehouse oder Power BI Modell.
Dabei können sich Fehler einschleichen – z. B. durch:

  • fehlerhafte Schnittstellen
  • fehlende Werte oder doppelte Datensätze
  • unvollständige Ladevorgänge

Das Ergebnis:
KPIs stimmen nicht mehr, Reports zeigen falsche Zahlen, und Entscheidungen basieren auf unzuverlässigen Daten.

Genau hier setzt die SQL-Qualitätsprüfung an – sie hilft dir, solche Fehler automatisiert zu erkennen und zu dokumentieren.

1. KPI-basierte Qualitätsprüfungen

Statt alle Tabellen Zeile für Zeile zu kontrollieren, kannst du mit Kennzahlen-Abgleichen (KPI-Checks) eine schnelle Plausibilitätsprüfung durchführen.

Beispiel:
Du möchtest sicherstellen, dass Umsatz, Bestellmenge und Kundenzahl zwischen zwei Systemen übereinstimmen.

SELECT 
    SUM(Umsatz) AS Gesamtumsatz,
    COUNT(DISTINCT KundenID) AS Kundenanzahl,
    SUM(Menge) AS Gesamtmenge
FROM DWH_FactSales;

Führe denselben Check auf dem Quellsystem aus und vergleiche die Ergebnisse.
Wenn die Kennzahlen gleich sind, ist die Datenbasis mit hoher Wahrscheinlichkeit konsistent.

💡 Tipp:
Speichere die Ergebnisse dieser Prüfungen täglich in einer Log-Tabelle – so kannst du historische Abweichungen nachverfolgen.

2. Vollständigkeitsprüfungen (Data Completeness Checks)

Fehlende Daten sind einer der häufigsten Qualitätsprobleme.
Mit SQL kannst du prüfen, ob erwartete Datensätze wirklich vorhanden sind.

Beispiel:
Sind für jeden Kunden auch Bestellungen vorhanden?

SELECT 
    COUNT(*) AS KundenOhneBestellung
FROM Kunden k
LEFT JOIN Bestellungen b ON k.KundenID = b.KundenID
WHERE b.KundenID IS NULL;

Wenn diese Abfrage mehr als 0 Zeilen zurückliefert, fehlen Daten – und du weißt, wo du suchen musst.

3. Doppelte Datensätze erkennen (Duplicate Checks)

Dubletten verfälschen Analysen und Kennzahlen.
Ein einfacher DISTINCT-Vergleich reicht oft aus, um doppelte Zeilen zu identifizieren.

SELECT KundenID, COUNT(*) AS Anzahl
FROM Kunden
GROUP BY KundenID
HAVING COUNT(*) > 1;

Du kannst diese Logik auch erweitern – z. B. auf Kombinationen aus Name, E-Mail oder Adresse.
Ideal für Data-Cleansing-Prozesse vor dem Reporting.

4. Wertebereiche und Anomalien prüfen

Eine weitere wichtige Qualitätsprüfung ist die Überwachung von Wertebereichen.
So stellst du sicher, dass keine unlogischen oder fehlerhaften Werte auftauchen.

Beispiel:
Prüfe, ob Umsätze im erwarteten Bereich liegen.

SELECT *
FROM DWH_FactSales
WHERE Umsatz < 0 OR Umsatz > 1000000;

So erkennst du Ausreißer und Tippfehler sofort.
In größeren Systemen kannst du solche Prüfungen auch automatisch per SQL Agent Job ausführen lassen.

🧩 5. Automatisierte Qualitätsberichte

Mit wenigen Zeilen SQL kannst du dir ein Dashboard oder eine View bauen, die alle Prüfungen zusammenfasst.

SELECT
    (SELECT COUNT(*) FROM Kunden WHERE Email IS NULL) AS FehlendeEmails,
    (SELECT COUNT(*) FROM Bestellungen WHERE Datum IS NULL) AS FehlendeDaten,
    (SELECT COUNT(*) FROM Kunden k LEFT JOIN Bestellungen b ON k.KundenID=b.KundenID WHERE b.KundenID IS NULL) AS KundenOhneBestellung;

Diese View kannst du regelmäßig aktualisieren und in Power BI oder Excel einbinden – für automatisierte Qualitätsreports.

Fazit

Mit SQL kannst du Datenqualität nicht nur prüfen, sondern messbar machen.
Durch KPI-basierte Vergleiche, Vollständigkeits-Checks und automatisierte Berichte stellst du sicher, dass deine Datenanalysen belastbar bleiben.

Gerade in Data-Warehouse- und Reporting-Projekten ist das entscheidend, um Vertrauen in Zahlen aufzubauen – intern wie extern.

🔗 Weiterführende Artikel

Für tiefergehende SQL-Analysen und Performance-Tipps schau dir auch diese Beiträge an:

Und wenn du lieber visuell lernst:
👉 YouTube-Kanal „Datenanalyst“ – dort findest du passende Video-Tutorials mit Praxisbeispielen.