Serie | Interaktive Datenvisualisierung – Datenbasierte Entscheidungen treffen und Handlungsempfehlungen aussprechen. Ein Fallbeispiel aus der Statistik zur Covid-19 Pandemie

Informationen und Daten sind eine wichtige Grundlage zur Einschätzung und Steuerung von Geschäftsprozessen, nicht zuletzt einer Pandemie. Die Covid-19 Pandemie ist nach wie vor eine globale Herausforderung, sodass es Werkzeuge und Methoden bedarf, die aktiv einen Beitrag zur Eindämmung und Bekämpfung leisten. Durch die Auswertung von Daten lassen sich Informationen über den Verlauf der Pandemie ableiten, weshalb der Statistik hier eine große Bedeutung zukommt. Die Menge an verfügbaren Daten nimmt täglich zu und damit auch das Potenzial daraus relevante Informationen ableiten zu können.

Zusammen mit einem Forscherteam der LMU konnte Lara das Epidemie-Geschehen in Deutschland mithilfe einer Bruchpunktanalyse der effektiven Reproduktionszahl bewerten. Dabei handelt es sich um ein statistisches Verfahren, das auf einem Regressionsmodell mit Bruchpunkten (engl. changepoints) basiert und den Epidemieverlauf datengesteuert anhand der Infektionsschutzgesetz-Meldedaten in verschiedene Phasen unterteilt. Abbildung 1 zeigt das Ergebnis einer Bruchpunktanalyse, der ein klassisches lineares Regressionsmodell mit Bruchpunkten zugrunde liegt. Der zeitliche Verlauf des effektiven R-Werts wird also in abschnittsweise Geraden eingeteilt, wodurch man Erkenntnisse über den durchschnittlichen Anstieg bzw. Rückgang des effektiven R-Werts erhält.

Insgesamt wurden für den Verlauf des R-Werts in diesem Zeitraum fünf Bruchpunkte geschätzt, die im Wesentlichen zeitlich gut interpretiert und nachvollzogen werden können. So fand beispielsweise die erste Veränderung Ende März 2020 statt. Davor fiel der R-Wert deutlich ab, was mit den öffentlichen Diskussionen und ersten Maßnahmen, wie beispielsweise der Absage großer Veranstaltungen, zusammenhängen kann. Es zeichnen sich zudem die drei vergangenen „Infektionswellen“ ab. Fraglich ist jedoch, dass das Infektionsgeschehen bereits vor dem „Lockdown-Light“ am 2. November 2020, sowie der „Verschärfung“ am 16. Dezember 2020 sank und das Infektionsgeschehen damit bereits vor den ergriffenen Maßnahmen abschwächte. Die absoluten Fallzahlen hingegen stiegen zu diesem Zeitpunkt auffällig in die Höhe. Wie kann das sein?

Die Anzahlen berichteter Fälle oder darauf basierender Raten, wie beispielsweise die 7-Tages-Inzidenz, sind stark abhängig vom Testverhalten, welches im bisherigen Verlauf der Covid-19 Pandemie stetig variierte. Das Testangebot hat sich in den vergangenen 20 Monaten sowohl zeitlich als auch regional stark verändert. Die Testkapazitäten wurden deutlich erhöht, wodurch auch deutlich mehr Infektionen aufgedeckt werden konnten. Das trug natürlich auch mitunter zu den auffällig hohen Fallzahlen bei.

Letztlich muss man sich die Frage stellen, welches epidemiologische Maß geeignet ist, um das Infektionsgeschehen angemessen zu beschreiben. Anhand einer Studie von Brinks et al. (2020) wird deutlich, dass der R-Wert verglichen mit der Anzahl der berichteten Fälle und 7-Tages-Inzidenz verhältnismäßig robust und deutlich unabhängiger vom Testgeschehen ist. Zwar birgt auch die Schätzung des R-Wertes einige statistische Schwierigkeiten wie z.B. das notwendige Nowcasting, aber der wesentliche Nachteil der Abhängigkeit vom Testverhalten, der große Schwankungen implizieren kann, entfällt.
Wir möchten uns schließlich auf die positiven Erkenntnisse der Studie beschränken und folgendes hervorheben: Durch ein verpflichtendes Testangebot im öffentlichen Raum, wie beispielsweise an Schulen oder Arbeitsplätzen, können Infektionsketten frühzeitig erkannt und unterbrochen werden, was langfristig zu einer Reduktion der Inzidenzen führt.

Erkenntnisse aus Daten können eine Menge an Diskussionsbedarf auslösen und von der Zielgruppe unterschiedlich interpretiert werden. Deshalb sind eine saubere Datenbasis und ein darauf aufbauendes, korrekt spezifiziertes Datenmodell unverzichtbar. Andernfalls geht man das Risiko ein am Ende verzerrte Ergebnisse zu erhalten und falsche Entscheidungen zu treffen, was verheerende Konsequenzen nach sich ziehen kann.

Quellen:

https://www.covid19.statistik.uni-muenchen.de/pdfs/codag_bericht_16.pdf

https://www.medrxiv.org/content/10.1101/2020.09.23.20200089v1.full-text

 

Übersicht der interaktive Datenvisualisierung Serie:

 

Haben wir Ihr Interesse geweckt? Kontaktieren Sie uns gerne.

Ihre Ansprechpartnerin

Datalytics Mitarbeiter Vorstellung Lara-Rad

Lara Rad

lara.rad@datalytics-consulting.com
+49 178 3984086