Die COVID-19-Pandemie sorgt in den traditionellen Medien und den sozialen Netzwerken für einer Informationsflut, wie ich sie noch nie erlebt habe. Im Minutentakt werden neue Daten, Hochrechnungen und Schätzungen publiziert, herumgereicht, diskutiert und miteinander verglichen. Dabei sind mir immer wieder grundlegende statistische Fehler oder Unsauberkeiten aufgefallen. Deshalb nachfolgend eine kurze Liste von häufigen statistischen Fallstricken. Die Liste ist nicht abschliessend und ich werde sie bei Gelegenheit mit weiteren Beispielen ergänzen (Ergänzung: Teil 2 der Liste mit Fragen 11 bis 26 wurde am 30. März 2020 veröffentlich und ist hier zu finden).
Wichtig: Nachfolgend geht es nur darum aufzuzeigen, was es beim Vergleich von Datenquellen zu beachten gilt. Die verwendeten Zahlen stützen sich alle auf verlässliche Quellen, dienen aber lediglich als Beispiele, d.h. sie sollen nicht als Referenzen für die Einschätzung der Lage in den erwähnten Ländern verwendet werden. Einerseits, da die Zahlen schnell überholt sind, andererseits, weil die Zahlen nur einen kleinen Teil der Informationen darstellen, die für das Eindämmen der Epidemie notwendig sind. Für aktuelle und verlässliche epidemiologische Einschätzungen gilt es, sich an vertrauenswürdige Quellen zu halten. Die wissenschaftliche Ideenschmiede «reatch» hat eine Übersicht solcher Quellen erstellt, die auch für epidemiologische Laien verständlich sein sollten: bit.ly/reatchCOVID19
1) Wurde die Einwohnerzahl eines Landes berücksichtigt?
Viele Kommentatoren vergleichen die Gesamtzahl der Fälle in verschiedenen Ländern. Dabei gilt es, die Anzahl der Fälle in Relation zu setzen mit der Bevölkerungszahl eines Landes. Südkorea hat bis jetzt über knapp 9000 bestätigte COVID-19-Fälle zu verzeichnen, die Schweiz gut 5500 (Stand: 21. März 2020, 09h00, gemäss Worldometers). Doch Südkorea hat auch eine Bevölkerung von ungefähr 51.5 Millionen Einwohnern, die Eidgenossenschaft ist mit gut 8.5 Millionen Einwohnern auch rund sechs Mal kleiner. Wenn man die Anzahl der bestätigten Fälle durch die Einwohnerzahl teilt, dann wird deutlich, dass die Schweiz mit knapp 650 Fällen pro Million Einwohner in relativen Zahlen viel stärker von COVID-19 betroffen ist als Südkorea mit 172 Fällen pro Million Einwohner (Stand: 21. März 2020, 09h00, gemäss Worldometers).
[Ergänzung 2020.12.02: Ich sehe immer wieder Berichte, in denen relative Corona-Kennzahlen aus verschiedenen Ländern miteinander verglichen werden (zum Beispiel hier im Tages-Anzeiger oder hier in der NZZ). Dabei wird die absolute Kennzahl meist durch die Zahl der Einwohner eines bestimmten Landes dividiert. Das kann zu Vergleichszwecken sinnvoll sein, um die relative Belastung einer Epidemie in unterschiedlich bevölkerungsreichen Ländern vergleichen zu können: 100'000 Infizierte sind für die Schweiz in der Regel belastender als 100'000 Infizierte in Deutschland.
Problematischer wird die Verwendung relativer Kennzahlen jedoch, wenn damit die Kontrolle des Infektionsgeschehens verglichen werden soll. Denn: Bei exakt gleichem Infektionsgeschehen in zwei unterschiedlich bevölkerungsreichen Ländern (d.h. gleiche absolute Fallzahlen, gleiche Ausbreitungsgeschwindigkeit, gleiche Todeszahlen etc., aber unterschiedliche Bevölkerungsgrösse) hat das bevölkerungsärmere Land zwangsläufig höhere relative Kennzahlen als das bevölkerungsreiche Land, solange die Epidemie exponentiell am Wachsen ist.
Das hat nichts mit dem Infektionsgeschehen zu tun, sondern ist ein statistisches Artefakt aufgrund der Division durch die Bevölkerungsgrösse. Siehe dazu die «quick-and-dirty»-Simulation hier:
Die absoluten Zahlen sind in beiden Ländern die gleichen, die relativen Zahlen vermitteln jedoch das Bild, dass im kleineren Land die Epidemie stärker wütet als im grossen Land. Das erklärt beispielsweise, warum ein kleines Land wie Luxemburg in Ländervergleichen basierend auf relativen Corona-Kennzahlen so weit oben liegt.]
2) Was ist die aktuelle Wachstumsrate der Fälle?
Vergleiche mit absoluten Fallzahlen geben auch keinen Aufschluss darüber, wie viele neue Fälle hinzukommen. So steigt die Anzahl der neu bestätigten Fälle in der Schweiz seit mehreren Wochen rasant an – in den letzten beiden Tagen waren es über 1000 neu bestätigte Fälle pro Tag (Stand: 21. März 2020, 09h00, gemäss Worldometers), was ca. 120 neuen Fällen pro Million Einwohner entspricht. Südkorea meldet hingegen seit über einer Woche ca. 100 neu bestätigte Fälle pro Tag (Stand: 21. März 2020, 09h00, gemäss Worldometers), was ca. 2 neuen Fällen pro Million Einwohner entspricht.
3) Wann ist COVID-19 erstmals in einem Land ausgebrochen?
Ebenso ist zu beachten, dass COVID-19 nicht in allen Ländern gleichzeitig ausgebrochen ist. Südkorea hat schon seit Ende Januar erste COVID-19-Fälle zu verzeichnen. In der Schweiz sind die ersten Fälle erst Ende Februar aufgetreten und dennoch werden wir Südkorea in ein bis zwei Tagen überholen, was die Gesamtzahl der bestätigten Fälle anbelangt – wenn sich das Wachstum in der Schweiz nicht stark abschwächt (Stand: 22. März 2020, 11h30, gemäss Worldometers).
4) Handelt es sich um bestätigte Fallzahlen oder um epidemiologische Schätzungen?
Auch zu beachten ist der Unterschied zwischen bestätigen Fallzahlen und Schätzungen basierend auf Modellrechnungen. Die bestätigten Fallzahlen in der Schweiz stellen zurzeit nur die unterste Schwelle aller Infizierten dar, weil es eine bestimmte Zeit dauert, bis bei infizierten Personen Symptome auftreten und längst nicht alle Infizierten getestet werden (mehr dazu hier).
5) Werden die Gesamtzahl der Tests oder die Tests pro Tag verglichen?
Im Zusammenhang mit COVID-19 wird auch die Bedeutung von flächendeckenden Tests diskutiert. Viele Expertinnen und Experten verweisen auf Südkorea als positives Beispiel und kritisieren mit Verweis auf die kumulative Anzahl der bereits durchgeführten Tests, dass die Schweiz weit hinter Südkorea hinterherhinke (siehe z.B. diesen Austausch auf Twitter). Andere betonen jedoch, dass die Schweiz in Bezug auf die Anzahl Tests pro Tag pro Einwohner fast gleichauf sei mit Südkorea.
Wie beim Vergleich der Zahl der infizierten Personen sollte aber auch die Zahl der Tests in Relation gesetzt werden mit Einwohnerzahl des jeweiligen Landes und den Beginn der Epidemie, um einschätzen zu können, ob ein Land mehr oder weniger Tests durchgeführt hat als ein anderer Staat. Hinzu kommt, dass zwischen der Anzahl der Tests pro Tag und der kumulativen Anzahl aller durchgeführten Tests unterschieden werden sollte. Weil Südkorea früher von COVID-19 betroffen war und damit auch früher mit der Durchführung von Tests begonnen hat, hat es sozusagen einen «Vorsprung», was die Anzahl der Tests anbelangt. Ein Vorsprung, der selbst dann bestehen bliebe, wenn die Schweiz ab sofort genau gleich viele Tests durchführen würde wie Südkorea.
Die Aussage, dass die Schweiz zurzeit ungefähr gleich viele Tests pro Tag und Einwohner durchführt, muss also nicht im Widerspruch stehen, dass Südkorea insgesamt bereits viel mehr Tests pro Einwohner durchgeführt hat.
6) Wann wurden die Daten publiziert?
Weil sich COVID-19 in vielen Ländern rasend schnell ausbreitet, sind die bestätigten Fall- und Testzahlen von heute morgen schon wieder überholt. Aus diesem Grund ist es wichtig, beim Vergleich der Datenpunkte immer darauf zu achten, wann diese erhoben und publiziert wurden. So ist beispielsweise ein Vergleich der Anzahl Fälle und Tests in verschiedenen Ländern nur dann sinnvoll, wenn wir dazu Daten heranziehen, die ungefähr zum gleichen Zeitpunkt erhoben wurden. Wenn die Daten aus zwei Ländern aber mehrere Tage auseinanderliegen – wie im Fall von Südkorea und der Schweiz bei diesem Beispiel hier – sind direkte Vergleiche mit Vorsicht zu geniessen. Abhilfe schaffen kann man, indem man sich auf einen Vergleich in einem klar abgesteckten Zeitfenster beschränkt, in dem Daten für beide Vergleichsländer vorhanden sind. Tut man das beispielsweise für den Zeitraum vom 25. Februar bis zum 09. März 2020, dann zeigt sich, dass Südkorea in dieser Zeit viel mehr Tests pro Tag und pro Einwohner durchgeführt hat als die Schweiz.
Dass die Schweiz laut Angaben des Bundesamtes für Gesundheit mittlerweile fast gleichauf ist in Bezug auf die Gesamtzahl der durchgeführten Tests pro Einwohner, liegt daran, dass die Testkapazitäten in den letzten Tagen massiv erhöht wurden, sodass aktuell bis zu 7000 Tests pro Tag möglich sein sollen (Stand: 22. März 2020, NZZ am Sonntag).
7) Können sich die publizierten Todesraten noch ändern?
Ebenfalls mit Vorsicht zu geniessen sind die aktuell bestätigten Todesraten in verschiedenen Ländern. Es ist entscheidend zu betonen, dass es sich hierbei nicht um die Rate der Todesfälle unter allen infizierten Personen handelt, sondern um die Rate der Todesfälle unter allen bestätigten Fällen. Die Zahl der tatsächlich infizierten Personen liegt vielerorts deutlich höher, was für eine tiefere Todesrate spricht, als die bestätigten Fälle es vermuten lassen. Ebenso wichtig ist es aber zu berücksichtigen, dass gerade in der Anfangsphase eines COVID-19-Ausbruchs die Anzahl der Infizierten viel schneller ansteigt als die Anzahl der Todesfälle. SARS-CoV-2 hat bei vielen Menschen eine eher lange Inkubationszeit, d.h. es dauert mehrere Tage bis zu zwei Wochen, bis die Krankheit bei ihnen ausbricht. Die überwiegende Mehrheit der Erkrankten überlebt glücklicherweise, doch jene, die daran sterben, tun das in der Regel erst nach einigen Tagen bis Wochen, nachdem das Virus nachweisbar ist oder Symptome aufgetreten sind. Während eines laufenden COVID-19-Ausbruchs gibt es also viele infizierte Menschen, die erst im weiteren Verlauf der Epidemie versterben werden. In der Schweiz lag beispielsweise über eine Woche zwischen der ersten bestätigen COVID-19-Infektion und dem ersten bestätigten Todesfall.
Das sind nur einige rein statistischen Gründe, weshalb die aktuell bestätigten Todesraten für COVID-19 sich noch verändern können. Hinzu kommen noch andere Gründe: Wenn beispielsweise ein Gesundheitssystem wegen zu vieler COVID-19 überlastet ist und damit an einen «Kipp-Punkt» gelangt, könnten die Todesraten in die Höhe schnellen. Nicht, weil das Virus gefährlicher geworden wäre, sondern weil die Infizierten keine optimale medizinische Versorgung mehr erhalten. Siehe dazu auch die Fragen 14, 17 und 18 im zweiten Teil dieser Liste.
8) Wurde die Bevölkerungsstruktur der verschiedenen Ländern mitberücksichtigt?
Ebenfalls wichtig für den Vergleich von Todesraten zwischen zwei Ländern ist die Information, ob die Bevölkerungsstruktur in den beiden Ländern vergleichbar ist. Das Risiko, an COVID-19 zu sterben, steigt mit zunehmendem Alter stark an. Ein Land, das einen höheren Anteil von betagten Einwohnern hat, muss durchschnittlich also mit mehr Todesfällen rechnen als ein Land, das mehr junge Einwohnern hat. Um die Todesraten verschiedener Länder miteinander vergleichen zu können, sollte deshalb idealerweise eine Standardisierung der Altersstruktur vorgenommen werden – zum Beispiel mithilfe einer «Referenzpopulation» wie der «European Standard Population».
9) Was sagt eine Bevölkerungsstatistik über mein individuelles Risiko aus?
Wenig. Alte Menschen haben im Durchschnitt ein höheres Risiko, an COVID-19 zu sterben, als junge Menschen. Das bedeutet aber nicht, dass alle alten Menschen ein höheres Risiko haben als alle junge Menschen. Diabetes, Herz-Kreis-Lauf-Erkrankungen oder chronische Atemwegserkrankungen korrelieren nach aktuellstem Kenntnisstand mit einem erhöhten Risiko, an COVID-19 zu sterben. Solche Krankheiten treten bei alten Menschen häufiger auf als bei jungen – und dennoch kann eine kerngesunde 66-Jährige ein tieferes Risiko haben, an COVID-19 zu sterben, als ein 33-Jähriger mit einer chronischen Atemwegserkrankung.
Hinzu kommt, dass nicht alle ihr eigenen gesundheitlichen Vorbelastungen kennen. So korreliert Bluthochdruck mit einer erhöhten Sterberate bei COVID-19-Infizierten. Ich weiss aber beispielsweise nicht, was mein durchschnittlicher Blutdruck ist. Wie gut andere in meinem Umfeld über ihren Blutdruck Bescheid wissen, habe ich versucht mit einer – in keiner Weise repräsentativen – Twitter-Umfrage in Erfahrung zu bringen. Von den 75 Personen, die abgestimmt haben, kennen rund 30 Prozent ihren Blutdruck. Ich habe meinen in der Zwischenzeit auch erfahren, weil ich zum Blutspenden gegangen bin.
10) Auf welcher Skala sind die Zahlen einer Grafik aufgetragen?
Einige der Grafiken zu COVID-19 werden auf einer logarithmischen Skala angezeigt, andere auf einer linearen Skala. Die logarithmische Skala hat den Vorteil, dass sich schnell anwachsende Zahlenreihen «sauberer» darstellen lassen, was Vergleiche zwischen Ländern erleichtert. Der Nachteil ist, dass die hohe Geschwindigkeit von neuen Fällen im späteren Verlauf der Ausbreitung weniger gut fassbar ist. Als Daumenregel kann man sich merken: Eine gerade Linie auf einer logarithmischen Skala entspricht einem exponentiellen Wachstum auf der linearen Skala (siehe Bild unten; Stand: 21. März 2020, 10h40, gemäss Worldometers).
Weitere Anmerkungen
Abschliessend sei noch erwähnt, dass jeder länderübergreifende Vergleich grundsätzlich mit Vorsicht zu geniessen ist. Unterschiede in den bestätigten Zahlen können viele Ursachen haben: Unterschiedliche Testprotokolle, Unterschiede im Verhalten, Unterschiede in den politischen Massnahmen, um nur einige Beispiele zu nennen. Für verlässliche Einschätzung der Ursachen für die unterschiedlichen Zahlen gilt es, sich an die jeweiligen Expertinnen und Experten zu halten (und nicht an jene, die sich dafür halten).
Ebenso möchte ich betonen, dass unvollständige Daten kein hinreichender Grund sind, um abzuwarten. Ja, es braucht in Bezug auf die COVID-19-Epidemie unbedingt mehr verlässliche Daten, um die richtigen Entscheide zu treffen – der Aufbau einer umfassenden Test-Strategie, wie es einige Schweizer Expertinnen und Experten fordern, könnte dabei helfen. Doch aufgrund bestehender Unsicherheiten in den Daten zu schliessen, dass wir erst einmal abwarten sollten, wäre meines Erachtens ein unverzeihlicher Fehler.
Hier geht es zu Fragen 11 bis 26.
Herzlichen Dank an Dominik Menges vom Institut für Epidemiologie, Biostatistik und Prävention der Universität Zürich für kritisches Feedback!
Relevante Interessenverbindungen
Ich arbeite in der Gruppe für Angewandte Statistik an der Universität Zürich. Siehe hier für eine vollständige Liste aller Interessenverbindungen.
Anpassungen
29. März 2020: Auswertung der Twitter-Umfragen bzgl. Blutdruck eingefügt; kleinere Fehler korrigiert.
30. März 2020: Verweis auf Teil 2 der Liste hinzugefügt.
02. Dezember 2020: Ergänzung zu Frage 1 bzgl. Vergleich relativer Kennzahlen angebracht.