Vor einer Woche habe ich in einem Artikel gängige Fehler und Unsauberkeiten im Umgang mit Statistiken aufzeigt – beispielhaft erklärt an den zurzeit allgegenwärtigen Zahlen zu COVID-19. Als Reaktion darauf habe ich viele Fragen und Rückmeldungen erhalten, die sich genauer anzuschauen lohnen. Hier folgen deshalb 16 weitere Fallstricke im Umgang mit (COVID-19)-Statistiken (Fragen 1 bis 10 finden sich hier).

Zur Erinnerung: Auch beim zweiten Teil dieser Liste geht es nur darum aufzuzeigen, was es bei der Beurteilung von Statistiken zu beachten gilt. Die verwendeten Zahlen stützen sich alle auf verlässliche Quellen, dienen aber lediglich als Beispiele, d.h. sie sollen nicht als Referenzen für die Einschätzung der Lage in den erwähnten Ländern verwendet werden. Vor allem deshalb, weil sich die Situation in Bezug auf COVID-19 laufend ändert und damit auch die Zahlen und Beispiele schnell veraltet sind. Für aktuelle und verlässliche epidemiologische Einschätzungen gilt es, sich an vertrauenswürdige Quellen zu wenden. Die wissenschaftliche Ideenschmiede «reatch» hat eine Übersicht solcher Quellen erstellt, die auch für epidemiologische Laien verständlich sein sollten: bit.ly/reatchCOVID19

11) Ist die Bevölkerungsdichte vergleichbar?

Christian Felber und Sven Titz (per E-Mail) haben darauf hingewiesen, dass die Bevölkerungsdichte nicht in jedem Land gleich ist. Das stimmt und ist für die Beurteilung der Fallzahlen und Wachstumsraten bei COVID-19 durchaus relevant: Je höher die Bevölkerungsdichte ist, desto einfacher kann sich SARS-CoV-2 verbreiten.

In einem Gebiet mit hoher Bevölkerungsdichte ist durchschnittlich mit mehr Infektionen zu rechnen als in eine Region, indem weniger Menschen pro Quadratkilometer leben – sofern andere relevante Parameter wie zum Beispiel die ergriffenen Präventionsmassnahmen, individuelle Verhaltensweisen oder Mobilität ähnlich sind.

12) Ist die Bevölkerungsdichte wirklich vergleichbar?

Wenn sich ein Grossteil der Bevölkerung auf einen kleinen Teil des Landes konzentriert, kann der Blick auf die durchschnittliche Bevölkerungsdichte in die Irre führen. So hat die Schweiz eine durchschnittliche Bevölkerungsdichte von ca. 214 Personen pro Quadratkilometer (Stand: 2018; Quelle: Bundesamt für Statistik). Ein grosser Teil der Bevölkerung lebt jedoch in den Städten und der Agglomeration, wohingegen die alpinen Regionen kaum besiedelt sind. So liegt die Bevölkerungsdichte in der Stadt Zürich bei ca. 4724 Einwohnern pro Quadratkilometer, in der Gemeinde Ferrera im Kanton Graubünden hat es hingegen gerade einmal eine Person pro Quadratkilometer (Stand: 2018; Quelle: Bundesamt für Statistik).

Auch in anderen Ländern ist die Bevölkerung nicht gleichmässig verteilt, sondern konzentriert sich auf die Ballungszentren, wie die nachfolgende Grafik sehr schön zeigt (Stand: 2011; Quelle: Eurostat/Alasdair Rae).

Spanien hat beispielsweise mit ca. 94 Einwohnern pro Quadratkilometer eine ausserordentlich tiefe durchschnittliche Bevölkerungsdichte (Stand: 2020; Quelle: Worldometers). Über 80% der Bevölkerung lebt aber in Städten (Stand: 2020; Quelle: Worldometers), d.h. die überwiegende Mehrheit der spanischen Bevölkerung lebt in Gebieten mit einer bedeutend höheren Bevölkerungsdichte, als es der nationale Durchschnitt vermuten liesse.

13) Sind die dokumentierten Fallzahlen repräsentativ für das ganze Land oder nur für eine Region?

Ein genauer Blick auf regionale Unterschiede innerhalb eines Landes lohnt sich auch in Bezug auf die Fallzahlen, wie Philipp Meier und Mario Leandros anmerkten. Offensichtlich wird das am Beispiel von China. Das Land weist gut 82'000 dokumentierte COVID-19-Fälle auf, was ungefähr 57 dokumentierten Fällen pro Million Einwohner entspricht. Damit liegt China unter dem weltweiten Durchschnitt der dokumentierten Infektionen pro Einwohner (Stand: 28. März, 14h40; Quelle: Worldometers). Mit gut 50'000 entfällt aber die Mehrheit der dokumentierten Fälle auf die Stadt Wuhan in der chinesischen Provinz Hubei, wo SARS-CoV-2 zum ersten Mal im Menschen nachgewiesen wurde. Bei ca. 11 Millionen Einwohnern in Wuhan ergibt das über 4500 dokumentierte Infektionen pro Million Einwohner (Stand: 28. März; Quelle: National Health Commission in China).

Ähnliche, wenn auch nicht ganz so extreme regionale Unterschiede lassen sich beispielsweise in Italien feststellen. Italien weist zurzeit ca. 86'000 dokumentierte COVID-19-Fälle auf, was gut 1400 Fällen pro Million Einwohner entspricht (Stand: 27. März 2020, 17h00; Ministero della Salute). 37'000 dieser Fälle entfallen auf die Lombardei, welche damit ca. 3700 dokumentierte Fälle pro Million Einwohner aufweist (Stand: 27. März 2020, 17h00; Ministero della Salute). Und auch beim Blick auf die Schweiz fällt auf, dass die Süd- und Westschweizer Kantone zurzeit viel stärker von COVID-19 betroffen sind als der Rest der Schweiz (Stand: 28. März,14h30; Quelle: corona-data.ch).

14) Sind die getesteten Personen repräsentativ für die Gesamtbevölkerung?

Viele Länder (u.a. die Schweiz) führen labordiagnostische Tests zum Nachweis von SARS-CoV-2 zurzeit in erster Linie bei Risikogruppen und Personen mit schweren Krankheitsverläufen durch. Diese Bevölkerungsgruppen sind aber in Bezug auf das Sterberisiko nicht repräsentativ für die Gesamtbevölkerung. Das kann dafür sorgen, dass die sogenannte «Case Fatality Rate», also die Anzahl der Todesfälle pro bestätigtem COVID-19-Fall, überschätzt wird. Denn jene Personen, die zu einer Risikogruppe gehören oder einen schweren Verlauf der Krankheit haben, sind auch jene Personen, die ein höheres Risiko haben, an COVID-19 zu sterben (siehe dazu auch Frage 7 im ersten Teil. Wenn aber Menschen versterben, die zuvor nicht auf SARS-CoV-2 getestet wurden, kann das zu einer Unterschätzung der Todesrate führen (siehe dazu auch Fragen 17 und 18).

15) Wenn wir nicht alle testen, können wir die Geschwindigkeit der Ausbreitung überhaupt verfolgen?

Ja. Zumindest dann, wenn die getesteten Personen ungefähr das gleiche Ansteckungsrisiko und eine ähnliche Inkubationszeit haben wie der Rest der Bevölkerung. Haben sie eine höheres Risiko oder eine kürzere Inkubationszeit – zum Beispiel, weil sie besonders häufig mit infizierten Menschen in Kontakt kommen oder früher Symptome entwickeln – dann überschätzen die publizierten Zahlen die Wachstumsrate. Haben sie ein tieferes Ansteckungsrisiko oder eine längere Inkubationszeit – zum Beispiel, weil sie weniger mobil sind oder weil ihr Immunsystem später auf den Erreger reagiert – dann unterschätzen die publizierten Zahlen die Wachstumsrate.

Solange die Ausbreitungsgeschwindigkeit von COVID-19 in der getesteten Bevölkerungsgruppe aber positiv korreliert mit der Ausbreitungsgeschwindigkeit im Rest der Bevölkerung, lässt sich – rein mathematisch – an einem Rückgang des Wachstums bei der getesteten Bevölkerungsgruppe auch ein Rückgang des Wachstums in der Gesamtbevölkerung ablesen. Voraussetzung dafür ist, dass die Testkapazitäten nicht komplett mit tatsächlichen COVID-19-Fällen ausgeschöpft sind (siehe dazu Frage 23).

16) Werden die Daten in den gleichen Abständen erhoben und publiziert?

Gerade für das Abschätzen der Wachstumsraten ist es entscheidend, dass die Daten ungefähr gleichmässig erhoben, bearbeitet und publiziert werden. Das scheint nicht überall der Fall zu sein. Wer sich beispielsweise die vom Robert-Koch-Institut in Deutschland veröffentlichten täglichen Fallzahlen anschaut, wird an den Wochenenden einen merklichen Rückgang des Wachstums feststellen, gefolgt von einem starken Anstieg an Wochentagen. Da das Virus keine freien Tage kennt, der Mensch aber sehr wohl, sind diese Schwankungen im täglichen Wachstum der Fallzahlen wohl in erster Linie darauf zurückzuführen, dass an den Wochenenden weniger Fälle getestet oder verarbeitet werden. Wer die Wachstumsrate basierend auf den aktuellen Daten des Robert-Koch-Instituts schätzen möchte, muss die Daten von mindestens einer Woche berücksichtigen, um eine verlässliche Angabe machen zu können.

17) Werden Todesfälle überall auf die gleiche Art und Weise gezählt?

Mario Leandros hat darauf hingewiesen, dass Todesfälle in verschiedenen Ländern allenfalls unterschiedlich erfasst werden könnten und auch Esteban Ortiz-Ospina hat dazu auf Twitter einen Thread publiziert, der sich dieser Frage annimmt.

In Italien wird ein Todesfall beispielsweise dann mit COVID-19 assoziiert, wenn mittels labordiagnostischer Tests nachgewiesen wurde, dass die Betroffenen mit SARS-CoV-2 infiziert waren – unabhängig von anderen Komorbiditäten, die zusammen mit dem Virus zum Tod geführt haben (könnten). Auch in der Schweiz scheint das der Fall zu sein, weil das Bundesamt für Gesundheit bei allen Verdachtsfällen einen labordiagnostischen Test empfiehlt (siehe Verdachts-, Beprobungs- und Meldekritieren des BAG; Stand: 24. März 2020). [Ergänzung 2020.04.01: In Grossbritannien werden in den täglich veröffentlichten COVID-19-Statistiken nur Patienten aufgeführt, die im Spital verstorben sind und bei denen ein positiver labordiagnostischer Test für SARS-CoV-2 vorliegt. COVID-19-Todesfälle, die sich ausserhalb der Spitäler ereignen, werden damit also nicht erfasst. In den wöchentlich veröffentlichten Statistiken werden jedoch auch labordiagnostisch bestätigte Todesfälle ausserhalb von Spitälern aufgeführt sowie Todesfälle, bei denen COVID-19 aufgrund der Symptomatik als Ursache vermutet wird, aber keine labordiagnostische Bestätigung vorliegt (Stand: 1. April 2020; Quelle: UK government guidance on Number of coronavirus (COVID-19) cases and risk in the UK). Wer Hinweise darauf hat, wie andere Länder die Todesfälle erfassen, bitte bei mir melden.] Grundsätzlich ist nicht davon auszugehen, dass alle Staaten genau die gleichen Teststrategien verfolgen und genau die gleichen Ressourcen dafür haben, sodass direkte Vergleiche der Todeszahlen zwischen den einzelnen Ländern im Moment nur unter Vorbehalt möglich sind.

Allergrösste Vorsicht ist jedoch geboten bei Zahlen aus Staaten, deren Regierungen aus politischen Gründen die öffentlichen Statistiken manipulieren. Dieser Verdacht steht beispielsweise bei Russland im Raum. So hat sich das Land 2015 zum Ziel gesetzt, die Todesfälle aufgrund kardiovaskulärer Erkrankungen zu reduzieren. Rein statistisch scheint das gelungen zu sein, doch mit dem Rückgang der Toten durch kardiovaskuläre Erkrankungen ging in fast gleichem Ausmass ein Anstieg der Todesfälle aufgrund unklarer oder seltener Krankheiten einher. Auch bei den sehr tiefen COVID-19-Zahlen, welche die russischen Gesundheitsbehörden melden, bestehen Fragezeichen. Nicht zuletzt deshalb, weil Rosstat, die russische Statistikbehörde, im Januar einen massiven Anstieg von Lungenentzündungen registrierte. Da viele COVID-19-Patienten eine Lungenentzündung bekommen, liegt der Verdacht nahe, dass dieser Anstieg auch auf SARS-CoV-2-Infektionen zurückzuführen ist und die Anzahl der COVID-19-Fälle in Russland damit höher liegt als offiziell berichtet.

18) Sorgt das viele Testen auf SARS-CoV-2 dafür, dass die COVID-19-Todeszahlen nach oben verzerrt werden?

Wenn ein Mensch mit typischen COVID-19-Symptome verstirbt und zudem eine labordiagnostische Bestätigung für SARS-CoV-2 vorliegt, dann ist es sinnvoll, diese Person (auch) als COVID-19-Fall zu erfassen, selbst wenn andere Vorerkrankungen vorliegen (siehe dazu auch Frage 19). In Bezug auf die Statistik sind mit dieser Praxis – wenig überraschend – zwei Auswirkungen möglich.

Wir überschätzen die Anzahl der COVID-19-Todesfälle, z.B. wenn Menschen, die mit SARS-CoV-2 infiziert sind, ohne an COVID-19 erkrankt zu sein, aber beispielsweise an einer Hirnblutung sterben, als COVID-19-Todesfälle erfasst würden.
Wir unterschätzen die Anzahl der COVID-19-Todesfällen, z.B. wenn nicht alle Menschen, die an COVID-19 gestorben sind, vor dem Tode einen Test auf SARS-CoV-2 gemacht haben.

Welche dieser beiden Auswirkungen ist nun stärker? Aufgrund der gegenwärtigen Testpraxis und den vorhandenen Daten aus den betroffenen Ländern scheint es momentan eher so zu sein, dass die absolute Zahl der COVID-19-Todesfälle eher unter- als überschätzt wird.

Einerseits sind in den meisten Ländern momentan gar nicht die Kapazitäten vorhanden, um «blind» alle Menschen zu testen. Auch in der Schweiz beschränkten sich die labordiagnostischen Abklärungen momentan auf Verdachtsfälle, welche typische COVID-19-Symptome zeigen (siehe dazu die aktuellen Meldekriterien des Bundesamts für Gesundheit, Stand: 24. März 2020). Es kann durchaus vorkommen, dass Verstorbene fälschlicherweise als COVID-19-Todesfälle gezählt werden, aber die Wahrscheinlichkeit bleibt solange gering, wie sich die Tests auf klinisch begründete Verdachtsfälle beschränken.

Andererseits zeigen die Todeszahlen in gewissen italienischen Gemeinden, dass die oben beschriebene Testpraxis das ganze Ausmass der COVID-19-Todesfälle dort eher unter- als überschätzt. So hatte die Stadt Bergamo vom 1. Januar bis zum 19. März 2020 fast doppelt so viele Todesfälle zu verzeichnen als im gleichen Zeitraum in den vergangenen Jahren (1128 statt 628 Verstorbene). Offiziell als COVID-19-Todesfälle registriert wurden aber nur gut 10% der zusätzlich angefallenen Todesfälle (48 von 500 zusätzlich Verstorbenen). Ähnlich sieht es in der Gemeinde Nembro aus. Zwischen dem 1. Januar und dem 24. März 2020 wären basierend auf den Todeszahlen aus den Vorjahren 35 Todesfälle zu erwarten gewesen. Tatsächlich verstorben sind aber 158 Menschen, wovon nur 31 als COVID-19-Fälle registriert sind.

In Ländern, in denen labordiagnostische Tests gar nicht oder nur nur punktuell durchgeführt werden können, ist deshalb mit einer noch grösseren Dunkelziffer bei den Todesfällen zu rechnen. Ein Beispiel dafür wäre Tansania. Als Zivildienstleistender habe ich eine Weile am Ifakara Health Institut in Bagamoyo gearbeitet. Falls Tansania gleich hart von COVID-19 getroffen wird wie Europa, dann wird das dortige Gesundheitssystem schnell an die Kapazitätsgrenzen kommen und Tests werden nur bei einem Bruchteil der an COVID-19 erkrankten Personen möglich sein. Aber auch bei gewissen europäischen Staaten muss zurzeit damit gerechnet werden, dass die COVID-19-Todesfälle eher unterschätzt werden. Ein niederländischer Statistiker berichtete beispielsweise davon, dass in Holland Menschen mit COVID-19-Symptomen versterben, aber nicht als COVID-19-Todesfälle erfasst werden, weil sie nicht auf SARS-CoV-2 getestet worden sind.

[Ergänzung 1. April 2020: Auch bei Grippewellen scheint die tatsächliche Zahl der Todesfälle aufgrund der Grippe unterschätzt zu werden. Das Schweizer Bundesamt für Statistik erfasst die Anzahl der Todesfälle, die in einem bestimmten Zeitraum anfallen. Wenn mehr Todesfälle registriert werden, als zu erwarten sind, spricht man von einer sogenannten «Übersterblichkeit». Bei Grippewellen ist jeweils eine hohe Übersterblichkeit bei den Menschen über 65 Jahren zu beobachten, doch nur ein kleiner Teil davon wird statistisch als Grippe-Todesfall erfasst.]

19) Sterben die Menschen gar nicht an COVID-19, sondern an etwas anderem?

Die oben beschriebenen Praxis, Todesfälle mit COVID-19 zu assoziieren, sofern ein positiver labordiagnostischer Test vorliegt, wird mitunter als Vorwand missbraucht, um das Ausmass oder sogar die Existenz der COVID-19-Pandemie in Frage zu stellen. COVID-19 sei gar nicht für den Tod der getesteten Menschen verantwortlich. Würde nicht auf SARS-CoV-2 getestet werden, so merkten wir gar nicht, dass eine Pandemie im Gange sei, und die Todesfälle würden auf andere Ursachen zurückgeführt. Diese Behauptungen basieren aber auf mindestens vier Fehlüberlegungen.

Erstens ändert ein Verzicht auf diagnostische Tests nichts an der Tatsache, dass in Teilen Italiens das Gesundheitssystem am Rande des Kollaps steht, weil derart viele Menschen ärztliche Behandlung brauchen, und dass sich dort auch die Zahl der Todesfälle vervielfacht haben verglichen mit den durchschnittlichen Todeszahlen (siehe dazu auch Frage 18).

Zweitens wird nicht einfach «drauflosgetestet». In der Schweiz empfiehlt das Bundesamt für Gesundheit labordiagnostische Abklärungen zurzeit nur dann, wenn ein klinischer Verdacht besteht (danke an Dominik Menges für den Hinweis). Das sorgt dafür, dass die Zahlen eher unter- als überschätzt werden (siehe dazu auch Frage 18).

Drittens stimmt es zwar, dass Komorbiditäten wie Diabetes, Herz-Kreislauf-Erkrankungen oder chronische Atemwegserkrankungen mit einem höheren Sterberisiko für COVID-19 korrelieren (siehe dazu auch Frage 8 in Teil 1). Doch nur weil solche Komorbiditäten das Sterberisiko erhöhen, heisst das nicht, dass COVID-19 keine ursächliche Rolle beim Tod der Patienten spielt. Ohne COVID-19 als zusätzlichen Faktor lässt sich nicht schlüssig erklären, warum auf einmal derart viele Menschen hospitalisiert werden müssen und sterben (siehe dazu auch Frage 18). Das heisst das nicht, das die Vorerkrankungen unerwähnt bleiben. Das Schweizer Meldeformular zu COVID-19-Todesfällen verlangt auch die Erwähnung allfälliger Vorerkrankungen und gesundheitlichen Risiken der Verstorbenen (Meldeformular zum klinischen Befund nach Tod; abgerufen am 30. März 2020).

Viertens ist es auch bei vielen anderen Erkrankungen der Fall, dass Komorbiditäten die allgemeine Sterblichkeit erhöhen. So führt die Grippe – für sich genommen – bei den wenigsten von uns zum Tod. Bei Menschen mit bestimmten Vorerkrankungen steigt das Risiko jedoch stark an, weshalb das Bundesamt für Gesundheit für diese Personengruppen eine Grippeimpfung empfiehlt. Es wäre jedoch absurd zu behaupten, dass Grippetote ausschliesslich an ihren Vorerkrankungen verstorben seien. Oft ist es nämlich erst die Grippeinfektion, die Komplikationen mit Todesfolge auslöst. Ähnlich, aber nach aktuellem Kenntnisstand weitaus tödlicher verhält es sich bei COVID-19.

20) Hat sich die Falldefinition verändert?

Vorsicht bei der Interpretation der Fallzahlen ist geboten, wenn sich die Falldefinition ändert. Das war beispielsweise in China der Fall. Am 12. Februar kündigte die Nationale Gesundheitskommission in China an, dass fortan auch jene Patienten als COVID-19 gezählt würden, die COVID-19-Symptome und eine Lungenentzündung hatten – selbst dann, wenn noch kein labordiagnostischer Test auf COVID-19 durchgeführt worden war. Wenig überraschend schnellten die Zahlen der dokumentierten Fälle an jenem Tag massiv nach oben. Nicht, weil es plötzlich so viele Neuinfektionen gegeben hätte, sondern weil viele Menschen, die schon krank waren, wegen der neuen Falldefinition als COVID-19-Fälle erfasst wurden. Nur eine Woche wurde diese Entscheidung wieder revidiert und nur noch Patienten, bei denen ein positiver Labortest vorlag, wurden als COVID-19-Fälle gezählt.

Einen stärkeren Anstieg als erwartet könnte es aus ähnlichen Gründen auch in den Statistiken aus Deutschland geben. Das deutsche Robert-Koch-Institut änderte nämlich am 24. März 2020 die Falldefinition dahingehend, dass neu auch Patienten, die mit laborbestätigten COVID-19-Fällen im Kontakt kamen, als COVID-19-Fälle zählen, wenn die typischen Symptome vorhanden sind (danke an Pat Mächler für diesen Hinweis). Künftig werden in Deutschland also auch Patienten als COVID-19-Fälle registriert, bei denen keine labordiagnostische Bestätigung vorliegt, bei denen aber aufgrund der Symptomatik und eines vorangehenden Kontakts mit einem bestätigten COVID-19-Fall vermutet werden kann, dass es sich um COVID-19 handelt. Dass sich in den vom Robert-Koch-Institut veröffentlichen Zahlen trotz veränderter Falldefinition kein aussergewöhnlicher Anstieg zeigt, liegt wohl daran, dass offenbar weiterhin nur labordiagnostisch bestätigte Fälle in diese Statistiken einfliessen. Aus Sicht der Verbleichbarkeit der Daten ist das begrüssenswert.

21) Hat sich verändert, wie getestet wird?

Neben der Falldefinition kann sich auch die Art und Weise, wie getestet wird, verändern. Die Schweiz hat beispielsweise am Anfang des Ausbruchs versucht, alle Verdachtsfälle zu testen. Ab dem 9. März wurde die Strategie aber dahingehend verändert, dass nicht mehr alle COVID-19-Verdachtsfälle labordiagnostisch abgeklärt wurden, sondern sich die Tests auf Risikogruppen und schwere Fälle konzentrierten. Das hat statistisch gesehen zur Folge, dass die dokumentieren Fällen immer nur die unterste Schwelle aller infizierten Personen darstellen und dass gewisse statistische Metriken wie beispielsweise die «Case Fatality Rate» vorsichtig interpretiert werden müssen (siehe dazu auch Frage 4 im ersten Teil sowie Fragen 14, 17 und 18 in diesem Text).

[Ergänzung vom 31. März 2020: Das Universitätsspital Zürich hat mitgeteilt, dass es ab dem 1. April alle Patienten testen wird, unabhängig davon, ob diese COVID-19-Symptome zeigen oder nicht. In Deutschland hat das Robert-Koch-Institut mitgeteilt, die Dunkelziffer der mit SARS-CoV-2 infizierten Personen mittels repräsentativer Stichproben zu ermitteln. Ähnliche Anstrengungen werden auch in Norwegen und in Island unternommen.]

22) Ist die steigende Anzahl der Infektionen ein Artefakt der steigenden Anzahl der Tests?

Diese Frage wurde von Jörg (Nachname leider unbekannt) auf Twitter gestellt. Die Antwort darauf lautet: Jein. Da nicht alle möglichen Verdachtsfälle getestet werden, stellen die dokumentierte Zahl der COVID-19-Fälle nur die unterste Schwelle der tatsächlichen Zahl der infizierten Personen dar (siehe dazu auch Frage 4 im ersten Teil). Je breiter getestet wird, desto mehr COVID-19-Fälle werden erfasst und desto stärker nähert sich die dokumentierte Zahl der Fälle der tatsächlichen Anzahl der infizierten Personen an.

Dennoch gäbe es nur dann Grund zur Annahme, dass die steigenden Fallzahlen ausschliesslich ein Artefakt der steigenden Anzahl der Tests darstellen, wenn das Verhältnis der positiv getesteten Fälle zur Gesamtzahl der Tests über die Zeit hinweg ungefähr gleich bliebe. Dazu müsste aber auch die Anzahl der infizierten Personen unter den Getesteten ungefähr gleich bleiben, was während einer Pandemie eher unwahrscheinlich sein dürfte. Für die Schweiz habe ich keine nützlichen Angaben zur Anzahl der Tests über die Zeit hinweg gefunden, aber ein Blick auf Südkorea zeigt, dass das Verhältnis positiver Tests zur Gesamtzahl der Tests nicht [Ergänzung vom 22. April 2020: zufällig um einen konstanten Mittelwert schwankt, sondern zeitliche Muster erkennbar sind, die sich nicht mit der Anzahl der Tests allein erklären lassen] (siehe Grafik unten).

Beobachtungszeitraum: 1. Februar bis 28. März. Gestrichelte Linien zeigen Zeiträume ein, bei denen zwei oder mehr Tage zwischen einzelnen Datenpunkten liegen. Quelle: Korean Center for Disease Control, aggregiert via Wikipedia; Grafik: Servan Grünin… — Beobachtungszeitraum: 1. Februar bis 28. März. Gestrichelte Linien zeigen Zeiträume ein, bei denen zwei oder mehr Tage zwischen einzelnen Datenpunkten liegen. Quelle: Korean Center for Disease Control, aggregiert via Wikipedia; Grafik: Servan Grüninger.

23) Bedeuten abflachende Wachstumskurven nur, dass die Testkapazität erschöpft ist?

Nicht unbedingt. Das wäre nur dann der Fall, wenn ausschliesslich Menschen getestet werden, die tatsächlich an COVID-19 erkrankt sind. Das klingt etwas kontraintuitiv, deshalb eine kurze Ausführung dazu.

Kein diagnostischer Test ist perfekt. Auch bei den labordiagnostischen Tests, um COVID-19-Verdachtsfälle abzuklären, kommt es zu «falsch positiven» und «falsch negativen» Resultaten. Ein falsch positives Resultat liegt dann vor, wenn eine Person nicht an COVID-19 erkrankt ist, der Test aber sagt, dass dies der Fall sei. Ein falsch negatives Resultat liegt vor, wenn jemand an COVID-19 erkrankt ist, der Test aber sagt, dass dem nicht so sei. Das Ganze lässt sich am folgenden Beispiel verdeutlichen: Wenn ein Arzt einem Mann sagt, dass er schwanger sei, dann ist das ein falsch positives Resultat. Wenn eine Ärztin einer schwangeren Frau sagt, sie sei nicht schwanger, dann ist das ein falsch negatives Resultat.

Bild: Adaptiert und übersetzt von «Effect Size FAQs».

Aus diesen Gründen ist es wichtig, einen diagnostischen Test zu wiederholen, um die Wahrscheinlichkeit falsch positiver oder falsch negativer Resultate zu minimieren. Für den Nachweis von SARS-CoV-2 werden zurzeit Tests verwendet, bei denen Teile des viralen Erbguts multipliziert werden, um es mit biochemischem Methoden nachweisen zu können. Solche Tests sind in der Regel sehr präzise, doch wie verlässlich das gesamte Testverfahren ist – von der Entnahme der Probe bis zur Bestätigung des Erstresultats im Referenzlabor – kann ich nicht beurteilen, da ich keine entsprechenden (wissenschaftlichen) Publikationen dazu gefunden habe (Hinweise darauf sind sehr willkommen). Dennoch können wir einen Blick auf die veröffentlichten Zahlen werfen, um abschätzen zu können, wie hoch die Rate falsch negativer Resultate sein müsste, damit die Testkapazität ausgeschöpft wäre.

Wenn alle der getesteten Personen tatsächlich an COVID-19 erkrankt sind, würden alle negativen Resultate lediglich falsch negative Resultate darstellen. Die steigende Fallzahlen wären damit nur ein Abbild der steigenden Testkapazität. Das wäre beispielsweise dann der Fall, wenn es schon derart viele schwere COVID-19-Fälle gäbe, dass alle durchgeführten Tests ausschliesslich diese Fälle erfassen würden. In diesem Fall würde die Zahl der bestätigten Fälle die tatsächliche Anzahl der infizierten Personen noch stärker als erwartet unterschätzen (siehe auch Frage 4 im ersten Teil sowie Frage 21 in diesem Teil). In der Schweiz gibt es zurzeit aber keinen Hinweis darauf, dass die Testkapazitäten ausgeschöpft sind. Diese wurden in den letzten Tagen und Wochen massiv erhöht, sodass bis heute ca. 111'000 Tests durchgeführt wurden, von denen 13 % positiv waren (Stand: 29. März 2020, 08h00; Quelle: Bundesamt für Gesundheit). Die Rate der falsch negativen Resultate müsste also bei exorbitanten 87 % liegen, damit die Testkapazität komplett mit tatsächlichen COVID-19-Fällen ausgeschöpft wäre und abflachende Wachstumskurven lediglich eine Artefakt fehlender Testkapazitäten wären.

24) Über welchem Zeitraum hinweg fallen die Fälle an?

Genauso, wie es relevant ist, die geografische Verbreitung zu berücksichtigen (siehe Fragen 11 bis 13), ist es relevant, die zeitliche Verbreitung von COVID-19 im Hinterkopf zu behalten. In den sozialen Medien sind mir immer wieder Kommentare begegnet, welche die aktuellen Todeszahlen aufgrund von COVID-19 vergleichen mit der jährlichen Zahl der Todesfälle aufgrund anderer Ursachen.

Solche Vergleiche sind aus mindestens zwei Gründen problematisch. Einerseits ist die COVID-19-Pandemie erst am Anfang und die Anzahl der Todesfälle wird massgeblich davon abhängen, wie wir darauf reagieren. Andererseits spielt es eine Rolle, in welchem Zeitraum die Fälle anfallen. Bei den meisten Erkrankungen verteilen sich die resultierenden Todesfälle einigermassen gleichmässig über das ganze Jahr oder zumindest über einen längeren Zeitraum hinweg. Bei COVID-19 fallen jedoch in sehr kurzer Zeit sehr viele Todesfälle an. Ein seriöser Vergleich zwischen den Todesfällen müsste sich also zumindest über den gleichen Beobachtungszeitpunkt hinweg erstrecken.

25) Ab wann schlagen sich die ergriffenen Gegenmassnahmen in den Statistiken nieder?

Schon wenige Tage, nachdem der Schweizer Bundesrat striktere Massnahmen im Kampf gegen COVID-19 erlassen hat, wurden Stimmen laut, welche mit Blick auf die steigenden Fallzahlen die Wirksamkeit dieser Massnahmen anzweifelten. Doch wie bereits im ersten Teil dieses Texts erwähnt, hat COVID-19 eine eher lange Inkubationszeit. Eine Untersuchung basierend auf Daten aus China schätzt, dass die Hälfte der Personen erst ungefähr 5 Tage nach der Infektion Symptome zeigt. Zudem wird nicht jede Person, die Symptome zeigt, sofort getestet, und die Testresultate liegen auch nicht sofort vor. Insofern sollte man wohl mindestens eine Woche warten, bis man versucht, die Wirksamkeit irgendeiner Massnahme an den dokumentierten Fallzahlen abzulesen.

26) Wie viele Menschen werden 2020 zusätzlich wegen COVID-19 sterben?

Das lässt sich erst sagen, nachdem das Jahr vorbei ist und hängt wesentlich von den ergriffenen Gegenmassnahmen ab. Aufgrund der vorhandenen Daten ist aber zumindest in der Schweiz davon auszugehen, dass sich Ende 2020 eine Übersterblichkeit in den Statistiken zeigen wird, d.h. dass mehr 2020 mehr Menschen sterben werden als in einem durchschnittlichen Jahr.

Dennoch wäre es falsch zu sagen, dass es sich bei allen COVID-19-Todesfällen um zusätzliche Todesfälle in der Todesfallstatistik von 2020 handelt. Wie der britische Statistiker David Spiegelhalter hier festhält und wie auch Christof (Nachname leider unbekannt) auf Twitter angemerkt hat, wäre ein Teil der Personen, die COVID-19 zum Opfer gefallen sind, im Verlaufe des Jahres an einer anderen Krankheit verstorben. Wie gross dieser Anteil ungefähr sein wird, zeigt sich wie erwähnt erst Ende des Jahres. Zudem sei auch hier noch einmal erwähnt, dass ein Blick auf die jährlichen Todesstatistiken die Sichtweise insofern verzerren kann, als zeitlich beschränkte Spitzen von überdurchschnittlich vielen Todesfällen und hohen Belastungen für das Gesundheitswesen durch jährliche Durchschnitte verdeckt werden können (siehe Frage 24).

27) Unterschätzen die bestätigten Fallzahlen die tatsächlichen Infektionszahlen immer noch? (Ergänzt am 30. August 2020).

In Frage 4 von Teil 1 habe ich geschrieben, dass die Zahl der bestätigten Fälle die tatsächliche Zahl der mit SARS-CoV-2 infizierten Menschen unterschätzt, weil es eine bestimmte Zeit dauert, bis bei infizierten Personen Symptome auftreten und längst nicht alle Infizierten getestet werden. Zum Zeitpunkt der Publikation von Teil 1 wurden die bestätigten Infektionszahlen in der Schweiz zusätzlich nach unten verzerrt, weil fast ausschliesslich Risikogruppen und Menschen mit schweren Krankheitsverläufen getestet wurden. Mittlerweile sind die Tests stark ausgeweitet worden, sodass die bestätigten Fallzahlen die tatsächlichen Fallzahlen nicht mehr so stark unterschätzen wie im Frühling.

Wen mehr getestet wird, werden aber natürlich auch mehr gesunde Menschen auf SARS-CoV-2 getestet, was die Zahl der sogenannten «falsch positiven» Testergebnisse erhöht (siehe dazu Frage 23). Wie stark wirkt sich das auf die Fallzahlen als Ganzes aus? Pauschal lässt sich das nicht beantworten, da mehrere Faktoren mitspielen.

Die Spezifität (wie viele Gesunde erhalten ein negatives Testresultat) und die Sensitivität (wie viele Kranke erhalten ein positives Testresultat) spielen dabei eine Rolle. In beiden Fällen handelt es sich um die Eigenschaften des Tests selbst, d.h. Sensitivität und Spezifität sind – im Idealfall – unabhängig von der Zahl der durchgeführten Tests. Bei der Frage, wie viele der tatsächlich Infizierten Personen mit den Tests korrekt erfasst werde, ist neben Spezifität und Sensitivität des Tests deshalb auch die Zahl der Getestetn bzw. die Teststrategie relevant.

In der Anfangsphase wurden in der Schweiz hauptsächlich Risikopatienten und Menschen mit schweren Verläufen getestet - all jene mit leichten Verläufen tauchten damit nicht in der Statistik auf, die Zahl wurde systematisch unterschätzt. Heute werden auch leichte Verläufe getestet und damit insgesamt mehr Menschen getestet. Damit steigt die absolute Zahl der falsch positiven Resultate, es werden gleichzeitg aber auch mehr Menschen erfasst, die tatsächlich mit Corona-Infiziert sind, womit auch die absolute Zahl der falsch negativen Resultate steigt. Welche der beiden Zahlen überwiegt, ist eine Funktion der Sensitivität des Tests, der Spezifität des Tests und der Verbreitung der Krankheit. Unabhängig davon sorgt die breitere Anwendung des Tests aber dafür, dass wir mehr Infizierte erfassen, wodurch sich die systematische Unterschätzung der tatsächlich Infizierten reduziert.

Hier noch ein stark vereinfachtest Beispiel: Wir haben 100'000 Menschen, 10'000 davon sind infiziert, 1000 mit einem schweren Verlauf. Gehen wir der Einfachheit halber davon aus, dass Spezifität und Sensitivität je 0.99 betragen. Wenn wir nur die 1000 mit schwerem Verlauf testen, haben wir 990 korrekt positive, 10 falsch negative Testresultate und 9000 Infizierte die überhaupt nicht erfasst wurden. In der Statistik tauchen also bloss 990 Infizierte auf, obwohl 10'000 vorhanden sind. Wenn wir hingegen alle 100'000 Menschen testen, haben wir bei den 10'000 Infizierten insgesamt 9900 korrekt positive Resultate, 100 falsch negative Resultate. Bei den 100'000 nicht infizierten Menschen haben wir 99'000 korrekt negative Resultate, 1000 falsch positive Resultate. In der Statistik der bestätigten Fälle tauchen nun 10'900 Infizierte auf, obwohl es «nur» 10'000 sind. Doch weil wir alle tatsächlich infizierten Menschen erfasst haben, unterschätzen wird die Zahl der Infizierten nicht mehr.

In der Realität werden wir sie im Falle steigender Infektionszahlen freilich immer noch unterschätzen, weil sich nicht alle, die infiziert sind, testen lassen und es wenige Tage bis zu zwei Wochen dauern kann, bis bei Infizierten Symptome auftreten und sie überhaupt auf die Idee kommen, sich testen zu lassen. [Ergänzung vom 13. September 2020: Ebenso ist die Annahme, dass Spezifität und Sensitivität je 0.99 betragen nur das: Eine Annahme. Die bisherigen empirischen Resultate zur Genauigkeit deuten daraufhin, dass die Spezifität um einiges höher ist.] Die Zahl der bestätigten Fallzahlen hinken dem tatsächlichen Infektionsverlauf deshalb wohl weiterhin hinterher.

Abschliessende Bemerkungen

Für eine seriöse Einordnung der vielen COVID-19-Statistiken ist es wichtig, sich die möglichen und tatsächlichen Beschränkungen bei der Datenerhebung bewusst zu machen und bei der Verwendung solcher Statistiken entsprechend vorsichtig zu sein. Ich möchte aber betonen, dass die obige Liste lediglich Hinweise darauf gibt, wo Fehler passieren können, nicht wo tatsächlich Fehler geschehen. Wer behauptet, dass eine Statistik verzerrt oder falsch ist, muss den entsprechenden Nachweis oder zumindest gute Gründe dafür angeben. Und selbst der Nachweis von Unsicherheiten und Verzerrungen bedeutet nicht, dass es irgendeinen Zweifel daran gibt, dass COVID-19 eine enorme Herausforderung für unser Gesundheitswesen darstellt.

In den sozialen Netzwerken und insbesondere auf Youtube sind mir leider immer wieder Kommentare und Videos begegnet, welche die Schwierigkeiten und Unsicherheiten bei der Datenerhebung zum Anlass nehmen, die aktuelle Pandemie zu verharmlosen oder deren Existenz gänzlich infrage zu stellen. Einige dieser Behauptungen habe ich unter Fragen 17 bis 19 behandelt (danke an Dominik Menges für das Feedback dazu). Kurz gesagt: Wenn sich im italienischen Bergamo die Zahl der Todesanzeigen in kürzester Zeit verzehnfacht und die Krematorien nicht mehr stillstehen, dann ist das nicht normal – statistische Unsicherheiten hin oder her.

Hier geht es zu Fragen 1 bis 10.

Relevante Interessenverbindungen

Ich arbeite in der Gruppe für Angewandte Statistik an der Universität Zürich. Siehe hier für eine vollständige Liste aller Interessenverbindungen.

Anpassungen

31. März 2020: Ergänzung von Frage 21 mit zusätzlichen Informationen; Schreibfehler korrigiert und leichte sprachliche Überarbeitung.
1. April 2020: Ergänzung von Frage 18 mit Informationen zu Übersterblichkeit bei Grippewellen; Ergänzung von Frage 26 bzgl. Erhöhung der Gesamtsterblichkeit im Jahr 2020; Ergänzung Frage 17 bzgl. Erfassung von Todesfällen in Grossbritannien.
22. April 2020: Präzisierung des zweiten Absatzes von Frage 22.
25. April 2020: Überarbeitung Grafik zu Frage 22, um aufzuzeigen, wo Daten fehlen.
30. August 2020: Ergänzung von Frage 27.
13. September 2020: Ergänzung einer Passage zur Verlässlichkeit der SARS-CoV-2-Tests.