COVID19 \(-\) Was sagen die Daten?

Ein einfaches SIR-Modell zur Beschreibung einer allgemeinen epidemenologischen Entwicklung anhand der Fallzahlen der COVID-19 (Coronavirus SARS-CoV-2) Infektionszahlen in Europa und den USA.

(direkt zur Auswertung)

Eine praktische Erklärung des Modells und der Situation zu Ostern 2020 findet sich in diesem

Video

COVID19-Simulation
\[ \begin{array}{ccl} S_{t+1}&=&S_t-\alpha\frac{\displaystyle I_t}{\displaystyle N}S_t\\ \\ I_{t+1}&=&I_t+\alpha\frac{\displaystyle I_t}{\displaystyle N}S_t-\beta I_t\\ \\ R_{t+1}&=&R_t+\beta I_t \end{array} \]

Was bedeuten diese Kurven zu COVID19, die in ähnlicher Form im Internet kursieren und auf die sich die Epidemologen beziehen, wenn sie die bestehenden Schutzmaßnahmen zu erklären versuchen?

Oft fällt dabei der Begriff des exponentiellen Wachstums. Einem Wachstumsprozess \(-\) ähnlich wie bei der Zinseszinsrechnungen \(-\) legen wir jedoch meistens eine konstante Wachstumsrate zugrunde:

Daher ist das „exponentielle“ Wachstum (insbesondere im biologischen und medizinischen Bereich) der Normalfall – und nicht eine „lineare Näherung“, von der oft im BWL-Bereich Gebrauch gemacht wird. Daher verwundert es oft, dass eine solche lineare Näherung nicht mehr gilt,  insbesondere wenn wir es mit Wachstumsraten pro Periode von 100% und mehr, wie im Seerosenbeispiel, zu tun haben.

Derzeit diskutiert wird, dass die Vervielfachungsrate pro Woche (oder Verdopplungszeit) laut Professor Dr. Lothar H. Wieler (Leiter des Robert-Koch-Instituts (RKI)) deutlich unter einen Wert von 2 (über eine Woche) fallen (steigen) müsse.

Auf dieser Seite setzen wir vor diesem Hintergrund ein konzeptionell leicht verständliches dynamisches Modell (SIR) auf, welches immer noch mehr oder weniger die Grundlage für die Epidemologie bildet.

(Abkürzung zum Modell)

Zu Risiken und Nebenwirkungen dieses Modells:

Nach Aufstellen der Grundgleichungen stellt man fest, dass es sich um gekoppelte Differenzen bzw. Differentialgleichungen handelt, die im Allgemeinen nicht mehr geschlossen lösbar sind. Dies ist wohl auch der Grund dafür, dass dieses Modell nach seiner Formulierung in den 1930er Jahren (Kermack und McKendrick 1927, 1932, 1933) erst einmal einige Jahrzehnte im Verborgenen geschlummert hat, um dann nach dem dem Zweiten Weltkrieg seine überragende Bedeutung zu entwickeln (1991 kam es dann sogar zu einem kompletten Reprint der Arbeiten)\(^1\).

Bevor wir aber in das Modell einsteigen, sei an dieser Stelle noch einmal klar gesagt, dass es sich bei den folgenden Berechnungen um eine reine deskriptive Analyse handelt und insbesondere die längerfristige Fortschreibung als reine Szenariobetrachtung angesehen werden muss und keine induktive Statistik zur stochastischen Überprüfung vorgenommen wird! 

Das RKI und andere Institutionen verwenden sicherlich deutlich detailliertere Modelle, auf die auch in der allgemeinen Veröffentlichung hingewiesen wird. Dem interessierten Leser fehlt hier aber sicher die Erläuterung der Zusammenhänge, da eben auf die SIR- bzw. SIER-Modelle „nur“ in Fussnote (1-3) \(-\) und auch hier muss man sich  über zwei weitere Verweise bis zur Primärquelle (Hethcote, H. und Waltman, P. (1973)) vorarbeiten \(-\) verwiesen wird. Diese Lücke versucht diese Seite zu schließen, indem das SIR-Modell konzeptionell erläutert wird und ein Excel-Baukasten zum „Selberbasteln“ zur Verfügung gestellt wird. Jeder Informatiker oder in Visual-Basic firme Leser wird dies sicher belächeln, da es natürlich mit einigen rudimentären Programmierkenntnissen auch viel eleganter geht. Nicht zuletzt ist das Modell auch in Mathematica direkt implementiert ist, so dass jeder wolframalpha-user sich sämtliche Programmierung sparen kann. Jeder, der allerdings Grundkenntnisse in MS-Office aufweist und weiß, wie man sowohl eine Spalte in Excel ausliest als auch mit einer festen Zahl multipliziert, kann die Rechnung einfach nachvollziehen\(^2\).

Als Belohnung für das Lesen der Motivation hier schon mal das Ergebnis vorweg: Was sicherlich etwas überraschend war, ist, dass die grundsätzlichen Aussagen von Herrn Wieler des RKI durch diese Szenariorechnung sehr gut nachvollziehbar werden. Zudem werden wir auch sehen, weswegen selbst ein Ignorant wie Donald Trump nach ein paar Wochen sich dann doch gegen sein übliches Leugnen der Fakten entschieden hat und genau die gleichen Kurven im Weißen Haus präsentiert hat\(^3\).

Schwachpunkt bleiben natürlich die Zahlen der John Hopkins University (oder des RKI), die wir im Folgenden den Berechnungen zu Grunde legen. Denn deren Verläßlichkeit wird sich erst in der Zukunft zeigen.

Fussnote 1: Ähnliches ist übrigens dem Ramsey-Modell (1928) in den Wirtschaftswissenschaften wiederfahren, welches letztlich als Spezialfall das fundamentale Wachstumsmodell der Ökonomie (Solow, Swan 1956) enthält für welches Solow nicht zuletzt 1987 den Nobelpreis in Wirtschaftswissenschaften erhielt. So scheint an dieser Stelle schon die Verbindung der Pandemie mit der Ökonomie hindurch.

Fussnote 2:  Außerdem wird jeder, der sich einmal die Mühe gemacht hat, in Excel eine lineare Regression oder die Formeln für den Standardfehler des t-Tests „von Hand“ zu implemtieren, festgestellt haben, dass danach das Verständnis für Statistik sich fundamental erhöht hat, und Statistik nicht nur aus dem Einlesen eines Datensatzes in SPSS, SAS oder STATA,... mit anschließendem ENTER-Drücken besteht.

Fussnote 3: Verbunden mit einem überschwenglichen Dank an die Forscher aus Harvard und von der Columbia University, die durch Ihre Adresse am Broadway in New York sicher auch ein hohes Maß an intrinsischer Motivation haben.