Auswertung \(-\) Deutschland
23.04.2020

Im Folgenden werden die Infektionszahlen mit dem COVID19-Virus der (Datenquelle: Johns Hopkins University bzw. die Rohdaten) für die Simulation anhand eines SIR-Modells verwendet (die Simulationsdatei findet sich hier):

Zumeist wird in den Medien nur auf einen Ist-Stand, bzw. eine naive Mittelung der Wachstumsraten der Infizierten bezug genommen. In dieser Auswertung zusammen mit der theoretischen Erklärung (SIR-Modells und Video) wird versucht, etwas mehr Klarheit in die Zsammenhänge und die zukünftige Entwicklung zu bringen.

Eine praktische Erklärung des Modells und der Situation zu Ostern 2020 findet sich in diesem

Video

Ist-Stand-Szenario:
Fortschreibung der Zuwachsrate der Infizierten auf dem Stand des Durchschnitts seit dem 30.03.2020
Kapazitätsüberlastung des Gesundheitssystems Mitte Juli

Konservatives Szenario:
Abfall der Wachstumsrate der Infizierten augrund des Trends seit dem 24.02
Weniger als 2 Mio Infizierte in der Spitze und damit keine Kapazitätsüberlastung mehr!!!
In der Spitze knapp 2 Mio. Infizierte

Positiv Szenario:
Abfall der Wachstumsrate der Infizierten augrund des Trends seit dem 21.03
Der Trend des Rückgangs ist in den letzten Tagen rückläufig und die Zuwachsraten der Infizierten stabilieren sich auch niedrigem Niveau!

Weniger als 2 Mio Infizierte in der Spitze und damit keine Kapazitätsüberlastung mehr!!!
In der Spitze nur noch knapp 1 Mio. Infizierte

UK/USA
Zuwachsraten der Infizierten im Mittel der letzten Woche immer noch dramatisch hoch

USA
Todesfälle pro Kopf steigen doppelt so schnell wie in Europa, mittlerweile höher als in Luxemburg, welches europäische Land überholen sie als nächstes?


x
Eigene Berechnungen: Eine pure Fortschreibung aufgrund des Durchschnitts der letzten Zeit (rot) führt immer noch zu einer Kapazitätsüberschreitung (2 Mio Infizierte, entsprechend 5% der Infizierten benötigen intensivmedizinische Betreuung = 100.000 Betten) des Gesundheitssystems. Die im weiteren Verlauf näher erläuterten Konservativ- und (Positiv)-Szenario zeigen mittlerweile eine Beherschbarkeit der Epidemie. 

An den Kurvenverläufen ist allerdings auch zu erkennen, dass die "Abflachung" mit einer deutlichen "Verbreiterung" des Epidemieverlaufes zu erkaufen ist. Zumindest nach diesem einfachen Modell werden wir noch bis Ende des Jahres, wenn kein Impfstoff  oder hochwirksame Medikamente gefunden werden, mit hohen Infiziertenzahlen zu kämpfen haben. Eine Tolerierung von hunderttausenden von Toten, wie es die Administration in den USA immer wieder fallen lässt, ist aber meiner Ansicht nach keine wirklich zu erwägende Alternative.



Modellbeschreibung

Die Bevölkerung \(N\) wird in drei Gruppen unterteilt
Die Dynamik des Modells wird folgendermaßen beschrieben:

\[
\begin{array}{rcl}
\overbrace{S_{t+1}}^{\textrm{anfällige}\,\textrm{ Personen}\,\textrm{ morgen}}&=&\overbrace{S_t}^{\textrm{anfällige}\,\textrm{ Personen}\,\textrm{heute}}-\overbrace{\alpha{I_t\over N}S_t}^{\textrm{heute}\,\textrm{ angesteckte}\,\textrm{ Personen}}\\
\\
\overbrace{I_{t+1}}^{\textrm{infizierte}\,\textrm{ Personen}\,\textrm{ morgen}}
&=&\overbrace{I_t}^{\textrm{infizierte}\,\textrm{ Personen}\,\textrm{ heute}}+\overbrace{\alpha{I_t\over N}S_t}^{\textrm{heute}\,\textrm{ angesteckte}\,\textrm{ Personen}}-\overbrace{\beta I_t}^{\textrm{heute}\,\textrm{  immun}\,\textrm{ gewordene}\,\textrm{ Personen}}
\\
\\
\overbrace{R_{t+1}}^{\textrm{immune}\,\textrm{ Personen}\,\textrm{ morgen}}
&=&\overbrace{R_t}^{\textrm{immune}\,\textrm{ Personen}\,\textrm{ heute}}+\overbrace{\beta I_t}^{\textrm{heute}\,\textrm{  immun}\,\textrm{ gewordene}\,\textrm{ Personen}}
\end{array}
\]
mit den Parametern \(\alpha=a\cdot k\) (\(a:\) Wahrscheinlichkeit bei einem Kontakt mit einer infizierten Person angesteckt zu werden; \(k\): Anzahl der Kontakte eines Infizierten mit anderen Personen pro Tag) und \(\beta\): Rate pro Tag eines Infizierten immun zu werden (Aufgrund der Beobachtung, dass Infizierte mit einem milden Verlauf  nach rund 14 Tagen keine Symptome mehr zeigen, kann\(\beta\) über \(\beta\approx {1\over 14}\approx 0,0714\) ) abgeschätzt werden.

Als Startpunkt wird daher für Deutschland der 24.02 gewählt mit \(I_0=16, I_1=17, I_3=27,...\). Betrachtet man die Entwicklung der Zahl der Infizierten, so sieht bei den absoluten Werten einfach nur den drastischen Anstieg (Kurve links) innerhalb von sehr kurzer Zeit. Da es sich aber um einen esponentiellen Wachstumsprozess handelt ist es sinnvoller die logarithmierten Werte zu verwenden oder \(-\) wie unten eine logarithmierte Skala. Legt man diese zugrunde, so lässt sich die von uns allen erhoffte Abflachung (Kurve rechts) der Zuwachsraten ablesen. Exemplarisch erkennt man zudem ab dem 6.3 einen gewissen Knick und ab dem 21.3 (vielleicht ein erster Hinweis auf die Wirkung des Shutdowns) flacht die Kurve noch weiter ab. Seit dem 30.3 ist die Abflachung dann noch ausgeprägter. Seit einigen Tagen zeigt diese Abflachung aber einen etwas langsameren Trend als noch von einer Woche aus.
x
Quelle: JHU (23.4.2020)

daher wurden die Zeiträume   für einen Fit bzgl. des oben beschriebenen SIR-Modells an die Daten vorgenommen
x
Quelle: JHU (23.04.2020), eigene Berechnungen

Die blaue, gelbe, grüne und violette Kurve entspricht dabei jeweils den hypothetischen Verläufen, wenn die Entwicklung sich jeweils mit dem daraus gewonnenen \(\alpha \) fortgesetzt hätte. Das SIR-Modell ist dadurch vollständig determiniert, so dass mit diesen vier berechneten Szenarien auch die langfristige Entwicklung wiedergegeben werden kann.

Szenariobetrachtung anhand der drei Zeiträume Blau=24.02-06.03, Gelb=06.03-20.03 und Grün=20.03-30.03 Violett=30.03-
x
Eigene Berechnungen

Entscheidend ist letztlich, wie schnell die Kurve der Infizierten ansteigt und welchen Maximalwert sie erreicht. Legen wir die immer wieder kolportierte Zahl von 5% der Infizierten zugrunde, die einer intensiven medizinischen Betreuung bedürfen und stellen dagegen einmal eine hypothetische Kapazität von bis zu 100.000 Betten, die das deutsche Gesundheitssystem dafür in der nächsten Zeit aufbauen könnte, so kann man in jedem Szenario jeweils den Tag bestimmen, an dem unser Gesundheitssystem überlastet (gewesen) wäre:

Blau=24.02-06.03  Gelb=06.03-20.03 Grün=20.03-30.03 Violett=30.03-
\(\alpha\) 0,48 0,35 0,21 0,10
Wachstumsfaktor pro Woche 11,1 5,8 2,46 1,26
Verdopplungszeit [Tage] 2 2,8 5,4 21,2
I-Max [Mio.] 50 41 25 5
Tag der Kapazitätsüberschreitung 30. März 8. April 26.April 15. Juli
  Eigene Berechnungen

Schon anhand dieser Tabelle ist ersichtlich, dass zwar im Durchschnitt \(-\) falls die veröffentlichten Zahlen überhaupt den wahren bisherigen Epidemieverlauf widerspiegeln \(-\) die Verdopplungszeit angestiegen ist, mit einer Zunahme der Voerdopplungszeit auf knapp drei Wochen aber noch nichts gewonnen ist.

Warum können wir aber trotzdem gedämpft optimistisch sein? Unser Modell weist nämlich ein großes Manko auf: Der Parameter \({\bf{\alpha}}\)=Ansteckungswahrscheinlichkeit \(\cdot\) Kontaktzahl ist über die Zeit konstant. Damit aber genau dies nicht der Fall ist, haben wir die ganzen Maßnahmen eingeleitet. Somit erscheint es sinnvoll, aus den vorhandenen Daten eine Idee davon zu bekommen, wie sich dieses \(\alpha\) im vergangenen Monat entwickelt hat. Da das
\(\alpha\) in unserem Modell letztlich die Wachstumsrate des exponentiellen Anstiegs bestimmt, betrachten wir die zeitliche Entwicklung der prozentualen Zunahme der Infizierten gegenüber dem Vortag. Diese ist allerdings sehr volatil, was nicht zuletzt der Datenerhebung geschuldet ist \(-\) am Wochenende wird tendenziell weniger getestet als unter der Woche, die Testkapazitäten sind immer noch im Aufbau, ... \(-\) Nichtsdestotrotz ist natürlich auch hier eine fallende Tendenz abzulesen, ist das doch letztlich nur eine andere Darstellung der logarithmierten Werte aus der vorherigen Grafik. 

x
Quelle: JHU (23.04.2020), eigene Berechnungen

Es gibt sicher viele Möglichkeiten diesen fallenden Verlauf zu modellieren bzw. eine Kurve möglichst nah an die vorhandenen Daten\(^1\) zu "fitten".
Eine erste Idee ist fast immer einfach eine lineare Regression \(y=a+bx\) durch solch eine Kurve zu legen. Damit sollte man jedoch vorsichtig sein, denn bei einem Abfall gilt genau das das Umgekehrte, wie bei einem Anstieg. Sind wir bei der Zunahme von dem immensen Tempo überrascht worden, so ist ein linearer Abfall "deutlich schneller" \(-\) dies ist natürlich keine mathematisch exakte  Aussage \(-\) als ein exponentieller Abfall\(^2\). Zudem haben wir es immer noch mit einem medizinisch-biologischen Prozess gepaart mit einer Anpassung unseres Sozialverhaltens zu tun. Bei allen Unwägbarkeiten erscheint es daher durchaus sinnvoll auch hier einen exponetiellen Abfall zu unterstellen. Des Weiteren können wir dann wieder über die logarithmierten Werte eine einfache lineare Regression durchführen. Über den Zeitraum vom 24.2-- ergibt sich mit diesem Ansatz die orange Kurve in obiger Grafik:

Nehmen wir diesen Verlauf der Abnahme als gegeben an und schreiben nun diesen Verlauf umgekehrt in die Zukunft fort, so kann man für jeden Tag in der Zukunft ein hypothetisches \(\alpha\) bestimmen und damit die Dynamik des SIR-Modell "laufen" lassen. D.h., wir nehmen in jedem Tag in der Zukunft an, dass sich von diesem Tag an die Parameter nicht mehr ändern würden. Daraus kann man zumindest in einer Szenariobetrachtung eine Idee dafür bekommen, wie sich Verdopplungszeiten und Fallzahlen in der Zukunft entwickeln könnten.

x

x
Eigene Berechnungen, das Datum ist nicht mit dem vorher berechneten Zeitpunkt des Erreichens der Kapazitätsgrenze zu verwechseln, sondern dies ist jeweils der Zeitpunkt, an dem die Parameter für die Fortschreibung im SIR-Modell als konstant betrachtet werden.

Mit dem Sinken der hypothetischen Wachstumsrate flacht nun auch die Kurve der Infizierten immer weiter ab und wir können so auch bestimmen, wann wir eine Wachstumrate erreicht haben, mit der unser Gesundheitssystem nicht mehr an seine Kapazitätsgrenze stößt.

Innerhalb dieses Szenrios wären wir also ende April bei einem Punkt angelangt, an dem, falls sich dann bzgl. der Ausbreitungsdynamik nichts mehr ändert, unser Gesundheitssystem nicht mehr an die Kapazitätsgrenze stoßen würde. Allerdings kann man dieses Szenario wahrscheinlich eher als eine recht "konservative" Sichtweise bezeichnen, denn die Daten, aus denen der exponentielle Abfall der Wachstumraten bestimmt worden ist, bezogen sich auf einen Zeithorizont, der zu etwa der Hälfte noch in die Zeit vor dem "Social Distancing" liegt.

Seit Einführung der Maßnahmen sollte der Abfall aber mit einem etwas höheren Tempo verlaufen. Für solch ein "optimistisches" Szenario wird die gleiche Rechnung mit den Daten ab dem 21. März durchgeführt, also dem Zeitpunkt, an dem vorher schon aufgefallen war, dass die Abflachung der logarithmierten Werte der Fallzahlen etwas zugenommen hatte.

Nach dieser Regression ergeben sich folgende Kurven und Zahlen:
x

x
Eigene Berechnungen

In diesem Szenario haben wir schon seit einigen Tagen einen Zustand erreicht, bei der es in der Spitze  nicht mehr zu 2 Millionen Infizierten kommen würde. Allerdings ist der Zeitraum der Epidemie dann auch bis Ende 2021 gestreckt. Dies wäre letztlich ein Zustand, den wir zu erreichen hoffen, wobei dies natürlich nicht bedeutet, dass wir schon wieder zu unserem alten Leben zurückkehren könnten, denn das würde das \(\alpha\) ja aller Voraussicht nach gerade wieder in die andere Richtung drehen (was in den USA eventuell bald wieder passieren wird), so dass das ganze wieder von vorne los ginge.

Außerdem noch eine Einordnung der deutschen Zahlen in den internatonalen Kontext.

x  Quelle: JHU (23.04.2020), eigene Berechnungen
  
Die USA und UK nehmen bei den Zuwachsraten der Infizierten leider eine traurige Spitzenposition ein, womit sich wohl schon jetzt zeigt, dass die dortigen politischen Führungen, die Lage falsch eingeschätzt haben und zu spät reagiert haben. In UK und den USA liegen die aktuellen Wachstumsraten der Infizierten etwa doppelt so hoch wie in Mitteleruopa. Die Daten für Frankreich sind  nur bedingt verwendbar, da sie eine sehr hohe Volatiliät in den Veränderungsraten aufweisen.

Neben den Infiziertenzahlen, die für die Dynamik der Epedemie ausschlaggebend sind, sind natürlich sozio-politisch die Todesfälle bzw. Todasraten von Bedeutung. Daher an dieser Stelle auch diese im internationalen Vergleich:

x

  Quelle: JHU (23.04.2020), eigene Berechnungen* aktuell (Ostersonntag 2020) weist die JHU eine gesunkene Totenzahl gegenüber dem Vortag für Deutschland auf, was man vielleicht mit Ostern erklären kann, aber doch wohl eher ein Datenfehler ist :-)

Die USA liegen hier zwar im internationalen Vergleich noch relativ niedrig, jedoch holen diese die letzten Wochen bedingt durch die hohen Zuwachsraten leider relativ schnell auf und haben mittlerweile Österreich, Dänemark und Luxemburg hinter sich gelassen. Zudem sind die Zuwachsraten der USA und UK bei den Todesfällen pro Kopf mit durchschnittlich deutlich höher als in den anderen großen Ländern der EU. Ist UK Ende März noch mit einem Wert knapp vor dem von Dänemark gestartet, so liegt das Land mittlerweile deutlich vor den Niederlanden. Und mittlerweile bewahrheitet sich leider immer mehr die Prognose, dass UK und USA mit riesen Schritten ein Land nach dem anderen hinter sich lassen. Dramatisch sind mittlerweile die Zuwachsraten der Todesfälle pro Kopf in den USA, die doppelt so hoch liegen wie in Euopa. Zudem sollte man bei der Betrachtung von Schweden und den Niederlanden, die beide eine etwas weichere Strategie in der Bekämpfung der Epidemie fahren nicht außer Acht lassen, dass deren Todesfälle pro Kopf  derzeit gut doppelt bzw. rund vier-so hoch liegen, wie in Deutschland. Leider bewahrheitet sich damit die Prognose, dass der laxe Umgang mit den Abstandsregeln und die Vermischung dieses Aspekts mit dem Wahlkampf in den USA zu dramatischen Todeszahlen führen wird. Mittlerweile haben die USA bei den Todesfällen pro Kopf auch Luxemburg hinter sich gelassen.

All diese Aussagen sind natürlich von dem Hintergrund der hohen Datenunsicherheit zu sehen. Nichtsdestotrotz legt diese rein deskriptive Analyse den Schluss nahe, dass die Bundesrepublik Deutschland derzeit nicht den schlechtesten Ausweg aus der Krise sucht.

Excel: Die hier zur Verfügung gestellte Exceldatei erhebt natürlich keinen Anspruch auf Richtigkeit und Fehler können nicht ausgeschlossen werden. Ansonsten sind aber alle Daten und Verknüpfungen vorhanden, so dass der Modellzusammenhang nachvollziehbar sein sollte.

Fussnote 1: Jedoch ist dieser Vorgang immer mit großer Vorsicht zu genießen, denn rein mathematisch kann man mehr oder weniger jeden Datensatz mit einem Polynom n-ten Grades replizieren, wodurch ein \(R^\approx 1\) resultieren würde. Gewonnen ist damit allerdings nichts, wenn keine Erklärung für verwendeten Ansatz vorhanden ist  \(-\) Korrelation ist nicht Kausalität. Im Vorfeld wurden der globalen Finanz- und Wirtschaftskrise wurden auch viele Prognosen aus unterstellen Vergangenheits-Zukunfts-Symmetrien erstellt, die sich dann fatalerweise als falsch herausgestellt haben. Eine solche auch unser Freund über dem großen Teich lange vor sich hergetragen, als er prophezeite, dass der Virus sich mit steigender Temperatur zu Ostern like a miracle verflüchtigt haben wird.

Fussnote 2: Dies hat etwas mit der Konvexität bzw. Linkskrümmung der Exponentialfunktion zu tun.