Das SIR-Modell
Im Zuge der globalen Pandemie, ausgelöst durch das Virus SARS-CoV-2 (COVID-19) stellt sich die Frage, wie sich die Ausbreitung in den Industrieländern abschätzen läßt. In der Epidemologie, hat sich dabei das SIR-Modell (susceptible/anfällig-infected/infiziert-removed/immun) nach (Kermack und McKendrick 1927, 1932, 1933) etabliert. Aufgrund des einfachen Aufbaus, kann die Ausbreitungsdynamik gut nachvollzogen werden, und die Wirkung der Kontaktzahl zwischen Infizierten und potenziell zu infizierenden Personen als fundamentale Einflussgröße in diesem Modell veranschaulicht werden. Verwendet werden die aktuell verfügbaren Zahlen (Rohdaten) der Johns Hopkins University (JHU). Sicherlich sind die Zahlen (Rohdaten) des RKIfür Deutschland  grundsätzlich "besser". Allerdings sollen hier auch internationale Vergleiche vorgenommen werden, so dass eben dieser Vergleichbarkeit wegen eine eineitliche Quelle verwendet wird, und nicht zuletzt handelt es sich bei den Daten der JHU um Echtzeitdaten, während bei den RKI-Daten ein gewisser Meldeverzug vorhanden ist (direkt zur aktuellen Auswertung ).

Eine praktische Erklärung des Modells und der Situation zu Ostern 2020 findet sich in diesem

Video

Wir betrachten das SIR-Modell in stetiger\(^1\) Zeit \(t \in \mathbb{R}\) (), in dem von einer Bevölkerung \(N>0\) ausgegangen wird, die sich in drei Gruppen unterteilt:
Schematisch kann die Dynamik folgendermaßen veranschaulicht werden:
x

Der Ansteckungsprozess wird sehr einfach modelliert, mit folgenden Annahmen:
  1. Jede Person hat im Durchschnitt \( k\) Kontakte mit anderen Personen in einer bestimmten Periode (z.B. 1 Tag). Die Wahrscheinlichkeit, dass somit eine potenziell infizierbare Person aus der Gruppe \(S(t)\) Kontakt zu einer infizierten Person aus der Gruppe \(I(t)\) hat, ist daher \(k\frac{I(t)}{N}\).
  2. Bei einem Kontakt zwischen \(I(t)\) und \(S(t)\) erfolgt eine Ansteckung mit der konstanten Wahrscheinlichkeit \(a\in (0,1)\). Im Folgenden setzen wir \( \alpha:=ak\).
Auf die aktuelle Situation bezogen lässt sich diese Zahl \( \alpha\) sehr einfach interpretieren. Setzen wir \( a=10\% \) und \( k\)=20, dann wird eine infizierte Person im Durchschnitt \( \alpha = 10\%\cdot20=2\) Personen pro Tag anstecken. Die zum Zeitpunkt \(t\) neu angesteckten Personen sind damit \(ak\frac{I(t)}{N}S(t)=\alpha \frac{I(t)}{N}S(t)\) und die Änderung der Menge der Anzahl der anfälligen Personen in der Zeit ergibt sich zu: \[ \dot{S}(t)=-\alpha{I(t)\over N}S(t)\quad\textrm{oder}\,\textrm{ zeitdiskret}\quad \overbrace{S_{t+1}}^{\textrm{anfällige}\,\textrm{ Personen}\,\textrm{ morgen}}=\overbrace{S_t}^{\textrm{anfällige}\,\textrm{ Personen}\,\textrm{heute}}-\overbrace{\alpha{I_t\over N}S_t}^{\textrm{heute}\,\textrm{ angesteckte}\,\textrm{ Personen}}\quad (1)\]

(Exkurs 1)

Umgekehrt erhöht sich damit zum einen die Zahl der Infizierten \(I(t)\) gerade um \(\alpha \frac{I(t)}{N}S(t)\), zum anderen nehmen wir an, dass die Infizierten nach einer gewissen Zeit die Krankheit überstanden haben und danach immun sind.\(^2\)  Der Anteil, der zu einem Zeitpunkt \(t\) immun gewordenen Infizierten wird mit \(\beta\in (0,1)\) bezeichnet und soll ebenfalls wie \(\alpha\) über die Zeit konstant sein. Für die zeitliche Änderung der Menge der infizierten Personen ergibt sich damit
\[
\dot{I}(t)=\alpha{I(t)\over N}S(t)-\beta I(t)\quad\textrm{oder}\,\textrm{zeitdiskret}\quad \overbrace{I_{t+1}}^{\textrm{infizierte}\,\textrm{ Personen}\,\textrm{ morgen}}
=\overbrace{I_t}^{\textrm{infizierte}\,\textrm{ Personen}\,\textrm{ heute}}+\overbrace{\alpha{I_t\over N}S_t}^{\textrm{heute}\,\textrm{ angesteckte}\,\textrm{ Personen}}-\overbrace{\beta I_t}^{\textrm{heute}\,\textrm{  immun}\,\textrm{ gewordene}\,\textrm{ Personen}} \quad (2)
\]
Geschlossen wird das Modell über die dritte Gruppe der immun gewordenen Personen. Für deren zeitliche Änderung folgt
\[
\dot{R}(t)=\beta I(t)\quad\textrm{oder}\,\textrm{zeitdiskret}\quad \overbrace{R_{t+1}}^{\textrm{immune}\,\textrm{ Personen}\,\textrm{ morgen}}
=\overbrace{R_t}^{\textrm{immune}\,\textrm{ Personen}\,\textrm{ heute}}+\overbrace{\beta I_t}^{\textrm{heute}\,\textrm{  immun}\,\textrm{ gewordene}\,\textrm{ Personen}} \quad (3)
\]


Addiert man (1)+(2)+(3), so ergibt sich
\[
\dot{S}(t)+\dot{I}(t)+\dot{R}(t)=0=\dot{N}(t)\quad\textrm{oder}\,\textrm{zeitdiskret}\quad \overbrace{N_{t+1}}^{\textrm{Bevölkerung}\,\textrm{morgen}}
=\overbrace{N_t}^{\textrm{Bevölkerung}\,\textrm{heute}}
\]
denn alle drei Gruppen zusammen müssen natürlich die Gesamtbevölkerung \(N\) ergeben. Damit folgt aus den Modellannahmen die Konstanz der Bevölkerung\(^3\). Die schöne technische Konsequenz aus dieser Identität\(^4\) ist allerdings, dass wir dadurch  (3) wieder vergessen dürfen und sich unserer dynamisches System auf die zwei Gleichungen (1) und (2) reduziert.

\[
\begin{array}{rcll}
\dot{S}(t)&=&-&\alpha{\displaystyle I(t)\over \displaystyle N}S(t)\\
\\
\dot{I}(t)&=&&\alpha{\displaystyle  I(t)\over \displaystyle N}S(t)-\beta I(t)
\end{array}
\]

Das System ist zwar nicht geschlossen lösbar, aber mit der vorgegebenen Bevölkerungszahl \( N \) und den Startbedingungen \(S(0):=S_0>0\) und \(I(0):=I_0>0\) ist die Dynamik des Systems vollständig determiniert.
 
Im Folgenden beschränken wir uns auf den Fall
\[
\alpha\frac{\displaystyle S_0}{\displaystyle N}>\beta
\]
denn nur in diesem Fall kommt es zum Ausbruch der Epidemie. Motivieren kann man dies anhand der Beobachtung, dass ansonsten schon zum Start aus (2) ein Fallen der Zahl der Infizierten abzulesen wäre:
\[
I_{1}=I_0+I_0{\huge(}\overbrace{\alpha{S_0\over N}-\beta}^{<0}{\huge)}
\]


Folgende fundamentale Eigenschaften lassen sich aus der Stabilitätsanalyse und dem asymptotischen Verhalten des Systems ableiten::
Aus diesen Eigenschaften lassen sich die wesentlichen Aussagen für den Epidemieverlauf und mögliche Gegenmaßnahmen ableiten:

Anhand der bisher verfügbaren Daten kann auf einfache Weise in Excel mit dem zeitdiskreten Modell insbesondere der Parameter \(\alpha\) ermittelt werden (Excel). Denn dies ist letztlich der entscheidende Parameter aufgrund dessen mögliche Maßnahmen zur Eindämmung des Virus getroffen werden können. Den Parameter \(\beta\) können wir relativ gesichert  aus der Beobachtung ableiten, dass Infizierte mit einem milden Verlauf  nach rund 14 Tage keine Symptome mehr zeigen. Damit ergibt sich \(\beta\approx {1\over 14}\approx 0,0714\).

Verwenden wir für den Beginn der Epidemie  die Näherung \(I(t)=I_0 e^{(\alpha-\beta)t}\), so erhalten wir \(\alpha \) durch einfache lineare Regression der logarithmierten Fallzahlen auf die Zeit \(t\) in Tagen.

Im Folgenden ist dies am Beispiel Deutschlands seit Ende Februar durchgeführt. Dabei erfolgt keine Diskussion der Datengenauigkeit bzw. Verlässlichkeit der Daten, mit Ausnahme der Wahl der Startpunkts. Denn erst bei einem erkennbaren exponentiellen Anstieg erscheint eine Regression sinnvoll.

Auswertung vom 23.04.2020


Excel: Die hier zur Verfügung gestellte Exceldatei erhebt natürlich keinen Anspruch auf Richtigkeit und Fehler können nicht ausgeschlossen werden. Ansonsten sind aber alle Daten und Verknüpfungen vorhanden, so dass der Modellzusammenhang nachvollziehbar sein sollte.

Fussnote 1: Die Grundgleichungen werden auch in diskreter Zeit angegeben, denn damit wird nachher natürlich die Umsetzung in Excel vorgenommen.

Fussnote 2: Von Todesfällen sehen wir in diesem einfachen Modell ab, denn ohne dabei zynisch klingen zu wollen ändert bei den gegenwärtigen Todesraten die Zahl der Toten die Dynamik von \(S(t)\,I(t))\) nur geringfügig. Wer die Todeszahlen trotzdem abschätzen möchte, kann dies dadurch machen, indem man  die maximale Zahl der Infizierten mit den aktuellen Todesraten multipliziert.

Fussnote 3: Da wir nirgendwo einen Prozess wie Geburten, Sterben oder Wanderungen modelliert haben, müßten wir uns auch ansonsten eingehende Gedanken über unsere Modellkonzeption machen.

Fussnote 4: Ein ähnlicher Zusammenhang ist die ex post Identität von [Sparen = Investieren] am Pol der Vermögensveränderung des Wirtschaftskreislaufen. Daran kann man sich hier noch einmal den Zusammenhang zwischen Bestands- und Flussgrößen klar machen.

Fussnote 5:  In diesem Zusammenhang wird in den Medien häufig von der Basisreproduktionszahl \(R_0\) (nicht zu verwechseln mit anfangs immungen Zahl der Personen!), gesporchen, die sich in diesem Modell zu \(R_0=\frac{alpha}{beta}\) ergibt. Epidemologisch ist dies natürlich eine sehr wichtige Kennzahl, jedoch eher aus einer ex post Sichtweise, wenn man den Epidemieverlauf anhand der vollständigen Daten über den Kurvenverlauf der Infizierten abschätzen kann. Im Anfangsstadium der Epidemie erscheint dagegen der Parameter \(\alpha =a\cdot k\) der sinnvollere und einfacher zu interpretierende Parameter.

Fussnote 6: Anhand der Paramter lässt sich auch unsere derzeitige Diskussion zum Tragen von Schutzmasken erläutern. Während das Tragen einer Maske aller Voraussicht nach \(a\) senken würde, wird teilweise davor gewarnt, dass dadurch ein trügerisches Sicherheitsgefühl geweckt würde, Mann und Frau sich wieder näher kommen und somit durch ein größeres \(k\) letztlich nichts gewonnen wird. Man kann allerdings auch argumentieren, dass eine Schutzmaske eher ein Signal dafür, dass etwas nicht in Ordnung ist, so dass der Effekt einer stärkeren Annäherung zu hinterfragen ist.

Exkurs 1: Wer sich ein bisschen mit Wachstumsprozessen auskennt, sieht schon an (1), dass es nicht überraschend ist, wenn später das exponetielle Wachstum auftritt. Denn angenommen \( I,N=\) const., (bzw. I anfangs klein) so nimmt \(S(t)\) mit der konstanten Rate \(\eta = ak\frac{I(t)}{N}\) ab und entwickelt sich nach der Funktion \(S(t)=S_0e^{-\eta t}\,\,(S_0>0)\) bzw. \(S_t=S_0(1+\eta)^t\), wo wir direkt unsere Zinseszinsrechnung wieder erkennen. Ganz so einfach ist es aber aber natürlich nicht, denn zum einen steigt \( I \)  mit jeder Ansteckung und zum anderen haben wir noch unseren Immunisierungsprozeß.

Exkurs 2: Unter der Annahme, dass wir letztlich keine Immunität erlangen können, sondern mit der gleichen Wahrscheinlichkeit \(\beta\) nach erfolgter Immunisierung wieder anfällig werden, kann die obige Näherung folgendermaßen plausibel gemacht werden:. Denn das Differentiallgleichungssystem vereinfacht sich dann zum sogenannten SIS-Modell (susceptible/anfällig-infected/infiziert-susceptible/anfällig) mit  \[
\begin{array}{rcll}
\dot{S}(t)&=&-&\alpha{\displaystyle I(t)\over \displaystyle N}S(t)+\beta I(t)\\
\\
\dot{I}(t)&=&&\alpha{\displaystyle  I(t)\over \displaystyle N}S(t)-\beta I(t)
\end{array}
\]Der Einfachheit halber normieren wir die Bevölkerungszahl auf \(N:=1\), und mit der damit geltenden Identität \(S(t)+I(t)=1\) erhalten wir für die Bewegungsgleichung der Infizierten \[\dot{I}(t)=\alpha I(t)(1-I(t))-\beta I(t)=\alpha I(t)\left(\frac{\alpha-\beta}{\alpha}-I(t)\right)=(\alpha-\beta)\left(1-\frac{\alpha}{\alpha-\beta}I(t))\right)
\] Dies ist zum einen die logistische Differentialgleichung, welche sich mit der Substitution \(z:=1-\frac{\alpha}{\alpha-\beta}I(t)\) zu \(\frac{dz}{z}=(-\alpha-\beta)dt\) elementar lösen lässt, mit dem Ergenis \[{I}(t)=\frac{I_0e^{(\alpha-\beta)t}}{(1-I_0)+I_0e^{(\alpha-\beta)t}}
\] Die Näherung für "kleine" \(t\) erhält man durch die Taylorentwicklung der Exponentialfunktion in der Nähe von null, so dass man im Nenner \(e^{(\alpha-\beta)t}\approx 1\) setzen kann.

Exkurs 3: Ein Maximum muß letztlich deshalb exisitieren, da die Infiziertenzahl am Anfang zunimmt, nachher aber, wenn schon ein Großteil der Bevölkerung immun geworden ist, die Wahscheinlichkeit einer Neuinfektion immer geringer wird, so dass ab einem bestimmten Zeitpunkt die Rate der Genesung \(\beta\) die der Infektionen übersteigt. Rechnerisch folgt aus dem Quotienten (2):(1)\[\frac{dI}{dS}=-1+\frac{\beta}{\alpha}\frac{1}{S}\quad \textrm{mit}\quad\frac{dI}{dS}=0\quad \textrm{für}\quad S=S^*=\frac{\beta}{\alpha}\] weiterhin folgt \[dI=\frac{\beta}{\alpha}\frac{dS}{S}-dS\Rightarrow I(S)=\frac{\beta}{\alpha}\ln S-S+C_0=N\frac{\beta}{\alpha}\ln\frac{S}{S_0} -S+N\] da  \(S_0+I_0\approx N\),  und nach Einsetzen von \(S^*\)  erhält man das Maximum der Infiziertenzahl zu \(\max\{I(t)\}\approx I^*\).