Bill Gates und das Imperial College of London (2)

Die Entlarvung einer scheinbar wissenschaftlichen Studie als herrschaftsdienlichem Auftragswerk.


Der folgende Artikel fordert dem Leser einiges ab, sowohl inhaltlich als auch was die Länge betrifft. Aber der Einsatz lohnt sich. Sebastian Domschke hat hier akribisch eine Studie aus Großbritannien zerlegt, die von den Leitmedien ohne jede Kritik verbreitet wurde. Mit maßgeschneiderten Modellen verbog man in der Studie die Realität, um “nachzuweisen”, dass die massiven Grundrechtseinschränkungen in elf europäischen Ländern Millionen Menschen das Leben gerettet hätten. Wie bereits im ersten Teil angedeutet, zeigt sich exemplarisch und in aller Klarheit, die systemische Funktion eines angeblich seriösen Instituts sowie die Abhängigkeit der in ihm Beschäftigten.


Wie sieht eine ‘unabhängige’, ‘wissenschaftliche’ Studie wie die des Imperial College heute aus, in der unter anderem die Bill & Melinda Gates Foundation dankend unter ‘Acknowlegdements’ genannt wird (0)? Bevor wir uns jene Studie vom Imperial College anschauen, die 3,1 Millionen vermiedene Todesfälle für 11 europäische Länder vermeldete, noch ein paar Worte zum Geleit.

Für mich bedeutet wissenschaftliches Arbeiten Wissen zu schaffen, und zwar in der Tiefe und wichtiger sogar noch in der Breite. Wissenschaftliche Arbeiten, die eine Mehrheit der Bevölkerung nicht verstehen kann, sind aus meiner Sicht nicht wissenschaftlich, sondern herrschaftsschaffend. Sie sind Herrschaftswissen und unterscheiden sich nicht von einer Religion. Denn das wahre Wort ist hier wie da ein Dogma, dort das Wort Gottes, hier das Wort des Robert-Koch-Instituts (RKI), das sich in nichts Wesentlichem vom Diktum des Vatikans unterscheidet.

Das Folgende ist darum mein persönlicher Versuch, Wissen in der Breite zu schaffen. Ob das gelingt, weiß ich nicht. Aber das Verständnis wächst mit der Erfahrung. Darum freue ich mich auch über jede persönliche Kritik, was Sie gut fanden, und wichtiger noch, was Ihnen langweilig oder unverständlich vorkam. Was das Folgende eher nicht sein  möchte, ist der Versuch gezielt Meinungen zu beeinflussen. Falls Sie das in Ihrem Bekannten- oder Freundeskreis tun wollen, dann halten Sie sich lieber an die Quellenangaben am Schluss. Oft wurde im Text — im Bemühen um ein leichteres Verständnis — vereinfacht und darum grob oder auch mal verkürzt wiedergegeben. Es ist daher im Detail — so man es zuvor gewollt oder ungewollt dekontextuiert und nur auszugsweise weiterverbreitet — leicht angreifbar.

Kommen wir zurück zum Imperial College und dessen Studie, die Daten aus 11 Ländern aufbereitet, und ein Modell bieten will, anhand dessen die Zahl der tatsächlich Betroffenen abgeschätzt werden soll, sowie ein zweites Modell, dass die Autoren kontrafaktisch nennen, um den Pandemieverlauf nachzuzeichnen, der ihrer Ansicht nach ohne Maßnahmen erfolgt wäre. Bevor wir uns damit befassen, wollen wir zunächst auf die Grundlagen einer solchen Studie eingehen.

Die Studie vom Imperial College benutzt als zentralen Pfeiler R — die sogenannte Reproduktionszahl. Patrick Grete bezeichnete diese in einem lesenswerten Artikel bei Multipolar — nachdem sie Eingang in die Medien gefunden hatte — als eine Art Ableitung (1). Das stimmt sprachlich ganz gut, mathematisch aber überhaupt nicht. R ist etwas grundlegend anderes als eine Ableitung, und hat daher auch grundlegend andere Eigenschaften, wird aber im Prinzip für den selben Zweck benutzt wie eine gewöhnliche Ableitung (a1).

Es gibt nun genau zwei Möglichkeiten auf dieser Basis eine sinnvolle Arbeit zu gestalten. Ich kann entweder aus den vorhandenen statistischen Daten R herausrechnen, und einfach abbilden, oder ich kann R modellieren, also nach irgendwelchen Prinzipien vorher festlegen, und überprüfen, inwieweit meine Festlegungen mit den statistischen Daten übereinstimmen.

Das Imperial College liefert nun gleich zwei(!) Modellierungen, eine für R und eine für den Verlauf (da das eine das andere zwingend vorgibt, ist das im Prinzip ein und die selbe Basis), bezeichnet beide als ein und das selbe Modell und beide gemeinsam — in völliger Ignoranz der Datenlage — als von den Daten gedeckt.

Sodann entwirft es auch noch ein drittes Modell, dass ‘kontrafaktisch’ genannt wird, was so viel heißen soll wie “so ist es zum Glück nicht gekommen. Wäre es aber …”, das genauso wenig von den statistischen Daten gedeckt ist, und schätzt nun die Todeszahlen anhand dieser drei Modelle, als Differenz (Anmerkung: Das ist hier nicht das erste mal, das jemand den Unterschied zwischen 2 und 3 nicht sauber zu vollziehen mag).

Springen wir direkt hinein, in die graphische Auseinandersetzung. Ich wähle zur Anschauung Frankreich, schlicht weil es das erste Diagramm in der Studie war (b1):

Die roten Balken sind dabei die Rohdaten, also die offiziellen Zahlen, wie sie dem ECDC (European Centre of Disease Control = Europäisches Zentrum für Infektionskontrolle) entnommen sind. Dieses nutzt, augenscheinlich unverändert, die Zahlen der nationalen Gesundheitsbehörden — im Falle Deutschlands ist das das RKI (2,3).

Hier offenbart sich ein erstes Problem, nämlich die Vergleichbarkeit. Weil das ECDC keine eigenen Daten erhebt, sondern nur die Daten der Gesundheitsbehörden unterschiedlicher Länder einsammelt, die naturgemäß unterschiedliche (nämlich nationale) Regeln zur Erfassung ihrer Daten nutzen — die sich im Zeitverlauf auch ändern können — ist grundsätzlich erst einmal keine Vergleichbarkeit gegeben. Eine seriöse länderübergreifende Studie müsste diesem Thema eine grundlegende Diskussion widmen, und die Datenbasis entsprechend anpassen. Wir finden hier kein Wort darüber. Warum das wichtig ist, sieht man in einem Extrembeispiel an Belgien. Bhakdi und andere haben darauf hingewiesen (4,5).

Zurück zu den drei Diagrammen; diese zeigen von links nach rechts:

  1. das Modell über den ‘Pandemie’-Verlauf (blaues Band), mit roten Balken (Fallzahlen),
  2. die Todesfälle als rote Balken, die die statistische Grundlage bilden, auf der alle Analysen des Imperial College fußen, samt einer rein technischen statistischen Schätzung (blaues Band),
  3. das Modell für R (Reproduktionsrate), das die Autoren vom Imperial College entwickelten (in Grün).

Statistik der Toten

Wir beginnen mit den statistischen Grundlagen, also mit dem Diagramm in der Mitte. Man hat hier die Todesfälle als Basis der statistischen Analyse genommen, mit dem Argument, dass die Infektionszahlen nicht präzise erfasst werden könnten, weil unausweichlich wenigstens bei den milden (oder gar symptomlosen) Verläufen eine hohe Dunkelziffer zu erwarten sei. Die Todeszahlen seien aber, ob der umfassenden medizinischen Erfassung korrekt.

Der Unterschied in der Erfassung zwischen Todeszahlen und Infektionszahlen besteht ohne Zweifel. Das die Todeszahlen deshalb akkurat seien, darf allerdings bezweifelt werden. Am besten sieht man das an der jährlichen Grippewelle. In Tabelle 3 auf Seite 47 des Saisonberichtes 2018 vom RKI (6) sind in der Saison 2016/17 22900 geschätzte Todesfälle (Exzess-Schätzung) verzeichnet, gegenüber nur 722 laborbestätigten Todesfällen.

Für die Saison 2017/2018 stehen 25100 geschätzte Todesfälle 1674 laborbestätigten Toten gegenüber. Dabei ist Grippe eine der am umfassendsten beobachteten Erkrankungen überhaupt, die Surveillance-Einrichtungen etabliert, und das System zur Datenerfassung seit Jahren erprobt. Surveillance heißt aber eben auch repräsentative Stichproben statt teurer Massentests (die ihre eigenen Schwierigkeiten mitbringen — konkret: wenn ich einen positiven Influenza-Test habe, war das Virus dann auch ursächlich verantwortlich für die Erkrankung oder gar den eingetretenen Todesfall).

Demgegenüber standen für Covid-19 Anfang März noch nicht einmal Tests in angestrebtem Umfang zur Verfügung. Dabei ist der Labortest selbst keine zwei Monate alt gewesen, nicht validiert, und laut Herstellerangaben zur klinischen Diagnostik ungeeignet — sein Einsatzzweck war ausschließlich die labormedizinische Forschung. Mit diesem Test hat man dann zu keiner Zeit repräsentative Stichproben genommen, sondern sofort Massentests eingeleitet.

[Einschub Peds Ansichten: Es ist stets wichtig, innerhalb der Coronadiskussion darauf hinzuweisen, dass zwischen der Erkrankung Covid-19, respektive der angeblich daran Verstorbenen und den Positivtests auf das Virus bis zum heutigen Tage nicht mehr als eine Korrelation besteht, niemals jedoch eine nachgewiesene Kausalität. Korrelationen (als korrespondierende Parameter einer Funktion) lassen sich jederzeit und willkürlich für alle beliebigen Aspekte herstellen; das erst recht wenn mit Modellen hantiert wird. Ursache und Wirkung zwischen PCR-Tests und Todeszahlen wird jedoch — auch beim Imperial College — wider besseren Wissens als bewiesen in die Studie eingebunden, was den Tatbestand einer systematischen Desinformation der Bevölkerung erfüllt. Dass diese Menschen gestorben sind, kann man als sicher annehmen, aber an was sie starben, ist keinesfalls klar].

Obwohl wir also generell durchaus davon ausgehen können, dass die Todeszahlen besser erfasst werden, als die Infektionszahlen, heißt dies keinesfalls, dass die Todeszahlen ganz sicher tatsächlich so waren, wie sie aufgenommen wurden. Die Todeszahlen können dabei sowohl unterschätzt werden, wie bei der Grippe, als auch überschätzt, wenn zum Beispiel schon Verdachtsfälle bei Eintritt des Todes als definitive Todesfälle gewertet werden. Das war und ist bei Covid-19 generell üblich. Zusätzlich existieren jedoch noch unterschiedliche Kriterien dafür, was als Verdachtsfall zu gelten hat (hier wieder vergleichen mit Belgien; 4i,5i).

In Deutschland zum Beispiel wertet das RKI jeden Todesfall, egal unter welchen Umständen, als Covid-19 Todesfall, wenn er sich in einem bestimmten Zeitraum nach einem positiven SARS-CoV-2-Test ereignet. Auch dann, wenn es zum Beispiel um einen Verkehrsunfall geht. Auch dann, wenn die betreffende Person in der Zwischenzeit genesen ist, und zwischenzeitlich nachweislich negativ auf SARS-CoV-2 getestet wurde (7).

Was wurde nun gemacht? Man hat die erfassten Todeszahlen — die roten Balken — ‘einfach’ einem Algorithmus überantwortet, der daraus mit Hilfe eines statistischen Verfahrens nach Bayes, ein blaues Band gezaubert hat.

An so einem Vorgehen ist heute prinzipiell nichts anspruchsvolles mehr. Dafür gibt es Statistikprogramme, die alles, und wirklich alles alleine machen, wenn man das möchte. Man muss diese Programme nur mit Daten füttern. Auch wenn man ihnen völlig zufällige Daten vorgibt, liefern die noch immer ein blaues Band, das die Datenpunkte optisch miteinander verbindet. Denn das ist ihre Aufgabe. Hier hat man selbst einen Algorithmus geschrieben, und dabei — streng nach Methode — noch einige zusätzliche Parameter eingepflegt, mit denen man die Datenlage der eigenen Wirklichkeitsfiktion anpassen kann. Das konstruierte Modell richtet sich also nach den Ambitionen der Verfasser, statt ehrlich eine angemessene Abstraktion der Realität darzustellen.

Wir werden später mit dem blauen Band weiterarbeiten, so wie es ist. Aber glaubwürdig ist das nicht (2). Denn was ist so ein blaues Band, ein Vertrauensbereich? Schauen wir uns nun die mittlere Grafik  aus dem obigen Bild etwas genauer an (b2):

Es sei aus der deutschen Wikipedia zitiert (Hervorhebungen und Einschübe in Klammern durch Autor):

Wenn man das Zufallsexperiment auf identische Art und Weise wiederholt, dann wird ein γ ⋅ 100 % — Konfidenzintervall [Vertrauensbereich, Erwartungsbereich] den unbekannten Parameter ϑ in γ ⋅ 100 % aller Fälle überdecken. Da der unbekannte Parameter ϑ keine Zufallsvariable ist, kann man allerdings nicht sagen, dass ϑ in einem γ ⋅ 100 % -Konfidenzintervall mit Wahrscheinlichkeit γ liegt. Solch eine Interpretation ist dem bayesschen Pendant von Konfidenzintervall, den sogenannten Glaubwürdigkeitsintervallen vorbehalten.” (8)

γ wäre in unserem Fall 95%. Man kann also nicht sagen, dass 95% unserer Messungen im Vertrauensbereich (Glaubwürdigkeitsbereich) liegen sollen. Und das ist schon mal gut, denn es liegen tatsächlich deutlich weniger als 95% der Messwerte innerhalb des blauen Bandes (siehe die unvollständige Abdeckung des blauen Bandes mit den roten Säulen der statistischen Werte). Das ist auf einen Blick sichtbar. Das wäre nur bei der Methode nach Bayes möglich, man spricht dann von einem Glaubwürdigkeitsintervall. Das Problem: Im Artikel wird ausdrücklich die Methode nach Bayes erwähnt und in der Bildunterschrift heißt es dann auch folgerichtig “blue 50% credible interval; light blue 95% credible interval” (“blau: 50% der Werte liegen im Glaubwürdigkeitsintervall, hellblau: 95% der Werte liegen im Glaubwürdigkeitsintervall”). Das aber sind im Englischen jene Begriffe, die ausdrücklich der Methode nach Bayes vorbehalten sind (9).

Also sollten in unserem Fall doch 95% der Messergebnisse im — hellblau und blau gekennzeichneten — Glaubwürdigkeitsintervall(!) liegen. Was nicht annähernd der Fall ist. Wie kann das sein?

Nun es könnte zumindest so sein. Das blaue Band ist zu Beginn sehr schmal und später dann breiter. Das liegt daran, dass man eben davon ausgegangen ist, dass die Todesfälle nicht einfach zufällig erfolgt, sondern einem gewissen, von den Rahmenbedingungen abhängigen Verlauf gefolgt sind. Mit so einer Verknüpfung von Daten kann man natürlich versuchen Mängel in der Datenlage zu beheben, dann gilt logischerweise nicht mehr, dass 95% der Messungen im Glaubwürdigkeitsbereich liegen müssen. Aber wir benötigen dafür zusätzliche Annahmen — hier ist es die Annahme, dass der Verlauf der Pandemie im wesentlichen bekannt ist. Denn nur dann kann man ihn zeitlich auch mit lückenhaften Daten nachmodellieren.

Den zeitlichen Verlauf der ‘Pandemie’ wollten wir doch aber erst nachzeichnen. Darum nehmen wir uns ja die besten statistischen Daten, die wir finden können, nämlich die Sterbedaten. Wenn wir da jetzt einen Verlauf hinein modellieren, um das Datenmaterial zu verbessern, dann wird das ein Zirkelschluss.

Und dann zeigt sich eben auch, dass unsere statistischen Daten mit dem Modell nicht so recht zusammenpassen, denn zu Beginn liegt kaum eine Messung im Glaubwürdigkeitsintervall. Das sollten sie aber eigentlich, wenn die Daten gut wären. Und als ob das noch nicht genug wäre, gibt es da diese gigantischen Ausschläge zum Beispiel am 4. April (siehe Abbildung oben). Was ist das?

Nun zunächst einmal, stellt sich die Frage, ob das ein statistisches, sprich zufälliges Artefakt ist, oder ein systematisches Problem anzeigt. Wenn wir Todeszahlen aufschreiben, dann schreiben wir die immer mit Datum auf. Das ist bei Erkrankungen anders, wo das RKI schon mal keine genauen Daten hat, wann die Krankheit anfing, und deswegen auf die Meldedaten zurückgreift — also den Tag, an dem jemand zum Arzt ging. Bei Todesfällen wird immer das Sterbedatum erfasst, und auch mitgeliefert. Wir dürfen also (hoffentlich!) davon ausgehen, dass die Grafik zeigt, wann die Leute gestorben sind, und nicht wann ihr Tod gemeldet wurde.

Um jetzt herauszubekommen, ob ein plötzlicher Anstieg systematisch oder zufällig bedingt ist, gibt es ein statistisches Werkzeug, dass wir inzwischen von Euromomo kennen: den Z-Score. Der lässt sich grob aus dem Diagramm bestimmen. Darum lese ich aus dem Diagramm — wie gesagt in grober Näherung — eine Grundsterblichkeit von 900 ab (siehe die y-Achse “daily number of deaths” — tägliche Anzahl der Todesfälle — im Glaubwürdigkeitsintervall in obiger Grafik), und für diesen einen Tag, den 4. April eine Sterblichkeit von 1800. Die groben Zahlen wurden so gewählt, weil man zur Ermittlung des Z-Score Wurzeln berechnen muss.

Damit kommen wir — sehr grob und sehr vorsichtig geschätzt  — zu einem Z-Score von über 30 (a2). Das ist mehr als Frankreichs Übersterblichkeit zur schlimmsten Zeit aufwies. Und damit glasklar nicht zufällig bedingt, sondern einer Ursache geschuldet. Wenn wir 900 zusätzliche Todesfälle erklären müssen, dann haben wir im Prinzip zwei Möglichkeiten:

Entweder wir stellen fest, dass Terroristen am 04. April 2020 in ungefähr 10 SARS-CoV-2 — Kliniken in Frankreich gleichzeitig Bomben zündeten, die etwa 900 Patienten und etliche weitere Menschen in den Tod rissen. Das wäre eine Erklärung. Sie klingt vielleicht lächerlich, aber sie erhellt ein wenig die Dimension, mit der wir es hier zu tun haben.

Oder es stimmt GRUNDLEGEND etwas nicht an der Art und Weise, wie wir die Daten erhoben haben. Wenn wir Todesfälle betrachten, darf es noch nicht einmal die üblichen und viel kleineren Schwankungen nach Wochentag geben, die wir bei allen Infektionszahlen in Europa wunderbar beobachten können — weil am Wochenende eben weniger zum Arzt gegangen wird. Aber die Viren kennen keine Sonntage, und gestorben wird darum immer.

Und jetzt schauen wir im Diagramm oben auf den hinteren Teil und den wunderbar erkennbaren 7-Tage-Rhythmus. Auch dies ist ein Problem. Der geneigte Leser mag vielleicht im Laufe der folgenden Zeilen immer mal wieder bei den verschiedenen Sterbezahldiagrammen nach diesen Wochentagesschwankungen schauen. Es gibt kaum ein Land, in dem man sie nicht beobachtet.

Und so etwas müsste ganz dringend diskutiert werden. Im Hauptartikel und nicht vielleicht in irgendwelchen Zusatzteilen. Das verschweigen dieser Unstimmigkeiten in der Datenbasis gleicht ein wenig der Art und Weise, wie sich der 9-11-Commission Report in seiner Aufarbeitung zu den Ereignissen des 11. September 2001 in New York mit WTC 7 beschäftigt hat. Das war natürlich auch nicht so wichtig.

Wir können jetzt aus den Todeszahlen zwei Dinge abschätzen: zum einen, einfach über die geschätzten Todeszahlen die Zahl der tatsächlich Infizierten. Zum anderen, durch den zeitlichen Verlauf die Entwicklung der Reproduktionszahl (R). Beachten müssen wir dabei eigentlich nur die zeitliche Verschiebung. Wir wollen R ja für den Zeitpunkt der Infektion abschätzen. Der liegt naturgemäß vor jedem Erkrankungsbeginn. Der Erkrankungsbeginn ist jener Zeitpunkt an dem wir erstmalig nennenswert Daten gewinnen können, weil jemand der nicht krank ist, in der Regel auch nicht zum Arzt geht, und also auch nicht getestet werden kann (Achtung, das ist seit einiger Zeit nicht mehr so, weil inzwischen massenhaft Gesunde getestet werden!).

Zusammenhang zwischen Infektionen und Todesfällen

Der Erkrankungsbeginn liegt naturgemäß einen gewissen Zeitraum vor dem Eintreten des Todes. Die Studie gibt in den “Supplementary Informations” (10) auf Seite 4 von 35 oben einen Durchschnitt von 23 Tagen (“mean 22.9 days”). Eine Seite weiter unten, nämlich auf Seite 5 oben finden wir übrigens die Generationszeit g, die wir später noch benötigen. Sie beträgt laut dieser Studie 6,5 Tage, und ich werde sie weiter unten kurz erklären.

Das einfachere ist die Abschätzung der tatsächlich Infizierten. Also beginnen wir damit. Man benötigt nichts weiter als eine Schätzung der Sterblichkeitsrate — also eine Antwort auf die Frage: Wenn 100 Menschen infiziert sind, wie viele von ihnen sterben dann an dem Virus?

Zu beachten sind zwei Dinge. Das eine ist, dass wir die totale Fallsterblichkeit brauchen. Nicht die Zahl derjenigen, die nach einer Krankenhauseinweisung mit dem Virus sterben, sondern die Sterblichkeit auf alle Fälle gerechnet, auch die zumeist unerkannten. Die sogenannte Heinsberg-Studie und andere haben dafür Werte ermittelt die im Bereich von 0,5% und darunter lagen (11).

Die Studie hier geht von einem höheren und länderspezifischen Wert aus, der mit Ausnahme Norwegens (0,91%) zwischen 1,02% und 1,26% liegt (10i, S. 31, Tabelle 3). Der einfache Durchschnitt der Infection Fatality Rate (IFR) ist 1,09% der nach Bevölkerung gewichtete 1,16%, weil die bevölkerungsreichen Länder Deutschland, Frankreich und Italien die drei höchsten Einzelwerte ausweisen. 

[Einschub Peds Ansichten: Die IFR gibt ein Verhältnis von Sterbezahlen (im Zähler) zu Infizierten (im Nenner) in Prozent an und kann daher Werte zwischen 0 (keiner der Infizierten stirbt) und 100 (alle Infizierten sterben) annehmen. Beachten wir dabei, dass hier bereits die weiter oben benannten systemischen Fehler zur Ermittlung des Wertes einfließen, wie zum Beispiel, dass positiv getestete Tote als infiziert gelten, obwohl so etwas der PCR-Test gar nicht anzuzeigen vermag. Wie auch Todesfälle in die Statistik aufgenommen werden, die definitiv nicht an der Infektion sondern an Unfällen oder anderen Krankheiten verstarben (12). Wie letztlich überhaupt hinterfragt werden darf, was das Positivergebnis eines PCR-Tests eigentlich aussagt.]

Für uns sind die Details nicht so wichtig, und ich rechne daher für den Moment mit einer IFR von 1,1%. Und damit haben wir eigentlich alles was wir brauchen. Aus diesem Diagramm (b2i):

wird folgendes (b3):

Es ist nichts weiter passiert, außer dass ich die Werte der  y-Achse durch 1,1% dividiert (was gleichbedeutend einer Multiplikation mit 91 ist) und alle Werte auf der x-Achse um 23 Tage verschoben habe (vom 8. März auf den 14. Februar). Das können wir jetzt (grob) als Schätzung der “Neuinfektionen” gelten lassen.

Damit den Statistikern nicht die Haare ausfallen — mit diesem Bild müssen wir sehr, sehr vorsichtig umgehen, denn es ersetzt keine ernsthafte, statistische Analyse. Das Problem ergibt sich dergestalt, dass die Menschen ja nicht alle punktgenau 23 Tage nach “Infektion” sterben. Das ist nur das Mittel. Vor allem nach hinten kann dieser Wert durchaus stark abweichen — nach vorn nicht so wahnsinnig viel — nämlich niemals mehr als 23 Tage. In der Realität bleibt es eine Verteilung, eine die sich in der Studie auch findet (10ii, Fig.1,a3)

Wir können daher den Verlauf des blauen Bandes zwar als — es sei wiederholt — grobe Schätzung beibehalten. Die Infektionszahlen müssten am Anfang etwas höher sein. Aber den Vertrauensbereich, die Breite des Bandes, können wir an dieser Stelle völlig vergessen. Das ist nur noch enthalten, um den Ursprung der Abschätzung bildlich sichtbar zu machen. Auch die roten Balken haben keinerlei Aussagekraft mehr, außer der den Bezug zur Herkunft der Schätzung aufzuzeigen. Doch genügt es für den Vergleich mit dem Modell der Studie des Imperial College (b4):

Das ist überhaupt nicht das Selbe wie in Abbildung b3 (siehe weiter oben).

[Einschub Peds Ansichten: Kann es auch nicht, weil es ein Modell ist, und zwar keines als Abstraktion der Realität sondern einer gewünschten “neuen Realität”. Ahnt der Leser möglicherweise auch warum? Der dargestellte, radikale Abfall der Infektionszahlen fällt nämlich genau auf das Datum der Einführung des Ausnahmezustands in Frankreich. Aber die indirekt aus den Todesfällen herleitbaren Daten zu Anzahl und Zeitpunkt der Infektionen (siehe weiter oben) geben das überhaupt nicht her! Das wird Sebastian Domschke im weiteren noch gründlicher erläutern, aber an dieser Stelle bereits die Sensibilisierung zur gedanklichen Verarbeitung der obigen Grafik.]

Die Reproduktionszahl R

Auch die Reproduktionszahl R kann man nämlich aus den Verlaufsdiagrammen ablesen, doch benötigen wir hierzu noch ein paar Informationen, um dies ausreichend zu verstehen. Wir beginnen wieder bei den realen Daten, den gemeldeten Todesfällen. Wissen müssen wir dafür vorab zwei Aspekte. Erstens bildet man R einfach als Quotienten aus der Zahl der Neuinfektionen zum Zeitpunkt Tag X und der jener zum Tag Y.

Zweitens sind X und Y nicht zwei aufeinander folgende Tage. Vielmehr bestimmt man ein sogenanntes “generational interval” — also die Dauer einer Generation — und nimmt dann zwei Tage (X und Y), die den Anfang und das Ende des Intervalls definieren. Es sei als Hinweis mitgegeben, dass sich die Geister bei der Ermittlung dieses (zeitlichen) Intervalls scheiden können. Das ECDC nimmt für Covid-19 meines Wissens — so wie die Studie — einen Wert von 6,5 Tagen an (10, Fig.2). Das RKI wiederum geht von vier Tagen aus; warum auch immer (siehe unten).

Es sei an dieser Stelle ebenfalls darauf hingewiesen, dass sich aus dieser unterschiedlichen Annahme die Diskrepanz der R-Werte zwischen ECDC und RKI für Deutschland ergibt. Das ECDC und die Studie geben für Deutschland eine ursprüngliche Reproduktionszahl von ungefähr 4,1 an. Das RKI dagegen liefert einen Maximalwert für R von 3,3 im zeitlichen Verlauf. Ich sage das hier, um nochmals vor allzu hastigen Ländervergleichen zu warnen. Es sind dieselben Daten, beide Behörden rechnen korrekt (das sei hier unterstellt) und doch ergeben sich unterschiedliche Werte wegen unterschiedlicher ‘nationaler’ Annahmen.

Aus den offiziell zur Verfügung stehenden Todeszahlen (siehe Abbildung b2) kann man R ohne Weiteres ermitteln (b5):

Die senkrechten Linien markieren jeweils einen Abstand von 6,5 Tagen (der R-Wert nach ECDC, siehe weiter oben). An diesen Stellen entnehmen wir dem Diagramm die Fallzahlen (rote Linien) — ich habe ein ‘Lineal’ rechts angezeichnet, welches für die Darstellung der Verhältnisse völlig genügt. Wir bekommen grobe Abschätzungen für R in den verschiedenen Intervallen, die wir übrigens wieder 23 Tage zurück verlegen müssen, denn die Reproduktionszahl bezieht sich natürlich auf Infizierte, nicht auf Gestorbene:

Zeitraum (abwechselnd 6 und 7 Tage) Werte im Intervall R (grobe Näherung
23.02. — 29.02. 7,5 : 1,5 5
01.03. — 06.03. 18,0 : 7,5 2,5
07.03. — 13.03. 24,5 : 18,0 1,3
14.03. — 19.03. 24,5 : 24,5 1
20.03. — 26.03. 20,5 : 24,5 0,84
27.03. — 01.04. 16,0 : 20,5 0,78
02.04. — 08.04. 12,0 : 16,0 0,75

Wiederum geht es nicht um eine kommagenaue Abschätzung der Reproduktionszahl. Wir nehmen auch zur Kenntnis, dass wir R ziemlich direkt aus den Todesfällen ableiten, was eigentlich nicht zulässig ist.

Stattdessen geht es um zwei Dinge: Einerseits darum, qualitativ aufzuzeigen, wie man eine Reproduktionszahl im Prinzip ermittelt (wenn wir dafür Infektionszahlen verwenden würden). Und andererseits zu zeigen, dass sich R im Zeitverlauf maßgeblich geändert hat — hier am Beispiel der Daten aus Frankreich. Für Deutschland gibt uns das RKI eine viel bessere und methodisch korrekte, eine echte professionelle Abschätzung an die Hand (b6):

Diese Abbildung findet sich übrigens in allen epidemiologischen Bulletins des RKI genau ein einziges Mal, nämlich in Ausgabe 17 — und sonst nirgends (a4). Man mag dies darauf zurückführen, dass sich R danach nicht mehr maßgeblich änderte. Man könnte aber auch den Verdacht hegen, dass schon die Veröffentlichung dieser Abbildung ein dem RKI nicht genehmer Ausrutscher war. Wie dem auch sei, das Diagramm zeigt kaum bestreitbar (a5), dass:

  1. R sich stetig ändert und
  2. dass es dies auch schon tat, bevor irgendwelche Maßnahmen eingeführt wurden.

Denn die Maßnahmen in Deutschland — jene Maßnahmen, deren angeblichen Erfolg die vorliegende Studie für elf europäische Staaten zu belegen vorgibt — wurden eingeleitet am 6. März (Quarantäne für Infizierte), 12. März (Social Distancing = “Soziales” Abstandhalten), 14. März (Schulschließungen), 22. März (Verbot öffentlicher Veranstaltungen, was übrigens laut Studie nichts gebracht haben soll, dazu später mehr) sowie ebenfalls am 22. März die allgemeine Ausgangssperre (“Lockdown”). Letztere sei, laut Studie die einzige Maßnahme, welche einen maßgeblichen Einfluss auf die Reproduktionszahl genommen haben soll (siehe Abbildung 4 weiter oben).

Dieses öffentliche und politische Narrativ der Wirkung des “Lockdowns” passt aber überhaupt nicht zur Abbildung des RKI (b6, siehe oben). Und das gilt auch für Frankreich (vergleiche Abbildungen b2, b3, siehe ebenfalls weiter oben), wo die Maßnahmen — die allesamt laut Studie nichts bringen — am 13., 14., zweimal am 16. März und schließlich der “Lockdown” am 17. März eingeleitet wurden. Denn auch dort war die Reproduktionszahl schon vor Beginn aller Maßnahmen im wesentlichen auf 1 gefallen. Nämlich laut der hergeleiteten Tabelle (siehe oben) bis spätestens 13. März auf einen Wert um die 1,3.

Wobei Letzterer als Mittelwert aufzufassen ist, und bei fallender Kurve am 7. März tatsächlich darüber und am 13. März darunter gelegen haben wird; unbeachtet der Tatsache, dass er damit den größten Teil des Abstieges von 5 auf 1 zu jener Zeit bereits hinter sich gelassen hatte.

Wir haben bis hierhin anhand realer Daten und der Definition von R den zeitlichen Verlauf der Reproduktionszahl grob abgeschätzt. Es gibt hierzu Daten der ECDC und das Imperial College hat sich auch keiner anderen als jener bedient. Daher legen wir noch einmal, am Beispiel Frankreichs die qualitativ entscheidenden Abbildungen vor. Einmal die linke Abbildung mit den ECDC-Daten und dann jene des Imperial College auf der rechten Seite. Was fällt auf?

[Zwischenfazit von Peds Ansichten: Der Sinkflug der Reproduktionszahl am 17. März — so wie er vom Imperial College behauptet wird — hat überhaupt keine Basis in den Daten; hat es nicht einmal in den Daten die das College selbst vorgibt, als Grundlage genutzt zu haben. Es wird stattdessen schlicht ein Zusammenhang konstruiert, der die Gültigkeit des Modells (rechts) beweisen soll. Denn eines erscheint hier ziemlich sicher: Die Kurve des Modells stand als Ergebnis bereits fest, als mit der Studie begonnen wurde. Das vorgezeichnete, scheinwissenschaftliche Ergebnis war Inhalt der politisch gestellten Aufgabe. Es sollte “beweisen”, dass der “Lockdown gut und notwendig war. Dass eine Studie, welche die Realität in die Fiktion zwingen möchte, um nach außen glaubhaft erscheinen zu können, voller Inkonsistenzen, ja geradezu absurder Widersprüche ist, bis hin zum “kontrafaktischen” Modell eines düsteren Szenarios Millionen Covid-19 – Toter kann da nicht überraschen.]

Teil 3 dieser Artikelreihe von Sebastian Domschke folgt in Kürze. Bitte bleiben Sie schön aufmerksam, liebe Leser.


Anmerkungen und Quellen

(Allgemein) Dieser Artikel von Peds Ansichten ist unter einer Creative Commons-Lizenz (Namensnennung – Nicht kommerziell – Keine Bearbeitungen 4.0 International) lizenziert. Unter Einhaltung der Lizenzbedingungen kann er gern weiterverbreitet und vervielfältigt werden. Bei Verlinkungen auf weitere Artikel von Peds Ansichten finden Sie dort auch die externen Quellen, mit denen die Aussagen im aktuellen Text belegt werden. Die Rechte des Autors Sebastian Domschke bleiben davon unbelassen. Redaktionelle Einarbeitung durch Peds Ansichten.

(a1) Betreffs der mathematischen Unterschiede der Reproduktionszahl R zu mathematischen Ableitungen: Ableitungen bildet man auf stückweise stetigen Funktionen. Was wir (im Falle der Studie) haben, sind jedoch endliche Zahlenfolgen — nämlich Infektionszahlen für Tag {1,2,3 … n} und hier meint n eben nicht beliebig groß, sondern n hört gewöhnlich auch noch irgendwann auf. Und daran lässt sich noch nicht einmal theoretisch etwas ändern, weil wir einerseits das Zeitintervall zwischen zwei Messungen — hier ist es ein Tag — nicht beliebig klein machen können, und selbst wenn wir es könnten, wäre immer dann, wenn etwas passiert, also wenn eine “Infektion” hinzukommt, die Stetigkeit verletzt. Es kommt immer genau eine “Infektion” hinzu, egal wie klein wir das Zeitfenster machen. Es handelt sich um diskrete Werte und damit fallen Ableitungen als Analyseinstrument aus, die ja ihre Aussagekraft aus der Änderung von x innerhalb eines Intervalls von y (in unserem Falle wäre das die Zeit) beziehen (und die ja — siehe Stetigkeit — voraussetzen, dass diese Änderung bei der Wahl eines hinreichend kleinen Intervalls beliebig klein werden kann und eben nicht minimal 1 ist). Stattdessen bezieht R sich auf die Größe — nicht Änderung — der Infektionszahl am Tag B, und setzt sie ins Verhältnis zu jener Infektionszahl vom Tag A, wobei B = A + g festgelegt wird, bei der g eine Konstante beschreibt: die Generationszeit.

(a2) (1800 — 900)/Wurzel 900 ~ 30 (siehe (14))  

(a3) Wenn also zum Beispiel 10.000 Menschen am 1. April “infiziert” werden, dann sterben von diesen statistisch — bei einer IFR von 1,1% — 110 Menschen. Aber eben nicht alle genau 23 Tage danach. Es läuft vielleicht ungefähr so: In den ersten Wochen nach der Infektions stirbt niemand, weil alle erst erkranken müssen. Dann breitet sich die Krankheit im Körper aus, nimmt (bei 1,1%) einen schlimmen Verlauf, worauf die Leute zum Arzt gehen und ins Krankenhaus eingewiesen werden. Nach 14 Tagen, am 15. April stirbt der erste jener 110, die wir erwarten. Nach 15 Tagen sterben weitere zwei, dann drei, vier, fünf, sechs; bis am 23. April dann schließlich neun Patienten sterben. Danach ist die Sterberate wieder langsam rückläufig. Wenn wir jetzt annehmen, dass am 2. April ebenfalls 10.000 Menschen infiziert worden wären, aber vorher und nachher keine mehr, dann stirbt am 15. April — statistisch gesehen — immer noch ein Mensch. Am 16. April aber schon drei — nämlich zwei die sich am 1. April und einer, der sich erst am 2. April angesteckt hat. Am dritten Tag dann fünf Todesfälle — drei von den am 1. April infizierten und zwei derjenigen die sich erst am Folgetag ansteckten. Das sieht anders aus, wenn sich am 1. April 10.000, am nächsten Tag jedoch 20.000 Menschen ansteckten. Dann gibt es am 15. April immer noch nur einen Todesfall, am 16. April aber schon vier (2 plus 2 mal 1), am 17. April sieben (drei plus zwei mal zwei) Todesfälle und so weiter. Wenn wir jetzt real über einen Zeitraum Todesfälle beobachten, dann hängen diese zusammen, weil sie sich jeweils aus den Infektionen von verschiedenen Tagen zusammensetzen. Und darum kann man aus  dem Verlauf der Todeszahlen auf den Verlauf der Infektionen zurückrechnen.

(a4) Falls jemand eine solche Abbildung zum R-Wert aus einer anderen Publikation des RKI für irgendeinen Zeitraum bezüglich SARS-CoV-2 kennt, möge er bitte darauf hinweisen, vielen Dank!

(a5) Man könnte die Datenbasis durchaus angreifen. Was ich persönlich auch tue (1,13, siehe auch Kapitel “Statistik der Toten”).

(0) 08.06.2020; nature; Seth Flaxmann, Swapnil Mishra, Axel Gandy und weitere; Estimating the efforts of non-pharmaceutical interventions on COVID-19 in Europe; https://www.nature.com/articles/s41586-020-2405-7

(1,1i) 13.05.2020; mulitpolar; Patrick Grete; Mythos Reproduktionszahl; https://multipolar-magazin.de/artikel/mythos-reproduktionszahl

(2) 12.07.2020; RKI; Täglicher Lagebericht des RKI zur Coronavirus-Krankheit-2019 (COVID-19); https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Situationsberichte/2020-07-12-de.pdf?__blob=publicationFile

(3) 27.08.2020; ECDC; COVID-19 situation update worldwide …; https://www.ecdc.europa.eu/en/geographical-distribution-2019-ncov-cases

(4,4i) 27.06.2020; Rubikon; Sucharit Bhakdi, Karina Reiss; Das Medien-Versagen; Exklusiv-Abdruck aus deren Buche “Corona: Fehlalarm?”; https://www.rubikon.news/artikel/das-medien-versagen-2

(5,5i) 22.04.2020; Tagesanzeiger; Karolina Meta Beisel; Warum Belgien die höchste Todesrate weltweit hat; https://www.tagesanzeiger.ch/warum-belgien-die-hoechste-todesrate-weltweit-hat-825753123788

(6) 2019; RKI; Bericht zur Epidemiologie der Influenza in Deutschland 2018/19; https://influenza.rki.de/Saisonberichte/2018.pdf#

(7) 16.07.2020; Rubikon; Jens Bernert; Die geheilten Toten; https://www.rubikon.news/artikel/die-geheilten-toten

(8) https://de.wikipedia.org/wiki/Konfidenzintervall; abgerufen: 27.08.2020

(9) Glaubwürdigkeitsintervall; https://en.wikipedia.org/wiki/Credible_interval; abgerufen: 27.08.2020

(10 bis 10ii) Estimating the efforts of non-pharmaceutical interventions on COVID-19 in Europe; https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-020-2405-7/MediaObjects/41586_2020_2405_MOESM1_ESM.pdf

(11) 07.05.2020; Frankfurter Allgemeine; Christoph Sahm, Stephan Sahm; Die Statistikschwächen der Heinsberg-Studie; https://www.faz.net/aktuell/wissen/corona-die-statistik-schwaechen-der-heinsberg-studie-16758326.html; Der Autor argumentiert, dass die unbeachtete Unsicherheit der Zahl der Todesfälle dazu führt, dass man das Vertrauensintervall der Sterblichkeitsrate nach oben anpassen muss, vergisst aber zu erwähnen, dass dem auch eine Anpassung des Vertrauensintervalls nach unten folgt, weil auch überdurchschnittlich viele Menschen in Heinsberg gestorben sein könnten. Es ergibt sich dann ein Vertrauensintervall für die Sterblichkeitsrate, dass nicht wie nach Angabe der Autoren der Heinsbergstudie bei 0,29 — 0,45% (mittel 0,36%) liegt, sondern eines, dass bei ~ 0,07 — 0,8% liegt; das Mittel bleibt davon unberührt. — was hier allerdings wegen der Einfachheit der angewanden Mittel (Standardabweichung) nur als Überschlagsrechnung begriffen werden sollte.

(12) Fall-Verstorbenen-Anteil; https://de.wikipedia.org/wiki/Fall-Verstorbenen-Anteil; abgerufen: 25.08.2020

(13) 23.04.2020; Spektrum; Christof Kuhbandner; Von der fehlenden wissenschaftlichen Begründung der Corona-Maßnahmen (aktualisiert); https://scilogs.spektrum.de/menschen-bilder/von-der-fehlenden-wissenschaftlichen-begruendung-der-corona-massnahmen/

(b1) Imperial College; Studie; Grafik zu angeblich realen und ohne “Lockdown” zu erwartenden Todeszahlen

(b2, b2i) Extrakt aus Grafik (b1) des Imperial College

(b3) Herleitung der “Infektionszahlen” aus den angeblich an Covid-19 gestorbenen Menschen, wie sie das Imperial College in seiner Studie vom Juni 2020 angab; Autor: Sebastian Domschke

(b4) Imperial College; Modell zur Darstellung der Infektionszahlen in Abhängigkeit von der Einführung landesweiter Ausgangssperren (“Lockdown”)

(b5) Studie des Imperial College; Todesfälle; eingearbeitet der R-Wert (nach Maßgabe ECDC); Autor: Sebastian Domschke

(b6) 23.04.2020; RKI; Epidemiologisches Bulletin; S. 14, Abb. 5; https://www.rki.de/DE/Content/Infekt/EpidBull/Archiv/2020/Ausgaben/17_20.pdf?__blob=publicationFile

(Titelbild) Grafik, Diagramm; Autor: Mediamodifier (Pixabay); 23.12.2017; https://pixabay.com/de/illustrations/grafik-diagramm-wachstum-3033203/; Lizenz: Pixabay License 

Aufrufe: 5576