Warum die Heinsberg-Studie keinen Grund für Entwarnungen gibt

von Frank Taeger | Mai 4, 2020 | Aktuelles, Analyse, Corona

Gangelt/Heinsberg Studie

Die viel erwartete Gangelt/Heinsberg-Studie ist erschienen! Ein Grund zum feiern? Nun, vielleicht, vielleicht auch nicht. Wir müssen diese Studie und andere ihrer Art korrekt einordnen. Bevor politische Schlüsse gezogen werden, bevor Öffnungen und sonstige Rechtfertigungen eingehen, müssen wir die Studie erst analysieren und ihre Bedeutung wirklich verstehen. Sonst laufen wir Gefahr, die Ergebnisse fehlzuinterpretieren und gigantische Fehler zu machen. Also legen wir los.

Die Tests

Um eine Viruskrankheit zu diagnostizieren, brauchen wir einen Test für die Diagnostik. Hier benutzen wir sog. PCR Tests. Diese sollten möglichst sensibel reagieren, damit positive Fälle nicht falsch negativ getestet werden. Wir wollen ja lieber, dass jemand ohne Erkrankung in Quarantäne geht, als dass wir infektiöse Personen freilaufend in der Bevölkerung haben.

Für die Bestimmung von Immunität oder der Frage, wie viele Menschen in Deutschland nun krank waren, brauchen wir hingegen Antikörper Tests, die eine frühere Infektion belegen können. Hier ist es weniger schlimm, wenn wir falsch negative Tests haben, aber falsch positive Tests sind unpraktisch, da sie die Zahlen falsch aufblähen.

Die beiden Werte, die wir daher brauchen, sind die Sensibilität und Spezifität des Tests. Sensibilität gibt die Anzahl falsch negativer Tests an, die Spezifität die Anzahl falsch positiver Tests. Diese Werte sind wichtig, weil sie am Ende bestimmen, wie belastbar die Ergebnisse sind. Je kleiner die Anzahl positiver Tests, desto stärker wirkt sich eine hohe Anzahl falsch positiver Tests auf das Gesamtergebnis aus. Dazu später mehr.

Halbgare Ergebnisse

Als Hendrick Streeck die Zwischenergebnisse der Heinsberg-Studie vor wenigen Wochen im Fernsehen auf einer Pressekonferenz bekannt gab, hat es mich geschaudert. Nicht, weil die Ergebnisse so großartig oder schlecht waren, sondern weil hier halbgare Ergebnisse ohne nötige Sorgfalt nicht nur herausposaunt, sondern auch gleich politisch interpretiert wurden.

Der Backlash der wissenschaftlichen Gemeinschaft war eben dementsprechend groß, denn unter normalen Umständen ist das, was dort passiert ist, grobes Fehlverhalten. Nach langem Warten ist nun das Manuskript der Heinsberg-Studie auf einem Pre-Print Server der Uni Bonn endlich publiziert worden. Es ist daher an der Zeit, die Studie anzusehen und Peer Review zu betreiben.

Peer Review ist der Prozess in der Wissenschaft, bei dem Kolleg*innen ein Manuskript lesen und Kritik üben, um eine hohe Qualität der Daten und Schlussfolgerungen sicherzustellen. Dieser Prozess ist essenziell in der Wissenschaft, dauert aber lange. Deswegen wird im Moment dieser Prozess nach hinten verlagert und Manuskripte erstmal „vorpubliziert“, um sie einer möglichst großen Leserschaft zur Korrektur und auch frühzeitigen Information zur Verfügung zu stellen.

Schauen wir uns die Studie genauer an

Ein erster Eindruck: Was die Beschreibung der Materialien und Methoden angeht, ist die Heinsberg-Studie in jedem Stück vorbildlich. Jede Methode, jeder Schritt, wurde sehr ergiebig dokumentiert und beschrieben. In der Studie wurden aus dem Melderegister per Zufall 600 Haushalte ausgewählt und rekrutiert.

Es wurden insgesamt 919 Teilnehmer untersucht. Diese haben eine Blutprobe abgegeben, die mit ELISA Tests der Firma EUROIMMUN getestet wurden. Dabei handelt es sich um Immunglobulin A und G Tests. Die Autoren der Heinsberg-Studie geben eine Spezifität von 99.1% vom Hersteller an, die sie mit 98.3% selbst getestet haben. Eine unabhängige Studie Aus Kopenhagen hingegen gibt die Spezifität mit 93% für IgA und 96% für IgG an.

Die Antikörpertest-Ergebnisse

Warum das wichtig ist, dazu kommen wir später. Die Autoren der Heinsberg-Studie geben an, dass 18.5% der Teilnehmer IgA positiv und 13.6% als IgG positiv getestet wurden. Diese Zahlen wurden dann um die vom Hersteller angegebene Spezifität und Sensibilität korrigiert. Daraus ergaben sich dann 10.63% IgA positiv und 14.11% positiv getestete.

Hier werden nun auch die die Konfidenzintervalle angegeben, die zwischen 7.48% und 13.88% für IgA Tests und 11.15% und 17.27% lagen. Ein Konfidenzintervall soll angeben, wie genau eine Lageschätzung ist. Das 95% gibt dabei ein Intervall an, dass wenn wir das Experiment beliebig oft wiederholen würden, den unbekannten, echten Parameter, in 95% der Fälle bedeckt.

Je enger das Konfidenzintervall ist, desto genauer schätzen wir einen Wert auch ein. Zu den Personen mit Antikörper Tests kamen nun noch weitere hinzu, die einen positiven PCR Test hatten. Am Ende geben die Autoren an, dass eine Anzahl von 15.53% [95% KI 12.31 -18.96%] positiv infiziert war.

Von sieben Toten zur Sterblichkeit

Von dieser Zahl berechnen sie dann, indem sie die sieben Toten im Landkreis, bei denen eine SARS-COV-2 Infektion nachgewiesen wurde, in Relation setzen, die sog. Infection Fatality Rate. Die Infection Fatality Rate umschließt die Dunkelziffer, während die sog. Case Fatality Rate diese Dunkelziffer nicht berücksichtigt. Als Ergebnis geben die Autoren eine IFR von 0.36 [95% KI 0.29 – 0.45%] an. Also Klartext: eine Tödlichkeit von 0,36% für Corona.

Stanford-Studie: Warum Corona definitiv tödlicher ist als die Influenza

Die Heinsberg-Studie gibt dann noch einige weitere Angaben über die Symptome der Patienten, die nicht viel Neues bieten. Von Verlust des Geschmacks hin zu Fieber und ist alles dabei und eher für die Kliniker interessant. Dabei ist auffällig, dass nur 22.2% der Infizierten keinerlei Symptome haben. Das wird später nochmal wichtig.

Kinder erhöhen die Ansteckungswahrscheinlichkeit

Eine teilweise positive Nachricht zeigt sich dann aber weiter. Die sog. Secondary Attack Rate sagt uns, wie viele Personen in einem Haushalt von einem Infizierten weiter infiziert wurden. Diese Wahrscheinlichkeiten stiegen mit der Haushaltsgröße an, jeweils von 15.53 auf 43.59% [25.26%; 64.60%] für zwei Personen Haushalte, 35.71% [19.57%; 55.60%] für drei Personen Haushalte und 18.33% [9.67%; 28.74%] für Haushalte mit vier Personen.

War ein infiziertes Kind im Haushalt, stieg die Ansteckungswahrscheinlichkeit auf 66.67% [21.83%, 100.00%] in drei Personen Haushalten und 33.33% [9.02%; 71.60%] in Haushalten mit vier Personen. Das bedeutet, dass der Kontakt mit einem infizierten Kind öfter zu einer Ansteckung geführt hat, als dies in reinen Erwachsenenhaushalten oder Haushalten in denen Eltern infiziert waren, der Fall war. Im Großen und Ganzen sind dies sehr gute Ergebnisse, sie zeigen eine deutlich niedrigere Infektiosität, als erwartet.

Kommen wir zur Interpretation dieser Ergebnisse

Die Analyse ist vorbildlich, ebenso die Diskussion. Die Ergebnisse kommen aus einem Hotspot mit einem Superspreader Event, einer Karnevalssitzung, bei dem viele Personen infiziert wurden. Die Ergebnisse sind nach WHO Protokoll aufgenommen worden, was gut ist. Sie sind aber erstmal NUR für den Bereich Gangelt repräsentativ. Nicht einmal für die ganze Region Heinsberg.

Somit erstmal mit Vorsicht zu genießen. Von einem Hotspot auf die gesamte Bevölkerung zu schließen, ist fahrlässig. Die ermittelte Infection Fatality Rate liegt ungefähr bei der Hälfte der Infection Fatality Rate, die aus der Region Hubei ermittelt wurde. Dies kann ebenso als Glück wie ein Zeichen unseres guten Gesundheitssystems gewertet werden.

Die Ergebnisse zeigen eine hohe Dunkelziffer mit einem Faktor 5

Das Gute ist, dass die Anzahl positiver Fälle hoch genug ist, dass die ermittelte Spezifität ausreicht, dass die Schwankung falsch positiver Fälle zumindest keinen fatalen Effekt hat. Dennoch ist hier Vorsicht geboten. Die eingangs erwähnte Studie aus Kopenhagen gibt immerhin eine Spezifität von 93% für IgA und 96% für IgG an.

Streeck und Kollegen haben ihre eigene Messung vorgenommen, allerdings mit nur 68 Proben und einem einzelnen falsch positiven Ergebnis. Ein Versuch von mir, die nötige statistische Power zu errechnen, gab mir deutlich größere Sample Sizes aus, um eine solch kleine falsch positive Rate zu testen.

Ein Testrechner, mit dem ich die Wahrscheinlichkeiten berechnet habe, gab mir folgende Daten aus: Für den IgA Test liegt die Wahrscheinlichkeit bei 29%, das ein positives Ergebnis falsch positiv ist. Für den IgG Test liegt die Wahrscheinlichkeit eines falsch positiven Tests bei 24.5%. Nehme ich Streecks 98.3% an, wären es nur 12.1% erwartbare falsch positive Werte. Und mit den 99.1% des Herstellers gerade mal 6.8% falsch positive Werte.

eine riesige Menge an möglichen falsch Positiven Werten

Je nachdem, wer hier nun Recht hat, haben wir hier eine riesige Menge an möglichen falsch Positiven Werten. Auch deswegen ist Vorsicht geboten. Eine weitere externe Validierung der Antikörper Tests ist aus meiner Sicht absolut geboten, damit die Genauigkeit der Daten auch wirklich gegeben ist. Insbesondere, wenn politische Schlüsse gezogen werden. Diese Effekte verändern auch die IFR. Das ist auch als Laie schnell ersichtlich.

Die Anzahl Toter in Gangelt ist sieben. Diese Zahl ändert sich nicht. Gangelt hat 12.529 Einwohner. Sind davon nun 15.53% infiziert, sind das geschätzt 1944. Sind aber 24.5% falsch positiv, müssten wir diesen Wert korrigieren. Der unkorrigierte igG Wert sind 14.11%. Korrigieren wir diesen Wert um 24.5%, erhalten wir 10.65%, was nun 1334 Personen entspricht. Und einer mittleren IFR von 0.52%.

Gangelt vs katastrophale Stanford Studie

Und das in der selben Rechnung, mit den selben Ergebnissen, weil die Qualität des Tests einfach eine andere ist. Richtig absurd wird so etwas, wenn wir an die ebenso in der Presse hochgelobte Studie aus Santa Clara von der Uni Stanford denken. Dort wurde ein Test benutzt, bei dem 99% Spezifität behauptet wurden.

Die gleiche Studie, die 96% Spezifität für den Euroimmun Test ermittelt hatte, fand eine Spezifität von gerade mal 87% für den Test in der Santa Clara Studie. Diese hat aber nur eine Prävalenz von 1.5% ermittelt. Das heißt, es ist absolut im Rahmen des Möglichen, dass JEDES Testergebnis in der Studie, das positiv ist, auch falsch ist. Und deswegen sind solche Teststatistiken unglaublich wichtig.

1,8 Millionen Infizierte? Hanebüchen!

Was wir aus den Daten ziehen, ist komplizierter, als man denkt. Die Uni Bonn sagt mit Daten der Heinsberg-Studie, dass bis zu 1,8 Millionen könnten infiziert sein. Diese Art, eine Dunkelziffer zu schätzen, ist völlig unseriös. Um diese Zahl zu erreichen, hat man die an COVID19 verstorbenen Personen in ganz Deutschland genommen, und einfach durch die ermittelte IFR von 0.36 geteilt. 6812 / 0,0036 ergibt 1,892 Millionen. Eine solche Rechnung ist aber völlig hanebüchen.

Erstens ist die IFR in einem Hotspot ermittelt worden. Ob dieser in irgendeiner Form repräsentativ für Deutschland ist, ist aus der Studie nicht abzulesen. Somit sind die 1,8 Millionen schon mal quatsch. Diese würden sich aber auch aus der Studie eher nicht ergeben. Wir reden hier von 3.1% mit PCR Tests positiv getesteten Personen und 15.53% vermuteten Erkrankten. Das ist der Faktor 5.

Eher 827.374

Bei 165.745 erkrankten Personen (Stand 04. Mai) ergäbe das 827.375 Personen. Also WEIT unter den 1,8 Millionen. Trotzdem steht dieser Wert schon in der Bild, der FAZ, dem FOCUS… Qualitätsjournalismus eben. Amüsant wird es dann, wenn wir noch einberechnen, dass wir ja gewisse Schwankungen aufgrund der Testqualität haben könnten. Dann schwankt der Wert direkt um einige hunderttausend Personen.

Aber lassen wir das, das ist eben genau wie die 1.8 Millionen, reine Spekulation, die zu nichts führt! Denken wir lieber daran, dass nur 22.2% keine Symptome gezeigt haben, relativiert auch das den Wert der Dunkelziffer wieder enorm. Bisher gingen wir eher von 50-80% Asymptomatikern aus. Sollten es 22.2% sein, dürfte die Dunkelziffer eher sinken, als steigen, da es deutlich weniger Personen ohne Symptome gibt, die das Virus unwissentlich verbreiten.

Können wir aus dieser Studie nun etwas über Öffnungen ablesen?

Ja und Nein. Die interessanteste Zahl für mich bezieht sich vor allem auf Kinder. Denn wenn ein infiziertes Kind im Haushalt war, stieg die Wahrscheinlichkeit, sich zu infizieren deutlich höher als mit einem erwachsenen Kranken. Eltern und Kinder haben mehr Körperkontakt als Personen im Haushalt miteinander, was somit die Wahrscheinlichkeit der Infektion steigert.

Wir wissen aus Studien an Kindern, dass sie die gleichen Mengen an Viren mit sich tragen, wie Erwachsene. Wir wissen auch, dass sie sich aber deutlich weniger oft infizieren. Die Öffnung der Schulen und KiTas ist somit keine gute Idee, sie erhöht die Wahrscheinlichkeit einer Infektionswelle DEUTLICH.

180.800 Tote bis zur Durchseuchung

Die generelle Wahrscheinlichkeit sich zuhause anzustecken ist aber niedriger als erwartet. Das ist eine gute Nachricht. Die IFR Rate ist laut Heinsberg-Studie niedriger in Gangelt als gemeinhin angenommen wird. Dennoch ist das KEINE gute Nachricht. Gehen wir davon aus, wir hätten 1.8 Millionen Infizierte und wir bräuchten 60% Durchseuchung für Herdenimmunität, müssten wir noch weitere 27,3x soviele Menschen anstecken, wie jetzt.

Das heißt, wir müssten somit weitere 180.800 Todesfälle ertragen, wenn wir auf Herdenimmunität setzen. Und das unter der Annahme, dass die absurde Zahl aus dieser Studie, die absolut keine Belastbarkeit hat, richtig ist. Auch wenn deutlich mehr Personen infiziert sind als erwartet, sind wir WEIT von Herdenimmunität entfernt. Wir sind gerade mal 3.6% des Weges gegangen.

Wir stehen also, wenn wir auf dieses Konzept setzen würden, noch immer ganz am Anfang. Auch wenn die Studie ein wenig Hoffnung gibt, sollten wir ihre Daten nicht überbewerten. Als Grundlage einer politischen Entscheidung zur Öffnung ist sie unzureichend, sie gibt uns sogar eher eine Mahnung mit, was die Kinder betrifft.

Es sind weitere Studien dieser Art, inklusive sehr weitreichender Validierung der Tests, in ganz Deutschland nötig, damit wir weitere Entscheidungen treffen können. Diese sollten auf einer guten Datenbasis stehen. Die Heinsberg-Studie ist ein erster Schritt in diese Richtung. Aber eben nur ein erster Schritt.

Quellen

Heinsberg-Studie (Link)
Santa Clara Studie (Link)
Studie zur Evaluation der Assays (Link)

Artikelbild: Federico Gambarini/dpa