COVID-19So veranschaulichen Datenjournalist:innen das Coronavirus

Datenjournalist:innen brechen die Komplexität des Corona-Virus und seiner Folgen in Grafiken und Karten herunter. Wir haben uns im Netz umgeschaut und präsentieren die spannendsten und hilfreichsten Visualisierungen.

Illustration mit Arzt und Virus vor einer Weltkarte
Das neuartige Coronavirus eilt um die Welt – und Journalist:innen versuchen es zu erklären. – Vereinfachte Pixabay Lizenz Mohamed Hassan

Das Corona-Virus COVID-19 stellt auch die journalistische Arbeit vor eine Vielzahl an Herausforderungen. Autor:innen wollen Informationen über die Ausbreitung des Virus vermitteln, ohne dabei Panik zu schüren. Komplexe Sachverhalte wollen einfach erklärt werden – und doch möglichst vollständig abgehandelt sein.

In vielen Redaktionen arbeiten daran derzeit Datenjournalismus-Teams. Mit Grafiken und interaktiven Schaubildern versuchen sie, das neuartige Corona-Virus verständlicher und greifbarer zu machen. Wir haben uns umgeschaut und präsentieren euch die spannendsten und hilfreichsten Visualisierungen.

Zeit Online: Wie das Coronavirus nach Deutschland kam

Die Entwicklung des Virus in Deutschland. - Alle Rechte vorbehalten Screenshot

Zeit Online versucht sichtbar zu machen, wie sich das Virus in Deutschland verbreitet hat. Im Vordergrund stehen nicht absolute Fallzahlen, sondern die geographische Ausbreitung und die Entwicklung regionaler Hotspots – die Karte ist in eine Spurensuche nach dem Ursprung des Virus in Deutschland eingebettet. Die Autor:innen erkunden, wieso die ersten Fälle in Bayern gut eingedämmt werden konnten, während im Kreis Heinsberg in Nordrhein-Westfalen die Suche nach dem oder der Patient:in Null auf Hochtouren läuft. Die Karte wird nicht laufend aktualisiert – und stellt somit eher eine Momentaufnahme dar.

Berliner Morgenpost: Coronavirus-Monitor

Interaktive Karte, die Verbreitung des Corona-Virus zeit.
Infizierte, Tote und Genesene, nach Daten der Johns Hopkins Universität. - Alle Rechte vorbehalten Screenshot.

Die Berliner Morgenpost wartet mit einer laufend aktualisierten globalen Übersicht auf. Die Ansicht unterscheidet zwischen infizierten, genesenen und gestorbenen Patient:innen und ist kumulativ, führt also alle bekannten Fälle zusammen. Dies erlaubt zwar den internationalen Vergleich, der hochdynamische Charakter einer Pandemie kann aber ins Hintertreffen geraten – denn diese ist auch bei einer geringen Zahl Infizierter gefährlich. Zudem sind die Daten für Deutschland nur auf Länderebene aufgeschlüsselt.

Die Daten für die Karte stammen aus einem Projekt der Johns Hopkins Universität, die seit Ende Januar einen Übersicht über aktuelle Fallzahlen öffentlich zur Verfügung stellt. Datengrundlage dieses semi-automatisierten Dashboards sind die Weltgesundheitsorganisation, nationale Behörden zur Seuchenprävention sowie Einrichtungen auf Landes-, städtischer und kommunaler Ebene.

Von der Schwierigkeit, exponentielles Wachstum zu verstehen

Neben Karten, die die globale Ausbreitung des Virus aufzeigen, widmen sich Datenjournalist:innen verstärkt dem Thema der Infektionsraten und dem exponentiellen Wachstum. Denn selbst wenn in Deutschland noch vergleichsweise wenige Corona-Infektionen nachgewiesen sind, gibt es doch Anlass zur Beunruhigung – auch wenn einige das nicht glauben möchten.

Süddeutsche Zeitung: Die Wucht der großen Zahl

Mögliche Infektionen in Deutschland ohne angemessene Vorsorgemaßnahmen. - Alle Rechte vorbehalten Screenshot

Die Süddeutsche Zeitung erläutert, dass die zentrale Kennziffer für die Ausbreitung des Virus die Zeitspanne ist, innerhalb derer sich die Fallzahlen verdoppeln. Nach konservativen Schätzungen liegt diese beim Corona-Virus bei etwa sieben Tagen. Die nebenstehende Grafik zeigt das Wachstum der Fallzahlen in Zwei-Wochen-Schritten auf: Würden in Deutschland keine effektiven Maßnahmen zur Eindämmung des Virus ergriffen, wäre schon Mitte Mai mit mehr als einer Millionen Fälle zu rechnen.

Flattening the Curve Die Ausbreitung des Virus verlangsamen

Zwei Ausbreitungsszenarien im Vergleich. - CC-BY-SA 4.0 Siouxsie Wiles and Toby Morris

Das Ziel effektiver Eindämmungsstrategien liegt demnach weniger darin, die Zahl absoluter Fälle zu reduzieren, als vielmehr den Zeitrahmen zu strecken, innerhalb dessen sie auftreten. Die jeweils blau und orange eingefärbten Flächen repräsentieren eine ähnliche Menge an Fallzahlen – jedoch mit unterschiedlichen Infektionsraten. Im ‚blauen‘ Szenario werden keine Schutzmaßnahmen ergriffen, das Virus greift schnell um sich und sprengt die Kapazitäten des Gesundheitssystems. Im ‚orangenen‘ Szenario treten die Fälle über einen langen Zeitraum auf, bewegen sich aber innerhalb des Kapazitätsrahmens der Gesundheitsversorgung. Übrigens: Dass Infektionen nicht in der klassischen Warnfarbe rot dargestellt sind, ist kein Zufall und soll allzu ausgeprägtem Alarmismus vorbeugen.

New York Times: How Bad Will the Coronavirus Outbreak Get?

Ein weiterer Indikator für Übertragungsraten liegt in der durchschnittlichen Zahl an Personen, die ein:e Infizierte:r ansteckt. Die New York Times weist darauf hin, dass diese Zahl für das Corona-Virus nach aktuellen Schätzungen bei zwischen zwei und vier Personen liegt. Aus fünf Infizierten können so innerhalb von fünf Ansteckungszyklen (von jeweils sieben Tagen, nach konservativen Schätzungen) 368 werden.

Grafik, die Ausbreitung des corona-Virus veranschaulicht.
Ausbreitung des Corona-Virus. - Alle Rechte vorbehalten Screenshot

Die Eindämmung der SARS-Pandemie 2002/2003 gelang nur, erklären die Autor:innen, indem die durchschnittliche Anzahl angesteckter Personen pro Fall auf 0.4 gesenkt werden konnte. Doch auch wenn die Anzahl angesteckter Personen nur halbiert wird, sind die Ergebnisse enorm. Bei 1.3 angesteckten Personen, dem Wert für die saisonale Grippe, pro fünf Infizierter ergeben sich nach fünf Zyklen nur 45 Gesamtfälle.

Grafik, die Ausbreitung des corona-Virus veranschaulicht.
Ausbreitung der saisonalen Grippe. - Alle Rechte vorbehalten Screenshot

Positive Tests sind nur die Spitze des Eisberges

Ein riesiges Problem, vor dem Wissenschaftler:innen, Journalist:innen und Entscheidungsträger:innen stehen, ist die unklare Datenlage zu Coronafällen. Alle grafischen Darstellungen über die Ausbreitung des Virus basieren auf Zahlen über positiv getestete Menschen. Doch diese sind nur die Spitze des Eisberges. Es gibt vermutlich eine große Dunkelziffer an Infizierten, die (noch) nicht getestet sind – zum Beispiel, weil sie keine oder nur sehr milde Symptome zeigen.

Medium: Coronavirus Why we must act now (Warum wir jetzt handeln müssen)

Der letzte Artikel dieser Übersicht ist sehr dicht und spürt der Dunkelziffer nach. Der Autor blickt hier auf die Entwicklungen aus dem Januar in Hubei, dem Epidemieherd des Virus, zurück und vergleicht offizielle Krankheitszahlen – also positiv getestete Personen – mit einer rückblickenden Schätzung tatsächlicher Krankheitsfälle – also Personen, die zwar infiziert waren, aber noch keinen offiziellen Kontakt zu den Gesundheitsbehörden hatten. Das Fazit dieser komplexen Analyse? Die offiziellen Krankheitszahlen, in der Grafik durch die gelben Balken repräsentiert, hinken den tatsächlichen Erkrankungen hinterher, in der Grafik durch die blauen Balken dargestellt.

Grafik, die Unterschied zwischen tatsächlichen und bekannten Fallzahlen aufzeigt.
Der Unterschied zwischen tatsächlichen Erkrankungen und bekannten Fällen. - Alle Rechte vorbehalten Screenshot.

Die hier versammelten Quellen machen eines deutlich: Eine gewisse Portion Vorsicht scheint im Falle des Corona-Virus durchaus angebracht. Wenn vorhandene gesundheitliche Daten der Realität einen Schritt hinterher hinken, müssen politische Entscheidungsträger:innen dies berücksichtigen. Gut verständliche Visualisierungen der Problematik können sicher einen Teil dazu beitragen, die Debatte um das Virus zu versachlichen.

Update 16/03:

Der im Artikel aufgeführte Medium Artikel von Tomas Pueyo hat seit seiner Veröffentlichung eine enorme Reichweite erlangt (laut Angaben des Autoren über 28 Millionen Aufrufe) – zu der natürlich auch wir mit diesem Artikel beigetragen haben. Der Beitrag enthält jedoch eine Reihe fragwürdiger Schlussfolgerungen und wird von Epidemiolog:innen und Statistiker:innen kritisiert. Wir entschuldigen uns dafür, dem Artikel zusätzlichen Aufwind gegeben zu haben und bedanken uns auch für die kritischen Kommentare zum Artikel.

21 Ergänzungen

  1. Dieses Argument hörte man bisher, wenn es (angeblich) um T. ging, um dann die Freiheitsrechte weiter zu beschränken.

    Noch plausibler scheint es doch, wenn aus Gesundheitsgründen der „Notstand“ (28.02.2020) ausgerufen wird und die Freiheitsrechte eingeschränkt werden.

    „Es handelt sich um eine Notstandsmaßnahme im öffentlichen Interesse, weil Nachteile für Leben und Gesundheit drohen und Gefahr im Verzug vorliegt.“
    https://www.bmvi.de/SharedDocs/DE/Anlage/LF/coronavirus-anordnung-bmg.pdf

    In Frontal21 warnen Mediziner und Experten vor Panikmache.
    Corona sei, so die Fachleute, wohl nicht viel gefährlicher als ein Influenzavirus.
    https://www.zdf.de/politik/frontal-21/corona-zwischen-panik-und-pandemie-100.html

    Bundespressekonferenz vom 09.03.2020 (Jens Spahn, Prof. Dr. Wieler (RKI) , Prof. Drosten (Charité) –
    Die Vielzahl und der Altersdurchschnitt der „Coronatoten“ in Italien von ca. 81 Jahren erklärt sich ungefähr so:
    Man nimmt alle Gestorbenen und untersucht diese dann, ob diese (vielleicht) das Virus in sich tragen.

    Das ist KEIN Witz!

    In Deutschland ist der Altersdurchschnitt bei ca. 40 Jahren.
    Hier wird getestet, wer das Virus in sich trägt und später ggf. AUSSCHLAGGEBEND an den Folgen DARAN stirbt.

    In der heutigen Befragung der Bundesregierung (13:44-46)- Jens Spahn zum Coronavirus – erwähnte JS auf eine Frage der Parteikollegin Frau Prof. Dr. Claudia Schmidtke auch bereits umgesetzte polizeirechtliche Regelungen in einigen Bundesländern!
    https://www.bundestag.de/dokumente/textarchiv/2020/kw11-de-regierungsbefragung-685554

    Die SICHERHEIT der Bürger „gehe vor wirtschaftlichen Interessen“.

    Das ist (K)EIN Witz!

    Die Nato-Übung mit über 20 x 1.000 Beteiligten findet statt!

    Das ist KEIN Witz!

    Die Zahl der Infizierten steigt UNAUFHÖRLICH!
    Klar, wenn die Zahl der wieder Gesundeten NICHT ERHOBEN und damit NICHT von der Infiziertenzahl abgezogen wird!

    Wie heißt es noch, glaube keiner Statistik, ….

    1. What is CoronaStats?

      On CoronaStats.org you can find current and historical statistics about the current worldwide outbreak of COVID 19 coronavirus:

      Current statistics about the number of confirmed cases, recovered patients, and death tolls.
      Check which countries have reported their first case report about infections with coronavirus.
      Compare the outbreak in multiple countries by viewing country-specific charts side-by-side.

      https://www.corona-stats.org

  2. Der Medium-Beitrag „Why we must act now“ strotzt vor Kausalfehlern. Da ihr hier nur Chart 7 zitiert, schaut euch bitte Mal das Original an. Das ist im Beitrag sogar verlinkt (https://jamanetwork.com/journals/jama/fullarticle/2762130). Die Analyse von Hr. Pueyo bestand lediglich darin die roten Pfeile mit den Ereignissen einzufügen. Dazu schreibt er „It shows in orange bars the daily official number of cases in the Hubei province: How many people were diagnosed that day. The grey bars show the true daily coronavirus cases.“ Ein Blick ins Paper zeigt, dass dies grundlegend falsch ist: „Daily numbers of confirmed cases are plotted by date of onset of symptoms (blue) and by date of diagnosis (orange).“ Nicht nur wird aus blau plötzlich grau (Das kann ich noch nachvollziehen :D), vor allem wird aus dem Unterschied zwischen Diagnosezeitpunkt und Einsetzen der Symptome plötzlich der Unterschied zwischen bekannten und tatsächlichen Fällen.

    1. Lieber Karl,
      danke für deine Anmerkungen. Die Herkunft der Grafik, die du ansprichst, ist tatsächlich interessant. Das auf Jama Network veröffentliche Paper, das im medium Artikel zitiert wird, greift auf Daten des chinesischen ‚Infectious Disease Information System‘ zurück – Stand 11.02.20. Von dort stammen also die 44.672 Fälle, die in der Grafik auftauchen.

      Die Studie definiert das date of onset als Zeitpunkt, zu dem Patient:innen in einer rückblickenden epidemiologischen Untersuchung nach eigener Aussage die ersten Symptome verspürten. Offiziell diagnostizierte Fälle sind demnach jene, die nach einem Rachenabstrich positiv getestet wurden. Quelle: http://weekly.chinacdc.cn/fileCCDCW/journal/article/ccdcw/2020/8/PDF/COVID-19.pdf

      Auch wenn es ein kausaler Sprung ist, aufgrund dieser Informationen von bekannten und tatsächlichen Fällen zu sprechen, macht der Autor in meiner Lesart primär das Argument, dass positive Testergebnisse in keiner Hinsicht die Realität der Krankheitsverbreitung darstellen (zu wenig Menschen gehen zu spät zum Arzt). In der Hinsicht finde ich die Zahlen durchaus spannend. Was denkst du?

      1. Genau in dieser Hinsicht sind die Zahlen eben leider irreführend. Bei der Menge an Fällen gibt es zwischen beiden Farben keinen Unterschied. Beide bilden die 44.672 Fälle ab. Blau bildet diese Fälle nach subjektivem Zeitpunkt der ersten Symptome ab und gelb nach Zeitpunkt des positiven Testergebnisses. Ich wüsste nich einmal welche Aussage ich hier aus der mittleren Distanz ziehen soll. Selbst diese wird davon beeinflusst, wie schnell die Leute zum Arzt gehen. Das wiederum wird sicherlich vom Krankheitsverlauf und damit auch durch die Risikofaktoren der jeweiligen Bevölkerungsgruppe beeinflusst. Hinzu kommen Testgeschwindigkeit, usw. Alles Faktoren die ich auf dieser Datengrundlage nicht auseinander gerechnet bekomme.

        Letztendlich handelt es sich bei beiden Farben um bekannte & kranke Fälle. Um eine Aussage über tatsächliche Fälle zu treffen, muss ich die Untererfassung schätzen. Daher welcher Anteil von Fällen wird überhaupt erfasst. Das RKI hat dazu mehr Informationen: https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Steckbrief.html#doc13776792bodyText7

        Auch Aussagen zur realen Krankheitsverbreitung sollte man differenzieren. Genau genommen gibt es einen Unterschied zwischen der Infektionsausbreitung, also der Ausbreitung des Virus SARS-CoV-2, sowie der Krankheitsausbreitung, also der Lungenkrankheit Covid-19. Nicht jeder Infizierte wird auch krank (zeigt Symptome), kann aber trotzdem infektiös sein und trägt damit zur Infektionsausbreitung bei (Manifestationsindex). Das Chart zeigt nur bekannte & kranke Fälle. Jetzt verläuft Covid-19 in vermutlich sogar über 80% der (Krankheits-)Fälle recht mild (s. https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Steckbrief.html#doc13776792bodyText2). Jemand mit Fieber, und das ist ein Großteil der Covid-19 Erkrankten, soll einfach zu Hause bleiben, wird aber nicht getestet. In diesem Fall ist die Infektionsausbreitung auch noch nicht schlimm, wobei das Schwert halt zweischneidig ist. Einerseits werden so immer mehr Menschen immun, andererseits steigt eben auch das Infektionsrisiko für Risikogruppen. Wenn das zu schnell geht, kommt es zur Überlastung des Gesundheitssystems. Das wiederum trifft dann wieder alle.

        Was die Tests abbilden kommt darauf an, wie & wo getestet wird. Wenn ich diese Umstände entsprechend beachte, kann ich statistisch von der Stichprobe auf die Grundgesamtheit schließen. Inwiefern dies die Realität der Verbreitung wiedergibt kommt auf die Annahmen an. Natürlich müssen wir die Ausbreitung der Infektion verlangsamen, aber Pandemiemanagement ist eben kein „No-Brainer“ á la wir werden alle sterben, weil wegen Exponentialfunktion. Am Ende ist die Frage warum die relevanten Entscheider reagieren, wie sie reagieren und ob ich dem als Bürger vertrauen kann. Solange Infektionsketten nachvollzogen werden können, habe ich auch die relevante Untererfassung im Griff. Wenn das nicht mehr geht muss ich großflächiger Infektionswege unterbrechen. Erst wenn das nicht mehr geht werden gezielt Risikogruppen geschützt. Grundlage für diese Entscheidungen sind aber eben kausale Zusammenhänge. Weil wegen Exponentialfunktion hat damit nichts zu tun und schafft eher noch Panik.

        1. Huhu,

          hatte die Grafik auch in dem Medium-Artikel gesehen und den Text dazu gelesen und hatte das im Groben so geglaubt. Danke für die Klarstellung und danke für den Link zur Untererfassung vom rki.

          Dort steht was von Faktor 4,5 bis 11,1 mit „Vorsicht und Unsicherheit“ bezogen auf die in China erfassen Zahlen. Dass man mit bestätigen Fällen von heute aber 9 Tage hinterher hängt, kommt noch hinzu? Also wieviele Infizierte laufen da draußen rum?

          1. Im medium artikel wird die zahl der toten genommen..in d heute 7 (der 8. war in aegypten). Mal 1/sterblichkeit= 0.5% = 1400 infizierte gab es vor 18 tagen. Dann wieder xurueck auf heute per verdopplungsrate alle 3 tage. 18/3=6 verdopplungen 2×2×2×2×2×2=64. ergebniss 64×1400 infizierte in d heute= ca. 90000. Faktor 20 gabs auch in wuhan zwischen bekannt und unbekannt infizierte wobei die viel rigoroser getestet haben.

          2. Nur mal so am Rande… Bei aller (aus meiner SIcht zum Großteil berechtigten) Kritik, habe ich den Artikel schon vor einiger Zeit gelesen, und hatte für meinen Teil nicht in Erinnerung, dass er mir mit dem Schaubild besonders eindrücklich etwas zur Dunkelziffer oder Logik der Testdurchführung mitgegeben hätte. Was ich sehr wohl als wichtig und interessant erinnert habe, ist, dass die Grafik die „diagnostic gap“ darstellt, und uns damit (retrospektiv ermittelt) eine Schätzung gibt, in wie weit wir zeitlich bei den in den Teststellen eintreffenden Fällen (gleiche Testlogik voraus gesetzt) dem subjektiven Krankheitsbeginn hinterher hinken. Für mich war das eine durchaus nützliche Information, die mir zu den Schätzungen der Inkubationszeit einen informativen Gewinn gebracht hat.

  3. Obacht momentan bei Visualisierungen, die Bundesländer unterscheiden und Todesfälle ausweisen. Das RKI scheint die Ausweisung der Fallzahlen umgestellt zu haben und die neue Spalte „davon elek­tro­nisch über­mittelt (darunter Todes­fälle)“ wird von einigen Visualisierungen als Anzahl der Todesfälle interpretiert. Daher sind diese dort viel zu hoch.
    Durch die bevorstehende komplette Umstellung auf elektronisch übermittelten Infektionszahlen und den damit einhergehenden Meldeverzug wird es dann auch Abweichungen zwischen den veröffentlichten Fallzahlen der einzelnen Bundesländern und jenen des RKI geben.

  4. Sehr interessant sind auch die Aufbereitungen von Mark Handley hier:
    CoVID 19 Worldwide Growth Rates
    http://nrg.cs.ucl.ac.uk/mjh/covid19/

    Und mit der halblogarithmischen Darstellung kann man auch wunderbar die Trends erkennen. Verstehe sowieso nicht, warum das nicht alle Publikationen so machen, stattdessen lineare Kurven zeigen und „exponentielles Wachstum versteht niemand“ schreiben …

  5. spannend wäre, wenn man tatsächlich die lokalen Karten in Charts darstellt, jeweils auch die Entwicklungskurven fortführt (Düsseldorf, Köln, Berlin, ….)

    insgesamt sowieso spannend, dass
    – immer nur tatsächlich getestete Fälle dargestellt werden. Interessanter ist doch eine Fortführung der Kurve um 2 Wochen, denn das ist wegen der Incubationszeit von 2 Wochen dann eher der aktuelle Status
    – außerdem wäre spannend in jedem Land/Stadt das Verhältnis zwischen tatsächlich getesteten Personen sowie Positiven/Negativen darzustellen
    – Zusammenhang mit Bevölkerungsdichte

  6. Insgesamt gute Hinweise und Ausführungen. Wenn Sie nun noch bitte Ihre statistischen Auswertungen mit Atemwegserkrankungen aus den Vorjahren vergleichen und bildlich gegenüberstellen würden, könnte man daraus ersehen, ob und um welchen Faktor sich COVID-19 schneller verbreitet als beispielsweise Influenza. Den Vergleich der Letalitätszahlen dabei bitte nicht vergessen.

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.