Corona-Ampel.org

Methodik

Anmerkungen zur Datenlage und -verarbeitung (Stand: März 2021)

Begriffe

Grundsätzlich verwenden wir großteils die Begriffe, die vom Gesundheitsministerium und der AGES in ihren Datenveröffentlichungen verwendet werden. Das Gesundheitsministerium und die AGES sind aktuell auch die Haupt-Datenquellen, da sie – anders als die meisten Bundesländer – regelmäßig strukturiert Daten veröffentlichen.

Die von uns verwendeten Datenquellen sind in Kürze:

Eine vollständige offizielle Dokumentation inklusive Meldeketten und Definitionen ist für keine der genannten Datenquellen verfügbar. @botic hat aber eine möglichst vollständige Dokumentation basierend auf Erfahrungen und Behördenanfragen erstellt.

Einen Überblick über Datensätze, die als Open Data veröffentlicht werden, ist auf dem Österreichischen COVID-19 Open Data Informationsportal zu finden.

Die Definitionen für die Begriffe, die wir vom Gesundheitsministerium übernehmen, finden Sie in den „Erläuterungen zum Amtlichen Dashboard COVID19“. Die von uns verwendete Kennzahl „bestätigte Fälle“ entspricht der Definition „jemals positiv getestete“ des Gesundheitsministeriums.

Zu bemerken ist, dass ein bestätigter Fall weder zwingendermaßen das Virus weiter verbreiten kann, noch selbst Symptome verspürt.

Falsch-Positive Tests im Sinne eines Nachweises der Präsenz von Viren-DNA sind jedenfalls äußerst selten, zumindest solange die Behörden (wie bisher) nur PCR-Tests verwenden bzw. melden. (Update: Achtung, die Art der Tests könnte sich in Zukunft ändern) Personen, die einmal positiv und einmal negativ getestet wurden, werden trotzdem als „bestätigter Fall“ gezählt, da sie die Definition „jemals positiv getestet“ erfüllen.

⚠️ Die Korrektheit der Übernahme der Bewertungskriterien und Details zur Beschlussfassung der Corona-Ampel-Schaltungen können wir nicht garantieren, da diese nicht maschinenlesbar veröffentlicht werden und mühsam und fehleranfällig übernommen werden müssen.

Zahlen, die die Länder veröffentlichen, können in den meisten Fällen nicht automatisiert erhoben werden, da sie nicht verlässlich maschinenlesbar veröffentlicht werden. Der Wartungsaufwand für neun weitere Datenquellen wäre schwer zu stemmen.

Die Länder veröffentlichen oft Daten unter dem gleichen Begriff, aber mit subtil anderen Erhebungsmethoden oder Meldeketten, als gleichnamige Daten auf Ebene der Ministerien. Sie sind deswegen oft nicht vergleichbar.

Zeitreihen

Seit Oktober 2020 veröffentlicht die AGES ihre Zahlen auch rückblickend, also als Zeitreihen. Die Fälle werden allerdings anhand des Datum des jeweiligen Ereignisses (positives Testergebnis, Genesung, Todesfall) veröffentlicht, nicht anhand der Meldung. Das heißt: jeden Tag ändert sich nicht nur der aktuelle Tag, sondern auch einige Tage davor, da Todesmeldungen oder Meldungen von positiven Tests teilweise Tage später erfolgen.

Für die Veränderung zum Vortag stellen wir deswegen nicht die Fallzahlen des Vortags laut AGES dar, sondern die Veränderung der Gesamtsumme im Vergleich zur Veröffentlichung des Vortags.

Die dargestellten Timelines beruhen allerdings immer auf den Timelines der AGES. In diesen werden Fälle, die am Tag der Veröffentlichung gemeldet nur berücksichtigt, wenn sie vor dem Veröffentlichungstag eingetreten sind (Todesfallmeldung oder Meldung eines positiven Tests vom Vortag).

Daten zur Belegung von Krankenhäusern, Intensivstationen und Testungen werden von der AGES nun auch mit über 24-stündiger Verzögerung im Vergleich zum Gesundheitsministerium veröffentlicht. 🤷‍♂️

⚠️ Da wir die Veränderung seit Gestern selbst zusammenstellen müssen, können wir nicht zwischen Veränderung durch Ortswechsel (beispielsweise durch Verlagerung von Erkrankten in das Krankenhaus) und tatsächlichen neuen Fällen unterscheiden. Dadurch entstehen in den Bezirks- und Bundesländerdaten an manchen Tagen auch negative Veränderungen der Fallzahlen.

Aktive Fälle

Die aktiven Fälle aus unserer Hauptdatenquelle sind falsch. Die Korrektur Ende Dezember („Haircut“ – Fälle automatisch nach 21 Tagen als Genesen betrachtet) behebt den Fehler nicht, sondern macht ihn nur unsichtbarer.

Das liegt daran, dass BMG, AGES und mehrere Länder es seit mehreren Monaten nicht schaffen, die Meldungen von Genesen aus den Systemen der Länder korrekt in das System des Bundes zu übernehmen. Außerdem wird es wohl landesweise unterschiedlich gehandhabt, wer wann als Genesen gemeldet wird.

Als Workaround schätzen wir die aktiven Fälle mit Hilfe der 14-Tage-Inzidenz. Eine Covid-19-Erkrankung dauert etwa 14 Tage, die Quarantäne zwischen 10 und 14 Tage.

⚠️ Das ist eine neue Änderung, die Methodik kann sich noch ändern, Fehler können passieren.

Newsletter

Der Newsletter wird grundsätzlich gleich bespielt wie das Dashboard. Die Timelines – also die Vergleiche mit dem Vortag – funktionieren auf der gleichen Basis. Die Anzahl der bestätigten Fälle ist immer die neueste bekannte Zahl.

Der Newsletter wird jeden Tag ab 14:30 generiert, da laut AGES das Dashboard zwischen 13:00 und 14:00 aktualisiert wird, und die Übernahme der Daten etwas dauert. Sollten für einen Tag keine Zahlen veröffentlicht worden sein, oder die Übernahme der Daten nicht funktioniert haben, wird der Newsletter nicht versandt.

⚠️ Die Darstellung der Ampelschaltungen und ihrer Begründungen und Entscheidungsgrundlagen erfolgt aufgrund von nicht maschinenlesbar veröffentlichten Daten, die wir nach dem „best Effort“-Prinzip verarbeiten. Es kann – wie auch sonst – keine Garantie auf Vollständigkeit und Korrektheit gegeben werden. Aber wir bemühen uns.

FAQ

Warum stimmen Ihre Zahlen nicht mit den Zahlen von ORF, BMI, Gesundheitsministerium, Tweets von BM Anschober, oÄ zusammen?

Seufz.

Es gibt mehrere offizielle Zahlen zur Corona-Pandemie in Österreich. Diese haben unterschiedliche Aktualisierungszeitpunkte und Meldeketten, und haben alle Vor- und Nachteile. Das BMI veröffentlicht Vormittags Daten zu den positiven Testungen aus den Meldungen der Länder. Diese enthalten teilweise schon Fälle, die noch nicht vollständig in das Epidemiologische Meldesystem (EMS) des Gesundheitsministeriums eingetragen sind, sie sind also möglicherweise aktueller. Auch das Gesundheitsministerium veröffentlicht Vormittags Zahlen aus dem EMS und aus Meldungen der Länder, für die bestätigten Fälle gibt es Nachmittags ein Update.

Keine dieser Quellen bietet die Zahlen in Zeitreihen an. Diese können jedoch durch regelmäßiges Mitschreiben und Vergleiche mit den Vortagsdaten erstellt werden.

Die AGES veröffentlicht täglich zwischen 13:00 und 14:00 die Informationen, die wir verwenden. Sie bietet Zeitreihen an, jedoch können diese Zeitreihen nicht für Vortagsvergleiche verwendet werden, da sowohl bestätigte Fälle als auch Todesfälle rückdatiert werden, und zwar auf das Ereignisdatum (positives Testergebnis, Todesfall). Vergleiche zum Vortag, zur Vorwoche etc können nur durch Vergleiche mit alten Veröffentlichungen durchgeführt werden, die jedoch nicht öffentlich aufrufbar sind.

Der ORF verwendet beispielsweise die Zahlen aus der Veröffentlichung der AGES und stellt das in seiner Methodikbeschreibung ausführlich dar.

Warum kann es vorkommen, dass sich die Zahl der aktiven Fälle stärker erhöht, als die der bestätigten Fälle?

Die AGES veröffentlicht positive Fälle erst, nachdem sie in den Bezirksbehörden amtlich bestätigt wurden und der korrekte Wohn- oder Aufenthaltsbezirk einer Person eingetragen ist. Die Länder lassen Meldungen direkt aus den Labors und Krankenhäusern in ihre Definition der positiv getesteten Fälle mit einfließen – und damit auch in die Berechnung der aktiven Fälle. Deswegen kann laut Gesundheitsministerium es auch zu „Minus-Meldungen“ kommen.

Wann gilt eine Person als Genesen?

Die Anzahl der Genesenen wird von den Bundesländern gemeldet. Eine einheitliche Definition oder Vorgehensweise, ab wann jemand als Genesen gilt, ist dem Gesundheitsministerium auf Addendum-Anfrage nicht bekannt. Laut Dokumentation des Ministeriums kann teilweise ein Algorithmus zur Schätzung der Anzahl der Genesenen verwendet werden – auch das wird von durch die Länder (beziehungsweise die Bezirksgesundheitsbehörden) durchgeführt und orientiert sich an dem Vorgehen des Robert Koch-Instituts.

Für Bezirke in Vorarlberg und Wien sind die Daten bestätigter Fälle nicht vollständig. Warum?

Das Land Vorarlberg und die Stadt Wien haben in den ersten Wochen – als Addendum die Daten noch telefonisch erhoben hat – eine Veröffentlichung dieser Daten auf Nachfrage mehrfach abgelehnt.

Sind die Testungen die Testergebnisse oder die bisher durchgeführten Abstriche?

Als „Testungen“ sind die von Laboren ermittelten Testresultate zu verstehen.

Warum steht in der Karte [keine Angabe]?

Die Daten über die Entscheidungsgrundlagen und die Beschlussfassung zur Corona-Ampel werden nicht maschinenlesbar und oft nach der Ampelschaltung selbst veröffentlicht. Wenn Daten entweder noch nicht veröffentlicht wurden, oder die Art der Veröffentlichung verändert wird, greifen wir auf diese Anzeige zurück. Das kann auch passieren, wenn Spaltennamen in den veröffentlichten Excel-Tabellen verändert werden. Es kam auch schon vor, dass die Ampelschaltung am Tag nach der Erstveröffentlichung geändert wurde. Dadurch können die Dokumente mit den Entscheidungsgrundlagen der korrigierten Ampelschaltung nicht zugeordnet werden, weil das Datum nicht mehr zusammen passt. „[keine Angabe]“ kann auch vorkommen, wenn die Ampelschaltung verändert wurde, aber die Beschlussfassung dafür nicht extrahiert werden konnte.

Was ist bei der Testpositivrate zu beachten?

Die Daten zur Anzahl der Tests sind weit weniger verlässlich, als die zur Anzahl der bestätigten Fälle. Labors sind gesetzlich zur sofortigen Meldung eines positiven Tests verpflichtet, negative Tests werden freiwillig gemeldet. Manche Labors melden diese automatisiert ein, scheinbar jedoch noch nicht alle. Es kommt manchmal zu Nachmeldungen einzelner Labors, diese verringern die Testpositivrate dementsprechend. Um das abzuschwächen, sehen wir uns immer nur Testpositivraten einer ganzen Woche an.

Wir tun das auch, weil ein Test auch an einem anderen Tag der dazugehörige bestätigte Fall gemeldet werden kann, da bestätigte Fälle von der Behörde kontaktiert werden bevor sie in der Statistik gezählt werden.

Wie werden die Trend-Linien im Newsletter berechnet?

Die Trend-Linie wird aufgrund der Veränderung der letzten 25 Tage berechnet, wobei jeweils fünf Tage auf einen Wert zusammengefasst werden. Die Linie, die die fünf entstehenden Werte verbindet, wird per Spline geglättet.

Warum werden manche Grafiken im Newsletter nicht angezeigt?

Einige Email-Programme – wie Gmail – zeigen manchmal die Grafiken nicht an. Das kann vorkommen, wenn die Nachricht noch nicht fertig heruntergeladen war. Ein zweites Öffnen der Nachricht funktioniert meistens. Ansonsten freue ich mich über Hinweise.