Datensatzdokumentation
Robert Koch-Institut | RKI
Nordufer 20
13353 Berlin
Beitragende
Alexander Ullrich¹ (Datenmanagement), Michaela Diercke¹ (Projektleitung) und Hannes Wuensche² (Datenkuration)
¹ Robert Koch-Institut | Fachgebiet 32
² Robert Koch-Institut | Fachgebiet MF 4
Zitieren
Robert Koch-Institut (2024): 7-Tage-Inzidenz der COVID-19-Fälle in Deutschland, Berlin: Zenodo. DOI: 10.5281/zenodo.14378281
Im Datensatz "7-Tage-Inzidenz der COVID-19-Fälle in Deutschland" werden die aktuellen 7-Tage-Inzidenzen der nach den Vorgaben des Infektionsschutzgesetzes - IfSG - an das RKI übermittelten COVID-19-Fälle veröffentlicht.
Das Fachgebiet 32 | Surveillance und elektronisches Melde- und Informationssystem (DEMIS) | ÖGD Kontaktstelle ist verantwortlich für die fachlichen Anforderungen, Standardisierung und konzeptionelle Weiterentwicklung des Meldesystems gemäß IfSG.
Zuständig für den Betrieb des Meldesystems und die Verarbeitung und Aufbereitung der im Meldesystem vorliegenden Rohdaten ist das Fachgebiet IT4 | Softwarearchitektur und -entwicklung des RKI.
Die Veröffentlichung der Daten, die Datenkuration sowie das Qualitätsmanagement der (Meta-)Daten erfolgt durch das Fachgebiet MF 4 | Fach- und Forschungsdatenmanagement. Fragen zum Datenmanagement können an das Open Data Team des Fachgebiets MF4 gerichtet werden OpenData@rki.de.
Das Robert Koch-Institut ist ein Bundesinstitut im Geschäftsbereich des Bundesministeriums für Gesundheit (BMG) und ist die zentrale Einrichtung des Bundes auf dem Gebiet der Krankheitsüberwachung und -prävention sowie der anwendungsorientierten biomedizinischen Forschung. Es berät die zuständigen Bundesministerien, insbesondere das Bundesministerium für Gesundheit, und wirkt bei der Entwicklung von Normen und Standards mit. Wesentliche Aufgaben des RKI leiten sich aus dem Infektionsschutzgesetz ab. Dazu gehört neben der in §4 Abs. 1 IfSG beschriebenen Aufgabe der „Vorbeugung übertragbarer Krankheiten sowie zur frühzeitigen Erkennung und Verhinderung der Weiterverbreitung von Infektionen“ auch die Erstellung von "Falldefinitionen für die Bewertung von Verdachts-, Erkrankungs- oder Todesfällen und Nachweisen von Krankheitserregern" (vgl. §11 Abs. 2 IfSG).
Das Infektionsschutzgesetz hat den Zweck, die Übertragung von Krankheiten beim Menschen vorzubeugen und Infektionen frühzeitig zu erkennen sowie die Verbreitung dieser zu verhindern. Es regelt, welche Krankheiten bei Verdacht, Erkrankung oder Tod meldepflichtig sind. Zusätzlich wird neben der Art der zu meldenden Krankheit auch festgelegt, welche Personen zur Meldung verpflichtet sind, welche Inhalte die Meldung enthalten muss, an wen die Meldung erfolgen muss und welche Fristen eingehalten werden müssen.
Dem Gesundheitsamt wird gemäß § 6 Abs. 1 Satz 1 Nr. 1 Buchst. t IfSG der Krankheitsverdacht, die Erkrankung, die Hospitalisierung sowie der Tod in Bezug auf eine Coronavirus-Krankheit-2019 (COVID-19) sowie gemäß § 7 Abs. 1 Nr. 44a IfSG der direkte oder indirekte Nachweis von Severe-Acute-Respiratory-Syndrome-Coronavirus-2 (SARS-CoV-2), soweit er auf eine akute Infektion hinweist, namentlich gemeldet.
Die Meldung muss unverzüglich erfolgen und dem zuständigen Gesundheitsamt spätestens 24 Stunden, nachdem der Meldende Kenntnis erlangt hat, vorliegen. Die Meldungen erfolgen zunehmend elektronisch (siehe Deutsches Elektronisches Melde- und Informationssystem für den Infektionsschutz, DEMIS.
COVID-19-Fälle, die die Falldefinition des RKI erfüllen, müssen vom zuständigen Gesundheitsamt spätestens am nächsten Arbeitstag an die zuständige Landesbehörde und von dort spätestens am nächsten Arbeitstag an das RKI übermittelt werden. Die Daten werden für die Übermittlung pseudonymisiert. Der Übermittlungsweg ist durchgehend elektronisch.
Datengrundlage zur Berechnung der 7-Tage-Inzidenzen sind die an das RKI übermittelten COVID-19-Fälle. Detaillierte Dokumentation zur Erhebung der Daten zum Infektionsgeschehen ist im Datensatz "SARS-CoV-2-Infektionen in Deutschland" hinterlegt.
Robert Koch-Institut (2022): SARS-CoV-2 Infektionen in Deutschland, Berlin: Zenodo. 10.5281/zenodo.4681153
https://github.com/robert-koch-institut/SARS-CoV-2-Infektionen_in_Deutschland_Archiv
Die für die Berechnung notwendigen Bevölkerungsdaten bezieht das RKI durch das Statistisches Bundesamt (Destatis), Referat F24 | Bevölkerungsfortschreibung, Ausländer- und Integrationsstatistiken. Detaillierte Informationen und Ergebnisse des Statistischen Bundesamtes bietet der Themenbereiche „Bevölkerungstand“ und die Datenbank GENESIS-Online, sowie die Regionaldatenbank Deutschland des Bundes und der Länder. Die Daten zur Bevölkerung lassen sich in sich durch den Filtercode "12411" aufrufen.
Die 7-Tage-Inzidenzen berechnen sich aus der Summe der COVID-19-Fälle mit Meldedatum innerhalb der letzten sieben Tage, bezogen auf 100.000 Einwohner:innen.
7-Tage-Inzidenz = COVID-19-Fälle der letzten 7 Tage / Anzahl der Einwohner:innen * 100000
Durch den zeitlichen Verzug zwischen der Meldung und der Übermittlung an das RKI kommt es zu einer Unterschätzung der aktuellen Inzidenzen. Zur Abschätzung der tatsächlichen Fallzahlen stellt das RKI ein Nowcasting bereit.
an der Heiden, Matthias (2022): SARS-CoV-2-Nowcasting und -R-Schaetzung, Berlin: Zenodo. DOI:10.5281/zenodo.4680400
Die 7-Tage-Inzidenzen können für verschiedene Bezugsgruppen berechnet werden. In der epidemiologischen Statistik wird eine Bezugsgruppe als Population bezeichnet. Eine Bezugspuppe bzw. Population kann beispielsweise nur Personen, 80 Jahre und älter in einem Kreis enthalten. Bei der Berechnung der 7-Tage-Inzidenz für eine Bezugsgruppe werden nur die COVID-19-Fälle dieser Gruppe und die Anzahl der Einwohner:innen dieser Bezugsgruppe für die Berechnung herangezogen. Wird die Population nur räumlich differenziert (Deutschland, Bundesländer, Landkreise), ist die 7-Tage-Inzidenz als statistische Größe, die die durchschnittliche Anzahl an Neuerkrankungen bezogen auf 100.000 Einwohner:innen angibt, zu interpretieren.
Der Datensatz enthält Daten zur Anzahl von COVID-19-Fällen und zur 7-Tage-Inzidenz. Im Datensatz enthalten sind:
- 7-Tage-Inzidenz von COVID-19 auf Bundes-, Bundesland- und Landkreisebene
- Lizenzdatei mit der Nutzungslizenz des Datensatzes in Deutsch und Englisch
- Datensatzdokumentation in deutscher Sprache
- Metadaten zur automatisierten Weiterverarbeitung
Die Daten zur 7-Tage-Inzidenz von COVID-19 sind nach folgenden Merkmalen differenziert (in den Klammern finden sich die Variablen dieser Merkmale):
- Meldedatum des COVID-19-Falls (Meldedatum)
- Differenzierung der Bezugsgruppe (Altersgruppe)
- Größe der Bezugsgruppe (Bevoelkerung)
- COVID-19-Fallzahlen (Faelle_gesamt, Faelle_neu, Faelle_7-Tage)
- COVID-19-Fälle der letzten 7 Tagen je 100.000 Einwohner:innen (Inzidenz_7-Tage)
Die Daten bilden einen tagesaktuellen Stand (00:00 Uhr) aller über das Meldesystem gemäß Infektionsschutzgesetz an das RKI übermittelten COVID-19-Fälle ab. Das bedeutet, dass alle bis 00:00 Uhr von den Gesundheitsämtern über die zuständigen Landesbehörden an das RKI übermittelten COVID-19-Fälle im Datenstand enthalten sind. Die Daten werden täglich vollständig neu erzeugt, dieser Datenstand ersetzt den Datenstand des Vortages.
Die Datei COVID-19-Faelle_7-Tage-Inzidenz_Deutschland.csv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschema_COVID-19-Faelle_7-Tage-Inzidenz_Deutschland.json hinterlegt:
tableschema_COVID-19-Faelle_7-Tage-Inzidenz_Deutschland.json
Variable | Typ | Ausprägungen | Beschreibung |
---|---|---|---|
Meldedatum | date | Format: YYYY-MM-DD |
Datum, an dem das lokale Gesundheitsamt Kenntnis über den Fall erlangt und ihn elektronisch erfasst hat |
Altersgruppe | string | Werte: 00-04 , 05-14 , 15-34 , 35-59 , 60-79 , 80+ , 00+ |
Altersgruppe der übermittelten COVID-19-Fälle |
Bevoelkerung | integer | Werte: ≥0 |
Anzahl der Einwohner:innen in der Bezugsgruppe, Daten der Bevölkerungsstatistik des Statistischen Bundesamtes mit Datenstand 31.12.2022 |
Faelle_gesamt | integer | Werte: ≥0 |
COVID-19-Fälle seit Beginn der Datenerhebung |
Faelle_neu | integer | Werte: ≥0 |
Anzahl Fälle, die erstmals in der Berichterstattung des RKI veröffentlicht werden |
Faelle_7-Tage | integer | Werte: ≥0 |
Anzahl COVID-19-Fälle mit Meldedatum innerhalb der letzten sieben Tage |
Inzidenz_7-Tage | number | Werte: ≥0 |
COVID-19-Fälle mit Meldedatum innerhalb der letzten sieben Tage je 100.000 Einwohner:innen |
Die Daten zur 7-Tage-Inzidenz auf Bundeslandebene sind nach folgenden Merkmalen differenziert (in den Klammern finden sich die Variablen dieser Merkmale):
- Meldedatum des COVID-19-Falls (Meldedatum)
- Differenzierung der Bezugsgruppe (Altersgruppe, Bundesland_id)
- Größe der Bezugsgruppe (Bevoelkerung)
- COVID-19-Fallzahlen (Faelle_gesamt, Faelle_neu, Faelle_7-Tage)
- COVID-19-Fälle der letzten 7 Tagen je 100.000 Einwohner:innen (Inzidenz_7-Tage)
Die Daten bilden einen tagesaktuellen Stand (00:00 Uhr) aller über das Meldesystem gemäß Infektionsschutzgesetz an das RKI übermittelten COVID-19-Fälle ab. Das bedeutet, dass alle bis 00:00 Uhr von den Gesundheitsämtern über die zuständigen Landesbehörden an das RKI übermittelten COVID-19-Fälle im Datenstand enthalten sind. Die Daten werden täglich vollständig neu erzeugt, dieser Datenstand ersetzt den Datenstand des Vortages.
Die Datei COVID-19-Faelle_7-Tage-Inzidenz_Bundeslaender.csv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschema_COVID-19-Faelle_7-Tage-Inzidenz_Bundeslaender.json hinterlegt:
tableschema_COVID-19-Faelle_7-Tage-Inzidenz_Bundeslaender.json
Variable | Typ | Ausprägungen | Beschreibung |
---|---|---|---|
Meldedatum | date | Format: YYYY-MM-DD |
Datum, an dem das lokale Gesundheitsamt Kenntnis über den Fall erlangt und ihn elektronisch erfasst hat |
Bundesland_id | string | ID des Bundeslands, aus dem die COVID-19-Fälle übermittelt wurden, auf Basis des amtlichen Gemeindeschlüssels | |
Altersgruppe | string | Werte: 00-04 , 05-14 , 15-34 , 35-59 , 60-79 , 80+ , 00+ |
Altersgruppe der gemeldeten Fälle |
Bevoelkerung | integer | Werte: ≥0 |
Anzahl der Einwohner:innen in der Bezugsgruppe, Daten der Bevölkerungsstatistik des Statistischen Bundesamtes mit Datenstand 31.12.2022 |
Faelle_gesamt | integer | Werte: ≥0 |
COVID-19-Fälle seit Beginn der Datenerhebung |
Faelle_neu | integer | Werte: ≥0 |
Anzahl Fälle, die erstmals in der Berichterstattung des RKI veröffentlicht werden |
Faelle_7-Tage | integer | Werte: ≥0 |
Anzahl COVID-19-Fälle mit Meldedatum innerhalb der letzten sieben Tage |
Inzidenz_7-Tage | number | Werte: ≥0 |
COVID-19-Fälle mit Meldedatum innerhalb der letzten sieben Tage je 100.000 Einwohner:innen |
Die Daten zur 7-Tage-Inzidenz von COVID-19 auf Landkreisebene sind nach folgenden Merkmalen differenziert (in den Klammern finden sich die Variablen dieser Merkmale):
- Meldedatum des COVID-19-Falls (Meldedatum)
- Differenzierung der Bezugsgruppe (Landkreis_id)
- Größe der Bezugsgruppe (Bevoelkerung)
- COVID-19-Fallzahlen (Faelle_gesamt, Faelle_neu, Faelle_7-Tage)
- COVID-19-Fälle der letzten 7 Tagen je 100.000 Einwohner:innen (Inzidenz_7-Tage)
Die Daten bilden einen tagesaktuellen Stand (00:00 Uhr) aller über das Meldesystem gemäß Infektionsschutzgesetz an das RKI übermittelten COVID-19-Fälle ab. Das bedeutet, dass alle bis 00:00 Uhr von den Gesundheitsämtern über die zuständigen Landesbehörden an das RKI übermittelten COVID-19-Fälle im Datenstand enthalten sind. Die Daten werden täglich vollständig neu erzeugt, dieser Datenstand ersetzt den Datenstand des Vortages.
Die Datei COVID-19-Faelle_7-Tage-Inzidenz_Landkreise.csv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschema_COVID-19-Faelle_7-Tage-Inzidenz_Landkreise.json hinterlegt:
Variable | Typ | Ausprägungen | Beschreibung |
---|---|---|---|
Meldedatum | date | Format: YYYY-MM-DD |
Datum, an dem das lokale Gesundheitsamt Kenntnis über den Fall erlangt und ihn elektronisch erfasst hat |
Landkreis_id | string | Werte: 01001 , 01002 , 01003 , 01004 , 01051 , 01053 , 01054 , … |
ID des Landkreises, aus dem die COVID-19-Fälle übermittelt wurden, auf Basis des amtlichen Gemeindeschlüssels |
Bevoelkerung | integer | Werte: ≥0 |
Anzahl der Einwohner:innen in der Bezugsgruppe, Daten der Bevölkerungsstatistik des Statistischen Bundesamtes mit Datenstand 31.12.2022 |
Faelle_gesamt | integer | Werte: ≥0 |
COVID-19-Fälle seit Beginn der Datenerhebung |
Faelle_neu | integer | Werte: ≥0 |
Anzahl Fälle, die erstmals in der Berichterstattung des RKI veröffentlicht werden |
Faelle_7-Tage | integer | Werte: ≥0 |
Anzahl COVID-19-Fälle mit Meldedatum innerhalb der letzten sieben Tage |
Inzidenz_7-Tage | number | Werte: ≥0 |
COVID-19-Fälle mit Meldedatum innerhalb der letzten sieben Tage je 100.000 Einwohner:innen |
Die Daten sind im Datensatz als kommaseparierte .csv Datei enthalten. Der verwendete Zeichensatz der .csv Datei ist UTF-8. Trennzeichen der einzelnen Werte ist ein Komma ",".
- Zeichensatz: UTF-8
- .csv Trennzeichen: Komma ","
Zur Erhöhung der Auffindbarkeit sind die bereitgestellten Daten mit Metadaten beschrieben. Über GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Für jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadatenordner hinterlegt:
Versionierung und DOI-Vergabe erfolgt über Zenodo.org. Die für den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/#representation nachlesbar.
In der zenodo.json ist neben der Publikationsdatum ("publication_date"
) auch der Datenstand in folgendem Format enthalten (Beispiel):
"dates": [
{
"start": "2023-09-11T15:00:21+02:00",
"end": "2023-09-11T15:00:21+02:00",
"type": "Created",
"description": "Date when the published data was created"
}
],
Offene Forschungsdaten des RKI werden auf Zenodo.org, GitHub.com, OpenCoDE und Edoc.rki.de bereitgestellt:
- https://zenodo.org/communities/robertkochinstitut
- https://github.com/robert-koch-institut
- https://gitlab.opencode.de/robert-koch-institut
- https://edoc.rki.de/
Der Datensatz "Inanspruchnahme von Routineimpfungen in Deutschland – Ergebnisse aus der KV-Impfsurveillance" ist lizenziert unter der Creative Commons Namensnennung 4.0 International Public License | CC-BY 4.0 International.
Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung des Robert Koch-Instituts als Quelle, frei verfügbar. Das bedeutet, jede Person hat das Recht die Daten zu verarbeiten und zu verändern, Derivate des Datensatzes zu erstellen und sie für kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der LICENSE bzw. LIZENZ Datei des Datensatzes.