Skip to content

Im Rahmen der Bewältigung der COVID-19-Pandemie spielt die Diagnostik hinsichtlich SARS-CoV-2/COVID-19 eine entscheidende Rolle. Die Bedeutung liegt nicht nur in der diagnostischen Abklärung, sondern hat eine herausragende Stellung auch für die Beurteilung der epidemiologischen Entwicklung und hinsichtlich Strategien zur Verlangsamung des aktuel…

License

robert-koch-institut/SARS-CoV-2-PCR-Testungen_in_Deutschland

Repository files navigation

Datensatzdokumentation

SARS-CoV-2-PCR-Testungen in Deutschland

Robert Koch-Institut Seestraße 10
13353 Berlin

Abteilung 3 | Infektionsepidemiologie
Dr. Janna Seifried (Projektleitung)

Abteilung 1 | Infektionskrankheiten
Dr. Sindy Böttcher (Datenerhebung)

Fachgebiet ZBS 3 | Biologische Toxine
Dr. Daniel Stern (Datenmanagement)

Abteilung 2 | Epidemiologie und Gesundheitsmonitoring
[Stefan Albrecht] (Datenerhebung)

Fachgebeit MF 4 | Fach- und Forschungsdatenmanagement
Hannes Wuensche (Datenkuration)


Zitieren

Robert Koch-Institut (2023): SARS-CoV-2-PCR-Testungen in Deutschland, Berlin: Zenodo. DOI: 10.5281/zenodo.8069452

Informationen zum Datensatz und Entstehungskontext

Im Rahmen der Bewältigung der COVID-19-Pandemie spielt die Diagnostik hinsichtlich SARS-CoV-2/COVID-19 eine entscheidende Rolle. Die Bedeutung liegt nicht nur in der diagnostischen Abklärung, sondern hat eine herausragende Stellung auch für die Beurteilung der epidemiologischen Entwicklung und hinsichtlich Strategien zur Verlangsamung des aktuellen Geschehens in Deutschland. Die Erfassung der durchgeführten PCR-Tests sowie die Ermittlung des Anteils der SARS-CoV-2 positiven PCR-Tests ermöglichen eine Einschätzung zur Wirksamkeit der Maßnahmen und der Umsetzung der Teststrategie. Vor diesem Hintergrund werden im Datensatz an das RKI übermittelte Daten zu PCR-Testungen, PCR-Testergebnissen und Testkapazitäten in Deutschland als offene Daten bereitgestellt.

Administrative und organisatorische Angaben

Zur Erfassung der SARS-CoV-2-Testzahlen werden deutschlandweit Daten von Universitätskliniken, Forschungseinrichtungen sowie klinischen und ambulanten Laboren wöchentlich am RKI zusammengeführt. Die zugrundeliegenden Daten werden an das Robert Koch-Institut (RKI) auf freiwilliger Basis übermittelt. Die Übermittlung erfolgt aus verschiedenen Quellen: einer Online-Umfrage des RKIs mittels der Erhebungssoftware VOXCO (RKI-Testlaborabfrage), dem Netzwerk für respiratorische Viren (RespVir), der am RKI etablierten Antibiotika-Resistenz-Surveillance (ARS) sowie über eine Umfrage eines labormedizinischen Berufsverbandes. Zusätzlich werden über die RKI-Testlaborabfrage und die Abfrage eines Laborverbunds die maximalen Testkapazitäten der Labore für die kommende Kalenderwoche (KW) erfasst.

Die Testzahlerfassung wurde durch Abteilung 3 | Infektionsepidemiologie initiiert, Janna Seifried betreut die Erhebung als Projektleitung. Neben Abteilung 3 sind Abteilung 1 | Infektionskrankheiten, Abteilung 2 | Epidemiologie und Gesundheitsmonitoring und Fachgebiet ZBS 3 | Biologische Toxine, als Verantwortliche für die verschiedenen Erfssungssysteme, beteiligt. Ergebnisse aus der Testzahlerfassung werden jeweils im Krisenstab vorgestellt und diskutiert und fließen in die Lagebewertung mit ein. Inhaltiche Fragen zur Testzahlerfssung können an das Funktionspostfach Testzahlerfassung@rki.de gerichtet werden.

Die Veröffentlichung der Daten, die Datenkuration sowie das Qualitätsmanagement der (Meta-)Daten erfolgt durch das Fachgebiet MF 4 | Fach- und Forschungsdatenmanagement. Fragen zum Datenmanagement können an das Open Data Team des Fachgebiets MF4 gerichtet werden OpenData@rki.de.

Erhebung und Aufbereitung der Daten

Gegenstand

Für eine labordiagnostische Untersuchung zur Klärung des Verdachts auf eine Infektion mit dem SARS-CoV-2 Virus wurden PCR-Nachweissysteme entwickelt und validiert. Sie gelten als „Goldstandard“ für die Diagnostik. In der Falldefinition des RKI zur Coronavirus-Krankheit-2019 ist der Nachweis durch PCR-Testung (Nukleinsäurenachweis) einer der drei relvanten labordiagnostischen Nachweisverfahen. Nähere Angaben sind auch über die Webseite der WHO zu Coronaviren bzw. der Foundation for Innovative New Diagnostics verfügbar. Es steht eine Reihe von kommerziellen Testsystemen mit hoher Spezifität und unterschiedlicher Bearbeitungsdauer zur Verfügung.

Weiter Informationen zur PCR-Testung und Qualitätssicherung könne der Website des RKI entnommen werden:

https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Vorl_Testung_nCoV.html

Datenerhebung

VOXCO (RKI-Testlaborabfrage)

Die Datenerhebung zu SARS-CoV-2-PCR-Testungen erfolgt über die Online-Erhebungssoftware VOXCO des RKI. Bei Voxco handelt es sich um eine Software, über die Fragebögen programmiert und online bereitgestellt werden können. Erhobene Daten wer auf Servern des RKI gespeichert. Die Software ist sowohl von den Datenschutzbeauftragten, Informationssicherheitsbeauftragten als auch dem Bundesamt für Sicherheit in der Informationstechnik (https://www.bsi.bund.de/) geprüft und abgenommen.

Der Prozess der Testzahlerfassung erfolgte zweistufig:

  • Im ersten Schritt werden meldende Einrichtungen gebeten, sich mit Angabe der Einrichtung und einer Kontakt-E-Mail-Adresse zu registrieren
    • Unter anderem auf Basis der Liste der Einrichtungen, welche sich in VOXCO registriert hatten, wurde eine Liste der teilnehmenden Labore erstellt und IDs vergeben
  • Im zweiten Schritt wird um Angabe der aktuellen Daten gebeten
    • die registrierten Einrichtungen werden dazu, über die von ihnen angegebene E-Mail-Adresse, wöchentlich kontaktiert
    • Zu Beginn der Abfrage wird der Berichtszeitrum erfragt (nach Jahr und Kalenderwoche)

Neben teilweisen Zusatzabfragen (z.B. nach Auslastung, Kapazitätsgrenzen, Variantenabfragen...), wird standardmäßig jedes Labor nach der Anzahl der durchgeführten PCR-Testungen, sowie deren Positivenanteile abgefragt. Der Berichtszeitraum ist bei jeder Abfrage frei wählbar, sodass auch Nachmeldungen/Korrekturen und rückwirkende Meldungen möglich sind. Können Labore eine Abfrage nicht beantworten, so können die entsprechenden Eingabefelder leer gelassen werden.

VOXCO Eingabemaske

Das Netzwerk Respiratorische Viren wurde 2009 auf Initiative der Abteilung "Klinische Virologie" der Gesellschaft für Virologie (GFV) hin gegründet zielt darauf ab, interessierte Ärzte und Wissenschaftler über geographische und organisatorische Grenzen hinweg über die jeweils aktuelle epidemische Ausbreitung von Infektionskrankheiten und deren Krankheitserregern zu informieren. Im Rahmen der Pandemie wurde eine Erweiterung auf SARS-CoV-2-Nachweise etabliert. Die erhobenen Daten (Anzahl der positiven und negativen SARS-CoV-2-Teste) werden dem RKI für die Testzahlerfassung bereitgestellt.

ARS

Die Antibiotika-Resistenz-Surveillance (ARS) ist nach § 13 Abs. 4 IfSG als laborgestütztes und am RKI angesiedeltes Surveillance-System zur kontinuierlichen Erhebung von Daten der mikrobiologischen Routine für das gesamte Spektrum klinisch relevanter Erreger (einschließlich Viren) und ihrer Resistenzen konzipiert. Teilnehmer bei ARS sind Labore, die Proben aus medizinischen Versorgungseinrichtungen und Arztpraxen mikrobiologisch untersuchen und auf freiwilliger Basis ihre Daten an das RKI übermitteln.

Im Rahmen der Pandemie wurde die Laborbasierte Surveillance SARS-CoV-2 mit regelmäßigen zeitnahen Berichten als eine Erweiterung von ARS etabliert. Weitere Informationen und Berichte zur Laborbasierten Surveillance SARS-CoV-2 sind unter (https://ars.rki.de/Content/COVID19/Main.aspx) zu finden. Die aggregierten Angaben zu Testzahlen und Positivtestungen pro Kalenderwoche für die Teilmenge der an der Laborbasierten Surveillance SARS-CoV-2 teilnehmenden Labore fließen nach Ausschluss von Doppelübermittlungen in den beschriebenen Datensatz ein.

Umfrage des labormedizinischen Berufsverbandes

Der labormedizinische Berufsverband erfasst wöchentlich die Anzahl an durchgeführten PCR-Tests sowie die Anzahl positiver Tests auf Einzellaborebene. Zur Ermittlung der Auslastung der Testkapazitäten werden zusätzlich Angaben zur Testkapazität je Tag sowie zur Anzahl der Tagen in der Woche abgefragt, an welchen PCR-Testungen erfolgen. Die Angaben zur Testkapazität erfolgen jeweils prospektiv für die folgende Kalenderwoche. Die erhobenen Daten werden dem RKI für die Testzahlerfassung bereitgestellt.

Aufbereitung und Zusammenführung

Daten aus den oben bereits genannten vier verschiedenen Datenquellen (VOXCO, RespVir, ARS, Umfrage eines labormedizinischen Berufsverbandes) werden in Form von Exceltabellen mit Hilfe eines automatisierten R Skriptes importiert und weiter prozessiert. Daten aus den Quellen RespVir und ARS liegen in aggregierter Form vor unter Angabe der Anzahl der meldenden Labore, der Anzahl der durchgeführten PCR-Tests, sowie der Anzahl der positiven PCR-Tests. Daten aus den Quellen Voxco und dem labormedizinischen Berufsveraband liegen auf Laborebene vor unter Angabe der Anzahl der durchgeführte PCR-Tests, der Anzahl der positiven PCR-Tests, der Anzahl der Wochentagen, an denen Tests durchgeführt werden, der Testkapazität je Tag, sowie der Reichweite in Tagen, sollte es zu Lieferengpässen kommen. Zusätzlich wurden Daten zu Probenrückstau in Zeiten akuter Überlastung der Labore erhoben (wurde ab KW 22 2021 eingestellt). Seit KW 16 2022 erfolgt die Übermittlung und Auswertung der Daten im zweiwöchentlichen Rhythmus.

Da Labore ihr PCR-Testzahlen potenziell in mehreren der genannte Datenquellen übermitteln erfolgt der Abgleich der meldenden Labore mit Hilfe einer einzigartigen Labor-ID, die vom RKI an die übermittelnden Labore vergeben wird. Labore, deren Daten in aggregierter Form über ARS oder RespVir in die Testzahlerfassung eingeben werden von der Erfassung über VOXCO und des labormedizinischen Berufsverbandes ausgeschlossen. Übermittlungen über Voxco und den labormedizinischen Berufsverband werden anhand der Labor-ID zusammengeführt. Bei doppelten Meldung je Kalenderwoche, die z.B. durch Korrekturen bei der Eingabe in VOXCO entstehen können, werden die Meldungen, die den vollständigeren Datensatz enthalten (weniger NA pro Meldung) behalten. Wenn ein Labor über den labormedizinischen Berufsverband und VOXCO übermittelt werden die Daten der Meldung über den labormedizinischen Berufsverband in Betracht gezogen. Meldung mit unplausibel hohen PCR-Positivanteilen (≥ 95%) werden aus der Analyse ausgeschlossen. Die Daten werden nach Kalenderwoche aggregiert ausgegeben.

Interpretionshinweise

Bei der Interpretation sind folgende Punkte zu beachten:

  • Die Übermittlung der Daten erfolgt auf freiwilliger Basis, daher liegt keine Vollerfassung vor.
  • Es können Nachmeldungen bzw. Korrekturen erfolgen, was zu veränderten Angaben in den Vorwochen führen kann.
  • Die Zahl der übermittelten PCR-Tests und der positiven Tests ist nicht mit den gemeldeten Fallzahlen gleichsetzbar, da Mehrfachtestungen einer Person erfolgen können.
  • Die Inanspruchnahme der PCR-Testung ist im zeitlichen Verlauf von der jeweils gültigen Teststrategie/Testverordnung abhängig, daher keine direkte Vergleichbarkeit zwischen den Phasen der Pandemie möglich.

Aufbau und Inhalt des Datensatzes

Der Datensatz enthält Daten zu den SARS-CoV-2-PCR-Testungen meldender Labore in Deutschland. Im Datensatz enthalten sind:

  • Anzahl und Positivanteil der PCR-Testungen auf SARS-CoV-2
  • PCR-Testkapazitäten meldender Labore
  • Lizenzdatei mit der Nutzungslizenz des Datensatzes in Deutsch und Englisch
  • Datensatzdokumentation in deutscher Sprache
  • Metadaten zur automatisierten Weiterverarbeitung

Daten zu SARS-CoV-2-PCR-Testungen in Deutschland

Die Daten bilden einen wöchenlichen Stand (Sonntag, 24:00 Uhr) ab. Die Daten werden alle zwei Wochen neu erzeugt, dieser Datenstand ersetzt die vorherigen Daten.

SARS-CoV-2-PCR-Testungen_in_Deutschland.csv SARS-CoV-2-PCR-Testungen_in_Deutschland.xlsx

Variablen und Variablenausprägungen

Die SARS-CoV-2-PCR-Testungen auf Bundesebene enthalten die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen:

Variable Typ Ausprägungen Beschreibung
date Datum JJJJ-Www Berichtswoche im ISO-8601 Format
tests_total Natürliche Zahl ≥0 Gesamtzahl der in der zurückliegende Woche gemeldeten SARS-SARS-CoV-2-PCR-Testungen
tests_total_accumulated Natürliche Zahl ≥0 Gesamtzahl der seit Erhebungsbeginn gemeldeten SARS-CoV-2-PCR-Testungen
tests_positive Natürliche Zahl ≥0 Anzahl der in der zurückliegende Woche gemeldeten SARS-CoV-2-positiven PCR-Testungen
tests_positive_accumulated Natürliche Zahl ≥0 Anzahl der seit Erhebungsbeginn gemeldeten SARS-CoV-2-positiven PCR-Testungen
tests_positive_ratio Rationale Zahl ≥0.0000 Anteil der in der zurückliegende Woche gemeldeten SARS-CoV-2-positiven PCR-Testungen an allen der in der zurückliegende Woche gemeldeten SARS-CoV-2-PCR-Testungen
laboratories_tests Natürliche Zahl ≥0 Anzahl der Labore die Angeben zur Anzahl ihrer SARS-CoV-2-PCR-Testungen übermittelt haben
capacities_daily Natürliche Zahl ≥0 Summe der täglichen PCR-Testkapazitäten aller meldenden Labore
capacities_weekly_theoretically Natürliche Zahl ≥0 Summe der theoretischen wöchentlichen PCR-Testkapazitäten aller meldenden Labore. Angabe prospektiv für die der Berichtswoche folgenden Woche.
capacities_weeklyweek_actually Natürliche Zahl ≥0 Summe der tatsächlichen wöchentlichen PCR-Testkapazitäten aller meldenden Labore. Angabe prospektiv für die der Berichtswoche folgenden Woche.
laboratories_capacities Natürliche Zahl ≥0 Anzahl der Labore die Angeben zur PCR-Testkapazitäten übermittelt haben. Angabe prospektiv für die der Berichtswoche folgenden Woche.
laboratories_samplebacklog Natürliche Zahl ≥0 Anzahl der Labore die Angeben zur Anzahl an SARS-CoV-2-PCR-Probenrückstau übermittelt haben
samplebacklog Natürliche Zahl ≥0 und NA Anzahl an Proben die in der zurückliegende Woche als im SARS-CoV-2-PCR-Probenrückstau gemeldet wurden

Formatierung

Die Daten sind im Datensatz als kommaseparierte .csv und .xlsx Datei enthalten. Der verwendete Zeichensatz der .csv Datei ist UTF-8. Trennzeichen der einzelnen Werte ist ein Komma ",".

  • Zeichensatz: UTF-8
  • .csv Trennzeichen: Komma ","

Metadaten

Zur Erhöhung der Auffindbarkeit, sind die bereitgestellten Daten mit Metadaten beschrieben. Über GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Für jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadaten-Ordner hinterlegt:

Metadaten/

Versionierung und DOI-Vergabe erfolgt über Zenodo.org. Die für den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/#representation nachlesbar.

Metadaten/zenodo.json

Hinweise zur Nachnutzung der Daten

Offene Forschungsdaten des RKI werden auf GitHub.com, Zenodo.org und Edoc.rki.de bereitgestellt:

Lizenz

Der Datensatz "SARS-CoV-2-PCR-Testungen in Deutschland" ist lizenziert unter der Creative Commons Namensnennung 4.0 International Public License | CC-BY 4.0 International.

Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung des Robert Koch-Instituts als Quelle, frei verfügbar. Das bedeutet, jede Person hat das Recht die Daten zu verarbeiten und zu verändern, Derivate des Datensatzes zu erstellen und sie für kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der LICENSE bzw. LIZENZ Datei des Datensatzes.

About

Im Rahmen der Bewältigung der COVID-19-Pandemie spielt die Diagnostik hinsichtlich SARS-CoV-2/COVID-19 eine entscheidende Rolle. Die Bedeutung liegt nicht nur in der diagnostischen Abklärung, sondern hat eine herausragende Stellung auch für die Beurteilung der epidemiologischen Entwicklung und hinsichtlich Strategien zur Verlangsamung des aktuel…

Topics

Resources

License

Stars

Watchers

Forks