Skip to content
puzzle72 edited this page Oct 1, 2021 · 121 revisions

Escovid19data: Capturando colaborativamente datos de COVID-19 por provincias en España

Otras páginas de la wiki:

Especificaciones y aclaraciones sobre la base de datos por provincias Escovid19data

Hospitalizados

Actualmente Tenemos los datos de prevalencia de todas las CCAA de las últimas semanas. No todas las series están completas. En algunos casos para las fechas anteriores a mayo hay en la variable 'hospitalized' datos de hospitalizados acumulados.

Pasado La variable hospitalized mezcla valores acumulados y diarios. Esto es así porque la fuente de las comunidades autónomas uniproviniciales, y alguna otra comunidad, fue en su momento la del ISCIII que mezclaba ambos valores. En el caso de Madrid y Galicia, por ejemplo ha pasado de ser datos acumulados, a ser datos del día, a volver a ser datos acumulados.

A la vista de este gráfico que explora los datos de la variable hospitalized se aprecia que los datos son:

  • Acumulados para: Aragón, Andalucía, Asturias, Baleares, Cantabria, Ceuta?, Melilla?, Murcia, Navarra, La Rioja.
  • De prevalencia para : Castilla-La Mancha, Castilla y León, C. Valenciana, Extremadura, País Vasco.
  • Mezcla acumulados-prevalencia para: Madrid.
  • Sin datos: Canarias. Cataluña. Galicia.

Por Comunidades autónomas

Andalucía

Actualmente: Se utiliza la serie histórica de casos acumulados que publica la Junta de Andalucía. La volcamos manualmente en nuestra hoja de cálculo en la pestaña "AND" y descargamos directamente desde ahí.

2020.08 Para los hospitalizados @congosto ha desarrollado un script de Python para conseguir los hospitalizados y de cuidados intensivos a partir de los datos originales que publica la junta de Andalucía. Están disponibles en https://github.com/montera34/escovid19data/raw/master/data/original/andalucia-hospitalizados.csv

Pasado: Para los primeros días se usaron los datos que ofrecía RTVE en la visualización hecha con Flourish. Más tarde se usaron las notas de prensa de la Junta de Andalucía (ver ejemplo del 13.03.2020).

Fuente de datos (2020.04.28): Junta de Andalucía 100%.

2020.05.07. Informa @congosto: En la web de estadística de la Junta de Andalucía (https://www.juntadeandalucia.es/institutodeestadisticaycartografia/badea/informe/anual?CodOper=b3_2314&idNode=42348) se ha cambiado el formato. Hay tres cambios:

  1. Los confirmados pasan a ser confirmados PCR.
  2. Se añade una columna de confirmados totales y confirmados < 14 días.
  3. Por eso han interrumpido la serie temporal y han escondido el enlace.

2020.07.24. Hasta el 27 de julio de 2020 se actualizaba manualmente la pestaña Andalucía de la hoja de cálculo común.

Pasó a usarse este CSV (https://www.juntadeandalucia.es/institutodeestadisticaycartografia/badea/stpivot/stpivot/Print?cube=e31f8668-049c-4c17-a879-e097e9b3dfc8&type=3&foto=si&ejecutaDesde=&codConsulta=38228&consTipoVisua=JP) que alguardamos en (data/original/spain/andalucia/andalucia-instituto-estadistica-cartografia.csv) queda da casos los casos acumulados por PCR, hospitalizados (acumulados), fallecidos y curados.

Aragón

Actualmente:

Se utiliza un script que toma los datos de dos fuentes:

Hasta diciembre de 2020

Casos PCR+: Para los casos se utilizan los datos del portal de transparencia del Gobierno de Aragón, https://transparencia.aragon.es/COVID19. Los datos se vuelcan en la pestaña ARA de la hoja de cálculo.

Acumulados de hospitalizados, en UCI, PCR+, fallecidos y altas epidemiológicas: se utilizan los resumenes diarios de situación COVID-19 para profesionales. Solo se cuelgan los días laborables en https://www.aragon.es/-/procedimiento-de-actuacion-frente-a-casos-de-infeccion-por-el-nuevo-coronavirus-en-aragon

Hospitalizados prevalentes: Se usa la hoja de cálculo de datos de prevalencia por hospitales en Aragón https://www.aragon.es/documents/20127/38742837/casos_coronavirus_hospitales.xlsx.

Pasado:

Los datos se volcaban en la pestaña común "provincias" de la hoja de cálculo. hasta el 24 de agosto de 2020.

Casos PCR+ Para los casos se utilizaban las notas de prensa publicadas en Aragonhoy.net (Gobierno de Aragón): ejemplo de nota de prensa de 28.04.2020. Lo datos se vuelcan en la pestaña "ARA" de la hoja de cálculo.

Para los primeros días se usaron los datos que ofrecía RTVE en la visualización hecha con Flourish y algunos periódicos.

Fuente de datos (2020.04.28): Gobierno de Aragón 66%, RTVE 21%, G. de Aragón y RTVE 8%, Prensa 5%.

Asturias

Actualmente

Se descargan los datos diariamente del Panel de indicadores de Covid-19 en Asturias, según los datos de la Consejería de Salud del Principado de Asturias, que ofrece un fichero de datos abiertos, con datos actualizados e históricos, y una URL fija, https://dgspasturias.shinyapps.io/panel_de_indicadores_asturias/_w_0ecb484e/DATOS/TABLAS_RESUMEN/asturias_resumen.csv. Se emplea un script para extraer los datos de casos, hospitalizados, UCI y fallecidos.

Hasta noviembre de 2020

Los datos son publicados a diario a través de la cuenta de Twitter del Gobierno de Asturias, https://twitter.com/GobAsturias, en forma de imagen. Se publican cada día, pero indicando claramente que son datos recogidos el día anterior.

Además, aparecen en la página https://coronavirus.asturias.es/inicio . Aquí, se muestran los mismos datos, pero NO se indica que son del día anterior sino que solo se indica la fecha de publicación. Se están a la tabla con fecha del día anterior.

Por lo tanto, los datos se introducen manualmente en la pestaña "AST" del documento en Google Drive.

Por último, existe una página que recopila datos históricos, muestra gráficos y permite descargarse un CSV histórico, en https://app.transparenciaendatos.es/v/#!/5eb4344e16b9fc465933d217 . Sin embargo, no utilizamos esta opción porque:

  1. No permite descargar ese CSV automáticamente: solo haciendo clic en un botón correspondiente, por lo que resulta difícil de automatizar.
  2. En el histórico, no se incluyen datos que sí se muestran en las otras fuentes: casos activos, fallecidos y recuperados.

Baleares

Existe un directorio de notas de prensa (ordenadas por novedad, las más recientes primero) en http://www.caib.es/pidip2front/jsp/es/ficha_emergencia/informaciones-covid-19

Actualmente: desde el 2020-09-12

El 12 de septiembre cambiaron el formato de las notas de prensa, con ejemplos como http://www.caib.es/pidip2front/jsp/adjunto?codi=2489030&idioma=es, en formato PDF (y también, mediante gráficos).

Se siguen recogiendo manualmente en la pestaña "BAL"

En este nuevo formato, dejaron de dar el número de casos activos, para ofrecer en su lugar el número de "personas atendidas por el Servicio de Salud". Este dato era también ofrecido en las notas anteriores, pero no se incluía en la pestaña porque no quedaba claro a qué se refería: literalmente, las notas de prensa señalaban: "Entre estos casos se incluye a personas con la infección superada." Este dato es el que ahora muestran las notas de prensa, lo que impediría seguir con el histórico de activos usando esta fuente.

Pero, se ha encontrado el número de casos activos en un dashboard, https://covid19ib.maps.arcgis.com/apps/opsdashboard/index.html#/c1cde29b86bd431287fd4225bb4193a4, que incluye los demás datos, pero que es actualizado a veces con retraso, y que no permite acceder a los datos históricos ni remite a una fuente abierta. Se toman manualmente estos activos, cuando es posible.

(Hasta el 2020-09-11)

Los datos se ofrecen a diario mediante notas de prensa, accesibles en el directorio de notas de prensa (ordenadas por novedad, las más recientes primero) en http://www.caib.es/pidip2front/jsp/es/ficha_emergencia/informaciones-covid-19 Se extraen manualmente, recogiéndose en la pestaña "BAL" de la hoja de cálculo común de notas de prensa como esta.

Canarias

Actualmente

La Consejería de Sanidad del Gobierno de Canarias no proporciona datos por provincias, sino por islas, y en varios tableros de información pública que no permiten la descarga automática. Se emplea un script para hacer scraping de los datos, tanto diariamente como los históricos. Esos dos tableros son:

El script agrupa esos cuatro datos en una línea diaria por provincia.

Hasta diciembre de 2020

La Consejería de Sanidad del Gobierno de Canarias no proporciona datos por provincias, pero sí ofrece algunos por islas que posibilitan su cálculo. Las cifras oficiales que establecen una diferenciación por islas incluyen los casos de coronavirus detectados por pruebas PCR, los fallecidos y los casos nuevos. Desde el día 25/05/2020 se añadió el número de recuperados y el de casos activos. Pese a ello, hay mucha información que no presenta dicho desglose. Los datos sanitarios oficiales permiten conocer únicamente a nivel regional el total de hospitalizados, las personas en UCI, los sanitarios contagiados, los casos sospechosos y el total de pruebas de detección. Por este motivo, en una pestaña se encuentran los datos relativos a cada isla y en otra los de todo el Archipiélago.

Actualmente: Se utilizan las notas de prensa publicadas por el Gobierno de Canarias: ejemplo de nota de prensa de 28.04.2020. Lo datos se vuelcan en la pestaña ["CANA-islas" de la hoja de cálculo común]https://docs.google.com/spreadsheets/d/1qxbKnU39yn6yYcNkBqQ0mKnIXmKfPQ4lgpNglpJ9frE/edit#gid=1123937706) por isla. Luego el script las agrega por provincias. Puedes usar el CSV por islas del repositorio en este archivo https://code.montera34.com/numeroteca/covid19/-/blob/master/data/original/spain/canarias/canarias.csv

Fuente de datos (2020.04.28): Gobierno de Canarias 100%.

Importante: Según informa la Consejería de Sanidad del Gobierno de Canarias en un comunicado, a partir del 2020.12.05, fecha inclusive, el dashboard que contiene los datos epidemiológicos de las Islas dejará de actualizarse los fines de semana y festivos. Esto se debe, según señala el Gobierno de Canarias, a que el Centro Coordinador de Alertas y Emergencias Sanitarias (CCAES), desde el mismo 2020.12.05, «no recepcionará información de las CC.AA. sobre datos epidemiológicos los fines de semana y festivos». Por lo tanto, a partir de este momento, la información epidemiológica referente a los días no laborables se recogerá de las notas de prensa publicadas en el Portal de Noticias del Gobierno de Canarias. Los datos proporcionados en ellas son provisionales y, según señalan en el mismo comunicado, serán revisados y consolidados según los protocolos. Destacar que en las notas de prensa de los fines de semana y festivos no se proporcionan los casos cerrados por alta médica, por lo que tampoco se pueden calcular los casos activos.

Especificaciones de los datos por islas:

Fuente: Consejería de Sanidad del Gobierno de Canarias. Los datos son proporcionados diariamente a través de las notas de prensa disponibles en la web del Gobierno de Canarias. En ellas ofrecen las cifras de la estadística oficial que se envía al Ministerio de Sanidad. Adicionalmente, y salvo alguna excepción, cada día hay un informe de seguimiento epidemiológico con datos meramente informativos y no oficiales, pues la hora del cierre estadístico es diferente a la de la estadística oficial. La información de estos informes es más completa, pero nunca ha sido utilizada para evitar mezclar sus cifras con las cifras sanitarias oficiales de las notas de prensa. * Debido al descuadre que queda explicado más adelante, desde el día 25/05/2020 en adelante se están utilizando los datos procedentes del mapa disponible en el siguiente enlace: https://grafcan1.maps.arcgis.com/apps/opsdashboard/index.html#/156eddd4d6fa4ff1987468d1fd70efb6. Aquí, actualizan los datos tres veces al día —a las 05.00 horas, a las 14.00 horas y a las 20.00 horas— pero en el proyecto se recogen los correspondientes a las 14.00 horas y según la declaración del caso. En dicha actualización, los casos, fallecimientos y recuperados por islas coinciden con los totales de la estadística oficial de las notas de prensa. En el dashboard mencionado se especificaban, por un lado, los datos según la declaración del caso y por otro, según el área de residencia, algo que quedó suprimido el día 22/08/2020. Según explica el Servicio Canario de Salud, los datos según la fecha de la declaración del caso coincidían con la fecha de diagnóstico, sin embargo, debido al incremento de rastreos se ha incrementado distancia temporal entre la fecha de declaración y la fecha de diagnóstico, por lo que a partir del 22 de agosto de 2020 únicamente se reflejan los casos por fecha de diagnóstico. Este cambio propició un reajuste de los datos de fallecidos en Tenerife y Gran Canaria y también de los casos acumulados en Tenerife.

La fuente de la serie de hospitalizaciones, personas en UCI y el total es la siguiente: https://grafcan1.maps.arcgis.com/apps/opsdashboard/index.html#/6c18fb18eae64df2a5ecca8c4bd846c3. En la columna «hospitalizados» no se incluye a las personas ingresadas en UCI, para los que hay una columna específica. En ambos casos, y tal y como se indica en la fuente, el Servicio Canario de Salud del Gobierno de Canarias contabiliza de manera conjunta los casos confirmados por coronavirus y los sospechosos pendientes de confirmación.

Hasta el 18/05/2018, las cifras se actualizaban cada día con datos correspondientes hasta las 20:00 horas del día anterior. A partir del día 19/05/2020 el Gobierno de Canarias cambió la hora de cierre de la estadística oficial y comenzó a publicar diariamente los datos recabados hasta las 14.00 horas del mismo día.

Los casos que publica Canarias sólo incluyen los positivos por test PCR. Todos los positivos detectados por test serológicos o rápidos los contrastan después con una prueba PCR porque es considerado el método más fiable. Sin embargo, ni en las notas de prensa, ni en los informes ni en el mapa se hace distinción alguna entre positivos según el tipo de test. Al final todos los positivos quedan confirmados o descartados una vez contrastados con una PCR. Si alguien da positivo en igM y luego da negativo en PCR, ese positivo es descartado.

Desde la Consejería de Sanidad del Gobierno de Canarias apuntan que no han tenido que modificar sus criterios de notificación ni difusión para adaptarlos a la nueva orden ministerial ya que, desde el primer momento, Canarias ha contado sus fallecidos tanto en centros hospitalarios como en centros residenciales o en domicilio, incluso cuando ha sido necesario se han hecho test post-mortem.

El día 06/04/2020 hubo un cambio metodológico: Los datos consolidados del día 05/04/2020 a las 20:00h son casos registrados en función del lugar de declaración y no al de residencia. Esto obedece a que hay personas que residen en una isla pero su tarjeta sanitaria está registrada en otra, lo que dificulta el procesamiento de los datos. Este día también presenta un desajuste de tres casos (acumulados) que «a la hora de cierre del informe no fue posible resolver» y que ya han quedado reflejados en el informe del 08/04/2020 (sobre el día 07/04/2020).

En los días 05/04/2020 y 06/04/2020 hay un desfase destacable en el número de casos nuevos, llegando a tener un valor negativo en algunas islas. Esto se debe a que los valores han cambiado y son en función del lugar de declaración y no al de residencia. Este criterio fue aplicado por la Dirección General de Salud Pública del SCS en el informe publicado el 06/04/2020.

El día 15/05/2020 en La Palma y La Gomera se redujeron 1 y 2 casos, respectivamente, «debido a un reajuste en los domicilios de los pacientes contagiados», de ahí los valores negativos en la columna de nuevos casos. Todos ellos pasaron a ser asignados a Tenerife, según la Consejería de Sanidad del Gobierno de Canarias.

El 18/05/2020 fue el último día en el que se notificaron los datos recogidos hasta las 20.00 horas del día anterior, correspondiente al cierre de la estadística oficial que se envía cada día al Ministerio de Sanidad. De esta manera, el 18/05/2020 todavía fueron notificadas las cifras del día anterior (17/05/2020) hasta las 20.00h; sin embargo, a partir del 19/05/2020 las actualizaciones se comenzaron a cerrar a las 14.00 horas del mismo día. Por este motivo los datos correspondientes al 18/05/2020 no quedan reflejados.

Los casos nuevos de Gran Canaria y Lanzarote presentan unos valores negativos el día 20/05/2020. Esto se debe a un reajuste de la Dirección General de Salud Pública del SCS ante la imposibilidad de registrar el área de residencia de dichos pacientes. Este descuadre repercute también sobre el total de casos acumulados del mismo día (20/05/2020), presentando un acumulado entre todas las islas de 2.271 casos cuando realmente el Gobierno de Canarias notifica para ese día 2.307. Los datos del 21/05/2020 continúan con este mismo problema, pues los casos acumulados entre todas las islas suman 2.276 cuando realmente el Gobierno de Canarias informa para el día 2.312. En el 22/05/2020 ocurre lo mismo, los datos acumulados suman 2.282 debido a ello, pero los reportados son 2.318. Para el 23/05/2020 los casos acumulados notificados por el Gobierno de Canarias son 2.321, a pesar de que la suma total de casos por islas suman 2.285. Esto se debe al reajuste del pasado día 20/05/2020. Por el mismo motivo, el 24/05/2020 sumando los casos acumulados por islas el total es de 2.286, pero realmente son 2.322, según registra la Consejería de Sanidad del Gobierno de Canarias.

*Antes del descuadre anterior —que se produjo por la imposibilidad de registrar el área de residencia de algunos pacientes— en las notas de prensa se presentaban los datos oficiales de casos acumulados y fallecimientos acumulados habiendo realizado un cribado estadístico sobre dichas cifras registradas según el lugar de residencia y según el área de declaración. Tal y como afirmaron desde la Consejería de Sanidad del Gobierno de Canarias, con este cribado se «refleja más concretamente la realidad de los casos positivos y fallecimientos por islas basados en la información sanitaria directa». Sin embargo, tras el descuadre que se viene arrastrando desde el día 20/05/2020, las notas de prensa dejaron de ofrecer los datos cribados y comenzaron a dar únicamente los casos y fallecimientos acumulados según el área de residencia. Este es un criterio que Canarias ya dejó de lado con el cambio metodológico del día 06/04/2020, por lo que desde el día 25/05/2020 el proyecto decidió retomar las cifras generadas en el mapa según el lugar de declaración. Los valores negativos de este día se deben a que ya no son datos cribados. Reiterar que la actualización del mapa a las 14.00h ofrece unos datos no oficiales por islas pero que, al sumarlos, coinciden con los casos, fallecidos y recuperados totales de la estadística oficial de las notas de prensa diarias.

Los días 23/05/2020 y 24/05/2020 las cifras de fallecidos acumulados, según los ofrecidos por islas en las notas de prensa, suman 156. Sin embargo, en las mismas notas de prensa informan de que son 157. En los informes diarios del Ministerio de Sanidad también reportan que son 157.

Con el último cambio metodológico de Sanidad (25/05/2020), los datos oficiales que notifica la Consejería de Sanidad de Canarias en notas de prensa no coinciden con los casos totales acumulados, el total de fallecidos ni con el total de hospitalizados que registra el Ministerio.

Los casos nuevos notificados por la Consejería de Sanidad del Gobierno de Canarias para el día 29/05/2020 son 5. Sin embargo, teniendo en cuenta los casos acumulados notificados por islas el día 28/05/2020 y el 29/05/2020, el total son 7 casos nuevos.

El día 11/06/2020 presenta un desajuste en el número acumulado de casos. Según se indica en nota de prensa, hay dos casos menos con respecto a los notificados el 10/06/2020 debido a que dos se registraron duplicados. Por ello, Tenerife tiene un valor negativo en la columna de casos nuevos. Hay que señalar que, a pesar de ello, el dato acumulado no decrece, pues los casos por islas suman 2.379 y no 2.377, que son de los que se informa desde el gabinete de prensa. Por otro lado, el total de recuperados notificados en la nota de este mismo día es 2.212 cuando, al sumarlos por islas, hay 2.122. Este descuadre afecta a los casos nuevos, pues en nota de prensa se informa de 95 y el resultado es de 96.

Los días 10/07/2020 y 12/07/2020 registran valores negativos en la columna correspondiente a «new_cases» en Tenerife y Fuerteventura, respectivamente. Para el primer día señalado, el 10/07/2020, las islas acumulan un caso menos de los difundidos por la Consejería de Sanidad, pasando de los 1456 casos totales acumulados del 09/07/2020, a 1455 en el día siguiente. Esto se debe a un reajuste en un caso de Tenerife. Dos días más tarde, el 12/07/2020 hay otro reajuste, esta vez en Fuerteventura, con 6 casos menos de los reportados en días anteriores.

Durante los días 25/07/2020 y 26/07/2020 -fin de semana- el dashboard (https://grafcan1.maps.arcgis.com/apps/opsdashboard/index.html#/156eddd4d6fa4ff1987468d1fd70efb6) no ofreció los datos actualizados a las 14.00 horas. En su lugar fueron recogidos los de la posterior actualización, la de las 20.00 horas.

El 01/08/2020 no hubo en todo el día una actualización en el dashboard que presenta los datos de la autonomía. Desde el día 02/08/2020 -incluido- hasta el 06/08/2020, las tres actualizaciones diarias del portal desaparecieron, quedando únicamente la de las 05.00h. Por lo tanto, no se pudieron recopilar las cifras que presentaban siempre a las 14.00h. El 07/08/2020 recuperaron la actualización de las 14.00h.

El día 03/08/2020 se produjo un nuevo contagio en La Gomera que, sin embargo, no fue añadido al dashboard que muestra el recuento oficial, según informó la Consejería de Sanidad de Canarias. En este proyecto sí que ha sido contabilizado, quedando así un acumulado de 9 casos y 1 activo desde el 03/08/2020. Además, desde el digital «Telde Actualidad» informan de la existencia de dos casos pendientes de asignación en este mismo día. Se puede consultar la noticia en el siguiente enlace: https://www.teldeactualidad.com/noticia/canarias/2020/08/03/2789.html

Especificaciones de los datos a nivel autonómico:

Fuente de todos los datos exceptuando los referentes a las hospitalizaciones: Hasta el día 25/05/2020, los datos procedían de las notas de prensas diarias que publicaba el Gobierno de Canarias. A partir de la fecha indicada, se comenzaron a extraer del dashboard del siguiente enlace: https://grafcan1.maps.arcgis.com/apps/opsdashboard/index.html#/156eddd4d6fa4ff1987468d1fd70efb6.

La fuente de la serie de hospitalizaciones, personas en UCI y el total es esta: https://grafcan1.maps.arcgis.com/apps/opsdashboard/index.html#/6c18fb18eae64df2a5ecca8c4bd846c3. En la columna «hospitalizados» no se incluye a las personas ingresadas en UCI, para los que hay una columna específica. En ambos casos, y tal y como se indica en la fuente, el Servicio Canario de Salud del Gobierno de Canarias contabiliza de manera conjunta los casos confirmados por coronavirus y los sospechosos pendientes de confirmación.

Aclaraciones y descuadres:

La columna titulada «Total pruebas PCR/Ac» contiene el dato acumulado total de test PCR y de anticuerpos que se han realizado. El día 24/04/2020 el Gobierno de Canarias comenzó a darlo con periodicidad diaria en las notas de prensa.

Desde el día 20/05/2020 la Consejería de Sanidad del Gobierno de Canarias comenzó a ofrecer el desglose por tipo de prueba. Hay una columna creada que incluye el total de test PCR realizados —titulada «PCR realizados»— y otra para ver el total de test rápidos efectuados —incluido en la columna «Ac realizados»—. Los datos diarios de pruebas PCR y Ac también son datos acumulados. Al sumar los datos de estas dos columnas deberían coincidir con el dato de la columna «Total pruebas PCR y Ac», algo que no sucede en los días 21 y 24 de mayo de 2020.

La columna «Personas PCR/Ac» se refiere al total de personas a las que se les ha realizado algún o algunos test, ya sea de anticuerpos o PCR. El total de pruebas PCR/Ac no coincide con el total de personas a las que se les ha hecho un test. Esto es porque a una misma persona se le puede haber hecho más de un test. Las fuentes de estos datos son las notas de prensa diarias de la Consejería de Sanidad del Gobierno de Canarias.

Los datos de la columna «PCR+» proceden de la serie del Centro Nacional de Epidemiología (CNE). El día 21/05/2020 dejó de actualizarse debido al cambio en la notificación de las Comunidades Autónomas al Ministerio de Sanidad, motivo por el cual desde ese día no hay datos en esta columna. Desde el 24/02/2020 hasta el 10/03/2020 hay ciertos descuadres con respecto a los casos acumulados que se reportan en las notas de prensa. A partir del 11/03/2020 las cifras de la columna de «casos acumulados» coinciden con las de «PCR+».

Los datos de la columna de «sanitarios infectados» provienen de las notas de prensa que publican en la web del Gobierno de Canarias. Comenzaron a ofrecer la cifra el 26/03/2020 y son datos acumulados.A partir del 28/05/2020 dejaron de informar al respecto.

El porcentaje total de sanitarios contagiados sobre el total de casos acumulados es un cálculo que se ha realizado a partir de los datos oficiales recabados.

La Consejería de Sanidad, adaptándose al nuevo protocolo del Ministerio de Sanidad, comenzó a informar sobre el número de casos sospechosos el día 12/05/2020. Este índice no es acumulativo y corresponde a los casos sospechosos rastreados por los procesionales del CSC hasta las 20.00 horas del día anterior. Según establece el protocolo de Sanidad, estas personas serán estudiadas con PCR en las siguientes 24 horas, convirtiéndose en casos positivos o negativos en un período de entre 24 y 72 horas, tiempo que lleva la realización de pruebas, el traslado, tratamiento microbiológico y notificación de las mismas.

¿Qué es un caso sospechoso? El protocolo del Ministerio establece que se considerará caso sospechoso a «cualquier persona con cuadro clínico de infección respiratoria aguda de aparición súbita de cualquier gravedad que cursa, entre otros, con fiebre, tos o sensación de falta de aire.» Otros síntomas atípicos como la pérdida de gusto, la pérdida de olfato, diarreas, dolores musculares, etc. también se valorarán bajo criterio clínico como posible caso sospechoso.

Cantabria

De la web https://www.scsalud.es/coronavirus descargamos descargamos el CSV del final de la página el archivo https://www.scsalud.es/documents/2162705/9255280/2020_covid19_historico.csv a mano por que nos da el error "Peer certificate cannot be authenticated with given CA certificate" al intentar descargarlo desde R. El archivo descagado diariamente se guarda en https://code.montera34.com/numeroteca/covid19/-/blob/master/data/original/spain/cantabria/COVID19_historico.csv

Cataluña

Actualmente:

La informacion de coorespondencia de AGA con provincias es de este PDF que hemos pasado a CSV aquí.

Fuente de datos (2020.05.05): Transparencia de Catalunya 100%

Anteriormente:

PUEBLO /ZONA COMARCA REAL PROVÍNCIA REAL RS ASIGNADA PROVINCIA RS
Tora I Biosca Segarra Lleida Catalunya Central Barcelona
Vacarisses I Rellinars Valles Occidental Barcelona Catalunya Central Barcelona
Espinelves Osona Girona Catalunya Central Barcelona
Maresme Nord Maresme Barcelona Girona Girona
Viladrau Osona Girona Catalunya Central Barcelona
Zona Baixa Segarra Anoia Barcelona Camp De Tarragona Tarragona
Cunit Baix Penedes Tarragona Barcelona Sud Barcelona
Gósol Berguedà Lleida Catalunya Central Barcelona
Solsonés Solsonés Lleida Catalunya Central Barcelona

Este sistema ha dejado de funcionar ya que el dashboard de Salut de la Generalitat ha dejado de diferenciar entre sospechosos y positivos y se ha pasado a recopilar de los PDF diarios.

Fuente de datos (2020.05.05): Salut de Catalunya 100%

  • para otros datos como hospitalizados o cuidados intensivos hay una mezcla de fuentes periodísticas para Girona, Lleida y Tarragona. Falta indicar fuente para un 13%.

Los datos de casos y fallecidos para la provincia de Barcelona se calculaban en base al total de Cataluña (de Minsiterio de Sanidad- Datadista) y restando los datos de las otras tres provincias. Para Girona se usaba este repositorio mantenido por @nachotronic. Para Lleida el gráfico publicado en esta noticia de segre.com. Para Tarragona múltiples fuentes periodísticas. Barcelona se calculaba restando al total de la comunidad autónoma los datos de las otras tres provincias catalanas.

Los valores de fallecidos diarios se obtienen del powerBi siguiente, al menos hasta el 14.05.2020: https://app.powerbi.com/view?r=eyJrIjoiZTkyNTcwNjgtNTQ4Yi00ZTg0LTk1OTctNzM3ZGEzNWE4OTIxIiwidCI6IjNiOTQyN2RjLWQzMGUtNDNiYy04YzA2LWZmNzI1MzY3NmZlYyIsImMiOjh9

Por otro lado, el canal de comunicación de Salut: https://canalsalut.gencat.cat/ca/salut-a-z/c/coronavirus-2019-ncov/ emite Notas de Prensa diarias con el valor total acumulado de casos y fallecidos (positivos y sospechosos de forma separada). Se puede usar para contrastar datos (comparar los totales).

El PowerBi tiene la ventaja de tener el histórico de casos por dia y el inconveniente de que consolida datos (se introducen valores en fechas antiguas) por lo que se necesita una revisión del histórico de todos los datos de días anteriores de cada Región Sanitaria. Este Powerbi es la única fuente que tenemos que nos ofrece el histórico de los fallecidos. Los ofrece por región sanitaria y hay que agregar las diferentes regiones para tener los totales por provincias.

El PowerBi ha sufrido varias modificaciones durante el mes de Mayo:

  • La Región Sanitaria de Barcelona se separó en tres: Barcelona Ciutat, Metropolità Sud i Metropolità Nord.
  • Los casos positivos se separaron en tres: positivos por PCR + positivos epidemiológicos + positivos por test rápido.
  • Los 4 tipos de casos (los 3 anteriores + sospechosos) pasan a ser un total. Nos imposibilita la captura de datos.

Desde de la fecha del 14 de mayo se decide capturar los datos de las notas de prensa. El incremento diario se supone que es en la fecha del último día (sin consolidación de datos).

Castilla y León

Actualmente

Descargamos estos seis archivos automáticamente:

Hasta noviembre de 2021

Descargamos estos tres archivos automáticamente:

** Pasado** Fuente de datos (2020.04.28): Junta de Castilla y León: 87%, RTVE 13%.

Se copia pegan datos de la página de datos abiertos de la Junta de Castilla y León en la pestaña común "provincias" de la hoja de cálculo por provincia.

Hemos estado incluyendo los datos manualmente, desde la página de datos abiertos de la Junta de Castilla y León.

Para automatizar la tarea se pueden descargar los datos en formato CSV:

  • conjunto de datos de casos confirmados, nuevos casos, altas y fallecimientos. CSV | JSON
  • conjunto de datos de hospitalizados, altas y fallecimientos por hospitales. CSV | JSON

Del segundo conjunto de datos se pueden sacar los datos de hospitalizaciones diarias en planta y en UCI. Los datos vienen desagregados por hospital, así que hay que sumar los hospitales de cada provincia (en los casos de Burgos, León y Valladolid) para obtener el total por provincia.

Los valores totales por provincia de altas y fallecimientos son iguales en ambos conjuntos de datos, aunque en el segundo se dan desagregados por hospital con lo que es más rápido sacarlos del primero.

Castilla-La Mancha

Actualmente: Se utilizan las notas de prensa publicadas por el Castilla-La Mancha: ejemplo de nota de prensa de 28.04.2020. Lo datos se vuelcan en la pestaña "CLM" de la hoja de cálculo común por provincia.

Fuente de datos (2020.04.28): Gobierno de Castilla-La Mancha 73%, RTVE 27%.

Comunidad Valenciana

Actualmente

Desde noviembre de 2020, se realiza un scraping en Python de las notas de prensa publicadas por la Generalitat Valenciana ejemplo de nota de prensa de 8.04.2020, y los resultados se vuelcan en la pestaña común "VAL" de la hoja de cálculo por provincia.

Hasta noviembre de 2020: Se toman a mano los datos de las notas de prensa publicadas por la Generalitat Valenciana: ejemplo de nota de prensa de 8.04.2020. Los datos se vuelcan en la pestaña común "VAL" de la hoja de cálculo por provincia.

Hemos añadido hasta ahora los datos de las provincias de la Comunidad Valenciana, transcribiendo los valores que se publican en las notas de prensa que publica a diario la Consejería de Salud.

A mediados de mayo de 2020 han cambiado la manera de dar las cifras de CASOS DETECTADOS. Antes el total de casos detectados por cada provincia incluía PCR y test rápido. Ahora sólo incluye los PCR. Y luego dan el total regional incluyendo test rápidos

Fuente de datos (2020.04.28): Generalitat Valenciana 87%, RTVE 13%

Extremadura

Actualmente: Se utilizan las notas de prensa publicadas por la Junta de Extremdura: ejemplo de nota de prensa de 8.04.2020. Los datos se vuelcan en la pestaña "EXT" de la hoja de cálculo común por provincia, previo cálculo, pues en las notas de prensa aparecen por áreas de Salud.

Fuente de datos (2020.04.28): Junta de Extremadura 81%, Prensa 10%, Falta Fuente 9%

¿Qué pasa con Extremadura entre el 27 y el 28 de abril? Hay un salto en los confirmados que indica que algo falla. La razón es que la Junta de Extremadura estuvo dando cifras de casos confirmados por PCR y test hasta que hace unos días decidió publicar sólo PCR. En la base de datos del ISCIII están las dos cifras, pero como no viene por provincias no hemos podido ajustar la serie.

Galicia

Actualmente: El Área Sanitaria de Ourense, Verín e O Barco de Valdeorras ofrece datos de todas las áreas de Galicia, [que recopila @lipido en un repositorio] (https://github.com/lipido/galicia-covid19) desde el 2020.06.04.

La información está dividida en siete áreas, que coinciden fundamentalmente con:

  • Provincia de A Coruña:
    • Área sanitaria de Coruña y Cee
    • Área sanitaria de Santiago y Barbanza
    • Área de Ferrol
  • Provincia de Lugo
    • Área sanitaria de Lugo
  • Provincia de Ourense
    • Área sanitaria de Ourense
  • Provincia de Pontevedra
    • Área sanitaria de Pontevedra
    • Área sanitaria de Vigo

Nota adicional: de hecho, algunos municipios de la provincia de Pontevedra pertenecen al área sanitaria de Santiago.

Histórico:

  • Provincia de Ourense: todos los datos históricos están recogidos en el mismo repositorio citado, https://github.com/lipido/galicia-covid19
  • Provincias de A Coruña, Lugo y Pontevedra, hasta 2020.06.03: los datos de casos activos por área sanitaria proceden de las notas de prensa publicadas directamente por el SERGAS (en muchos casos, recopilados por Galiciancovid19). Todos los demás datos provienen de partes y comunicaciones transmitidas por cada área del SERGAS a diferentes medios. Estos medios publican los datos en forma de noticias, que han sido recopiladas y analizadas manualmente.

Fuente de datos:

  • Desde 2020.06.04: Área Sanitaria de Ourense, Verín e O Barco de Valdeorras
  • Hasta 2020.06.03: galiciancovid19.info (33,4%), galiciapress.es (12,0%), Área Sanitaria de Ourense, Verín e O Barco de Valdeorras (10,3%), lavozdegalicia.es (9,1%), SERGAS (7,8%), laopinioncoruna.es (4,8%), elprogreso.es (3,5%), farodevigo.es (2,9%), 20minutos.es (2,3%), vigoe.es (1,8%), diariodeferrol.com (1,3%), lavanguardia.com (1,2%), europapress.es (1,2%), cope.es (1,1%), elidealgallego.com (0,9%), diariodepontevedra.es (0,8%), metropolitano.gal (0,8%), galiciaartabradigital.com (0,7%), diariodearousa.com (0,7%), atlantico.net (0,7%), elcorreogallego.es (0,5%), laregion.es (0,4%), elespanol.com (0,4%), vigoalminuto.com (0,4%), cadenaser.com (0,2%), redaccionmedica.com (0,1%), gcdiario.com (0,1%), moncloa.com (0,1%), abc.es (0,1%), telemarinas.com (0,1%)

Información obtenida a partir del 4 de junio

Recopilada a partir de información obtenida desde estas fuentes:

  • Consellería de Sanidade (Xunta de Galicia). Proporciona datos a nivel global de la Comunidad Autónoma de Galicia y únicamente de casos activos por Área Sanitaria.
  • Xerencia da Área Sanitaria de Ourense, Verín e O Barco de Valdeorras (SERGAS). Proporciona datos de detallados de Ourense y del resto de Áreas Sanitarias.

Posteriormente, se acumulan, para cada provincia, los datos de todas las áreas sanitarias que están mayoritariamente incluídas en ella:

  • Casos activos con seguimiento a domicilio.
  • Hospitalizados totales (UCI + planta) en los hospitales del Área Sanitaria.
  • Pacientes en UCI en los hospitales del Área Sanitaria.
  • Total de pruebas PCR hechas hasta la fecha en el Área Sanitaria.

Y además, se compilan datos históricos por provincia de:

  • Casos acumulados (tanto PCR+, como anticuerpos, sin distinción)
  • Altas acumuladas
  • Fallecidos acumulados

Información obtenida hasta el 3 de junio

La información es ofrecida y compilada de dos formas:

  1. Información ofrecida directamente por el Sergas (Servicio Gallego de Salud)

Se publica una nota diaria, a las 12:00, en https://saladecomunicacion.sergas.gal/Paginas/Buscar.aspx?k=coronavirus, que incluye:

  • Solo el número total de casos activos, ese día, a las 12:00, desglosados por cada área sanitaria
  • Número total, para toda Galicia (es decir, sin desglosar), de:
    • Fallecidos acumulados, separando (desde el 8 de abril) entre:
    • Fallecidos en hospitales
    • Fallecidos en residencias sanitarias (solo algunos días)
    • Fallecidos en las últimas 24 horas
    • PCR acumulados en toda Galicia
  1. Cada área del SERGAS comunica a medios periodísticos datos diferentes sobre:
  • Hospitalizados
  • UCI
  • Y, no en todos los casos:
    • Casos domiciliados (desde el 8 de abril)
    • Fallecidos en las últimas 24 horas
    • Acumulado de fallecidos
    • Acumulado de recuperados

Pero las áreas del SERGAS no ofrecne esta información de forma directa, sino mediante partes y notas de prensa que luego es publicada por diferentes medios.

Esta metodología genera varios problemas para la recopilación:

Problema 1: no todas las áreas ofrecen esa información regularmente. Especialmente reseñable es el caso de la provincia de A Coruña; y particularmente, el área de A Coruña y Cee:

  • apenas da información sobre hospitalizados y personas en la uci
  • y, de forma esporádica, ofrece otros datos, como los recuperados en un día concreto: a veces, acumulados; y otras, sin acumular. Pero casi nunca ofrece el número acumulado de fallecidos o de recuperados. Las áreas de Ferrol y Santiago sí dan más información, pero no se han acumulado porque, al no tener él área de Coruña, los resultados finales no podían ser completos.

Problema 2: cada área NO ofrece información directamente, sino a través de distintos medios

Problema 3: no todos los medios de cada área publican la misma información desglosada todos los días sobre todos estos detalles. Eso supone que se hayan tenido que peinar, para cada día y cada área distinta, diferentes medios, entre los que se incluyen:

Problema 4: el SERGAS ha cambiado al menos 4 veces de criterios en la presentación de información

  • Hasta el 7 de abril: originalmente: el SERGAS solo contabilizaba datos en hospitales, pero NO contabilizaba datos de fallecidos en residencias.
  • Desde el 8 de abril: el SERGAS pasa a añadir datos, acumulando de golpe todos los fallecimientos de residencias, por área sanitaria.
    • Nota: para cada día hasta el 7 de abril, se han sumado datos de hospitales y residencias por día, tomados del propio SERGAS (vía medios), en lugar de volcar todos los datos de golpe el día 8.
  • Desde el 28 de abril: el SERGAS añade al acumulado de los recuperados TODOS los casos que tenía, tanto de hospitales como en residencias/domicilios
  • Hasta entonces, solo incluía altas hospitalarias, y añadía todos los demás casos que iban a domicilio, los pasaba a domiciliados (también en activos).
  • El 7 de mayo, el SERGAS comunica que hay 7 casos de fallecidos que “retira” de los positivos porque los PCR no dieron positivo. Pero, en las cifras reales, esos datos no se retiran (sic).
  • El 15 y 16 de mayo, los números totales de casos acumulados DESCIENDEN. La Xunta afirma que, “de acuerdo con las nuevas indicaciones del Ministerio de Sanidad”, el Sergas ha estado contando “episodios”, y no “casos”. Cada episodio es un análisis confirmado, pero puede haber varios “episodios” para una misma persona.

Madrid

Hay un repositorio que mantiene @alfonsotwr con datos de Madrid https://github.com/alfonsotwr/snippets/blob/master/covidia-cam/madrid-series.csv Alimentamos la base de datos con los hospitalizados y UCI de prevalencia.

Así explica en el README del repositorio:

En la columna de hospitalizados_dia sumo los Hospitalizados ingresados en el día y los de la UCI ingresados en el día, tal como hacía el Ministerio de Sanidad en sus informes: entiendo que los Hospitalizados ingresados en el día de la Consejería de Salud no incluían a los de la UCI, mientras el Ministerio de Sanidad sí los incluye, por lo que he usado la convención del Ministerio de Sanidad en los ficheros de datos.

Los informes PDF de la Consejería de Salud de la Comunidad de Madrid están disponibles en: https://www.comunidad.madrid/servicios/salud/2019-nuevo-coronavirus#situacion-epidemiologica-actual

El fichero madrid-historico.csv contiene las series con datos que complementan o incluso sustituyen los datos que proporciona la Consejería de Salud en madrid-series.csv.

En ambos ficheros, la fecha corresponde a la fecha de publicación del informe, es decir, son los datos del día anterior. Mientras, en las gráficas la fecha es la de los datos.

Así las columnas de Recuperados, uci_dia y hospitalizados_dia del fichero madrid-historico.csv fueron extraídas de las series publicadas el Instituto de Salud Carlos III (ISCIII) el 26 de abril de 2020.

Las columnas CASOS_PCR, Hospitalizados, UCI y Fallecidos del fichero madrid-historico.csv corresponden a las series actualizadas por el Instituto de Salud Carlos III (ISCIII) en las series publicadas el 21 de mayo de 2020.

Los datos del fichero madrid-historico.csv tienen preferencia a los de madrid-series.csv.

Murcia

Actualmente

El Portal Sanitario de la Región de Murcia fue actualizado y contiene información a nivel municipal; no obstante, los datos diarios a nivel regional son más completos en el portal de Twitter del Gobierno de la Comunidad que en los informes diarios que hay en PDF en el Portal. Por este motivo, se recopila la información de los informes que comparten en Twitter.

En ellos, a partir del día 27 de octubre de 2020 se comenzaron a incluir los casos positivos detectados mediante PCR y Antígenos*, pero sin su correspondiente desglose. Lo mismo ocurrió con la información sobre casos activos.

*Antes de este cambio las cifras sólo contemplaban positivos y activos detectados mediante PCR.

Importante: Desde el 2020.12.03, fecha inclusive, la Consejería de Salud de la Región de Murcia dejó de ofrecer el dato de casos acumulados detectados mediante prueba PCR.

Anteriormente

El Portal Sanitario de la Región de Murcia proporciona los datos diarios sobre COVID-19 en el apartado de «Actualización Epidemiológica». Se encuentra en el siguiente enlace: https://www.murciasalud.es/pagina.php?id=458869. Este contiene un PDF en el que se indican los casos confirmados totales, un desglose del total de casos confirmados por PCR, los casos activos y recuperados con su correspondiente desglose también, así como el dato acumulado de fallecidos. Las pruebas diagnósticas totales diarias realizadas en la autonomía quedan reflejadas en este mismo documento. Para extraer los PCR totales diarios hay que recurrir a las ocasionales notas de prensa del Portal Sanitario de la Región de Murcia, disponibles aquí: https://www.murciasalud.es/noticias.php.

Cabe destacar que todas las actualizaciones epidemiológicas diarias, ofrecidas en formato PDF, se publican en la misma URL. De esta manera, no se puede volver a acceder a PDF de días anteriores a no ser que previamente hayan sido descargados o cambiando la fecha en la misma URL. En el siguiente enlace se pueden consultar los documentos que contienen las actualizaciones epidemiológicas: https://archive.org/download/actualizacion-epidemiologica-murcia-covid. Están disponibles desde el 15/07/2020 en adelante. El fin de semana del 25/07/2020 y 26/07/2020, el Portal Sanitario de la Región de Murcia no publicó la actualización epidemiológica de estos dos días, por lo que estos PDF faltan en el repositorio.

Dado que durante el fin de semana las autoridades no añadieron la actualización correspondiente, los datos del 25/07/2020 fueron extraídos del siguiente dashboard: https://experience.arcgis.com/experience/fe1595b8b8fc4a5cb357393e8f62c0d7. En él se registra la situación de COVID-19 en la Región de Murcia con datos procedentes del Servicio de Epidemiología de la Comunidad Autónoma. Debido al atraso del mismo dashboard en los datos del 26/07/2020, la información fue recopilada de otra fuente. Esta vez de la cuenta de Twitter del Gobierno de la Región de Murcia (@regiondemurcia). Aquí, las cifras son publicadas con un mensaje seguido de una imagen adjunta y todas las actualizaciones a través de esta vía siguen la misma estructura. Puede ver un ejemplo de lo descrito en el enlace que corresponde a la actualización del 26/07/2020: https://twitter.com/regiondemurcia/status/1287711353634004997. Los datos de las pruebas diagnósticas totales diarias realizadas y desglosadas (PCR y Ac), únicamente se comparten en el perfil de Twitter del Gobierno de la Región de Murcia.

*Especificaciones:

El acumulado de fallecidos varía dependiendo de la fuente. En las actualizaciones epidemiológicas diarias del Portal Sanitario de la Región de Murcia notifican 148 decesos, dejando excluidos 3 por ser positivos en pruebas de anticuerpos. En el dashboard mantienen 151, así como en las actualizaciones publicadas por el Gobierno de la Región de Murcia en su cuenta de Twitter.

Navarra

Lo más actualizado recientemente (26.07.2020) son las notas de prensa de navarra.es. Si se usa la URL https://www.navarra.es/es/noticias/2020/07/15/ se pueden todas las notas de prensa de ese día, y en una de ellas estarán los datos que corresponden con los datos del día anterior. La noticia (ejemplo del 2020.07.15) contiene el número de casos PCR+ y fallecidos que son volcados a la pestaña de la hoja de cálculo compartida "NAV". Las notas de prensa e información puntual se difunde a tavés de la cuenta de Twitter @salud_na

Hay información no actualizada y descargable en:

Previamente al 19.07.2020 los datos eran recogidos de las mismas fuentes por @danielegrasso en este repositorio junto con otras comunidades autónomas uniproviniciales.

En la nota de prensa diaria, ejemplo de 2020.07.27, se indica el número de hospitalizados como suma de los hospitalizados en planta + hospitalizados domiciliarios + UCI. En la columna hospitalized de la hoja excel de datos se incluyen solo los hospitalizados en planta.

País Vasco

Los datos actuales (desde mediados de mayo) vienen de dos fuentes:

  • Irekia (https://www.irekia.euskadi.eus/es/news): las notas de prensa indican los casos en cada provincia y de los no residentes. Se recopilan diariamente en la hoja de cálculo común, sobre todo en los fines de semana que es cuando no se actualizan los datos en Open Data Euskadi.
  • Open Data Euskadi: para el total de casos acumulados y hospitalizados se utilizan las series https://opendata.euskadi.eus/catalogo /-/evolucion-del-coronavirus-covid-19-en-euskadi/

Le hemos dedicado una página especial a gráficos por hospital lab.montera34.com/covid19/euskadi.html

Actualmente: se recopila de las notas de prensa publiadas en Irekia, la página de datos abiertos del Gobierno Vasco: ejemplo de nota de prensa de 29.04.2020. Los datos se vuelcan en la pestaña "EUS" de la hoja de cálculo común por provincia. No hay datos por provincias asistenciales (hospitalizados y UCI prevalentes) desde el 1 de diciebmre 2020. Los fallecidos se construyen a partir de los datos de fallecidos acumulados por municipios que se publican semanalmente (ampliar información: numeroteca.org/2020/11/25/fallecidos-euskadi-provinicias-datos/). Los miércoles se publican los datos de la semana anterior lunes-domingo.

Anteriormente: Datos de hospitalizados, ingresos, altas, UCI estaban disponibles por hospitales hasta el 2020-12-01, desde entonces no hay datosasistenciales por provincia (https://opendata.euskadi.eus/contenidos/ds_informes_estudios/covid_19_2020/opendata/datos-asistenciales.xlsx).

Para los fallecidos: hay datos para todo Euskadi, datos por hospitales (sólo fallecidos en hospitales).

Fuente de datos (2020.04.28): Osakidetza 61%, Gobierno de Euskadi 28%, RTVE 9%, Irekia 2%

La Rioja

Actualmente

Desde el 2020-11-12, la Consejería de Salud y Portavoz de Gobierno de La Rioja ofrece un fichero público en Google Drive, https://docs.google.com/spreadsheets/d/11dMDMmOq3t2Hb35BH33X0wG4xqv8SQC1av3RM1EdXRY/edit#gid=2020928623, donde incluye una cincuentena de variables actualizadas, en teoría, diariamente, incluyendo datos sobre hospitalizados, UCI (en ambos casos, desagregados por hospitales), casos, recuperados y fallecidos, que se recopilan manualmente.

No obstante, la frecuencia de actualización de casos, recuperados y fallecidos es muy desigual, sin ofrecer datos en estos tres casos durante varios días consecutivos, de manera frecuente.

Anteriormente: del 2020-08-11 al 2020-11-11

Los datos completos se encuentran en las crónicas publicadas en el periódico La Rioja.com. El proceso consiste en:

  • Buscar en Google por "larioja.com coronavirus", con fecha de publicación en el día que corresponda.
  • Hallar la crónica de los datos para ese día
  • Y extraer manualmente, los datos para rellenar la pestaña "RIO" de la hoja de cálculo común

Estos datos se contrastan, en los casos en los que se dispone de información oficial (ver a continuación) con la información directa de la sección sobre "Coronavirus" del Gobierno de La Rioja.

(A partir del 2020-08-03)

La publicación de datos empieza a sufrir retrasos, y deja de ser publicada el 2020-08-18 (aunque siguen publicándose algunos datos sueltos). Por ello, se pasa a tomar datos de la sección sobre "Coronavirus" del portal de Actualidad del Gobierno de La Rioja https://actualidad.larioja.org/coronavirus/datos .

No obstante, los únicos datos publicados diariamente son los datos acumulados de "Confirmados", "Fallecidos", "Hospitalizados" y "Personas en UCI", sin desglose diario.

Sí se publican algunos de estos datos diarios, pero de forma semanal, mediante gráficos en Datawrapper, que permiten su extracción manual.

(Hasta el 2020-08-02)

Los datos se recogían de la sección Dato abierto del Gobierno de La Rioja (https://web.larioja.org/dato-abierto/datoabierto?filtros={%22tags%22%3A[%22Covid-19%22]}#listado

Ceuta

Tienen su propia pestaña CEU en la hoja de cálculo común.

Actualmente

Desde el 24 de febrero de 2021, Ingesa Ceuta ha dejado de ofrecer datos a diario, por lo que los datos se recogen de forma manual a partir de los informes de actualizaciones, de lunes a viernes (salvo días festivos) ofrecido por el Ministerio de Sanidad (https://www.mscbs.gob.es/profesionales/saludPublica/ccayes/alertasActual/nCov/situacionActual.htm, y ahí, pinchar en el enlace Actualización nº... : enfermedad por SARS-CoV-2 (COVID-19) [y la fecha], que ofrece datos del día anterior.

Anteriormente

Hasta el 21 de febrero de 2021, los datos se recogían diariamente de twitter. Publican una tabla en forma gráfica, de la que se extraen los datos a copiar en la pestaña de la hoja excel referenciada. La correspondencia de datos entre la tabla y la excel es la siguiente:

  • Positivos acumulados de Covid-19 en Ceuta->cases_acumulated
  • Positivos por PCR->cases_Acumulated_PCR
  • Positivos por test rápido-> not_used
  • Números de casos activos de COVID-19->activos
  • Nuevos positivos hoy-> new_cases
  • Casos activos en domicilio-> not_used
  • Nuevos curados hoy-> not_used
  • Personas en planta-> not_used
  • En el hospital hoy en día-> Este número menos UCI a hospitalized
  • Personas en urgencias-> not_used
  • Personas en la UCI del HUCE-> intensive_care
  • Fallecidos acumulados->deceased
  • Total de curados->recovered

Tal como se menciona la fecha en la publicación de twitter se entiende que son datos epidemiológicos del día de publicación.

Actualización 28 de Enero: Aparece esta noticia, por la que parece que se unifican dos series de datos. Con las nuevas publicaciones perdemos la visibilidad de activos, casos acumulados PCRy los recovered

Melilla

Tienen su propia pestaña MEL en la hoja de cálculo común. Los datos se recogen diariamente de twitter. Publican una tabla de la que se extraen los datos a copiar en la pestaña de la hoja excel referenciada. La correspondencia de datos entre la tabla y la excel es la siguiente:

  • Nuevos positivos hoy->PCR
  • Positivos acumulados(diagnóstico PCR)->cases_acumulated
  • En el hospital en el día de hoy-> hospitalized
  • En UCI en el día de hoy->intensive_care
  • Fallecidos en el día de hoy->not_used
  • Fallecidos acumulados desde el inicio:deceased
  • Nuevos curados en el día de hoy-> not_used
  • Curados acumulados desde el inicio-> recovered
  • Personas que tienen COVID-19 activo en el día de hoy-> activos
  • Pruebas diagnóstico PCR-> not_used
  • Test rápidos-> not_used

En el mensaje se menciona que los datos son del día anterior hasta las 24:00, luego se etiquetan bajo el día anterior.

Uniprovinciales

Comunidades uniprovinciales: Asturias, Baleares, Cantabria, Madrid, Murcia, Navara y La Rioja (Ceuta y Melilla)

Actualmente: Ver información en la wiki sobre cada provincia. Si no está actualizada cada línea (una línea corresponde a los datos de una provincia en un determinado día) indica la fuente o fuentes del dato original.

Pasado:

  • Desde el 21 de mayo de 2020, que el ISCIII ha dejado de publicar, se usan los datos publicados por las comunidades autónomas que recopila Daniele Grasso eneste repositorio. Se dejó de usar esta fuente el 20 de julio de 2020.
  • Se tomaba la serie histórica del Instituto de Salud Carlos III (https://covid19.isciii.es/resources/serie_historica_acumulados.csv) hasta que dejóde publicarse el 20 de mayo de 2020.
  • Se usan para algunas comunidades autónomas los datos de fallecidos previos al 8 de marzo de 2020 Datadista

Se usaba al principio los datos de RTVE, luego se sustituyó por los datos de los PDF del Ministerio de Sanidad que recopila Datadista.

Datos Comunicados por Sanidad

Adicionalmente, y con el objetivo original de compararlas con los comunicados por las Comunidades Autónomas, añadimos los datos de fallecidos comunicados diariamente por Sanidad por pdf. Los presentamos en dos formatos: formato tabla con una fila por cada {día, comunidad} y en formato matriz, con fecha en Y y comunidades en X.

Datos de vacunaciones

Hemos empezado a recopilar los datos de vacunaciones publicados de Lunes a Viernes por Sanidad en esta dirección.

Esos datos son leídos y replicados aquí. Dejamos dos tipos de ficheros :

  1. Fichero diario con el formato: estado_vacunacion_añomesdía.csv. Con formato año cuatro dígitos, mes y día de dos dígitos.
  2. Fichero de datos acumulados con el nómbre de fichero : estado_vacunacion_.csv

Los campos del csv son los siguientes:

  • date_pub: fecha de publicación del informe
  • ccaa : Comunidad/Ciudad autónoma
  • Dosis entregadas Pfizer : dosis entregadas a la Comunidad/Ciudad
  • Dosis entregadas Moderna : idem
  • Dosis entregadas AstraZeneca : idem
  • Dosis entregadas: suma de las entregadas de los tres fabricantes
  • Dosis administradas % sobre entregadas:cociente de vacunas administradas sobre vacunas entregadas
  • Total pauta completada: total de pautas completadas o dobles vacunaciones
  • Última fecha de actualización de datos: fecha indicada en la tabla como última con actualización
  • Fecha de la ultima vacuna registrada: este campo no está en uso actualmente
  • source_name: nombre la fuente Sanidad en todos los casos
  • source : link al fichero original de los datos