In [1]:
from convida import COnVIDa
from datatype import DataType
from regions import Regions
from regionalgranularity import RegionalGranularity
from temporalgranularity import TemporalGranularity
import pandas as pd

## Testing

In [2]:
COnVIDa.get_data_types()

['DataType.TEMPORAL', 'DataType.GEOGRAPHICAL']

In [3]:
COnVIDa.get_data_items_names(DataType.TEMPORAL)

{'AEMETDataSource': ['Precipitación',
  'Presión máxima',
  'Presión mínima',
  'Racha máxima',
  'Insolación',
  'Temperatura máxima',
  'Temperatura media',
  'Temperatura mínima',
  'Velocidad viento',
  'Altitud',
  'Dirección racha'],
 'COVID19DataSource': ['Incidencia acumulada en los últimos 14 días',
  'Media de casos detectados en 7 días',
  'Media de casos PCR confirmados en los últimos 7 días',
  'Media de fallecidos en los últimos 7 días',
  'Media de fallecidos en los últimos 3 días',
  'Casos diarios',
  'Casos diarios PCR',
  'Casos diarios anticuerpos',
  'Casos diarios prueba antígenos',
  'Casos diarios prueba Elisa',
  'Casos diarios de pruebas desconocidas',
  'Fallecidos diarios',
  'Porcentaje de nuevos fallecidos respecto de día anterior',
  'Casos detectados en los últimos 14 días',
  'Fallecidos en los últimos 7 días',
  'Casos acumulados',
  'Casos acumulados PCR',
  'Casos acumulados hospitalizados',
  'Casos acumulados UCI',
  'Casos acumulados fallecidos',


In [4]:
COnVIDa.get_data_items_names(DataType.GEOGRAPHICAL)

{'INEDataSource': ['Actividad física',
  'Índice de masa corporal (IMC)',
  'Tabaquismo',
  'Hogares por tipo de familia',
  'Hogares por densidad de ocupación',
  'Mayores de 65 años solos']}

In [5]:
print(COnVIDa.get_data_items_descriptions(DataType.GEOGRAPHICAL))
print(COnVIDa.get_data_items_descriptions(DataType.GEOGRAPHICAL, 'EN'))

{'INEDataSource': ['Nivel de actividad física según sexo y comunidad autónoma. Población de 15 a 69 años', 'Índice de masa corporal población adulta según sexo y comunidad autónoma. Población de 18 y más años', 'Consumo de tabaco según sexo y comunidad autónoma. Población de 15 y más años', 'Número de hogares por comunidades autónomas según el tipo de hogar y el tamaño del hogar', 'Población residente por comunidades autónomas según tamaño del hogar y densidad de población', 'Número de hogares unipersonales con mayores de 65 años por comunidades autónomas según sexo']}
{'INEDataSource': ['Level of physical activity by sex and autonomous community. Population from 15 to 69 years old', 'Body mass index of adult population by sex and autonomous community. Population aged 18 years old and above', 'Tobacco consumption by sex and autonomous community. Population aged 15 years old and above', 'Number of households by autonomous community by type of household and size of household', 'Resident 

In [6]:
print(COnVIDa.get_data_items_descriptions(DataType.TEMPORAL))
print(COnVIDa.get_data_items_descriptions(DataType.TEMPORAL, 'EN'))

{'AEMETDataSource': ['Precipitación diaria de 07 a 07', 'Presión máxima al nivel de referencia de la estación', 'Presión mínima al nivel de referencia de la estación', 'Racha máxima del viento', 'Horas de sol fuerte', 'Temperatura máxima del día', 'Temperatura media del día', 'Temperatura mínima del día', 'Velocidad media del viento', 'Altitud de la estación en m sobre el nivel del mar', 'Dirección de la racha máxima'], 'COVID19DataSource': ['Incidencia acumulada 14 días (casos en los últimos 14 días por cada 100.000 habitantes)', 'Media de casos detectados (ventana de 7 días)', 'Media de casos (ventana de 7 días) de casos con prueba de laboratorio PCR o técnicas moleculares', 'Media de fallecidos en una ventana de 7 días', 'Media de fallecidos en una ventana de 3 días', 'El número de casos diarios totales, confirmados o probables', 'El número de casos diarios con prueba de laboratorio PCR o técnicas moleculares', 'El número de casos diarios con prueba de laboratorio de test rápido de 

In [7]:
print(COnVIDa.get_data_items_units(DataType.GEOGRAPHICAL))
print(COnVIDa.get_data_items_units(DataType.GEOGRAPHICAL, 'EN'))

{'INEDataSource': ['Miles de personas', '', 'Miles de personas', 'Miles de hogares', 'Miles de personas', 'Miles de hogares unipersonales']}
{'INEDataSource': ['Thousands of persons', '', 'Thousands of persons', 'Thousands of households', 'Thousands of persons', 'Thousands of single-person households']}


In [8]:
print(COnVIDa.get_data_items_units(DataType.TEMPORAL))
print(COnVIDa.get_data_items_units(DataType.TEMPORAL, 'EN'))

{'AEMETDataSource': ['Milímetros (mm)', 'Hectopascales (hPa)', 'Hectopascales (hPa)', 'Metros por segundo (m/s)', 'Horas (h)', 'Grados Celsius (°C)', 'Grados Celsius (°C)', 'Grados Celsius (°C)', 'Metros por segundo (m/s)', 'Metros (m)', 'Decenas de grado (°)'], 'COVID19DataSource': ['Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Porcentaje (%)', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Número de personas', 'Porcentaje (%)', 'Número de dosis', 'Número de dosis', 'Porcentaje (%)', 'Porcentaje (%)'], 'MobilityDataSource': ['Porcentaje (%)', 'Porcentaje (%)', 'Porcentaje (%)',

In [9]:
Regions.get_regions('ES')

['España',
 'CA Andalucía',
 'CA Aragón',
 'CA Principado de Asturias',
 'CA Islas Baleares',
 'CA Canarias',
 'CA Cantabria',
 'CA Castilla-La Mancha',
 'CA Castilla y León',
 'CA Cataluña',
 'CA Ceuta',
 'CA Comunidad Valenciana',
 'CA Extremadura',
 'CA Galicia',
 'CA Comunidad de Madrid',
 'CA Melilla',
 'CA Región de Murcia',
 'CA Comunidad Foral de Navarra',
 'CA País Vasco',
 'CA La Rioja']

In [10]:
COnVIDa.get_data_types()
COnVIDa.get_sources_info()

('INEDataSource', <DataType.GEOGRAPHICAL: 1>, None, [<RegionalGranularity.COMMUNITY: 0>], 'literal_ine', <DataFormat.JSON: 0>, 90, ['actividad_fisica', 'imc', 'tabaco', 'hogares_tipo_familia', 'hogares_densidad_ocupacion', 'mayores_65_solos'], {'actividad_fisica': {'display_name': {'ES': 'Actividad física', 'EN': 'Physical activity'}, 'description': {'ES': 'Nivel de actividad física según sexo y comunidad autónoma. Población de 15 a 69 años', 'EN': 'Level of physical activity by sex and autonomous community. Population from 15 to 69 years old'}, 'data_unit': {'ES': 'Miles de personas', 'EN': 'Thousands of persons'}, '_id': '04013.px', 'funcion': 'DATOS_TABLA', 'codigo': '/t15/p419/a2017/p03/l0/', 'num_datos': '10', 'formato': 'VALORES_ABSOLUTOS_CCAA'}, 'imc': {'display_name': {'ES': 'Índice de masa corporal (IMC)', 'EN': 'Body mass index (BMI)'}, 'description': {'ES': 'Índice de masa corporal población adulta según sexo y comunidad autónoma. Población de 18 y más años', 'EN': 'Body mas

### 3.1 COVID testing

In [11]:
start = pd.to_datetime('2021-01-01', format='%Y-%m-%d')
end = pd.to_datetime('today', format='%Y-%m-%d')

data_items = COnVIDa.get_data_items_names()['COVID19DataSource']

regions = Regions.get_regions('ES')

In [None]:
data = COnVIDa.get_data_items(regions=[regions[0]],
                              data_items=[data_items[0]], 
                              start_date=start, 
                              end_date=end,
                              errors='raise')
display(data.tail(5))

In [None]:
data = COnVIDa.get_data_items(regions=regions[0:5],
                              data_items=[data_items[0]], 
                              start_date=start, 
                              end_date=end)
display(data.tail(2))

In [None]:
data.sample(5)

In [None]:
data = COnVIDa.get_data_items(regions=[regions[0]],
                              data_items=data_items[0:5], 
                              start_date=start, 
                              end_date=end)
display(data.tail(2))

In [None]:
data = COnVIDa.get_data_items(regions=regions,
                              data_items=data_items, 
                              start_date=start, 
                              end_date=end)
display(data.tail(2))

In [None]:
start = pd.to_datetime('2020-06-07', format='%Y-%m-%d')
end = pd.to_datetime('today', format='%Y-%m-%d')
data = COnVIDa.get_data_items(regions=['Murcia','Madrid','Andalucía'],
                              data_items=['Altas', 'Casos','Fallecidos'], 
                              start_date=start, 
                              end_date=end)
display(data)

In [None]:
data.to_markdown()

### 3.2 INE testing

In [17]:
data_items = COnVIDa.get_data_items_names()['INEDataSource']

regions = Regions.get_regions('ES')

In [18]:
data = COnVIDa.get_data_items(regions=[regions[0]],
                              data_items=[data_items[0]], 
                              start_date=start, 
                              end_date=end)

Assumed a TEMPORAL data retrieval...


In [None]:
data = COnVIDa.get_data_items(regions=[regions[0]],
                              data_items=[data_items[0]])
display(data.tail(3))

In [None]:
data = COnVIDa.get_data_items(regions=regions[0:5],
                              data_items=[data_items[0]])
display(data.tail(2))

In [None]:
data = COnVIDa.get_data_items(regions=[regions[0]],
                              data_items=data_items[0:5])
display(data.tail(2))

In [None]:
data = COnVIDa.get_data_items(regions=regions,
                              data_items=data_items)
display(data.tail(2))

### 3.3 Mobility testing

In [21]:
start = pd.to_datetime('2020-05-01', format='%Y-%m-%d')
end = pd.to_datetime('today', format='%Y-%m-%d')

data_items = COnVIDa.get_data_items_names()['MobilityDataSource']

regions = Regions.get_regions('ES')

In [None]:
data = COnVIDa.get_data_items(regions=[regions[0]],
                              data_items=[data_items[0]], 
                              start_date=start, 
                              end_date=end, errors='raise')
display(data.sample(5))

In [None]:
data = COnVIDa.get_data_items(regions=regions[0:5],
                              data_items=[data_items[0]], 
                              start_date=start, 
                              end_date=end, errors='raise')
display(data.sample(2))

In [None]:
data = COnVIDa.get_data_items(regions=[regions[0]],
                              data_items=data_items[0:5], 
                              start_date=start, 
                              end_date=end, errors='raise')
display(data.sample(2))

In [None]:
data = COnVIDa.get_data_items(regions=regions,
                              data_items=data_items, 
                              start_date=start, 
                              end_date=end, errors='raise')
display(data.sample(2))

### 3.4 MoMo testing

In [10]:
start = pd.to_datetime('2020-05-01', format='%Y-%m-%d')
end = pd.to_datetime('today', format='%Y-%m-%d')

data_items = COnVIDa.get_data_items_names()['MoMoDataSource']

regions = Regions.get_regions('ES')

In [11]:
print(regions)

['España', 'CA Andalucía', 'CA Aragón', 'CA Principado de Asturias', 'CA Islas Baleares', 'CA Canarias', 'CA Cantabria', 'CA Castilla-La Mancha', 'CA Castilla y León', 'CA Cataluña', 'CA Ceuta', 'CA Comunidad Valenciana', 'CA Extremadura', 'CA Galicia', 'CA Comunidad de Madrid', 'CA Melilla', 'CA Región de Murcia', 'CA Comunidad Foral de Navarra', 'CA País Vasco', 'CA La Rioja']


In [None]:
data = COnVIDa.get_data_items(regions=[regions[0]],
                              data_items=[data_items[0]], 
                              start_date=start, 
                              end_date=end)
display(data.tail(5))

In [None]:
data = COnVIDa.get_data_items(regions=regions[0:5],
                              data_items=[data_items[0]], 
                              start_date=start, 
                              end_date=end)
display(data.tail(2))

In [None]:
data = COnVIDa.get_data_items(regions=[regions[0]],
                              data_items=data_items[0:5], 
                              start_date=start, 
                              end_date=end)
display(data.tail(2))

In [None]:
data = COnVIDa.get_data_items(regions=regions,
                              data_items=data_items, 
                              start_date=start, 
                              end_date=end)
display(data.tail(2))

### 3.5 AEMET testing

In [None]:
start = pd.to_datetime('2020-05-01', format='%Y-%m-%d')
end = pd.to_datetime('today', format='%Y-%m-%d')

data_items = COnVIDa.get_data_items_names()['AEMETDataSource']

regions = Regions.get_regions('ES')

In [None]:
data = COnVIDa.get_data_items(regions=[regions[0]],
                              data_items=[data_items[0]], 
                              start_date=start, 
                              end_date=end,
                              errors='raise')
display(data.sample(5))

In [None]:
data = COnVIDa.get_data_items(regions=regions[0:5],
                              data_items=[data_items[0]], 
                              start_date=start, 
                              end_date=end,
                              errors='raise')
display(data.sample(2))

In [None]:
data = COnVIDa.get_data_items(regions=[regions[0]],
                              data_items=data_items[0:5], 
                              start_date=start, 
                              end_date=end)
display(data.sample(2))

In [None]:
data = COnVIDa.get_data_items(regions=regions,
                              data_items=data_items, 
                              start_date=start, 
                              end_date=end)
display(data.sample(2))

### 4. TEMPORAL testing (joining different sources)

In [None]:
start = pd.to_datetime('2020-05-01', format='%Y-%m-%d')
end = pd.to_datetime('today', format='%Y-%m-%d')

In [None]:
data = COnVIDa.get_data_items(regions=['Murcia'],
                              data_items=['Altas', 'Casos', 'Precipitación','Insolación'], 
                              start_date=start,
                              end_date=end)
display(data.sample(5))

In [None]:
data = COnVIDa.get_data_items(regions=['Murcia','Andalucía'],data_items=['Altas', 'Casos', 'Precipitación','Insolación','Supermercados y farmacias','Conducción','Parques'], start_date=start, end_date=end)
display(data.sample(10))

In [None]:
data = COnVIDa.get_data_items(regions=['Murcia','Andalucía','Madrid'],data_items=['Altas', 'Casos', 'Precipitación','Insolación','Supermercados y farmacias', 'Parques', 'Residencial'], start_date=start, end_date=end)
display(data.sample(10))

In [None]:
data.head(2)

In [None]:
data.tail(2)

### 5. Internal testing

In [None]:
COnVIDa.get_data_items_names(DataType.TEMPORAL,language='internal')

In [None]:
start = pd.to_datetime('2020-03-01', format='%Y-%m-%d')
end = pd.to_datetime('today', format='%Y-%m-%d')

In [None]:
data = COnVIDa.get_data_items(regions=['Murcia'],
                              data_items=['parks_percent_change_from_baseline',
                                          'casos','confirmados_pcr',
                                          'prec',
                                          'presMax',
                                          'defunciones_observadas',
                                          'defunciones_observadas_lim_inf',
                                          'defunciones_observadas_lim_sup',], 
                              start_date=start,
                              end_date=end,
                              language='internal')
display(data.sample(5))

In [None]:
data = COnVIDa.get_data_items(regions=['Murcia','Andalucía'],
                              data_items=['parks_percent_change_from_baseline',
                                           'casos',
                                           'confirmados_pcr',
                                           'prec',
                                           'presMax',
                                           'defunciones_observadas',
                                           'defunciones_observadas_lim_inf',
                                           'defunciones_observadas_lim_sup'],  
                              start_date=start, 
                              end_date=end,
                              language='internal')
display(data.sample(10))

In [None]:
data = COnVIDa.get_data_items(regions=['Murcia','Andalucía','Madrid','Asturias'],
                              data_items=['parks_percent_change_from_baseline',
                                           'casos',
                                           'confirmados_pcr',
                                           'prec',
                                           'presMax',
                                           'defunciones_observadas',
                                           'defunciones_observadas_lim_inf',
                                           'defunciones_observadas_lim_sup'],  
                              start_date=start, 
                              end_date=end,
                              language='internal')
display(data.sample(10))

In [None]:
data.head(2)

In [None]:
data.tail(2)