# SOLEMNE 1 MINERÍA DE DATOS

En este trabajo se realizará un análisis de datos sobre el COVID-19 y su impacto, para ello se utilizará un conjunto de datos públicos relacionados con el COVID-19 disponibles en BigQuery en la página de Google Cloud Platform

## Desarrollo de la Actividad

El primer paso a realizar es utlizar un paquete de python para así utilizar Bigquery, el cual corresponde al escrito en la siguiente línea de código. Además, se definirá un "cliente" el cuál nos permitirá recopilar la información adquirida por la base de datos.

In [1]:
from google.cloud import bigquery

client = bigquery.Client(project='pegasus-418020')

El nombre de pegasus corresponde al de un proyecto creado en Google Cloud Platform, en el cual mediante él se accederá a la base de datos que se utilizará.

El conjunto de datos públicos utilizado corresponde a la respuesta del gobierno frente a la pandemia debido al COVID-19, perteneciente a la Universidad de Oxford. Este set de datos es bastante interesante debido a que Inglaterra fue uno de los países que a pesar de presentar un rápido aumento de casos de COVID-19 a inicios del año 2020, se convirtió en uno de los primeros países que mantuvo un control de esta epidemia, conviertiéndose en el primer país del mundo en aprobar la vacuna Pfizer/BioNTech, empezar una vacuanción masiva y desarrollar la vacuna Oxford-AstraZeneca (todos estos eventos mencionados anteriormente se dieron a lugar en diciembre del año 2020). Debido a estos eventos y al involucramiento de la Universidad de Oxford en el desarrollo de una vacuna que hizo frente a la pandemia, es que se utilizarán estos datos.  

A continuación se presenta el código que permitirá acceder a los datos proporcionados por la Universidad de Oxford.

In [2]:
dataset_ref = client.dataset("covid19_govt_response", project="bigquery-public-data")

dataset = client.get_dataset(dataset_ref)

In [3]:
# List all the tables in the "hacker_news" dataset
tables = list(client.list_tables(dataset))

# Print names of all tables in the dataset (there are four!)
for table in tables:  
    print(table.table_id)

oxford_policy_tracker


In [4]:
# Construct a reference to the "full" table
table_ref = dataset_ref.table("oxford_policy_tracker")

# API request - fetch the table
table = client.get_table(table_ref)

In [5]:
table.schema

[SchemaField('country_name', 'STRING', 'NULLABLE', None, 'Name of the country', (), None),
 SchemaField('alpha_3_code', 'STRING', 'NULLABLE', None, '3-letter alpha code abbreviation of the country/region. See `bigquery-public-data.utility_us.country_code_iso` for more details', (), None),
 SchemaField('region_name', 'STRING', 'NULLABLE', None, 'Name of the region within the country', (), None),
 SchemaField('region_code', 'STRING', 'NULLABLE', None, 'Code of the region within the country', (), None),
 SchemaField('date', 'DATE', 'NULLABLE', None, 'Date of the measured policy action status', (), None),
 SchemaField('school_closing', 'STRING', 'NULLABLE', None, 'C1 - Ordinal scale record closings of schools and universities; 0 - No measures 1 - recommend closing 2 - Require closing (only some levels or categories eg just high school or just public schools) 3 - Require closing all levels No data - blank', (), None),
 SchemaField('school_closing_flag', 'STRING', 'NULLABLE', None, 'Are C1 a

In [6]:
client.list_rows(table, max_results=15).to_dataframe()

Unnamed: 0,country_name,alpha_3_code,region_name,region_code,date,school_closing,school_closing_flag,school_closing_notes,workplace_closing,workplace_closing_flag,...,contact_tracing_notes,emergency_healthcare_investment,emergency_healthcare_investment_notes,vaccine_investment,vaccine_investment_notes,misc_wildcard,misc_wildcard_notes,confirmed_cases,deaths,stringency_index
0,Aruba,ABW,,,2021-09-07,2.0,1.0,,,,...,,,,,,,,14913,151,37.96
1,Aruba,ABW,,,2021-09-08,,,,,,...,,,,,,,,14955,153,37.96
2,Aruba,ABW,,,2021-09-09,,,,,,...,,,,,,,,14991,154,37.96
3,Afghanistan,AFG,,,2021-08-25,,,,,,...,,,,,,,,152722,7090,
4,Afghanistan,AFG,,,2021-08-26,,,,,,...,,,,,,,,152822,7093,
5,Afghanistan,AFG,,,2021-08-27,,,,,,...,,,,,,,,152960,7101,
6,Afghanistan,AFG,,,2021-08-28,,,,,,...,,,,,,,,152960,7101,
7,Afghanistan,AFG,,,2021-08-29,,,,,,...,,,,,,,,152960,7101,
8,Afghanistan,AFG,,,2021-08-30,,,,,,...,,,,,,,,153148,7116,
9,Afghanistan,AFG,,,2021-08-31,,,,,,...,,,,,,,,153220,7118,


In [7]:
client.list_rows(table, selected_fields=table.schema[:25], max_results=10).to_dataframe()

Unnamed: 0,country_name,alpha_3_code,region_name,region_code,date,school_closing,school_closing_flag,school_closing_notes,workplace_closing,workplace_closing_flag,...,restrictions_on_gatherings_flag,restrictions_on_gatherings_notes,close_public_transit,close_public_transit_flag,close_public_transit_notes,stay_at_home_requirements,stay_at_home_requirements_flag,stay_at_home_requirements_notes,restrictions_on_internal_movement,restrictions_on_internal_movement_flag
0,Aruba,ABW,,,2021-09-07,2.0,1.0,,,,...,,,,,,,,,,
1,Aruba,ABW,,,2021-09-08,,,,,,...,,,,,,,,,,
2,Aruba,ABW,,,2021-09-09,,,,,,...,,,,,,,,,,
3,Afghanistan,AFG,,,2021-08-25,,,,,,...,,,,,,,,,,
4,Afghanistan,AFG,,,2021-08-26,,,,,,...,,,,,,,,,,
5,Afghanistan,AFG,,,2021-08-27,,,,,,...,,,,,,,,,,
6,Afghanistan,AFG,,,2021-08-28,,,,,,...,,,,,,,,,,
7,Afghanistan,AFG,,,2021-08-29,,,,,,...,,,,,,,,,,
8,Afghanistan,AFG,,,2021-08-30,,,,,,...,,,,,,,,,,
9,Afghanistan,AFG,,,2021-08-31,,,,,,...,,,,,,,,,,


In [8]:
query = """
    SELECT *
    FROM `bigquery-public-data.covid19_govt_response.oxford_policy_tracker`
    ORDER BY date DESC 
    LIMIT 10
"""

# Ejecuta la consulta y obtén los resultados
query_job = client.query(query)

# Imprime los resultados
for row in query_job:
    print(row)

Row(('Argentina', 'ARG', None, None, datetime.date(2021, 9, 10), None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, 75.93), {'country_name': 0, 'alpha_3_code': 1, 'region_name': 2, 'region_code': 3, 'date': 4, 'school_closing': 5, 'school_closing_flag': 6, 'school_closing_notes': 7, 'workplace_closing': 8, 'workplace_closing_flag': 9, 'workplace_closing_notes': 10, 'cancel_public_events': 11, 'cancel_public_events_flag': 12, 'cancel_public_events_notes': 13, 'restrictions_on_gatherings': 14, 'restrictions_on_gatherings_flag': 15, 'restrictions_on_gatherings_notes': 16, 'close_public_transit': 17, 'close_public_transit_flag': 18, 'close_public_transit_notes': 19, 'stay_at_home_requirements': 20, 'stay_at_home_requirements_flag': 21, 'stay_at_home_requirements_