# Global Corona Pandemic Analysis Mini Project

En la historia de la humanidad se han producido varias situaciones pandémicas.

Cada vez que aparece una nueva epidemia, la humanidad ha intentado encontrar nuevas vacunas y tratamientos. En cada caso, lo más importante ha sido realizar investigaciones epidemiológicas fiables y divulgar los resultados de forma transparente.

La humanidad creó nuevas vacunas y tratamientos basándose en datos divulgados públicamente e intentó encontrar un camino hasta que se dispusiera de una alternativa.

En la situación de pandemia, diversos análisis de datos, como: 

        ¿cuántas personas están infectadas en la actualidad?
        ¿dónde están las regiones en las que las personas infectadas están disminuyendo actualmente? 
        ¿cuál es la edad y el entorno vital en el que el número de personas infectadas es elevado? 
        ¿el número de personas infectadas está disminuyendo debido a la eficacia de la vacuna?
        y la visualización de datos para que la gente los entienda más fácilmente han hecho muchas contribuciones.
        
A través de este miniproyecto, también estamos intentando obtener estadísticas descriptivas sobre qué países tienen el mayor número de infecciones basándonos en los datos relacionados con la corona disponibles para el público.

El resultado mostrará el nivel de infección acumulado en un mapa del mundo para que cualquiera pueda comprobarlo de un vistazo.

Utilizamos los datos de la base de datos **Vacunaciones contra el coronavirus (COVID-19)** recogidos en tiempo real por https://ourworldindata.org/

Podemos utilizar los datos necesarios para la práctica en `covid-vaccination-doses-per-capita.csv`.

Como referencia, debemos entender que algunos datos están excluidos porque algunos países no revelan los datos al mundo.
los datos al mundo, pero aún así podemos practicar con los datos proporcionados.

In [9]:
import pandas as pd
import numpy as np
import datetime
import matplotlib.pyplot as plt
from datetime import datetime, date, time, timezone

In [19]:
vac_df = pd.read_csv("covid-vaccination-doses-per-capita.csv")
vac_df.head()

Unnamed: 0,Date,Entity,Code,total_vaccinations_per_hundred
0,2020-01-03,Afghanistan,AFG,
1,2020-01-04,Afghanistan,AFG,
2,2020-01-05,Afghanistan,AFG,
3,2020-01-06,Afghanistan,AFG,
4,2020-01-07,Afghanistan,AFG,


In [21]:
vac_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 339584 entries, 0 to 339583
Data columns (total 4 columns):
 #   Column                          Non-Null Count   Dtype  
---  ------                          --------------   -----  
 0   Date                            339584 non-null  object 
 1   Entity                          339584 non-null  object 
 2   Code                            339584 non-null  object 
 3   total_vaccinations_per_hundred  78477 non-null   float64
dtypes: float64(1), object(3)
memory usage: 10.4+ MB


# Paso 1
**Convierte el índice a tipo datetime**

In [None]:
...
vac_df.head()

**Comprueba cuantos países hay en el dataframe**

Si todo es correcto deberías obtener 255 países.

## Paso 2
**Crea un grupo alrededor de la columna Entity y cree un nuevo dataframe para almacenar los datos acumulados por país.**

In [22]:
covid_c = ...

Si ves el resultado del código siguiente, podrás comprobar que el número de filas (longitud del dataframe) del dataframe para cada clave (que en este caso será el nombre del país) es diferente. Esto significa que el estado real del suministro de datos es diferente para cada país.

Recuerda que esto es representativo de una de las situaciones del mundo real.

In [None]:
for key, group in covid_c:
    print("+key: ", key)
    print("+number: ", len(group))
    print(group.head())
    print("\n")


**Guarda el total de cada grupo en un nuevo dataframe.**

Crea estadísticas sobre el número acumulado de casos por 100 personas en cada país desde el momento del brote corona hasta la actualidad.

In [23]:
total_df = ...
total_df.head()

Unnamed: 0_level_0,total_vaccinations_per_hundred
Entity,Unnamed: 1_level_1
Afghanistan,3395.65
Africa,28974.53
Albania,13692.69
Algeria,664.55
American Samoa,0.0


## Paso 3
Hemos aprendido y practicado la visualización de datos de gráficos para diversas estadísticas descriptivas utilizando matplotlib o seaborn.

Sin embargo, en el campo de la visualización de datos, hay muchos casos de uso con representación en mapas.

El resultado de este mini-proyecto es expresar la situación del coronavirus en forma de dataframes cambiando el color según el peso en el mapa del mundo.

Antes de resolver el proyecto, aprenderemos a expresar datos en el mapa utilizando la biblioteca `folium`.

https://python-visualization.github.io/folium/

1. Instalar la librería folium

In [None]:
!pip install folium

2. Obtenga la información de coordenadas de la ubicación que desee:
 
    * Ve a https://www.google.com/maps
    * Busca la ubicación que desees en el mapa o muévela arrastrando el ratón.
    * Haz clic con el botón derecho del ratón en la ubicación de la que quieras obtener información precisa sobre la latitud y la longitud.
    * Al hacer clic en la información de coordenadas, la información se copia automáticamente en el portapapeles

3. Crea un mapa

In [None]:
import folium

map = folium.Map(location=[39.47935451253497, -0.33859413702953073],
                 zoom_start=18)

map

4) Aplica un estilo al mapa:
 
    * tamenterrain
    * stamentoner
    * stamenwatercolor
    * cartodbpositron
    * cartodbdark_matter
    * openstreetmap
 

In [None]:
map = folium.Map(location=[39.47935451253497, -0.33859413702953073],
                 zoom_start=18,
                tiles="stamenwatercolor")

map

5. Cómo mostrar iconos de marcador e información en lugares específicos

In [None]:
marker_map = folium.Map(location=[45.372, -121.6972], zoom_start=12, tiles="Stamen Terrain")

folium.Marker(
    location=[45.3288, -121.6625],
    popup="Mt. Hood Meadows",
    icon=folium.Icon(icon="cloud"),
).add_to(marker_map)

folium.Marker(
    location=[45.3211, -121.7113],
    popup="Timberline Lodge",
    icon=folium.Icon(color="green"),
).add_to(marker_map)

folium.CircleMarker(
    location=[45.3800, -121.600],
    radius=100,
    popup="circle",
    color="#3186cc",
    fill=True,
    fill_color="#3186cc",
).add_to(marker_map)

marker_map

6. Cómo mostrar un diagrama coroplético en el mapa

Es un método para visualizar datos mediante el coloreado del área delimitada por unos límites en un mapa, como por ejemplo fronteras o límites administrativos.

La intensidad de color aumenta y se hace más oscura conforme aumenta el valor de la información a representar.

In [None]:
import pandas as pd
import folium

url = "https://raw.githubusercontent.com/python-visualization/folium/master/examples/data"

state_geo = f"{url}/us-states.json"
state_unemployment = f"{url}/US_Unemployment_Oct2012.csv"
state_data = pd.read_csv(state_unemployment)

m = folium.Map(location=[48, -102], zoom_start=3)

folium.Choropleth(
    geo_data=state_geo,
    name="choropleth",
    data=state_data,
    columns=["State", "Unemployment"],
    key_on="feature.id",
    fill_color="YlGn",
    fill_opacity=0.7,
    line_opacity=0.2,
    legend_name="Unemployment Rate (%)",
).add_to(m)

folium.LayerControl().add_to(m)

m

## Paso 4
Podemos visualizar el dataframe ya procesado del número acumulado de casos confirmados por 100 personas en cada país aplicando el método de visualización al mapa aprendido en el paso 3.

https://ourworldindata.org/covid-vaccination-global-projections

In [2]:
import folium
import json
import urllib.request

center = [35.762887375145795, 84.08313219586536]

m = folium.Map(location=center, zoom_start=2,
               max_bounds=True,
               min_zoom=1,
               min_lat=-84, max_lat=84,
               min_lon=-175, max_lon=187,
              )

geo_path = "https://raw.githubusercontent.com/javipalanca/numpy_pandas/main/World_Countries_Generalized.geojson"


with urllib.request.urlopen(geo_path) as url:
    json_data = json.load(url)

folium.Choropleth(geo_data=json_data,
                  data=total_df,
                  columns=(df.index, "total_vaccinations_per_hundred"),
                  key_on="properties.ADMIN",
                  fill_color="RdYlGn",
                  fill_opacity=0.7,
                  line_opacity=0.5,
                 ).add_to(m)

folium.LayerControl().add_to(m)

m

NameError: name 'total_df' is not defined