## World Vaccination in Covid-19 

Este notebook contém uma análise do progresso da vacinação de COVID-19 no mundo.

Fonte dos dados: [Our World in Data](https://ourworldindata.org/).

## Importando as libs necessárias

In [None]:
import os
import numpy as np
import scipy as sp
import pandas as pd
import seaborn as sns
from pandas_profiling import ProfileReport
import matplotlib.pyplot as plt
%matplotlib inline

import warnings
warnings.filterwarnings("ignore")

In [None]:
#Importando os datasets
for dirname, _, filenames in os.walk('/kaggle/input'):
    for filename in filenames:
        print(os.path.join(dirname, filename))
        
df = pd.read_csv(dirname +"/country_vaccinations.csv")

## Conhecendo os dados

In [None]:
df.head(5)

In [None]:
df.info()

In [None]:
#Verificando o tamanho do dataframe
df.shape

In [None]:
#Verificando o número de nulos
df.isnull().sum()

A coluna *date* está como tipo object, vamos converter para o tipo *date* para facilitar as operações.

In [None]:
df["date"]= pd.to_datetime(df.date)

In [None]:
#Contando o total de vacinações
df["Total_vaccinations(count)"]= df.groupby("country").total_vaccinations.tail(1)

In [None]:
#Vamos verificar os 20 países com o maior numero de vacinações
df.groupby("country")["Total_vaccinations(count)"].mean().sort_values(ascending= False).head(20)

## Visualização de Dados

In [None]:
#Utilizando o barplot para vizualizar os países com o maior numero de vacinações
x= df.groupby("country")["Total_vaccinations(count)"].mean().sort_values(ascending= False).head(20)
sns.set_style("darkgrid")
plt.figure(figsize= (10,10))
ax= sns.barplot(x.values,x.index)
ax.set_xlabel("Total de vacinações")
ax.set_ylabel("Países")
plt.show()

In [None]:
#20 países com o maior numero de pessoas vacinadas
df["Full_vaccinations(count)"]= df.groupby("country").people_fully_vaccinated.tail(1)

df.groupby("country")["Full_vaccinations(count)"].mean().sort_values(ascending= False).head(20)

In [None]:
#Visualizado
plt.style.use("ggplot")
plt.figure(figsize= (10,10))
ax= sns.barplot(x.values,x.index)
ax.set_xlabel("Pessoas totalmente vacinadas")
ax.set_ylabel("Países")
plt.show()

In [None]:
#Vamos verificar os tipos de vacinas existentes
x=df.vaccines.unique()
y= list(x)
for i in y: print(i)

In [None]:
#Vacinas mais comuns
df.vaccines.value_counts()

In [None]:
plt.figure(figsize=(16,16))
sns.countplot(y= "vaccines",data= df)
plt.ylabel("Vacinas")
plt.xlabel("Vacinas mais populares")
plt.show()

In [None]:
#Progresso da vacinação ao longo dos dias
x= df.groupby("date").daily_vaccinations.sum()
plt.style.use("ggplot")
plt.figure(figsize= (15,5))
sns.lineplot(x.index,x.values)
plt.xlabel("Data")
plt.show()

In [None]:
#Total de vacinações
plt.figure(figsize= (15,5))
sns.lineplot(x= "date",y= "total_vaccinations",data= df)
plt.xlabel("Data")
plt.ylabel("Total de Vacinações")
plt.show()

In [None]:
#Países com as maiores médias diárias de vacinação
x= df.groupby("country").daily_vaccinations.mean().sort_values(ascending= False).head(20)
x

In [None]:
#daily vaccinations barplot
plt.figure(figsize= (6,6))
ax= sns.barplot(x.values,x.index)
ax.set_title("Países com maiores médias diárias de vacinação")
ax.set_xlabel("Média diária de vacinação")
ax.set_ylabel("Países")
plt.show()

In [None]:
#Vacinação no Brazil
plt.figure(figsize= (15,5))
plt.xlabel("Data")
plt.ylabel("Vacinação diária")
plt.title("Evolução da vacinação no Brasil")
sns.lineplot(x= "date",y= "daily_vaccinations",data= df[df.country== "Brazil"])
plt.show()

In [None]:
#Total de vacinação no Brasil
plt.figure(figsize= (15,5))
plt.xlabel("Data")
plt.ylabel("Total de Vacinação")
plt.title("Total de vacinação no Brasil")
sns.lineplot(x= "date",y= "total_vaccinations",data= df[df["country"]=="Brazil"])
plt.show()

In [None]:
#Evolução das pessoas vacinadas
plt.figure(figsize= (15,5))
sns.lineplot(x= "date",y= "people_vaccinated_per_hundred",data= df[df["country"]=="Brazil"])
plt.show()

In [None]:
#Vacinas mais utilizadas no Brasil
x= df[df["country"]=="Brazil"]
z= x.vaccines.value_counts()
c= list(z.index)
c

Vamos comparar o Brasil com os países com maior numero de vacinação

In [None]:
x= df.loc[(df.country== "United States") | (df.country== "China")| (df.country== "India")| (df.country== "Unted Kingdom")|(df.country== "England")|(df.country == "Brazil")]

In [None]:
#Comparação do total de vacinações
plt.figure(figsize= (15,5))
sns.lineplot(x= "date",y= "total_vaccinations" ,data= x,hue= "country")
plt.xlabel("Data")
plt.ylabel("Total de Vacinação")
plt.title("Comparação do total de vacinação")
plt.show()

In [None]:
#Comparação diária de vacinação
plt.figure(figsize= (15,5))
sns.lineplot(x= "date",y= "daily_vaccinations" ,data= x,hue= "country")
plt.xlabel("Data")
plt.ylabel("Evolução diária da vacinação")
plt.title("Comparação diária da vacinação")
plt.show()

In [None]:
#Comparação de pessoas vacinadas
plt.figure(figsize= (15,5))
sns.lineplot(x= "date",y= "people_fully_vaccinated" ,data= x,hue= "country")
plt.xlabel("Data")
plt.ylabel("Pessoas vacinadas")
plt.title("Evolução do total de pessoas vacinadas")
plt.show()