<a href="https://colab.research.google.com/github/eduardocorrearaujo/Panaroma-da-COVID-19-no-mundo/blob/master/Proj_Panorama_do_COVID_19_no_Mundo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Panorama do COVID-19 no Mundo

A pandemia do **COVID-19** colocou o mundo em estado de alerta. 

O COVID-19 é causado pelo vírus **SARS-CoV - 2** , também chamado de *novo coronavírus*, já que pertence a família dos coronavírus, que são vírus que atingem o sistema respiratório. 

O coronavírus se espalha por meio de gotículas espelidas por pessoas infectadas ao  tossir, espirrar ou exalar. Apesar de grande parte dos infectados terem sintomas leves ou moderados, uma parte dos que são acometidos gravemente pela doença precisam de respiradores mecânicos e tem uma recuperação lenta.

Até o momento não há medicação comprovada que cura o **COVID-19** ou uma vacina para doença. Nesse sentido, faz-se necessário o acompanhamento do números de infectados para garantir que o sistema de saúde consiga atender a todos os doentes.

Por essa razão, será realizada essa análise a respeito dos dados de coronavírus no mundo.


<center><img alt="Colaboratory logo" width="50%" src="https://raw.githubusercontent.com/eduardocorrearaujo/ic/master/24555.jpg"></center>



## Obtenção dos Dados


Os dados utilizados nessa análise são provenientes da plataforma **Our World in Data** e estão disponíveis [neste link](https://github.com/owid/covid-19-data/tree/master/public/data). 


A análise de novos doenças possui diversos empecilhos,sendo comum haver divergências entre dados de diferentes fontes. Essa diferença entre os dados, se não justificada pelo seu emissor pode levar a insights errados sobre a doença o que prejudica o seu combate.

**É importante ressaltar que as análises realizadas nesse artigo mostram apenas uma tendência de comportamento da doença, já que em relação ao COVID-19 temos o problema da subnotificação de casos que é diferente para cada região e afeta diretamente os dados. Além disso, a população, capacidade hospitalar e medidas de combate adotadas por cada país também impactam diretamente o número de casos, sendo necessário uma análise mais aprofundada desses dados para insights conclusivos.**

### Dicionário de Variáveis

Nessa seção é descrito o que cada uma das colunas do dataframe representa.

* `iso_code` - ISO 3166-1 alpha - 3 - Código de três letras para os países
* `continent` - Continente da localização geográfica das regiões analisadas
* `location` - Localização geográfica
* `date` - Data da observação 
* `total_cases` - Total de casos confirmados de COVID-19
* `new_cases` - Novos casos confirmados de COVID-19
* `total_deaths` - Total de mortes atribuídas ao COVID-19
* `new_deaths` - novas mortes atribuídas ao COVID-19
* `total_cases_per_million` - Total de casos confirmados de COVID-19 por milhão de habitantes
* `new_cases_per_miliion` - Novos casos confirmados por milhão de habitantes
* `total_deaths_per_million` - Total de mortes atribuídas ao COVID-19 por milhão de habitantes
* `new_deaths_per_million` - Novas mortes atribuídas ao COVID-19 por milhões de habitantes 
* `total_tests` - Total de testes para COVID-19
* `new_tests` - Novos testes para COVID-19
* `news_tests_smoothed` - Novos testes para COVID-19 (suavizado por 7 dias). Para países que não relatam dados de teste diariamente, assumimos que o teste mudou igualmente diariamente em qualquer período em que nenhum dado foi relatado. Isso produz uma série completa de números diários, que são calculados em média em uma janela de 7 dias consecutivos
* `total_tests_per_thousand` - Total de testes a cada mil de habitantes
* `new_testes_smoothed_per_thousand` - Novos testes para COVID-19 (7 dias suavizados) a cada mil habitantes
* ``tests_unit`- Unidades de testes utilizadas pelo local para relatar seus dados de teste
* `stringency_index` - Índice de Estress da Resposta do Governo: medida baseada em 9 indicadores de resposta, incluindo fechamento de escolas, fechamento de locias de trabalho e proibições de viagem, redimensionados para um valor de 0 a 100, sendo 100 equivalente a resposta mais estrita
* `population` - População em 2020
* `population_density` - Número de pessoas divididas por área terrestre, medida em quilômetros quadrados, no ano mais recente disponível
* `median_age` - Idade média da populção em 2020
* `aged_65_older` - Parcela da população com 65 anos ou mais, para o ano mais recente disponível
* `age_70_older` - Parcela da população com 70 anos ou mais no ano de 2015
* `gdp_per_capita` - Produto interno bruto com paridade do poder de compra (dólares internacionais constantes de 2011), último ano disponível
* `extreme_poverty` - Parcela da população vivendo em extrema pobreza, ano mais recente disponível desde 2010
* `cvd_death_rate` - Taxa de mortalidade por doença cardiovascular em 2017
* `diabetes_prevalence` - Prevalência de diabetes (% da população entre 20 e 79 anoos) em 2017
* `female_smokers` - Proporção das mulheres que são fumantes, ano mais recente disponível
* `male_smokers` - Proporção dos homens que são fumantes, ano mais recente disponível
* `handwashing_facilities` - Proporção da população com instalações básicas de lavagem das mãos nas suas instalações, último ano disponível
* `hospital_beds_per_thousand` - Leitos de hospital a cada mil habitantes, último ano disponível a partir de 2010
* `life_expectancy` - Expectativa de vida no nascimento em 2019


### Importando os dados do COVID-19

* Você deve entrar no site [https://github.com/owid/covid-19-data/tree/master/public/data](https://github.com/owid/covid-19-data/tree/master/public/data) e conhecer a base dados. Usaremos o formato `csv` neste projeto.


In [16]:
# importar as bibliotecas necessárias
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import plotly.express as px
import plotly.graph_objects as go


## Obtenção dos dados


In [17]:
dadosCOVID = pd.read_csv("https://raw.githubusercontent.com/owid/covid-19-data/master/public/data/owid-covid-data.csv")



## Análise Exploratória dos Dados
Nessa análise irei analisar o número de casos e mortes confirmados decorrentes de COVID-19 no mundo e para os 5 países com mais casos e mortes no mundo, estando entre eles o Brasil.

### Análise Exploratória Inicial

Nessa primeira análise irei identificar as características do DataFrame.


Visualizar as 5 primeiras linhas do DataFrame.

In [18]:
# primeiras 5 entradas
dadosCOVID.head()

Unnamed: 0,iso_code,continent,location,date,total_cases,new_cases,total_deaths,new_deaths,total_cases_per_million,new_cases_per_million,total_deaths_per_million,new_deaths_per_million,total_tests,new_tests,total_tests_per_thousand,new_tests_per_thousand,new_tests_smoothed,new_tests_smoothed_per_thousand,tests_units,stringency_index,population,population_density,median_age,aged_65_older,aged_70_older,gdp_per_capita,extreme_poverty,cvd_death_rate,diabetes_prevalence,female_smokers,male_smokers,handwashing_facilities,hospital_beds_per_thousand,life_expectancy
0,AFG,Asia,Afghanistan,2019-12-31,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,,,,,,,,,38928341.0,54.422,18.6,2.581,1.337,1803.987,,597.029,9.59,,,37.746,0.5,64.83
1,AFG,Asia,Afghanistan,2020-01-01,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,,,,,,,,0.0,38928341.0,54.422,18.6,2.581,1.337,1803.987,,597.029,9.59,,,37.746,0.5,64.83
2,AFG,Asia,Afghanistan,2020-01-02,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,,,,,,,,0.0,38928341.0,54.422,18.6,2.581,1.337,1803.987,,597.029,9.59,,,37.746,0.5,64.83
3,AFG,Asia,Afghanistan,2020-01-03,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,,,,,,,,0.0,38928341.0,54.422,18.6,2.581,1.337,1803.987,,597.029,9.59,,,37.746,0.5,64.83
4,AFG,Asia,Afghanistan,2020-01-04,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,,,,,,,,0.0,38928341.0,54.422,18.6,2.581,1.337,1803.987,,597.029,9.59,,,37.746,0.5,64.83


Visualizar as 5 últimas entradas do DataFrame.


In [19]:
# últimas 5 entradas
dadosCOVID.tail()

Unnamed: 0,iso_code,continent,location,date,total_cases,new_cases,total_deaths,new_deaths,total_cases_per_million,new_cases_per_million,total_deaths_per_million,new_deaths_per_million,total_tests,new_tests,total_tests_per_thousand,new_tests_per_thousand,new_tests_smoothed,new_tests_smoothed_per_thousand,tests_units,stringency_index,population,population_density,median_age,aged_65_older,aged_70_older,gdp_per_capita,extreme_poverty,cvd_death_rate,diabetes_prevalence,female_smokers,male_smokers,handwashing_facilities,hospital_beds_per_thousand,life_expectancy
26744,,,International,2020-02-28,705.0,0.0,4.0,0.0,,,,,,,,,,,,,,,,,,,,,,,,,,
26745,,,International,2020-02-29,705.0,0.0,6.0,2.0,,,,,,,,,,,,,,,,,,,,,,,,,,
26746,,,International,2020-03-01,705.0,0.0,6.0,0.0,,,,,,,,,,,,,,,,,,,,,,,,,,
26747,,,International,2020-03-02,705.0,0.0,6.0,0.0,,,,,,,,,,,,,,,,,,,,,,,,,,
26748,,,International,2020-03-10,696.0,-9.0,7.0,1.0,,,,,,,,,,,,,,,,,,,,,,,,,,


### Qual o tamanho do DataFrame


In [21]:
dadosCOVID.shape

(26749, 34)

### Quais são os nomes das colunas


In [22]:
dadosCOVID.columns

Index(['iso_code', 'continent', 'location', 'date', 'total_cases', 'new_cases',
       'total_deaths', 'new_deaths', 'total_cases_per_million',
       'new_cases_per_million', 'total_deaths_per_million',
       'new_deaths_per_million', 'total_tests', 'new_tests',
       'total_tests_per_thousand', 'new_tests_per_thousand',
       'new_tests_smoothed', 'new_tests_smoothed_per_thousand', 'tests_units',
       'stringency_index', 'population', 'population_density', 'median_age',
       'aged_65_older', 'aged_70_older', 'gdp_per_capita', 'extreme_poverty',
       'cvd_death_rate', 'diabetes_prevalence', 'female_smokers',
       'male_smokers', 'handwashing_facilities', 'hospital_beds_per_thousand',
       'life_expectancy'],
      dtype='object')

### Quais são os tipos de variáveis

In [23]:
dadosCOVID.dtypes

iso_code                            object
continent                           object
location                            object
date                                object
total_cases                        float64
new_cases                          float64
total_deaths                       float64
new_deaths                         float64
total_cases_per_million            float64
new_cases_per_million              float64
total_deaths_per_million           float64
new_deaths_per_million             float64
total_tests                        float64
new_tests                          float64
total_tests_per_thousand           float64
new_tests_per_thousand             float64
new_tests_smoothed                 float64
new_tests_smoothed_per_thousand    float64
tests_units                         object
stringency_index                   float64
population                         float64
population_density                 float64
median_age                         float64
aged_65_old

### Porcentagem de valores ausentes


In [24]:
# Porcentagem de valores nulos por coluna em ordem decrescente
(dadosCOVID.isnull().sum() / dadosCOVID.shape[0]).sort_values(ascending=False)


new_tests                          0.743990
new_tests_per_thousand             0.743990
total_tests_per_thousand           0.718756
total_tests                        0.718756
new_tests_smoothed_per_thousand    0.695764
new_tests_smoothed                 0.695764
tests_units                        0.672623
handwashing_facilities             0.592433
extreme_poverty                    0.403080
male_smokers                       0.283637
female_smokers                     0.275263
stringency_index                   0.201092
hospital_beds_per_thousand         0.173128
aged_65_older                      0.109350
gdp_per_capita                     0.106808
aged_70_older                      0.101200
median_age                         0.096564
cvd_death_rate                     0.095443
diabetes_prevalence                0.066133
population_density                 0.043553
life_expectancy                    0.013870
new_deaths_per_million             0.010430
total_deaths_per_million        

### Transformando a coluna data no formato `datetime`

In [25]:
dadosCOVID.date = pd.to_datetime(dadosCOVID.date)


### Análise por continente

No código abaixo agrupei os dados de cada continente no dia 26-06-20 em um *sub DataFrame*.

In [56]:
# Seleciona apenas os dados do dia 26-06-20
casoscont = dadosCOVID.loc[dadosCOVID.date == '2020-06-26'].sort_values(by="total_cases", ascending=False)


# casos da europa nesta data
eur = casoscont.loc[casoscont.continent == 'Europe']


# casos da América do Sul nesta data
ams = casoscont.loc[casoscont.continent == 'South America']

# casos da América do Norte  nesta data
amn = casoscont.loc[casoscont.continent == 'North America']

#casos da Oceania nesta data
oc = casoscont.loc[casoscont.continent == 'Oceania']

#casos da Ásia nesta data
asia = casoscont.loc[casoscont.continent == 'Asia']

# casos da Àfrica nesta data
afr = casoscont.loc[casoscont.continent == 'Africa']

#visualizando as primeiras entradas
oc.head(10)


Unnamed: 0,iso_code,continent,location,date,total_cases,new_cases,total_deaths,new_deaths,total_cases_per_million,new_cases_per_million,total_deaths_per_million,new_deaths_per_million,total_tests,new_tests,total_tests_per_thousand,new_tests_per_thousand,new_tests_smoothed,new_tests_smoothed_per_thousand,tests_units,stringency_index,population,population_density,median_age,aged_65_older,aged_70_older,gdp_per_capita,extreme_poverty,cvd_death_rate,diabetes_prevalence,female_smokers,male_smokers,handwashing_facilities,hospital_beds_per_thousand,life_expectancy
1422,AUS,Oceania,Australia,2020-06-26,7558.0,37.0,104.0,1.0,296.394,1.451,4.078,0.039,,,,,,,,,25499881.0,3.202,37.9,15.504,10.129,44648.71,0.5,107.791,5.07,13.0,16.5,,3.84,83.44
17608,NZL,Oceania,New Zealand,2020-06-26,1170.0,1.0,22.0,0.0,242.626,0.207,4.562,0.0,,,,,,,,19.44,4822233.0,18.206,37.9,15.322,9.72,36085.843,,128.797,8.08,14.8,17.2,,2.61,82.29
10096,GUM,Oceania,Guam,2020-06-26,247.0,16.0,5.0,0.0,1463.418,94.796,29.624,0.0,,,,,,,,,168783.0,304.128,31.4,9.551,5.493,,,310.496,21.52,,,,,80.07
8837,PYF,Oceania,French Polynesia,2020-06-26,60.0,0.0,0.0,0.0,213.596,0.0,0.0,0.0,,,,,,,,,280904.0,77.324,32.7,7.775,4.593,,,,22.63,,,,,77.66
18070,MNP,Oceania,Northern Mariana Islands,2020-06-26,30.0,0.0,2.0,0.0,521.222,0.0,34.748,0.0,,,,,,,,,57557.0,119.878,,,,,,194.994,,,,,,76.74
17429,NCL,Oceania,New Caledonia,2020-06-26,21.0,0.0,0.0,0.0,73.557,0.0,0.0,0.0,,,,,,,,,285491.0,15.342,33.4,9.954,6.489,,,,23.36,,,,,77.55
8373,FJI,Oceania,Fiji,2020-06-26,18.0,0.0,0.0,0.0,20.079,0.0,0.0,0.0,,,,,,,,,896444.0,49.562,28.6,6.224,3.284,8702.975,1.4,412.82,14.49,10.2,34.8,,2.3,67.44
18926,PNG,Oceania,Papua New Guinea,2020-06-26,11.0,1.0,0.0,0.0,1.229,0.112,0.0,0.0,,,,,,,,,8947027.0,18.22,22.6,3.808,2.142,3823.194,,561.494,17.65,23.5,48.8,,,64.5


No código abaixo somei todos as linhas do *subDataFrame* de cada continente obtido no gráfico anterior para gerar o gráfico de barras comparando o número de casos acumulados. Para somar o número total de casos usei o comando `"nomedosubdataset".total_cases.sum()`.


In [57]:
# em cada uma das variáveis traces são armazenados os gráficos que devem ser plotaados

trace2 = go.Bar(x=['Europa'], y=[eur.total_cases.sum()], name='Europa', text = ceur) 

trace3 = go.Bar(x=['Asia'], y=[asia.total_cases.sum()],name='Ásia',text = casia)

trace4 = go.Bar(x=['Africa'], y=[afr.total_cases.sum()],name='África', text = afr.total_cases.sum())

trace5 = go.Bar(x=['Oceania'], y=[oc.total_cases.sum()],name='Oceania',text = oc.total_cases.sum())

trace1 = go.Bar(x=['America'], y=[ams.total_cases.sum() + amn.total_cases.sum()],name='América',text = ams.total_cases.sum() + amn.total_cases.sum())



# comando que atualiza o layout
layout = go.Layout( title = "Casos confirmados de COVID-19 por continente no dia 26-06-2020", #define o título do gráfico 
                  titlefont = {'family': 'Arial', 'size': 22,}, #define a fonte e cor e fonte do título
                  xaxis = {'title': 'Continente'}, #título do eixo x
                  yaxis = {'title': 'Casos confirmados'},  #título do eixo y
                  template = 'plotly_white',
                  colorway= px.colors.qualitative.T10)
                       

data=[trace1,trace2,trace3,trace4,trace5] #vetor que armazena os dados que queremos plotar

fig = go.Figure(data, layout = layout) #função que gera a figura

fig.update_xaxes(showline=True, linewidth=1, linecolor='black'
                 )
fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
fig.update_yaxes(showline=True, linewidth=1, linecolor='black')

       


fig.show()

Número de mortos

Para gerar um gráfico com o número de mortos procedi de forma análoga a descrita para o número de  casos.

In [28]:
trace2 = go.Bar(x=['Europa'], y=[eur.total_deaths.sum()], name='Europa', text = eur.total_deaths.sum()) 

trace3 = go.Bar(x=['Asia'], y=[asia.total_deaths.sum()],name='Ásia',text = asia.total_deaths.sum())

trace4 = go.Bar(x=['Africa'], y=[afr.total_deaths.sum()],name='África', text = afr.total_deaths.sum())

trace5 = go.Bar(x=['Oceania'], y=[oc.total_deaths.sum()],name='Oceania',text = oc.total_deaths.sum())

trace1 = go.Bar(x=['America'], y=[ams.total_deaths.sum() + amn.total_deaths.sum()],name='América',text = ams.total_deaths.sum() + amn.total_deaths.sum())




layout = go.Layout( title = 'Mortes confirmadas de COVID-19 por continente no dia 26-06-2020', #define o título do gráfico 
                  titlefont = {'family': 'Arial', 'size': 22,}, #define a fonte e cor e fonte do título
                  xaxis = {'title': 'Continente'}, #título do eixo x
                  yaxis = {'title': 'Mortes confirmados'},  #título do eixo y
                  template = 'plotly_white',
                  colorway= px.colors.qualitative.T10)
                       

data=[trace1,trace2,trace3,trace4,trace5] #vetor que armazena os pontos que queremos plotar

fig = go.Figure(data, layout = layout) #função que gera a figura

fig.update_xaxes(showline=True, linewidth=1, linecolor='black'
                 )
fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
fig.update_yaxes(showline=True, linewidth=1, linecolor='black')

       


fig.show()

### Evolução do número de mortes por covid no mundo

O código abaixo gera um gráfico de linhas para mostrar a evolução do número de mortes por COVID-19 no mundo.

In [30]:

#fig = px.line(cmundo, x = "teste", y = "total_deaths", animation_frame= 'teste', animation_group="location", range_x = [0,100],range_y=[0,40000])

fig  = px.line(cmundo, x = "date", y = "total_deaths")


fig.update_layout(
    xaxis_title = "Data",
    yaxis_title = "Mortes Confirmadas",
    plot_bgcolor = 'rgba(0,0,0,0)')

fig.update_xaxes( showgrid=True, gridwidth=1, gridcolor='rgb(211,211,211)',
        showline=True, linewidth=1, linecolor='black'
                 )


fig.update_yaxes(showgrid=True, gridwidth=1, gridcolor='rgb(211,211,211)',
        showline=True, linewidth=1, linecolor='black')

fig.update_layout(title = "Evolução do número de mortes confirmadas por COVID-19 no mundo")
fig.show()

O código abaixo gera um gráfico de linhas para mostrar a evolução do número de casos por COVID-19 no mundo.

In [31]:
fig  = px.line(cmundo, x = "date", y = "total_cases")

fig.update_layout(
    xaxis_title = "Data",
    yaxis_title = "Casos Confirmados",
    plot_bgcolor = 'rgba(0,0,0,0)')

fig.update_xaxes( showgrid=True, gridwidth=1, gridcolor='rgb(211,211,211)',
        showline=True, linewidth=1, linecolor='black'
                 )


fig.update_yaxes(showgrid=True, gridwidth=1, gridcolor='rgb(211,211,211)',
        showline=True, linewidth=1, linecolor='black')

fig.update_layout(title = "Evolução do número de casos confirmados por COVID-19 no mundo")
fig.show()

## Países com mais casos e mortes para a data atual.

Agora iremos analisar os países com mais casos e mortes decorrentes de COVID-19 no dia 26-06-20.

### Mais casos

O código abaixo criar um *subDataFrame* ordenando os países por ordem decrescente segundo os dados do dia 26-06-20.

In [33]:
maiscasos = dadosCOVID.loc[dadosCOVID.date == '2020-06-26'].sort_values(by="total_cases", ascending=False)
maiscasos.head(6)

Unnamed: 0,iso_code,continent,location,date,total_cases,new_cases,total_deaths,new_deaths,total_cases_per_million,new_cases_per_million,total_deaths_per_million,new_deaths_per_million,total_tests,new_tests,total_tests_per_thousand,new_tests_per_thousand,new_tests_smoothed,new_tests_smoothed_per_thousand,tests_units,stringency_index,population,population_density,median_age,aged_65_older,aged_70_older,gdp_per_capita,extreme_poverty,cvd_death_rate,diabetes_prevalence,female_smokers,male_smokers,handwashing_facilities,hospital_beds_per_thousand,life_expectancy
26682,OWID_WRL,,World,2020-06-26,9582321.0,181511.0,489195.0,6716.0,1229.322,23.286,62.759,0.862,,,,,,,,,7794799000.0,58.045,30.9,8.696,5.355,15469.207,10.0,233.07,8.51,6.434,34.635,60.13,2.705,72.58
25456,USA,North America,United States,2020-06-26,2422310.0,40949.0,124416.0,2437.0,7318.099,123.712,375.876,7.362,,,,,,,,,331002600.0,35.608,38.3,15.413,9.732,54225.446,1.2,151.089,10.79,19.1,24.6,,2.77,78.86
3626,BRA,South America,Brazil,2020-06-26,1228114.0,39483.0,54971.0,1141.0,5777.745,185.75,258.615,5.368,,,,,,,,,212559400.0,25.04,33.5,8.552,5.06,14103.452,3.4,177.961,8.11,10.1,17.9,,2.2,75.88
20200,RUS,Europe,Russia,2020-06-26,613994.0,7113.0,8605.0,92.0,4207.327,48.741,58.965,0.63,,,,,,,,,145934500.0,8.823,39.6,14.178,9.393,24765.954,0.1,431.297,6.18,23.4,58.3,,8.05,72.58
11301,IND,Asia,India,2020-06-26,490401.0,17296.0,15301.0,407.0,355.362,12.533,11.088,0.295,7776228.0,215446.0,5.635,0.156,192800.0,0.14,samples tested,,1380004000.0,450.419,28.2,5.989,3.414,6426.674,21.2,282.28,10.39,1.9,20.6,59.55,0.53,69.66
25275,GBR,Europe,United Kingdom,2020-06-26,307980.0,1118.0,43230.0,149.0,4536.723,16.469,636.803,2.195,,,,,,,,,67886000.0,272.898,40.8,18.517,12.527,39753.244,0.2,122.137,4.28,20.0,24.7,,2.54,81.32


O código abaixo gera um código de barras com os 5 países com mais casos confirmados no dia 26-06-2020. 

In [34]:

top5casos = maiscasos[1:6]
fig = px.bar(top5casos, x = 'location', y = 'total_cases', color = "location", hover_name='location', text = 'total_cases',
             color_discrete_sequence=px.colors.qualitative.T10, )

fig.update_layout(
    xaxis_title = "País",
    yaxis_title = "Casos Confirmados",
    plot_bgcolor = 'rgba(0,0,0,0)',
    )

fig.update_xaxes( showgrid=False, gridwidth=1, gridcolor='rgb(211,211,211)',
        showline=True, linewidth=1, linecolor='black'
                 )

fig.update_yaxes(showgrid=True, gridwidth=1, gridcolor='rgb(211,211,211)',
        showline=True, linewidth=1, linecolor='black')

fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')

fig.update_layout(title = "Países com o maior número de casos confirmados em 26-06-2020")
fig.show()




O código abaixo cria um DataFrame para cada um dos 5 países com mais casos confirmados.

In [35]:
# Criando um DataFrame separado para cada um dos países com mais casos

# Estados Unidos
USA  = dadosCOVID.loc[dadosCOVID.location == 'United States'].sort_values(by="total_cases", ascending=False)

# Brazil
BR = dadosCOVID.loc[dadosCOVID.location == 'Brazil'].sort_values(by="total_cases", ascending=True)

# Russia
RS = dadosCOVID.loc[dadosCOVID.location == 'Russia'].sort_values(by="total_cases", ascending=True)

# India
IN = dadosCOVID.loc[dadosCOVID.location == 'India'].sort_values(by="total_cases", ascending=True)

# United Kingdom
UK = dadosCOVID.loc[dadosCOVID.location == 'United Kingdom'].sort_values(by="total_cases", ascending=True)




#### Plotando um gráfico em escala linear da evolução dos países com mais casos no dia 26-06-2020 no mundo

Utilizando os DataFrames criados anteriormente irei plotar um gráfico de linhas comparando a evolução do número de casos para cada um dos países.

In [36]:

trace1 = go.Scatter(x=USA.date, y=USA.total_cases, mode='lines',name='United States',) 

trace2 = go.Scatter(x=BR.date, y=BR.total_cases, mode='lines',name='Brazil',)

trace3 = go.Scatter(x=RS.date, y=RS.total_cases, mode='lines', name='Russia',)

trace4 = go.Scatter(x=IN.date, y=IN.total_cases,mode='lines',name='India',)

trace5 = go.Scatter(x = UK.date, y = UK.total_cases,mode = 'lines', name = 'United Kingdom' )

layout = go.Layout( title = 'Evolução do número de casos confirmados de  COVID-19', #define o título do gráfico 
                  titlefont = {'family': 'Arial', 'size': 22,}, #define a fonte e cor e fonte do título
                  xaxis = {'title': 'Data'}, #título do eixo x
                  yaxis = {'title': 'Casos confirmados'},  #título do eixo y
                  template = 'plotly_white',
                  colorway= px.colors.qualitative.T10)
                       

data=[trace1,trace2,trace3,trace4, trace5] #vetor que armazena os pontos que queremos plotar

fig = go.Figure(data, layout = layout) #função que gera a figura

fig.update_xaxes(showline=True, linewidth=1, linecolor='black'
                 )

fig.update_yaxes(showline=True, linewidth=1, linecolor='black')

       


fig.show()

Para avaliar a tendência de crescimento do número de casos em cada país irei plotar o gráfico acima em escala logarítmica.

In [37]:
trace1 = go.Scatter(x=USA.date, y=USA.total_cases, mode='lines',name='United States',) 

trace2 = go.Scatter(x=BR.date, y=BR.total_cases, mode='lines',name='Brazil',)

trace3 = go.Scatter(x=RS.date, y=RS.total_cases, mode='lines', name='Russia',)

trace4 = go.Scatter(x=IN.date, y=IN.total_cases,mode='lines',name='India',)

trace5 = go.Scatter(x = UK.date, y = UK.total_cases,mode = 'lines', name = 'United Kingdom' )

layout = go.Layout( title = 'Evolução do número de Casos - Escala logarítmica', #define o título do gráfico 
                  titlefont = {'family': 'Arial', 'size': 22,}, #define a fonte e cor e fonte do título
                  xaxis = {'title': 'Data'}, #título do eixo x
                  yaxis = {'title': 'Casos confirmados'},  #título do eixo y
                  template = 'plotly_white',
                  colorway= px.colors.qualitative.T10, yaxis_type="log")
                       

data=[trace1,trace2,trace3,trace4, trace5] #vetor que armazena os pontos que queremos plotar

fig = go.Figure(data, layout = layout) #função que gera a figura

fig.update_xaxes(showline=True, linewidth=1, linecolor='black'
                 )

fig.update_yaxes(showline=True, linewidth=1, linecolor='black')


### Maior número de mortes

O código abaixo criar um *subDataFrame* ordenando os países por ordem decrescente segundo o número total de mortes no dia 26-06-20.

In [38]:
maismortes = dadosCOVID.loc[dadosCOVID.date == '2020-06-26'].sort_values(by="total_deaths", ascending=False)
maismortes.head()

Unnamed: 0,iso_code,continent,location,date,total_cases,new_cases,total_deaths,new_deaths,total_cases_per_million,new_cases_per_million,total_deaths_per_million,new_deaths_per_million,total_tests,new_tests,total_tests_per_thousand,new_tests_per_thousand,new_tests_smoothed,new_tests_smoothed_per_thousand,tests_units,stringency_index,population,population_density,median_age,aged_65_older,aged_70_older,gdp_per_capita,extreme_poverty,cvd_death_rate,diabetes_prevalence,female_smokers,male_smokers,handwashing_facilities,hospital_beds_per_thousand,life_expectancy
26682,OWID_WRL,,World,2020-06-26,9582321.0,181511.0,489195.0,6716.0,1229.322,23.286,62.759,0.862,,,,,,,,,7794799000.0,58.045,30.9,8.696,5.355,15469.207,10.0,233.07,8.51,6.434,34.635,60.13,2.705,72.58
25456,USA,North America,United States,2020-06-26,2422310.0,40949.0,124416.0,2437.0,7318.099,123.712,375.876,7.362,,,,,,,,,331002600.0,35.608,38.3,15.413,9.732,54225.446,1.2,151.089,10.79,19.1,24.6,,2.77,78.86
3626,BRA,South America,Brazil,2020-06-26,1228114.0,39483.0,54971.0,1141.0,5777.745,185.75,258.615,5.368,,,,,,,,,212559400.0,25.04,33.5,8.552,5.06,14103.452,3.4,177.961,8.11,10.1,17.9,,2.2,75.88
25275,GBR,Europe,United Kingdom,2020-06-26,307980.0,1118.0,43230.0,149.0,4536.723,16.469,636.803,2.195,,,,,,,,,67886000.0,272.898,40.8,18.517,12.527,39753.244,0.2,122.137,4.28,20.0,24.7,,2.54,81.32
12477,ITA,Europe,Italy,2020-06-26,239706.0,296.0,34678.0,34.0,3964.584,4.896,573.552,0.562,,,,,,,,,60461830.0,205.859,47.9,23.021,16.24,35220.084,2.0,113.151,4.78,19.8,27.8,,3.18,83.51


O código abaixo gera um código de barras com os 5 países com mais casos confirmados no dia 26-06-2020. 

In [39]:

top5mortes = maismortes[1:6]
fig = px.bar(top5mortes, x = 'location', y = 'total_deaths', color = "location", hover_name='location', text = 'total_deaths',
             color_discrete_sequence=px.colors.qualitative.T10,  )

fig.update_layout(
    xaxis_title = "País",
    yaxis_title = "Mortes Confirmadas",
    plot_bgcolor = 'rgba(0,0,0,0)')

fig.update_xaxes( showgrid=False, gridwidth=1, gridcolor='rgb(211,211,211)',
        showline=True, linewidth=1, linecolor='black'
                 )

fig.update_yaxes(showgrid=True, gridwidth=1, gridcolor='rgb(211,211,211)',
        showline=True, linewidth=1, linecolor='black')

fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
fig.update_layout(title = "Países com o maior número de Mortes Confirmadas em 26-06-2020")
fig.show()


#### Plotando um gráfico em escala linear da evolução dos países com mais casos no dia 19-06-2020 no mundo

O código abaixo cria um DataFrame para cada um dos 5 países com mais casos confirmados.

In [40]:
# Criando um DataFrame separado para cada um dos países com mais mortes

# Estados Unidos
USA  = dadosCOVID.loc[dadosCOVID.location == 'United States'].sort_values(by="total_cases", ascending=False)

# Brazil
BR = dadosCOVID.loc[dadosCOVID.location == 'Brazil'].sort_values(by="total_cases", ascending=True)

# United Kingdom 
UK = dadosCOVID.loc[dadosCOVID.location == 'United Kingdom'].sort_values(by = "total_cases", ascending = True)

# Italy
IT = dadosCOVID.loc[dadosCOVID.location == 'Italy'].sort_values(by="total_cases", ascending = True)

# Spain
SP = dadosCOVID.loc[dadosCOVID.location == 'Spain'].sort_values(by = "total_cases", ascending = True)



Utilizando os DataFrames criados anteriormente irei plotar um gráfico de linhas comparando a evolução do número de mortes para cada um dos países.

In [41]:
# Plotando o gráfico 

trace1 = go.Scatter(x=USA.date, y=USA.total_deaths, mode='lines',name='United States',) 

trace2 = go.Scatter(x=BR.date, y=BR.total_deaths, mode='lines',name='Brazil',)

trace3 = go.Scatter(x=UK.date, y=UK.total_deaths, mode='lines', name='United Kingdom',)

trace4 = go.Scatter(x=IT.date, y=IT.total_deaths,mode='lines',name='Italy',)

trace5 = go.Scatter(x = SP.date, y = SP.total_deaths,mode = 'lines', name = 'Spain' )

layout = go.Layout( title = 'Evolução do número de Mortes confirmadas de  COVID-19', #define o título do gráfico 
                  titlefont = {'family': 'Arial', 'size': 22,}, #define a fonte e cor e fonte do título
                  xaxis = {'title': 'Data'}, #título do eixo x
                  yaxis = {'title': 'Mortes Confirmadas'},  #título do eixo y
                  template = 'plotly_white',
                  colorway= px.colors.qualitative.T10, )
                       

data=[trace1,trace2,trace3,trace4, trace5] #vetor que armazena os pontos que queremos plotar

fig = go.Figure(data, layout = layout) #função que gera a figura

fig.update_xaxes(showline=True, linewidth=1, linecolor='black'
                 )

fig.update_yaxes(showline=True, linewidth=1, linecolor='black')

       


fig.show()

Para avaliar a tendência de crescimento do número de mortes em cada país irei plotar o gráfico acima em escala logarítmica.

In [42]:
# Plotando o gráfico 

trace1 = go.Scatter(x=USA.date, y=USA.total_deaths, mode='lines',name='United States',) 

trace2 = go.Scatter(x=BR.date, y=BR.total_deaths, mode='lines',name='Brazil',)

trace3 = go.Scatter(x=UK.date, y=UK.total_deaths, mode='lines', name='United Kingdom',)

trace4 = go.Scatter(x=IT.date, y=IT.total_deaths,mode='lines',name='Italy',)

trace5 = go.Scatter(x = SP.date, y = SP.total_deaths,mode = 'lines', name = 'Spain' )

layout = go.Layout( title = 'Evolução do número de Mortes - Escala logarítmica', #define o título do gráfico 
                  titlefont = {'family': 'Arial', 'size': 22,}, #define a fonte e cor e fonte do título
                  xaxis = {'title': 'Data'}, #título do eixo x
                  yaxis = {'title': 'Mortes Confirmadas'},  #título do eixo y
                  template = 'plotly_white',
                  colorway= px.colors.qualitative.T10, yaxis_type="log" )
                       

data=[trace1,trace2,trace3,trace4, trace5] #vetor que armazena os pontos que queremos plotar

fig = go.Figure(data, layout = layout) #função que gera a figura

fig.update_xaxes(showline=True, linewidth=1, linecolor='black'
                 )

fig.update_yaxes(showline=True, linewidth=1, linecolor='black')

       


fig.show()

#### Gráfico de dispersão para algumas variáveis

Como o COVID-19 é uma doença infecciosa, para buscar relação entre suas variáveis é necessário analisar locais em que os surtos foram, de certo modo, proporcionais. Claramente, existem diversas diferenças entre os países acima, porém o objetivo dessa análise é buscar uma relação entre as variáveis.

Abaixo irei gerar um gráfico de dispersão relacionando a idade média da população e o número total de mortes por milhão.

In [44]:
fig = px.scatter( top5mortes, x ="median_age", y = "total_deaths_per_million", color = "location",
                 template = 'plotly_white', color_discrete_sequence = px.colors.qualitative.T10)
fig.update_xaxes(showline=True, linewidth=1, linecolor='black'
                 )

fig.update_yaxes(showline=True, linewidth=1, linecolor='black')

fig.update_layout(title = "Gráfico de dispersão da idade média x total de mortos por milhão ")

fig.show()

In [45]:
# Agrupando os países pelo total de mortos no dia mais recente com dados
mortosper = dadosCOVID.loc[dadosCOVID.date == '2020-06-26'].sort_values(by = "total_cases", ascending = False)

#eliminando a linha em que temos os dados para o mundo
mortosper = mortosper.drop(mortosper[mortosper.location == "World"].index)
mortosper.head()


Unnamed: 0,iso_code,continent,location,date,total_cases,new_cases,total_deaths,new_deaths,total_cases_per_million,new_cases_per_million,total_deaths_per_million,new_deaths_per_million,total_tests,new_tests,total_tests_per_thousand,new_tests_per_thousand,new_tests_smoothed,new_tests_smoothed_per_thousand,tests_units,stringency_index,population,population_density,median_age,aged_65_older,aged_70_older,gdp_per_capita,extreme_poverty,cvd_death_rate,diabetes_prevalence,female_smokers,male_smokers,handwashing_facilities,hospital_beds_per_thousand,life_expectancy
25456,USA,North America,United States,2020-06-26,2422310.0,40949.0,124416.0,2437.0,7318.099,123.712,375.876,7.362,,,,,,,,,331002600.0,35.608,38.3,15.413,9.732,54225.446,1.2,151.089,10.79,19.1,24.6,,2.77,78.86
3626,BRA,South America,Brazil,2020-06-26,1228114.0,39483.0,54971.0,1141.0,5777.745,185.75,258.615,5.368,,,,,,,,,212559400.0,25.04,33.5,8.552,5.06,14103.452,3.4,177.961,8.11,10.1,17.9,,2.2,75.88
20200,RUS,Europe,Russia,2020-06-26,613994.0,7113.0,8605.0,92.0,4207.327,48.741,58.965,0.63,,,,,,,,,145934500.0,8.823,39.6,14.178,9.393,24765.954,0.1,431.297,6.18,23.4,58.3,,8.05,72.58
11301,IND,Asia,India,2020-06-26,490401.0,17296.0,15301.0,407.0,355.362,12.533,11.088,0.295,7776228.0,215446.0,5.635,0.156,192800.0,0.14,samples tested,,1380004000.0,450.419,28.2,5.989,3.414,6426.674,21.2,282.28,10.39,1.9,20.6,59.55,0.53,69.66
25275,GBR,Europe,United Kingdom,2020-06-26,307980.0,1118.0,43230.0,149.0,4536.723,16.469,636.803,2.195,,,,,,,,,67886000.0,272.898,40.8,18.517,12.527,39753.244,0.2,122.137,4.28,20.0,24.7,,2.54,81.32


## Conclusão


A partir dessa análise podemos concluir que o Brasil apresenta um maior tendência de crescimento em relação ao número de casos mortes quando comparados com os outros países que até o dia 26–06–2020 alcançaram o maior número de casos e mortes. Além disso, conseguimos visualizar a relação entre o número de mortos por milhão e a idade média dos países com mais mortos. 
Por fim, é importante ressaltar que essa análise não é superficial, é que para resultados mais assertivos é preciso uma análise mais detalhada considerando parâmetros que aqui não foram considerados como subnotificação, capacidade hospitalar e medidas combate ao espalhamento da doença.