# O objetivo deste notebook é uma análise exploratória de dataset sobre o Covid-19 na ARGENTINA.

# Roteiro
## 1. Apresentação do problema
## 2. Análise exploratória
## 3. Tratamento dos dados
## 4. Gráficos

## 0. Carregamento das bibliotecas a serem utilizadas 

In [1263]:
import numpy as np
# NumPy’s main object is the homogeneous multidimensional array. 
# It is a table of elements (usually numbers), all of the same type, indexed by a tuple of non-negative integers.
# In NumPy dimensions are called axes. 
## An Array is a data structure that stores values of same data type.
## A tuple is a collection which is ordered and unchangeable.
## https://numpy.org/

In [1264]:
import pandas as pd
# pandas is an open source data analysis and manipulation tool.
## https://pandas.pydata.org/

In [1265]:
import plotly.offline as py
import plotly.graph_objs as go

py.init_notebook_mode(connected = True)

## 1. Apresentação do Problema

Realizar análise exploratória dos _datasets_ sobre COVID-19 da John Hopkins University (JHU), que detalham, para 265 países, o número acumulado de casos confirmados, de recuperados e de mortos por infecção pelo Coronavírus.

Para essa análise, foram disponibilizados 3 datasets:
* **time_series_covid19_deaths_global.csv** &nbsp;
Trata-se de arquivo que disponibiliza o detalhamento de mortes por país.
* **time_series_covid19_confirmed_global.csv** &nbsp;
Trata-se de arquivo que disponibiliza o detalhamento de casos confirmados por país.
* **time_series_covid19_recovered_global.csv** &nbsp;
Trata-se de arquivo que disponibiliza o detalhamento de recuperados por país.


## 2. Análise exploratória

O objetivo desta etapa é explorar os _datasets_ fornecidos, buscando identificar atributos principais e os relacionamentos entre eles.

### 2.1. Carregamento dos dados

In [1266]:
# fez-se a escolha por realizar a leitura dos dados via url, para que os dados sempre estivessem atualizados:
url_mortos = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv'
url_confirmados = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv'
url_recuperados = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv'
mortos = pd.read_csv(url_mortos)
confirmados = pd.read_csv(url_confirmados)
recuperados = pd.read_csv(url_recuperados)

Vamos examinar os dataframes criados:

In [1267]:
mortos.shape

(266, 108)

In [1268]:
confirmados.shape

(266, 108)

In [1269]:
recuperados.shape

(252, 108)

A diferença entre os _shapes_ dos _datasets_ indica que há países em que ainda não há registro de recuperados.

In [1270]:
mortos.head()

Unnamed: 0,Province/State,Country/Region,Lat,Long,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,...,4/25/20,4/26/20,4/27/20,4/28/20,4/29/20,4/30/20,5/1/20,5/2/20,5/3/20,5/4/20
0,,Afghanistan,33.0,65.0,0,0,0,0,0,0,...,47,50,57,58,60,64,68,72,85,90
1,,Albania,41.1533,20.1683,0,0,0,0,0,0,...,27,28,28,30,30,31,31,31,31,31
2,,Algeria,28.0339,1.6596,0,0,0,0,0,0,...,419,425,432,437,444,450,453,459,463,465
3,,Andorra,42.5063,1.5218,0,0,0,0,0,0,...,40,40,40,41,42,42,43,44,45,45
4,,Angola,-11.2027,17.8739,0,0,0,0,0,0,...,2,2,2,2,2,2,2,2,2,2


In [1271]:
confirmados.head()

Unnamed: 0,Province/State,Country/Region,Lat,Long,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,...,4/25/20,4/26/20,4/27/20,4/28/20,4/29/20,4/30/20,5/1/20,5/2/20,5/3/20,5/4/20
0,,Afghanistan,33.0,65.0,0,0,0,0,0,0,...,1463,1531,1703,1828,1939,2171,2335,2469,2704,2894
1,,Albania,41.1533,20.1683,0,0,0,0,0,0,...,712,726,736,750,766,773,782,789,795,803
2,,Algeria,28.0339,1.6596,0,0,0,0,0,0,...,3256,3382,3517,3649,3848,4006,4154,4295,4474,4648
3,,Andorra,42.5063,1.5218,0,0,0,0,0,0,...,738,738,743,743,743,745,745,747,748,750
4,,Angola,-11.2027,17.8739,0,0,0,0,0,0,...,25,26,27,27,27,27,30,35,35,35


In [1272]:
recuperados.head()

Unnamed: 0,Province/State,Country/Region,Lat,Long,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,...,4/25/20,4/26/20,4/27/20,4/28/20,4/29/20,4/30/20,5/1/20,5/2/20,5/3/20,5/4/20
0,,Afghanistan,33.0,65.0,0,0,0,0,0,0,...,188,207,220,228,252,260,310,331,345,397
1,,Albania,41.1533,20.1683,0,0,0,0,0,0,...,403,410,422,431,455,470,488,519,531,543
2,,Algeria,28.0339,1.6596,0,0,0,0,0,0,...,1479,1508,1558,1651,1702,1779,1821,1872,1936,1998
3,,Andorra,42.5063,1.5218,0,0,0,0,0,0,...,344,344,385,398,423,468,468,472,493,499
4,,Angola,-11.2027,17.8739,0,0,0,0,0,0,...,6,6,6,6,7,7,11,11,11,11


### 2.2 Análise de Atributos

O dicionário de dados dos arquivos traz as seguintes descrições dos atributos:

* **Province/State**: Nome da província ou estado de determinado país (_object_);
* **Country/Region**: Nome do país ou região (_object);
* **Lat**: Latitude de localização do país ou região (_float_);
* **Long**: Longitude de localização do país ou região (_float_);
* **Date**: Datas, dia a dia, em que com os números acumulados de mortes, confirmação de contaminações e de curados (_datetime_).

In [1273]:
mortos.dtypes

Province/State     object
Country/Region     object
Lat               float64
Long              float64
1/22/20             int64
                   ...   
4/30/20             int64
5/1/20              int64
5/2/20              int64
5/3/20              int64
5/4/20              int64
Length: 108, dtype: object

In [1274]:
confirmados.dtypes

Province/State     object
Country/Region     object
Lat               float64
Long              float64
1/22/20             int64
                   ...   
4/30/20             int64
5/1/20              int64
5/2/20              int64
5/3/20              int64
5/4/20              int64
Length: 108, dtype: object

In [1275]:
recuperados.dtypes

Province/State     object
Country/Region     object
Lat               float64
Long              float64
1/22/20             int64
                   ...   
4/30/20             int64
5/1/20              int64
5/2/20              int64
5/3/20              int64
5/4/20              int64
Length: 108, dtype: object

In [1276]:
mortos.count()

Province/State     82
Country/Region    266
Lat               266
Long              266
1/22/20           266
                 ... 
4/30/20           266
5/1/20            266
5/2/20            266
5/3/20            266
5/4/20            266
Length: 108, dtype: int64

In [1277]:
confirmados.count()

Province/State     82
Country/Region    266
Lat               266
Long              266
1/22/20           266
                 ... 
4/30/20           266
5/1/20            266
5/2/20            266
5/3/20            266
5/4/20            266
Length: 108, dtype: int64

In [1278]:
recuperados.count()

Province/State     67
Country/Region    252
Lat               252
Long              252
1/22/20           252
                 ... 
4/30/20           252
5/1/20            252
5/2/20            252
5/3/20            252
5/4/20            252
Length: 108, dtype: int64

É possível notar que alguns países estão repetidos porque possuem mais de uma província / estado. Seria desejável que os dados pertencentes a pronvíncias e estados sejam agrupados em uma única coluna do país / região respectiva. Todavia, como trataremos da apenas dos dados da Argentina, não será necessário, realizar esse tratamento.

## 3. Tratamento dos dados

Faremos o filtro dos 3 _datasets_ para que sejam mostrados apenas os dados referentes à Argentina:

In [1279]:
mortos_argentina = mortos[mortos['Country/Region'] == 'Argentina']
mortos_argentina

Unnamed: 0,Province/State,Country/Region,Lat,Long,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,...,4/25/20,4/26/20,4/27/20,4/28/20,4/29/20,4/30/20,5/1/20,5/2/20,5/3/20,5/4/20
6,,Argentina,-38.4161,-63.6167,0,0,0,0,0,0,...,185,192,197,207,214,218,225,237,246,260


In [1280]:
recuperados_argentina = recuperados[recuperados['Country/Region'] == 'Argentina']
recuperados_argentina

Unnamed: 0,Province/State,Country/Region,Lat,Long,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,...,4/25/20,4/26/20,4/27/20,4/28/20,4/29/20,4/30/20,5/1/20,5/2/20,5/3/20,5/4/20
6,,Argentina,-38.4161,-63.6167,0,0,0,0,0,0,...,1030,1107,1140,1162,1192,1256,1292,1320,1354,1442


In [1281]:
confirmados_argentina = confirmados[confirmados['Country/Region'] == 'Argentina']
confirmados_argentina

Unnamed: 0,Province/State,Country/Region,Lat,Long,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,...,4/25/20,4/26/20,4/27/20,4/28/20,4/29/20,4/30/20,5/1/20,5/2/20,5/3/20,5/4/20
6,,Argentina,-38.4161,-63.6167,0,0,0,0,0,0,...,3780,3892,4003,4127,4285,4428,4532,4681,4783,4887


Em seguida, concatenamos esses dados em um único _dataset_, retiramos as colunas desnecessárias e fazemos a transposição entre linhas e colunas para gerar os gráficos:

In [1282]:
lista = [mortos_argentina, recuperados_argentina, confirmados_argentina]
consolidado = pd.concat(lista)
consolidado

Unnamed: 0,Province/State,Country/Region,Lat,Long,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,...,4/25/20,4/26/20,4/27/20,4/28/20,4/29/20,4/30/20,5/1/20,5/2/20,5/3/20,5/4/20
6,,Argentina,-38.4161,-63.6167,0,0,0,0,0,0,...,185,192,197,207,214,218,225,237,246,260
6,,Argentina,-38.4161,-63.6167,0,0,0,0,0,0,...,1030,1107,1140,1162,1192,1256,1292,1320,1354,1442
6,,Argentina,-38.4161,-63.6167,0,0,0,0,0,0,...,3780,3892,4003,4127,4285,4428,4532,4681,4783,4887


In [1283]:
consolidado_limpo = consolidado.drop(['Province/State', 'Country/Region', 'Lat', 'Long'], axis = 1)
consolidado_limpo

Unnamed: 0,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,1/28/20,1/29/20,1/30/20,1/31/20,...,4/25/20,4/26/20,4/27/20,4/28/20,4/29/20,4/30/20,5/1/20,5/2/20,5/3/20,5/4/20
6,0,0,0,0,0,0,0,0,0,0,...,185,192,197,207,214,218,225,237,246,260
6,0,0,0,0,0,0,0,0,0,0,...,1030,1107,1140,1162,1192,1256,1292,1320,1354,1442
6,0,0,0,0,0,0,0,0,0,0,...,3780,3892,4003,4127,4285,4428,4532,4681,4783,4887


In [1284]:
transposed = consolidado_limpo.T
transposed

Unnamed: 0,6,6.1,6.2
1/22/20,0,0,0
1/23/20,0,0,0
1/24/20,0,0,0
1/25/20,0,0,0
1/26/20,0,0,0
...,...,...,...
4/30/20,218,1256,4428
5/1/20,225,1292,4532
5/2/20,237,1320,4681
5/3/20,246,1354,4783


In [1285]:
transposed.columns = ['mortos', 'recuperados', 'confirmados']

In [1286]:
transposed

Unnamed: 0,mortos,recuperados,confirmados
1/22/20,0,0,0
1/23/20,0,0,0
1/24/20,0,0,0
1/25/20,0,0,0
1/26/20,0,0,0
...,...,...,...
4/30/20,218,1256,4428
5/1/20,225,1292,4532
5/2/20,237,1320,4681
5/3/20,246,1354,4783


In [1287]:
transposed_limpo = transposed[transposed.confirmados != 0]
transposed_limpo

Unnamed: 0,mortos,recuperados,confirmados
3/3/20,0,0,1
3/4/20,0,0,1
3/5/20,0,0,1
3/6/20,0,0,2
3/7/20,0,0,8
...,...,...,...
4/30/20,218,1256,4428
5/1/20,225,1292,4532
5/2/20,237,1320,4681
5/3/20,246,1354,4783


In [1288]:
final = transposed_limpo.reset_index()
final

Unnamed: 0,index,mortos,recuperados,confirmados
0,3/3/20,0,0,1
1,3/4/20,0,0,1
2,3/5/20,0,0,1
3,3/6/20,0,0,2
4,3/7/20,0,0,8
...,...,...,...,...
58,4/30/20,218,1256,4428
59,5/1/20,225,1292,4532
60,5/2/20,237,1320,4681
61,5/3/20,246,1354,4783


In [1289]:
final.dtypes

index          object
mortos          int64
recuperados     int64
confirmados     int64
dtype: object

In [1290]:
final.columns = ['data','mortos', 'recuperados', 'confirmados']
final

Unnamed: 0,data,mortos,recuperados,confirmados
0,3/3/20,0,0,1
1,3/4/20,0,0,1
2,3/5/20,0,0,1
3,3/6/20,0,0,2
4,3/7/20,0,0,8
...,...,...,...,...
58,4/30/20,218,1256,4428
59,5/1/20,225,1292,4532
60,5/2/20,237,1320,4681
61,5/3/20,246,1354,4783


In [1291]:
final['data'] = pd.to_datetime(final['data'])

In [1292]:
final

Unnamed: 0,data,mortos,recuperados,confirmados
0,2020-03-03,0,0,1
1,2020-03-04,0,0,1
2,2020-03-05,0,0,1
3,2020-03-06,0,0,2
4,2020-03-07,0,0,8
...,...,...,...,...
58,2020-04-30,218,1256,4428
59,2020-05-01,225,1292,4532
60,2020-05-02,237,1320,4681
61,2020-05-03,246,1354,4783


In [1293]:
final.dtypes

data           datetime64[ns]
mortos                  int64
recuperados             int64
confirmados             int64
dtype: object

Para fins de comparação com outros países, realizamos exatamente o mesmo procedimento com os dados do Brasil:

In [1294]:
mortos_brasil = mortos[mortos['Country/Region'] == 'Brazil']
recuperados_brasil = recuperados[recuperados['Country/Region'] == 'Brazil']
confirmados_brasil = confirmados[confirmados['Country/Region'] == 'Brazil']
lista_brasil = [mortos_brasil, recuperados_brasil, confirmados_brasil]
consolidado_brasil = pd.concat(lista_brasil)
consolidado_limpo_brasil = consolidado_brasil.drop(['Province/State', 'Country/Region', 'Lat', 'Long'], axis = 1)
transposed_brasil = consolidado_limpo_brasil.T
transposed_brasil.columns = ['mortos', 'recuperados', 'confirmados']
transposed_brasil_limpo = transposed_brasil[transposed_brasil.confirmados != 0]
final_brasil = transposed_brasil_limpo.reset_index()
final_brasil.columns = ['data', 'mortos', 'recuperados', 'confirmados']
final_brasil['data'] = pd.to_datetime(final_brasil['data'])
final_brasil

Unnamed: 0,data,mortos,recuperados,confirmados
0,2020-02-26,0,0,1
1,2020-02-27,0,0,1
2,2020-02-28,0,0,1
3,2020-02-29,0,0,2
4,2020-03-01,0,0,2
...,...,...,...,...
64,2020-04-30,6006,35935,87187
65,2020-05-01,6412,38039,92202
66,2020-05-02,6761,40937,97100
67,2020-05-03,7051,42991,101826


## 4. Gráficos

Para que alguns dados fossem exibidos em valores relativos, precisamos coletar os dados referentes à população da Argentina e à do Brasil.

In [1295]:
pop_argentina = 45643937
pop_brasil = 217219215

In [1324]:
# Gráfico de linha
# Criando o gráfico:
trace1 = go.Scatter(x = final['data'],
                    y = (final['confirmados'] * 100000) / pop_argentina,
                    mode = 'lines',
                    name = 'Confirmados Argentina')
trace2 = go.Scatter(x = final_brasil['data'],
                    y = (final_brasil['confirmados'] * 100000) / pop_brasil,
                    mode = 'lines',
                    name = 'Confirmados Brasil',
                    line = {'dash':'dot'})
trace3 = go.Scatter(x = final['data'],
                    y = (final['mortos'] * 100000) / pop_argentina,
                    mode = 'lines',
                    name = 'Mortos Argentina')
trace4 = go.Scatter(x = final_brasil['data'],
                    y = (final_brasil['mortos'] * 100000) / pop_brasil,
                    mode = 'lines',
                    name = 'Mortos Brasil',
                    line = {'dash':'dot'})
trace5 = go.Scatter(x = final['data'],
                    y = (final['recuperados'] * 100000) / pop_argentina,
                    mode = 'lines',
                    name = 'Recuperados Argentina')
trace6 = go.Scatter(x = final_brasil['data'],
                    y = (final_brasil['recuperados'] * 100000) / pop_brasil,
                    mode = 'lines',
                    name = 'Recuperados Brasil',
                    line = {'dash':'dot'})

# Armazenando o gráfico em uma lista:
data = [trace1, trace2, trace3, trace4, trace5, trace6]

# Criando o Layout:
layout = go.Layout(title='Evolução COVID-19 - Brasil vs Argentina (por 100 mil habitantes)',
                   title_x=0.5,
                   yaxis={'title':''},
                   xaxis={'title':''})

# Criando figura que será exibida:
fig = go.Figure(data=data, layout=layout)

# Exibindo figura / gráfico:
py.iplot(fig)

Comentários: o gráfico deixa claro que o Brasil está em uma situação bem mais complicada que a Argentina em relação ao COVID19. A Curva de casos confirmados no Brasil tem um aspecto de curva exponencial indicando que a incidência do corona vírus na população é alto e com tendência de crescimento mais intenso, diferentemente do que ocorre com a Argentina.

In [1297]:
# Stacked Bar
# Criando o gráfico:
trace1 = go.Bar(x = final['data'],
                y = final['mortos'],
                name = 'Mortos',
                marker = {'color':'#e74c3c'})
trace2 = go.Bar(x = final['data'],
                y = final['confirmados'],
                name = 'Confirmados',
                marker = {'color':'#f1c40f'})
trace3 = go.Bar(x = final['data'],
                y = final['recuperados'],
                name = 'Recuperados',
                marker = {'color':'#2ecc71'})   

# Armazenando o gráfico em uma lista:
data = [trace1, trace2, trace3]

# Criando o Layout:
layout = go.Layout(title='COVID-19 Argentina',
                   title_x=0.5,
                   yaxis={'title':''},
                   xaxis={'title':''},
                   barmode = 'stack')

# Criando figura que será exibida:
fig = go.Figure(data=data, layout=layout)

# Exibindo figura / gráfico:
py.iplot(fig)

Comentários: esse gráfico demonstra que a COVID19 tem uma tendência de
crescimento na Argentina. Chama a atenção a taxa de contaminação e o número quase constate de mortos entre a segunda metade de abril e inicio de maio.

### Extra - Dados específicos da Argentina
fonte: https://github.com/SistemasMapache/Covid19arData

Encontramos um _dataset_ com dados específicos da Argentina e de suas províncias. São descritos detalhadamente os eventos relativos a contaminações, mortes e recuperações de infecção do Coronavírus

In [1298]:
url_dados_argentina = 'https://docs.google.com/spreadsheets/d/16-bnsDdmmgtSxdWbVMboIHo5FRuz76DBxsz_BbsEVWA/export?format=csv&id=16-bnsDdmmgtSxdWbVMboIHo5FRuz76DBxsz_BbsEVWA&gid=0'
dados_argentina = pd.read_csv(url_dados_argentina)

In [1299]:
dados_argentina.tail(10)

Unnamed: 0,fecha,dia_inicio,dia_cuarentena_dnu260,osm_admin_level_2,osm_admin_level_4,osm_admin_level_8,tot_casosconf,nue_casosconf_diff,tot_fallecidos,nue_fallecidos_diff,tot_recuperados,tot_terapia,test_RT-PCR_negativos,test_RT-PCR_total,transmision_tipo,informe_tipo,informe_link,observacion,covid19argentina_admin_level_4
653,3/05/2020,60,44.0,Argentina,Indeterminado,,4782,0,246,0,1442.0,146.0,,,,,,,no-data
654,4/05/2020,61,45.0,Argentina,Buenos Aires,,4820,38,253,7,,,,,,,,,buenos-aires
655,4/05/2020,61,45.0,Argentina,CABA,,4863,43,257,4,,,,,,,,,capital-federal
656,4/05/2020,61,45.0,Argentina,Chaco,,4868,5,258,1,,,,,,,,,chaco
657,4/05/2020,61,45.0,Argentina,Córdoba,,4874,6,260,2,,,,,,,,,cordoba
658,4/05/2020,61,45.0,Argentina,La Rioja,,4875,1,260,0,,,,,,,,,la-rioja
659,4/05/2020,61,45.0,Argentina,Misiones,,4876,1,260,0,,,,,,,,,misiones
660,4/05/2020,61,45.0,Argentina,Río Negro,,4883,7,260,0,,,,,,,,,rio-negro
661,4/05/2020,61,45.0,Argentina,Tucumán,,4886,3,260,0,,,,,,,,,tucuman
662,4/05/2020,61,45.0,Argentina,Indeterminado,,4886,0,260,0,,,,,,,,,no-data


In [1300]:
dados_argentina.shape

(663, 19)

In [1301]:
dados_argentina.osm_admin_level_4.unique()

array(['CABA', 'Indeterminado', 'Buenos Aires', 'San Luis', 'Chaco',
       'Río Negro', 'Tierra del Fuego', 'Córdoba', 'Jujuy', 'Salta',
       'Entre Ríos', 'Santa Cruz', 'Tucumán', 'Santa Fe', 'Corrientes',
       'Neuquén', 'Santiago del Estero', 'Mendoza', 'La Pampa',
       'Misiones', 'San Juan', 'La Rioja', 'Chubut'], dtype=object)

In [1302]:
Lat = pd.Series([])
Lat.astype('float64')
for i in range(len(dados_argentina)):
    if dados_argentina['osm_admin_level_4'][i] == 'CABA':
        Lat[i]='-34.603722'
    elif dados_argentina['osm_admin_level_4'][i] == 'Buenos Aires':
        Lat[i]='-34.921389'
    elif dados_argentina['osm_admin_level_4'][i] == 'San Luis':
        Lat[i]='-33.29501'
    elif dados_argentina['osm_admin_level_4'][i] == 'Chaco':
        Lat[i]='-27.46056'
    elif dados_argentina['osm_admin_level_4'][i] == 'Río Negro':
        Lat[i]='-40.81345'
    elif dados_argentina['osm_admin_level_4'][i] == 'Tierra del Fuego':
        Lat[i]='-54.8'
    elif dados_argentina['osm_admin_level_4'][i] == 'Córdoba':
        Lat[i]='-31.4135'
    elif dados_argentina['osm_admin_level_4'][i] == 'Jujuy':
        Lat[i]='-24.19457'
    elif dados_argentina['osm_admin_level_4'][i] == 'Salta':
        Lat[i]='-24.7859'
    elif dados_argentina['osm_admin_level_4'][i] == 'Entre Ríos':
        Lat[i]='-31.73197'
    elif dados_argentina['osm_admin_level_4'][i] == 'Santa Cruz':
        Lat[i]='-51.62261'
    elif dados_argentina['osm_admin_level_4'][i] == 'Tucumán':
        Lat[i]='-26.82414'
    elif dados_argentina['osm_admin_level_4'][i] == 'Santa Fe':
        Lat[i]='-31.63333'
    elif dados_argentina['osm_admin_level_4'][i] == 'Corrientes':
        Lat[i]='-27.4806'
    elif dados_argentina['osm_admin_level_4'][i] == 'Neuquén':
        Lat[i]='-38.95161'
    elif dados_argentina['osm_admin_level_4'][i] == 'Santiago del Estero':
        Lat[i]='-27.79511'
    elif dados_argentina['osm_admin_level_4'][i] == 'Mendoza':
        Lat[i]='-32.89084'
    elif dados_argentina['osm_admin_level_4'][i] == 'La Pampa':
        Lat[i]='-36.61667'
    elif dados_argentina['osm_admin_level_4'][i] == 'Misiones':
        Lat[i]='-27.36708'
    elif dados_argentina['osm_admin_level_4'][i] == 'San Juan':
        Lat[i]='-31.5375'
    elif dados_argentina['osm_admin_level_4'][i] == 'La Rioja':
        Lat[i]='-29.41105'
    elif dados_argentina['osm_admin_level_4'][i] == 'Chubut':
        Lat[i]='-43.30016'
    
dados_argentina.insert(5, 'Lat', Lat)






In [1303]:
Long = pd.Series([])
Long.astype('float64')
for i in range(len(dados_argentina)):
    if dados_argentina['osm_admin_level_4'][i] == 'CABA':
        Long[i]='-58.37723'
    elif dados_argentina['osm_admin_level_4'][i] == 'Buenos Aires':
        Long[i]='-57.954444'
    elif dados_argentina['osm_admin_level_4'][i] == 'San Luis':
        Long[i]='-66.33563'
    elif dados_argentina['osm_admin_level_4'][i] == 'Chaco':
        Long[i]='-58.98389'
    elif dados_argentina['osm_admin_level_4'][i] == 'Río Negro':
        Long[i]='-62.99668'
    elif dados_argentina['osm_admin_level_4'][i] == 'Tierra del Fuego':
        Long[i]='-68.3'
    elif dados_argentina['osm_admin_level_4'][i] == 'Córdoba':
        Long[i]='-64.18105'
    elif dados_argentina['osm_admin_level_4'][i] == 'Jujuy':
        Long[i]='-65.29712'
    elif dados_argentina['osm_admin_level_4'][i] == 'Salta':
        Long[i]='-65.41166'
    elif dados_argentina['osm_admin_level_4'][i] == 'Entre Ríos':
        Long[i]='-60.5238'
    elif dados_argentina['osm_admin_level_4'][i] == 'Santa Cruz':
        Long[i]='-69.21813'
    elif dados_argentina['osm_admin_level_4'][i] == 'Tucumán':
        Long[i]='-65.2226'
    elif dados_argentina['osm_admin_level_4'][i] == 'Santa Fe':
        Long[i]='-60.7'
    elif dados_argentina['osm_admin_level_4'][i] == 'Corrientes':
        Long[i]='-58.8341'
    elif dados_argentina['osm_admin_level_4'][i] == 'Neuquén':
        Long[i]='-68.0591'
    elif dados_argentina['osm_admin_level_4'][i] == 'Santiago del Estero':
        Long[i]='-64.26149'
    elif dados_argentina['osm_admin_level_4'][i] == 'Mendoza':
        Long[i]='-68.82717'
    elif dados_argentina['osm_admin_level_4'][i] == 'La Pampa':
        Long[i]='-64.28333'
    elif dados_argentina['osm_admin_level_4'][i] == 'Misiones':
        Long[i]='-55.89608'
    elif dados_argentina['osm_admin_level_4'][i] == 'San Juan':
        Long[i]='-68.53639'
    elif dados_argentina['osm_admin_level_4'][i] == 'La Rioja':
        Long[i]='-66.85067'
    elif dados_argentina['osm_admin_level_4'][i] == 'Chubut':
        Long[i]='-65.10228'
    
dados_argentina.insert(6, 'Long', Long)





In [1304]:
dados_argentina.head(20)

Unnamed: 0,fecha,dia_inicio,dia_cuarentena_dnu260,osm_admin_level_2,osm_admin_level_4,Lat,Long,osm_admin_level_8,tot_casosconf,nue_casosconf_diff,...,nue_fallecidos_diff,tot_recuperados,tot_terapia,test_RT-PCR_negativos,test_RT-PCR_total,transmision_tipo,informe_tipo,informe_link,observacion,covid19argentina_admin_level_4
0,2/03/2020,1,,Argentina,CABA,-34.603722,-58.37723,,1,1,...,0,,,,,importado,,https://www.infobae.com/coronavirus/2020/03/03...,no hay informe,capital-federal
1,3/03/2020,2,,Argentina,Indeterminado,,,,1,0,...,0,,,,,importado,,,no hay informe,no-data
2,4/03/2020,3,,Argentina,Indeterminado,,,,1,0,...,0,,,,,importado,,,no hay informe,no-data
3,5/03/2020,4,,Argentina,Buenos Aires,-34.921389,-57.954444,,2,1,...,0,,,,,importado,informe nacional,https://www.argentina.gob.ar/sites/default/fil...,,buenos-aires
4,6/03/2020,5,,Argentina,Indeterminado,,,,2,0,...,0,,,,,importado,informe nacional,https://www.argentina.gob.ar/sites/default/fil...,,no-data
5,7/03/2020,6,,Argentina,Indeterminado,,,,2,0,...,0,,,,,importado,,,no hay informe,no-data
6,8/03/2020,7,,Argentina,Buenos Aires,-34.921389,-57.954444,,10,8,...,0,,,,,importado,informe nacional,https://www.argentina.gob.ar/sites/default/fil...,,buenos-aires
7,9/03/2020,8,,Argentina,CABA,-34.603722,-58.37723,,11,1,...,1,,,,,importado,informe nacional,https://www.argentina.gob.ar/sites/default/fil...,,capital-federal
8,9/03/2020,8,,Argentina,San Luis,-33.29501,-66.33563,,13,2,...,0,,,,,importado,informe nacional,https://www.argentina.gob.ar/sites/default/fil...,,san-luis
9,9/03/2020,8,,Argentina,Chaco,-27.46056,-58.98389,,18,5,...,0,,,,,importado,informe nacional,https://www.argentina.gob.ar/sites/default/fil...,,chaco


In [1305]:
dados_argentina.count()

fecha                             663
dia_inicio                        663
dia_cuarentena_dnu260             602
osm_admin_level_2                 663
osm_admin_level_4                 663
Lat                               609
Long                              609
osm_admin_level_8                 135
tot_casosconf                     663
nue_casosconf_diff                663
tot_fallecidos                    663
nue_fallecidos_diff               663
tot_recuperados                    47
tot_terapia                        39
test_RT-PCR_negativos              47
test_RT-PCR_total                  47
transmision_tipo                  421
informe_tipo                      228
informe_link                      330
observacion                        36
covid19argentina_admin_level_4    663
dtype: int64

In [1306]:
dados_argentina.dtypes

fecha                              object
dia_inicio                          int64
dia_cuarentena_dnu260             float64
osm_admin_level_2                  object
osm_admin_level_4                  object
Lat                                object
Long                               object
osm_admin_level_8                  object
tot_casosconf                       int64
nue_casosconf_diff                  int64
tot_fallecidos                      int64
nue_fallecidos_diff                 int64
tot_recuperados                   float64
tot_terapia                       float64
test_RT-PCR_negativos             float64
test_RT-PCR_total                 float64
transmision_tipo                   object
informe_tipo                       object
informe_link                       object
observacion                        object
covid19argentina_admin_level_4     object
dtype: object

In [1307]:
dados_argentina['Lat'] = dados_argentina['Lat'].astype(str).astype(float)
dados_argentina['Long'] = dados_argentina['Lat'].astype(str).astype(float)
dados_argentina['fecha'] = pd.to_datetime(dados_argentina['fecha'])
dados_argentina.dtypes

fecha                             datetime64[ns]
dia_inicio                                 int64
dia_cuarentena_dnu260                    float64
osm_admin_level_2                         object
osm_admin_level_4                         object
Lat                                      float64
Long                                     float64
osm_admin_level_8                         object
tot_casosconf                              int64
nue_casosconf_diff                         int64
tot_fallecidos                             int64
nue_fallecidos_diff                        int64
tot_recuperados                          float64
tot_terapia                              float64
test_RT-PCR_negativos                    float64
test_RT-PCR_total                        float64
transmision_tipo                          object
informe_tipo                              object
informe_link                              object
observacion                               object
covid19argentina_adm

In [1308]:
# Quantidade total de casos por Província

total_confirmados_provincias = dados_argentina.groupby('osm_admin_level_4')['nue_casosconf_diff'].sum()
total_confirmados_provincias = total_confirmados_provincias.drop(['Indeterminado'], axis=0)
total_confirmados_provincias = total_confirmados_provincias.sort_values(ascending=False)
total_confirmados_provincias = total_confirmados_provincias.reset_index()

In [1309]:
populacao = pd.Series([])
for i in range(len(total_confirmados_provincias)):
    if total_confirmados_provincias['osm_admin_level_4'][i] == 'CABA':
        populacao[i]='2890151'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Buenos Aires':
        populacao[i]='14322087'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'San Luis':
        populacao[i]='431588'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Chaco':
        populacao[i]='1053466'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Río Negro':
        populacao[i]='633374'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Tierra del Fuego':
        populacao[i]='126190'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Córdoba':
        populacao[i]='3308876'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Jujuy':
        populacao[i]='672260'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Salta':
        populacao[i]='1215207'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Entre Ríos':
        populacao[i]='1236300'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Santa Cruz':
        populacao[i]='272524'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Tucumán':
        populacao[i]='1448200'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Santa Fe':
        populacao[i]='3194537'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Corrientes':
        populacao[i]='993338'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Neuquén':
        populacao[i]='550344'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Santiago del Estero':
        populacao[i]='896461'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Mendoza':
        populacao[i]='1738929'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'La Pampa':
        populacao[i]='316940'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Misiones':
        populacao[i]='1097829'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'San Juan':
        populacao[i]='680427'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'La Rioja':
        populacao[i]='331847'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Chubut':
        populacao[i]='506668'
    
total_confirmados_provincias.insert(2, 'populacao', populacao)
total_confirmados_provincias['populacao'] = total_confirmados_provincias['populacao'].astype(str).astype(float)





In [1310]:
total_confirmados_provincias['casos_relativos'] = (total_confirmados_provincias['nue_casosconf_diff'] * 100000) / total_confirmados_provincias['populacao']

In [1311]:
Lat2 = pd.Series([])
for i in range(len(total_confirmados_provincias)):
    if total_confirmados_provincias['osm_admin_level_4'][i] == 'CABA':
        Lat2[i]='-34.603722'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Buenos Aires':
        Lat2[i]='-34.921389'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'San Luis':
        Lat2[i]='-33.29501'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Chaco':
        Lat2[i]='-27.46056'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Río Negro':
        Lat2[i]='-40.81345'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Tierra del Fuego':
        Lat2[i]='-54.8'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Córdoba':
        Lat2[i]='-31.4135'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Jujuy':
        Lat2[i]='-24.19457'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Salta':
        Lat2[i]='-24.7859'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Entre Ríos':
        Lat2[i]='-31.73197'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Santa Cruz':
        Lat2[i]='-51.62261'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Tucumán':
        Lat2[i]='-26.82414'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Santa Fe':
        Lat2[i]='-31.63333'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Corrientes':
        Lat2[i]='-27.4806'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Neuquén':
        Lat2[i]='-38.95161'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Santiago del Estero':
        Lat2[i]='-27.79511'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Mendoza':
        Lat2[i]='-32.89084'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'La Pampa':
        Lat2[i]='-36.61667'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Misiones':
        Lat2[i]='-27.36708'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'San Juan':
        Lat2[i]='-31.5375'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'La Rioja':
        Lat2[i]='-29.41105'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Chubut':
        Lat2[i]='-43.30016'
total_confirmados_provincias.insert(4, 'Lat', Lat2)
total_confirmados_provincias['Lat'] = total_confirmados_provincias['Lat'].astype(str).astype(float)





In [1312]:
Long2 = pd.Series([])
for i in range(len(total_confirmados_provincias)):
    if total_confirmados_provincias['osm_admin_level_4'][i] == 'CABA':
        Long2[i]='-58.37723'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Buenos Aires':
        Long2[i]='-57.954444'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'San Luis':
        Long2[i]='-66.33563'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Chaco':
        Long2[i]='-58.98389'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Río Negro':
        Long2[i]='-62.99668'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Tierra del Fuego':
        Long2[i]='-68.3'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Córdoba':
        Long2[i]='-64.18105'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Jujuy':
        Long2[i]='-65.29712'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Salta':
        Long2[i]='-65.41166'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Entre Ríos':
        Long2[i]='-60.5238'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Santa Cruz':
        Long2[i]='-69.21813'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Tucumán':
        Long2[i]='-65.2226'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Santa Fe':
        Long2[i]='-60.7'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Corrientes':
        Long2[i]='-58.8341'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Neuquén':
        Long2[i]='-68.0591'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Santiago del Estero':
        Long2[i]='-64.26149'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Mendoza':
        Long2[i]='-68.82717'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'La Pampa':
        Long2[i]='-64.28333'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Misiones':
        Long2[i]='-55.89608'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'San Juan':
        Long2[i]='-68.53639'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'La Rioja':
        Long2[i]='-66.85067'
    elif total_confirmados_provincias['osm_admin_level_4'][i] == 'Chubut':
        Long2[i]='-65.10228'
    
total_confirmados_provincias.insert(5, 'Long', Long2)
total_confirmados_provincias['Long'] = total_confirmados_provincias['Long'].astype(str).astype(float)
total_confirmados_provincias





Unnamed: 0,osm_admin_level_4,nue_casosconf_diff,populacao,casos_relativos,Lat,Long
0,Buenos Aires,1753,14322087.0,12.239836,-34.921389,-57.954444
1,CABA,1347,2890151.0,46.606561,-34.603722,-58.37723
2,Chaco,347,1053466.0,32.938889,-27.46056,-58.98389
3,Córdoba,310,3308876.0,9.36874,-31.4135,-64.18105
4,Río Negro,255,633374.0,40.260573,-40.81345,-62.99668
5,Santa Fe,243,3194537.0,7.606736,-31.63333,-60.7
6,Tierra del Fuego,145,126190.0,114.906094,-54.8,-68.3
7,Neuquén,110,550344.0,19.987499,-38.95161,-68.0591
8,Mendoza,84,1738929.0,4.830559,-32.89084,-68.82717
9,La Rioja,56,331847.0,16.875247,-29.41105,-66.85067


In [1313]:
total_falecidos_provincias = dados_argentina.groupby('osm_admin_level_4')['nue_fallecidos_diff'].sum()
total_falecidos_provincias = total_falecidos_provincias.drop(['Indeterminado'], axis=0)
total_falecidos_provincias = total_falecidos_provincias.sort_values(ascending=False)
total_falecidos_provincias = total_falecidos_provincias.reset_index()
total_falecidos_provincias

Unnamed: 0,osm_admin_level_4,nue_fallecidos_diff
0,Buenos Aires,101
1,CABA,85
2,Córdoba,18
3,Chaco,18
4,Mendoza,10
5,Río Negro,9
6,Neuquén,6
7,La Rioja,6
8,Tucumán,4
9,Santa Fe,2


In [1314]:
populacao2 = pd.Series([])
for i in range(len(total_falecidos_provincias)):
    if total_falecidos_provincias['osm_admin_level_4'][i] == 'CABA':
        populacao2[i]='2890151'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Buenos Aires':
        populacao2[i]='14322087'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'San Luis':
        populacao2[i]='431588'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Chaco':
        populacao2[i]='1053466'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Río Negro':
        populacao2[i]='633374'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Tierra del Fuego':
        populacao2[i]='126190'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Córdoba':
        populacao2[i]='3308876'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Jujuy':
        populacao2[i]='672260'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Salta':
        populacao2[i]='1215207'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Entre Ríos':
        populacao2[i]='1236300'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Santa Cruz':
        populacao2[i]='272524'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Tucumán':
        populacao2[i]='1448200'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Santa Fe':
        populacao2[i]='3194537'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Corrientes':
        populacao2[i]='993338'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Neuquén':
        populacao2[i]='550344'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Santiago del Estero':
        populacao2[i]='896461'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Mendoza':
        populacao2[i]='1738929'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'La Pampa':
        populacao2[i]='316940'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Misiones':
        populacao2[i]='1097829'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'San Juan':
        populacao2[i]='680427'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'La Rioja':
        populacao2[i]='331847'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Chubut':
        populacao2[i]='506668'
    
total_falecidos_provincias.insert(2, 'populacao', populacao2)
total_falecidos_provincias['populacao'] = total_falecidos_provincias['populacao'].astype(str).astype(float)
total_falecidos_provincias





Unnamed: 0,osm_admin_level_4,nue_fallecidos_diff,populacao
0,Buenos Aires,101,14322087.0
1,CABA,85,2890151.0
2,Córdoba,18,3308876.0
3,Chaco,18,1053466.0
4,Mendoza,10,1738929.0
5,Río Negro,9,633374.0
6,Neuquén,6,550344.0
7,La Rioja,6,331847.0
8,Tucumán,4,1448200.0
9,Santa Fe,2,3194537.0


In [1315]:
total_falecidos_provincias['mortes_relativas'] = (total_falecidos_provincias['nue_fallecidos_diff'] * 100000) / total_falecidos_provincias['populacao']
total_falecidos_provincias

Unnamed: 0,osm_admin_level_4,nue_fallecidos_diff,populacao,mortes_relativas
0,Buenos Aires,101,14322087.0,0.705204
1,CABA,85,2890151.0,2.941023
2,Córdoba,18,3308876.0,0.543991
3,Chaco,18,1053466.0,1.708646
4,Mendoza,10,1738929.0,0.575067
5,Río Negro,9,633374.0,1.420961
6,Neuquén,6,550344.0,1.090227
7,La Rioja,6,331847.0,1.808062
8,Tucumán,4,1448200.0,0.276205
9,Santa Fe,2,3194537.0,0.062607


In [1316]:
Lat3 = pd.Series([])
for i in range(len(total_falecidos_provincias)):
    if total_falecidos_provincias['osm_admin_level_4'][i] == 'CABA':
        Lat3[i]='-34.603722'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Buenos Aires':
        Lat3[i]='-34.921389'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'San Luis':
        Lat3[i]='-33.29501'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Chaco':
        Lat3[i]='-27.46056'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Río Negro':
        Lat3[i]='-40.81345'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Tierra del Fuego':
        Lat3[i]='-54.8'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Córdoba':
        Lat3[i]='-31.4135'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Jujuy':
        Lat3[i]='-24.19457'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Salta':
        Lat3[i]='-24.7859'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Entre Ríos':
        Lat3[i]='-31.73197'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Santa Cruz':
        Lat3[i]='-51.62261'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Tucumán':
        Lat3[i]='-26.82414'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Santa Fe':
        Lat3[i]='-31.63333'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Corrientes':
        Lat3[i]='-27.4806'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Neuquén':
        Lat3[i]='-38.95161'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Santiago del Estero':
        Lat3[i]='-27.79511'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Mendoza':
        Lat3[i]='-32.89084'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'La Pampa':
        Lat3[i]='-36.61667'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Misiones':
        Lat3[i]='-27.36708'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'San Juan':
        Lat3[i]='-31.5375'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'La Rioja':
        Lat3[i]='-29.41105'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Chubut':
        Lat3[i]='-43.30016'
total_falecidos_provincias.insert(4, 'Lat', Lat3)
total_falecidos_provincias['Lat'] = total_falecidos_provincias['Lat'].astype(str).astype(float)





In [1317]:
Long3 = pd.Series([])
for i in range(len(total_falecidos_provincias)):
    if total_falecidos_provincias['osm_admin_level_4'][i] == 'CABA':
        Long3[i]='-58.37723'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Buenos Aires':
        Long3[i]='-57.954444'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'San Luis':
        Long3[i]='-66.33563'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Chaco':
        Long3[i]='-58.98389'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Río Negro':
        Long3[i]='-62.99668'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Tierra del Fuego':
        Long3[i]='-68.3'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Córdoba':
        Long3[i]='-64.18105'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Jujuy':
        Long3[i]='-65.29712'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Salta':
        Long3[i]='-65.41166'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Entre Ríos':
        Long3[i]='-60.5238'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Santa Cruz':
        Long3[i]='-69.21813'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Tucumán':
        Long3[i]='-65.2226'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Santa Fe':
        Long3[i]='-60.7'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Corrientes':
        Long3[i]='-58.8341'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Neuquén':
        Long3[i]='-68.0591'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Santiago del Estero':
        Long3[i]='-64.26149'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Mendoza':
        Long3[i]='-68.82717'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'La Pampa':
        Long3[i]='-64.28333'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Misiones':
        Long3[i]='-55.89608'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'San Juan':
        Long3[i]='-68.53639'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'La Rioja':
        Long3[i]='-66.85067'
    elif total_falecidos_provincias['osm_admin_level_4'][i] == 'Chubut':
        Long3[i]='-65.10228'
    
total_falecidos_provincias.insert(5, 'Long', Long3)
total_falecidos_provincias['Long'] = total_falecidos_provincias['Long'].astype(str).astype(float)
total_falecidos_provincias





Unnamed: 0,osm_admin_level_4,nue_fallecidos_diff,populacao,mortes_relativas,Lat,Long
0,Buenos Aires,101,14322087.0,0.705204,-34.921389,-57.954444
1,CABA,85,2890151.0,2.941023,-34.603722,-58.37723
2,Córdoba,18,3308876.0,0.543991,-31.4135,-64.18105
3,Chaco,18,1053466.0,1.708646,-27.46056,-58.98389
4,Mendoza,10,1738929.0,0.575067,-32.89084,-68.82717
5,Río Negro,9,633374.0,1.420961,-40.81345,-62.99668
6,Neuquén,6,550344.0,1.090227,-38.95161,-68.0591
7,La Rioja,6,331847.0,1.808062,-29.41105,-66.85067
8,Tucumán,4,1448200.0,0.276205,-26.82414,-65.2226
9,Santa Fe,2,3194537.0,0.062607,-31.63333,-60.7


In [1318]:
layout = go.Layout(title='COVID-19 Argentina',
                   title_x=0.5,
                   yaxis = {'title':''},
                   xaxis = {'title':'Província'})

trace1 = go.Bar(x = total_confirmados_provincias['osm_admin_level_4'],
                y = total_confirmados_provincias['nue_casosconf_diff'],
                name = 'Contaminados - Total')

trace2 = go.Bar(x = total_confirmados_provincias['osm_admin_level_4'],
                y = total_confirmados_provincias['casos_relativos'],
                name = 'Contaminados - Relativo')

trace3 = go.Bar(x = total_falecidos_provincias['osm_admin_level_4'],
                y = total_falecidos_provincias['nue_fallecidos_diff'],
                name = 'Mortes - Total')

trace4 = go.Bar(x = total_falecidos_provincias['osm_admin_level_4'],
                y = total_falecidos_provincias['mortes_relativas'],
                name = 'Mortes - Relativo')

data = [trace1, trace2, trace3, trace4]

fig = go.Figure(data, layout = layout)

py.iplot(fig)

Comentários: o gráfico demostra que, em números absolutos, a incidência do Coronavírus na Argentina está concentrado em algumas de suas maiores províncias, especialmente em Buenos Aires. A partir da província de La Rioja o número de registros confirmados de COVID19 tem pouca variação quando comparado com as províncias de Buenos Aires e Córdoba, por exemplo. No entanto, quando verificamos os números relativos, percebemos que os casos por 100 mil habitantes estão mais concentrados na província Terra do Fogo. Curiosamente, esta província não registrou nenhuma morte até o momento. Em termos relativos, CABA (Ciudade Autonoma de Buenos Aires) detém os números mais altos para mortes.

Comentários: o gráfico mostra que as mortes em decorrência de COVID19 estão praticamente todas concentrados nas províncias de Buenos Aires e na CABA (Ciudade Autonoma de Buenos Aires).

In [1319]:
total_confirmados_provincias['text'] = total_confirmados_provincias['osm_admin_level_4'] + (': ') + (total_confirmados_provincias['nue_casosconf_diff']).astype(str)+' casos confirmados'
limits = [(0,1000)]
colors = ["royalblue","crimson","lightseagreen","orange","lightgrey"]
scale = 1

fig = go.Figure()

for i in range(len(limits)):
    lim = limits[i]
    df_sub = total_confirmados_provincias[lim[0]:lim[1]]
    fig.add_trace(go.Scattergeo(
        locationmode = 'country names',
        lon = df_sub['Long'],
        lat = df_sub['Lat'],
        text = df_sub['text'],
        marker = dict(
            size = df_sub['nue_casosconf_diff']/scale,
            color = colors[i],
            line_color='rgb(40,40,40)',
            line_width=0.5,
            sizemode = 'area'
        ),
        name = '{0} - {1}'.format(lim[0],lim[1])))

fig.update_layout(
        title_text = 'Casos Confirmados COVID-19 Argentina',
        title_x = 0.5,
        showlegend = False,
        geo = dict(
            scope = 'south america',
            landcolor = 'rgb(217, 217, 217)',
        )
    )

fig.show()

In [1322]:
total_falecidos_provincias['text'] = total_falecidos_provincias['osm_admin_level_4'] + (': ') + (total_falecidos_provincias['nue_fallecidos_diff']).astype(str)+' mortes'
limits = [(0,1000)]
colors = ["crimson","lightseagreen","orange","lightgrey"]
scale = 0.1

fig = go.Figure()

for i in range(len(limits)):
    lim = limits[i]
    df_sub = total_falecidos_provincias[lim[0]:lim[1]]
    fig.add_trace(go.Scattergeo(
        locationmode = 'country names',
        lon = df_sub['Long'],
        lat = df_sub['Lat'],
        text = df_sub['text'],
        marker = dict(
            size = df_sub['nue_fallecidos_diff']/scale,
            color = colors[i],
            line_color='rgb(40,40,40)',
            line_width=0.5,
            sizemode = 'area'
        ),
        name = '{0} - {1}'.format(lim[0],lim[1])))

fig.update_layout(
        title_text = 'Mortes COVID-19 Argentina',
        title_x = 0.5,
        showlegend = False,
        geo = dict(
            scope = 'south america',
            landcolor = 'rgb(217, 217, 217)',
        )
    )

fig.show()