### Evolução do Número Total de Casos e Número Diário de Casos de Covid-19 no Estado de São Paulo.

In [21]:
# Importando os pacotes necessários.
import pandas as pd
import numpy as np
from datetime import datetime
import plotly.offline as py
import plotly.graph_objs as go
py.init_notebook_mode(connected=True)

In [22]:
pwd

'C:\\Users\\dlt02\\Documents\\Data Scientist\\Covid-19'

In [23]:
filepath = 'Dados-covid-19-estado_2.csv'

In [24]:
# leitura dos dados.
covid_sp = pd.read_csv(filepath, sep=';')
covid_sp

Unnamed: 0,Data,Total de casos,Casos por dia,Óbitos por dia,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8
0,26 fev,1,1,,,,,,
1,27 fev,0,0,,,,,,
2,28 fev,0,0,,,,,,
3,29 fev,2,1,,,,,,
4,01 mar,0,0,,,,,,
...,...,...,...,...,...,...,...,...,...
244,27/out,1098207,5364,132.0,,,,,
245,28/out,1103582,5375,122.0,,,,,
246,29/out,1108860,5278,112.0,,,,,
247,30/out,1113788,4928,136.0,,,,,


In [25]:
# Removendo as colunas 'unnamed' do dataframe.
covid_sp.drop(covid_sp.columns[covid_sp.columns.str.contains('unnamed',case = False)],axis = 1, inplace = True)
covid_sp

Unnamed: 0,Data,Total de casos,Casos por dia,Óbitos por dia
0,26 fev,1,1,
1,27 fev,0,0,
2,28 fev,0,0,
3,29 fev,2,1,
4,01 mar,0,0,
...,...,...,...,...
244,27/out,1098207,5364,132.0
245,28/out,1103582,5375,122.0
246,29/out,1108860,5278,112.0
247,30/out,1113788,4928,136.0


In [26]:
covid_sp.shape

(249, 4)

In [27]:
# Verificando a existência de valores faltantes (NaNs).
covid_sp.isnull().sum()

Data               0
Total de casos     0
Casos por dia      0
Óbitos por dia    20
dtype: int64

In [28]:
# Eliminando os valores faltantes (NaN).
covid_sp.dropna(inplace=True)
covid_sp

Unnamed: 0,Data,Total de casos,Casos por dia,Óbitos por dia
20,17 mar,164,12,1.0
21,18 mar,240,76,3.0
22,19 mar,286,46,1.0
23,20 mar,396,110,4.0
24,21 mar,459,63,6.0
...,...,...,...,...
244,27/out,1098207,5364,132.0
245,28/out,1103582,5375,122.0
246,29/out,1108860,5278,112.0
247,30/out,1113788,4928,136.0


** Percebe-se que, eliminando-se as linhas que contém NaNs, a primeira linha do dataframe, agora, passa a ser a de índice 20.** 

In [10]:
# Verificando os tipos das variáveis.
covid_sp.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 229 entries, 20 to 248
Data columns (total 4 columns):
 #   Column          Non-Null Count  Dtype  
---  ------          --------------  -----  
 0   Data            229 non-null    object 
 1   Total de casos  229 non-null    int64  
 2   Casos por dia   229 non-null    int64  
 3   Óbitos por dia  229 non-null    float64
dtypes: float64(1), int64(2), object(1)
memory usage: 8.1+ KB


In [11]:
covid_sp.dtypes

Data               object
Total de casos      int64
Casos por dia       int64
Óbitos por dia    float64
dtype: object

In [12]:
covid_sp

Unnamed: 0,Data,Total de casos,Casos por dia,Óbitos por dia
20,17 mar,164,12,1.0
21,18 mar,240,76,3.0
22,19 mar,286,46,1.0
23,20 mar,396,110,4.0
24,21 mar,459,63,6.0
...,...,...,...,...
244,27/out,1098207,5364,132.0
245,28/out,1103582,5375,122.0
246,29/out,1108860,5278,112.0
247,30/out,1113788,4928,136.0


### Criando os gráficos

In [13]:
# Criando o gráfico com Plotly.
trace = go.Scatter(x = covid_sp['Data'],
                   y = covid_sp['Total de casos'],
                   mode = 'markers')
# Armazenando o gráfico em uma lista.
data = [trace]
# Criando Layout
layout = go.Layout(title='Covid-19 no Estado de São Paulo',
                   yaxis={'title':'Total de casos'},
                   xaxis={'title': 'Tempo'})
# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)
# Exibindo figura/gráfico
py.iplot(fig)

In [29]:
trace = go.Scatter(x = covid_sp['Data'],
                   y = covid_sp['Casos por dia'],
                   mode = 'markers',
                   marker =  {'color' : '#e74c3c',
                              'line' : {'width': 1,
                                        'color': '#c0392b'}},
                   opacity=.8)
data = [trace]
layout = go.Layout(title='Covid-19 no Estado de São Paulo',
                   yaxis={'title':'Casos por dia'},
                   xaxis={'title':'Tempo'})
fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

### Conclusão
### Observando se o gráfico de Total de casos vs Tempo, percebe-se um aumento exponencial acentuado de 17 de março até o meio de agosto. À partir daí ocorre um aumento mais suave, sugerindo uma possível estabilização.
### Fato este, que fica mais claro no segundo gráfico: Casos por Dia vs Tempo. Onde a quantidade de casos diários começa a diminuir à partir do meio do mês de agosto de 2020. A pandemia estaria controlada quando o número de casos por dia tendesse a zero ou zerasse.