<h1  align="center"><b> C√ÅLCULO DA M√âDIA M√ìVEL </b></h1>

`Objetivo Geral:` Calcular a m√©dia m√≥vel de novos casos e obtos por Covid em S√£o Jos√© dos Campos.

`Dados:` Os dados foram retirados do reposit√≥rio [dados-covid-sp](https://github.com/seade-R/dados-covid-sp) da Funda√ß√£o Seade no dia 19/12/2023.

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from matplotlib.pylab import rcParams
rcParams['figure.figsize'] = 15, 6

<h2 align="center"><b> An√°lise Inicial </b></h2>

`Objetivo da Etapa:` Importar os dados e verificar se h√° algum problema.

In [8]:
tabela_covid = pd.read_csv("Dados Covid SP.csv", sep=";") # Importando os dados
tabela_covid = tabela_covid.loc[tabela_covid['nome_munic'] == 'S√£o Jos√© dos Campos'] # Selecionando apenas os dados de S√£o Jos√© dos Campos
tabela_covid = tabela_covid.drop(['nome_munic', 'codigo_ibge', 'pop'], axis=1) # Removendo colunas desnecess√°rias

In [9]:
tabela_covid.dtypes # Verificando os tipos de dados de cada coluna

datahora         object
casos             int64
casos_novos       int64
casos_mm7d       object
obitos            int64
obitos_novos      int64
obitos_mm7d      object
semana_epidem     int64
dtype: object

`Tipos de Atributos:`
<br>üîπ object -> strings
<br>üîπ int64: -> inteiros
<br>üîπ float64 -> reais
<br>üîπ complex -> complexos

&emsp;&emsp; As colunas casos_mm7d e obitos_mm7d deveriam ser num√©ricas, mas est√£o sendo reconhecidas como strings. Isso acontece porque esses valores est√£o utilizando v√≠rgula como separador decimal. Para resolver esse problema, vamos substituir a v√≠rgula por ponto e converter para um valor num√©rico.

In [10]:
tabela_covid['casos_mm7d'] = tabela_covid['casos_mm7d'].str.replace(',', '.') # Substituindo v√≠rgula por ponto
tabela_covid['casos_mm7d'] = pd.to_numeric(tabela_covid['casos_mm7d']) # Transformando a coluna casos_mm7d em float

tabela_covid['obitos_mm7d'] = tabela_covid['obitos_mm7d'].str.replace(',', '.') # Substituindo v√≠rgula por ponto
tabela_covid['obitos_mm7d'] = pd.to_numeric(tabela_covid['obitos_mm7d']) # Transformando a coluna obitos_mm7d em float

In [11]:
tabela_covid.dtypes

datahora          object
casos              int64
casos_novos        int64
casos_mm7d       float64
obitos             int64
obitos_novos       int64
obitos_mm7d      float64
semana_epidem      int64
dtype: object

In [12]:
tabela_covid.isnull().sum() # Verificando se h√° valores nulos

datahora         0
casos            0
casos_novos      0
casos_mm7d       0
obitos           0
obitos_novos     0
obitos_mm7d      0
semana_epidem    0
dtype: int64

&emsp;&emsp; N√£o h√° dados faltantes, mas h√° diversas linhas com apenas zeros. Vamos excluir parte dessas linhas (deixando apenas as que ocorrem na semana anterior ao primeiro caso).

In [13]:
ultima_ocorr√™ncia = tabela_covid.loc[tabela_covid['casos'] == 0]['semana_epidem'].max()
tabela_covid = tabela_covid.loc[tabela_covid['semana_epidem'] >= ultima_ocorr√™ncia - 1]
tabela_covid.reset_index(drop=True, inplace=True) # Resetando o √≠ndice

<h2 align="center"><b> M√©dia M√≥vel de Novos Casos </b></h2>

`Objetivo da Etapa:` Calcular a m√©dia m√≥vel de novos casos por Covid em S√£o Jos√© dos Campos e plotar o gr√°fico.

In [None]:
s√©rie_casos = pd.Series(tabela_covid.casos_novos.values, index = tabela_covid.datahora) # Criando uma s√©rie com os casos novos
s√©rie_casos.plot() # Plotando a s√©rie

![s√©rie_caos.plot()](./Gr√°ficos/s√©rie_casos.png)

In [None]:
m√©dia_casos = s√©rie_casos.rolling(window = 7).mean() # Calculando a m√©dia m√≥vel

plt.title('Casos Novos')
plt.plot(s√©rie_casos, label = 'S√©rie Real', color = 'blue')
plt.plot(m√©dia_casos, label = 'M√©dia M√≥vel Simples', color = 'red')
plt.legend(loc = 'best')
plt.show()

![m√©dia_casos](./Gr√°ficos/m√©dia_casos.png)

In [None]:
m√©dia_casos_centralizada = s√©rie_casos.rolling(window = 7, center = True).mean() # Calculando a m√©dia m√≥vel centralizada

plt.title('Casos Novos')
plt.plot(s√©rie_casos, label = 'S√©rie Real', color = 'blue')
plt.plot(m√©dia_casos_centralizada, label = 'M√©dia M√≥vel Centralizada', color = 'red')
plt.legend(loc = 'best')
plt.show()

![m√©dia_casos_centralizada](./Gr√°ficos/m√©dia_casos_centralizada.png)

<h2 align="center"><b> M√©dia M√≥vel de Novos √ìbitos </b></h2>

`Objetivo da Etapa:` Calcular a m√©dia m√≥vel de novos √≥bitos por Covid em S√£o Jos√© dos Campos e plotar o gr√°fico.

In [None]:
s√©rie_√≥bitos = pd.Series(tabela_covid.obitos_novos.values, index = tabela_covid.datahora) # Criando uma s√©rie com os √≥bitos novos
s√©rie_√≥bitos.plot() # Plotando a s√©rie

![s√©rie_√≥bitos.plot()](./Gr√°ficos/s√©rie_√≥bitos.png)

In [None]:
m√©dia_√≥bitos = s√©rie_√≥bitos.rolling(window = 7).mean() # Calculando a m√©dia m√≥vel

plt.title('√ìbitos Novos')
plt.plot(s√©rie_√≥bitos, label = 'S√©rie Real', color = 'blue')
plt.plot(m√©dia_√≥bitos, label = 'M√©dia Simples', color = 'red')
plt.legend(loc = 'best')
plt.show()

![m√©dia_√≥bitos](./Gr√°ficos/m√©dia_√≥bitos.png)

In [None]:
m√©dia_√≥bitos_centralizada = s√©rie_√≥bitos.rolling(window = 7, center = True).mean() # Calculando a m√©dia m√≥vel centralizada

plt.title('√ìbitos Novos')
plt.plot(s√©rie_√≥bitos, label = 'S√©rie Real', color = 'blue')
plt.plot(m√©dia_√≥bitos_centralizada, label = 'M√©dia Centralizada', color = 'red')
plt.legend(loc = 'best')
plt.show()

![m√©dia_√≥bitos](./Gr√°ficos/m√©dia_√≥bitos_centralizada.png)