## Preparando o Ambiente

In [None]:
import pandas as pd
import plotly.express as px
import plotly.io as pio


pio.renderers.default = "notebook_connected"

# Carregando os dados
df = pd.read_csv("../data/relacao-pessoas-limpo.csv", parse_dates=["data_vacinacao"])
df.head()


Unnamed: 0,_id,sexo,grupo,vacina,lote,dose,data_vacinacao,local_vacinacao,ano,mes,dia,dose_tipo
0,1,MASCULINO,TRABALHADORES INDUSTRIAIS E BANC√ÅRIOS,2 - CHADOX1NCOV-19 - OXFORD/ASTRAZENECA (FIOCRUZ),216VCD206Z,1,2021-07-26,DRIVE THRU PARQUE DE EXPOSI√á√ÉO,2021,7,26,1¬™ DOSE
1,2,MASCULINO,TRABALHADORES INDUSTRIAIS E BANC√ÅRIOS,2 - CHADOX1NCOV-19 - OXFORD/ASTRAZENECA (FIOCRUZ),219VCD270W,2,2021-10-19,DRIVE THRU PARQUE DE EXPOSI√á√ÉO,2021,10,19,2¬™ DOSE
2,3,FEMININO,TRABALHADORES DA SA√öDE,3 - COMIRNATY (PFIZER),32010BD,3,2021-10-07,CENTRO DE VACINA√á√ÉO UNINASSAU,2021,10,7,REFOR√áO
3,4,FEMININO,TRABALHADORES DA SA√öDE,1 - CORONAVAC - SINOVAC (BUTANTAN),210016,1,2021-02-11,CENTRO DE VACINA√á√ÉO COMPAZ MIGUEL ARRAES,2021,2,11,1¬™ DOSE
4,5,FEMININO,TRABALHADORES DA SA√öDE,1 - CORONAVAC - SINOVAC (BUTANTAN),210043,2,2021-03-04,CENTRO DE VACINA√á√ÉO PARQUE DE EXPOSI√á√ÉO,2021,3,4,2¬™ DOSE


## Explora√ß√£o Inicial dos Dados

In [3]:
# Verificar as primeiras linhas dos dados
df.head()

# Resumo estat√≠stico e informa√ß√µes gerais
df.info()

# Checar valores ausentes
df.isnull().sum()

# Estat√≠sticas descritivas
df.describe()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 229500 entries, 0 to 229499
Data columns (total 12 columns):
 #   Column           Non-Null Count   Dtype         
---  ------           --------------   -----         
 0   _id              229500 non-null  int64         
 1   sexo             229500 non-null  object        
 2   grupo            229500 non-null  object        
 3   vacina           229500 non-null  object        
 4   lote             229500 non-null  object        
 5   dose             229500 non-null  int64         
 6   data_vacinacao   229500 non-null  datetime64[ns]
 7   local_vacinacao  229500 non-null  object        
 8   ano              229500 non-null  int64         
 9   mes              229500 non-null  int64         
 10  dia              229500 non-null  int64         
 11  dose_tipo        229500 non-null  object        
dtypes: datetime64[ns](1), int64(5), object(6)
memory usage: 21.0+ MB


Unnamed: 0,_id,dose,data_vacinacao,ano,mes,dia
count,229500.0,229500.0,229500,229500.0,229500.0,229500.0
mean,114750.5,1.686266,2021-08-20 20:14:29.647058688,2021.056606,7.489264,15.613834
min,1.0,1.0,2021-01-19 00:00:00,2021.0,1.0,1.0
25%,57375.75,1.0,2021-06-22 00:00:00,2021.0,6.0,8.0
50%,114750.5,2.0,2021-08-27 00:00:00,2021.0,8.0,15.0
75%,172125.25,2.0,2021-10-26 00:00:00,2021.0,10.0,23.0
max,229500.0,4.0,2022-01-24 00:00:00,2022.0,12.0,31.0
std,66251.087727,0.705605,,0.231088,3.082962,8.641366


## An√°lise da Vacina√ß√£o Mensal

In [5]:
# Adicionar coluna de 'ano_mes' para facilitar a an√°lise por m√™s
df['ano_mes'] = df['data_vacinacao'].dt.to_period('M')

# Agrupar o n√∫mero de vacinados por m√™s
vacinacao_mensal = df.groupby('ano_mes').size().reset_index(name='total_vacinados')
vacinacao_mensal['data'] = vacinacao_mensal['ano_mes'].dt.to_timestamp()

# Criar gr√°fico de linha de vacina√ß√£o mensal
fig1 = px.line(
    vacinacao_mensal,
    x='data',
    y='total_vacinados',
    markers=True,
    title='üíâ Vacina√ß√£o Mensal em Recife',
    labels={'total_vacinados': 'Total de Vacinados', 'data': 'M√™s/Ano'},
    color_discrete_sequence=['#1f77b4']
)
fig1.update_layout(template='plotly_white', hovermode='x unified')
# fun√ß√£o show() n√£o estava rodando ent√£o usei o write_html
fig1.write_html("../content/grafico_vacinacao.html", auto_open=True)


## Distribui√ß√£o por Tipo de Vacina

In [6]:
# Contar o n√∫mero de vacinas por tipo
vacina_tipo = df['vacina'].value_counts().reset_index()
vacina_tipo.columns = ['vacina', 'total']

# Criar gr√°fico de barras para a distribui√ß√£o de vacinas
fig2 = px.bar(
    vacina_tipo,
    x='vacina',
    y='total',
    text='total',
    title='üìä Distribui√ß√£o por Tipo de Vacina',
    labels={'vacina': 'Vacina', 'total': 'N√∫mero de Doses'},
    color='vacina',
    color_discrete_sequence=px.colors.qualitative.Set2,
    height=650
)
fig2.update_traces(textposition='outside')
fig2.update_layout(template='plotly_white', xaxis_tickangle=-45)
fig2.write_html("../content/grafico_distribuicao_vacina.html", auto_open=True)


## An√°lise por Sexo

In [7]:
# Passo 11: Contar o n√∫mero de vacinados por sexo
sexo_dist = df['sexo'].value_counts().reset_index()
sexo_dist.columns = ['sexo', 'total']

# Passo 12: Criar gr√°fico de pizza para a distribui√ß√£o por sexo
fig3 = px.pie(
    sexo_dist,
    names='sexo',
    values='total',
    title='üë• Distribui√ß√£o por Sexo',
    color='sexo',
    color_discrete_map={'MASCULINO':'#1f77b4', 'FEMININO':'#ff7f0e'}
)
fig3.update_traces(textposition='outside', textinfo='percent+label')
fig3.write_html("../content/analise_sexo.html", auto_open=True)


## An√°lise por Grupo Priorit√°rio

In [8]:
# Analisar o total de vacinados por grupo priorit√°rio
top_grupos = df['grupo'].value_counts().nlargest(10).reset_index()
top_grupos.columns = ['grupo', 'total']

# Criar gr√°fico de barras para os 10 grupos priorit√°rios
fig4 = px.bar(
    top_grupos,
    x='grupo',
    y='total',
    text='total',
    title='üìä Top 10 Grupos Priorit√°rios',
    color='grupo',
    color_discrete_sequence=px.colors.qualitative.Pastel,
    height=650
)
fig4.update_traces(textposition='outside')
fig4.update_layout(template='plotly_white', xaxis_tickangle=-45)
fig4.write_html("../content/analise_grupo_prioritario.html", auto_open=True)


## An√°lise de Vacinados por Local

In [9]:
# Analisar os locais de vacina√ß√£o
top_locais = df['local_vacinacao'].value_counts().nlargest(10).reset_index()
top_locais.columns = ['local_vacinacao', 'total']

# Criar gr√°fico de barras para os 10 locais de vacina√ß√£o mais frequentes
fig5 = px.bar(
    top_locais,
    x='local_vacinacao',
    y='total',
    text='total',
    title='üè• Top 10 Locais de Vacina√ß√£o',
    color='local_vacinacao',
    color_discrete_sequence=px.colors.qualitative.Vivid,
    height=650
)
fig5.update_traces(textposition='outside')
fig5.update_layout(template='plotly_white', xaxis_tickangle=-45)
fig5.write_html("../content/analise_vacinados_local.html", auto_open=True)

## An√°lise de Previs√µes Futuros

In [10]:
from sklearn.linear_model import LinearRegression
import numpy as np

# Preparar os dados para a regress√£o
vacinacao_mensal['mes_ordinal'] = np.arange(len(vacinacao_mensal)).reshape(-1, 1)
X = vacinacao_mensal[['mes_ordinal']]
y = vacinacao_mensal['total_vacinados']

# Criar e treinar o modelo de regress√£o linear
model = LinearRegression()
model.fit(X, y)

# Fazer previs√µes para os pr√≥ximos 3 meses
future_months = np.arange(len(vacinacao_mensal), len(vacinacao_mensal) + 3).reshape(-1, 1)
predicoes = model.predict(future_months)
future_dates = pd.date_range(start=vacinacao_mensal['data'].max() + pd.offsets.MonthBegin(1), periods=3, freq='MS')

# Criar DataFrame de previs√µes
pred_df = pd.DataFrame({'data': future_dates, 'total_vacinados': predicoes})

# Criar gr√°fico de linha com previs√£o
fig6 = px.line(
    vacinacao_mensal,
    x='data',
    y='total_vacinados',
    markers=True,
    title='üíâ Vacina√ß√£o Mensal com Previs√µes Futuras',
    labels={'total_vacinados': 'Total de Vacinados', 'data': 'M√™s/Ano'},
    color_discrete_sequence=['#1f77b4']
)
fig6.add_scatter(
    x=pred_df['data'],
    y=pred_df['total_vacinados'],
    mode='lines+markers',
    line=dict(dash='dot', color='red'),
    name='Previs√£o'
)
fig6.update_layout(template='plotly_white', hovermode='x unified')
fig6.write_html("../content/analise_previsoes_futuras.html", auto_open=True)



X does not have valid feature names, but LinearRegression was fitted with feature names

