# 8 - Predições da demanda


Para entender como o atendimento pode se comportar num futuro próximo, vamos usar modelos preditivos. Assim, vamos tentar estimar algumas metas da Secretaria Municipal de Educação. Vamos começar com a demanda. A meta é zerá-la. Portanto, vamos calcular quando isso acontece:

In [18]:
import pandas as pd
import numpy as np
import matplotlib.pylab as plt

from matplotlib.pylab import rcParams
rcParams['figure.figsize'] = 15, 6

dateparse = lambda dates: pd.datetime.strptime(dates, '%Y-%m')
distritos = pd.read_csv('dados/distritos.csv', sep = ',')
dados_educ_pop = pd.read_csv('dados/dados_educ_pop.csv', sep = ',', parse_dates=['ANO_MES'], index_col='ANO_MES', date_parser=dateparse) 

# Só precisamos do distrito e da demanda, para esse caso
dados_educ_pop = dados_educ_pop[['DISTRITO', 'DISTRITO_F', 'DEM_CRECHE']]

Usando o modelo de predição ARIMA, sigla para Média móvel integrada autoregressiva, que forneceu o menor erro médio nos testes, vamos tentar descobrir em torno de qual mês a demanda atinge zero, para esse distrito. Vamos prever até no máximo 2030.

In [47]:
import statsmodels.api as sm

distritos['PERIODO'] = 'default value'

for distrito in dados_educ_pop.DISTRITO.unique():
    dados_demanda = dados_educ_pop[dados_educ_pop['DISTRITO'] == distrito]
    zero = False
    distrito_f = dados_demanda.at[dados_demanda.index[0], 'DISTRITO_F']
    
    # Gerando o modelo
    fit1 = sm.tsa.statespace.SARIMAX(dados_demanda.DEM_CRECHE, order=(3, 2, 1), seasonal_order=(0, 1, 1, 4)).fit()
    demanda_prevista = fit1.predict(start="2018-03-01", end="2030-12-01", dynamic=True)
    
    # Verificando se a meta foi atingida
    for index, element in demanda_prevista.iteritems():
        if element <= 0:
            zero = True
            data = str(index)
            periodo = data[:4] + '-' + data[5:7]
            break
    if not zero:
        periodo = '2031-03'
        
    i = distritos[distritos['DISTRITO_F'] == distrito_f].index[0]    
    distritos.at[i, 'PERIODO'] = periodo
    
    
    # Gerando o gráfico
#     plt.ioff()
#     fig = plt.figure(dpi=200, figsize=(10, 6))
#     plt.title('Evolução da fila das creches em ' + distrito)
#     plt.plot(dados_demanda['DEM_CRECHE'], label='Demanda registrada nas creches do distrito', color='c', linewidth=5.0)
#     plt.plot(demanda_prevista, label='Demanda prevista nas creches do distrito', color='midnightblue', linewidth=5.0)
#     plt.legend(loc='upper center', bbox_to_anchor=(0.5, -0.2),  shadow=True, ncol=2)
#     plt.ylabel('Crianças de 0 a 3 anos')
#     plt.xlabel('Data de Referência')
#     plt.xticks(rotation=90)
#     plt.savefig('graficos/previsao_demanda_' + distrito + '.png', bbox_inches='tight')
#     plt.close(fig)







  warn('Non-invertible starting seasonal moving average'


In [58]:
distritos = distritos.sort_values(by='PERIODO').reset_index(drop=True)
for index in distritos.index:
    posicao = str(index+1)
    zona = distritos.at[index, 'ZONA']
    nome = distritos.at[index, 'DISTRITO_F']
    periodo = distritos.at[index, 'PERIODO']
    print("\\textbf{" + posicao + "} & " + nome + " & " + zona + " & " + periodo + "\\\\ \hline")

\textbf{1} & Butantã & Oeste & 2018-12\\ \hline
\textbf{2} & Guaianases & Leste & 2018-12\\ \hline
\textbf{3} & Vila Curuçá & Leste & 2018-12\\ \hline
\textbf{4} & Cachoeirinha & Norte & 2018-12\\ \hline
\textbf{5} & Cursino & Sul & 2018-12\\ \hline
\textbf{6} & Sacomã & Sul & 2018-12\\ \hline
\textbf{7} & Cangaiba & Leste & 2018-12\\ \hline
\textbf{8} & Ermelino Matarazzo & Leste & 2018-12\\ \hline
\textbf{9} & Ipiranga & Sul & 2018-12\\ \hline
\textbf{10} & José Bonifácio & Leste & 2018-12\\ \hline
\textbf{11} & Jaguara & Oeste & 2018-12\\ \hline
\textbf{12} & Artur Alvim & Leste & 2018-12\\ \hline
\textbf{13} & Ponte Rasa & Leste & 2018-12\\ \hline
\textbf{14} & Lajeado & Leste & 2018-12\\ \hline
\textbf{15} & Limão & Norte & 2018-12\\ \hline
\textbf{16} & Penha & Leste & 2018-12\\ \hline
\textbf{17} & Jardim Paulista & Oeste & 2019-03\\ \hline
\textbf{18} & Cidade Tiradentes & Leste & 2019-12\\ \hline
\textbf{19} & Brasilândia & Norte & 2019-12\\ \hline
\textbf{20} & Jardim Helena 