# 5 - Agrupamentos

Para compreender como os distritos podem ser agrupados, serão gerados gráficos de dispersão.

## Matrículas x Demanda

O primeiro agrupamento é como o oferecimento se relaciona com a demanda. Para ficar mais fácil de ver, a análise será a cada ano (com um mês fixo).

In [27]:
import pandas as pd
import matplotlib.pyplot as plt
import imageio
from pylab import rcParams
from matplotlib.pyplot import figure

rcParams['figure.figsize'] = 7, 4
rcParams['figure.dpi'] = 100

dados_educ_pop = pd.read_csv('dados/dados_educ_pop.csv', sep = ',')

def geraGrafico(periodo, mes):
    dados = dados_educ_pop[dados_educ_pop['MES_ANO_REF'] == periodo]
    dados = dados[dados_educ_pop['MES'] == mes]

    dados['MAT_TOTAL'] = dados['MAT_CRECHE']/dados['TOTAL']*100
    dados['DEM_TOTAL'] = dados['DEM_CRECHE']/dados['TOTAL']*100
    plt.ioff()
    plt.scatter(dados['MAT_TOTAL'], dados['DEM_TOTAL'], color='#440154')
    plt.title('Matrículas x Demanda - ' + periodo)
    plt.ylabel('Demanda relativa à população (%)')
    plt.xlabel('Matrículas relativas à população (%)')
#     dados = dados[dados_educ_pop['DISTRITO'] == 'PENHA']
#     plt.annotate(dados['DISTRITO_F'].values[0],
#             xy=(dados['MAT_CRECHE']/dados['TOTAL'], dados['DEM_CRECHE']/dados['TOTAL']),  # theta, radius
#             xytext=(0.05, 0.05),    # fraction, fraction
#             textcoords='figure fraction',
#             arrowprops=dict(facecolor='black', shrink=0.05),
#             horizontalalignment='left',
#             verticalalignment='bottom',
#             )
    plt.ylim(0, 60)
    plt.xlim(0, 110)
    
    plt.savefig('graficos/agrupamentos/mat_dem_' + periodo + '.png', bbox_inches='tight')
    plt.close()   
    
def geraGif(periodos, mes):
    with imageio.get_writer('gifs/agrupamentos_mat_dem_' + mes + '.gif', mode='I', duration=0.6) as writer:
        for periodo in periodos:
            if (periodo[:3] == mes):
                image = imageio.imread('graficos/agrupamentos/mat_dem_' + periodo + '.png')
                writer.append_data(image)

In [28]:
mes = 'dez'
periodos = dados_educ_pop.MES_ANO_REF.unique()

for periodo in periodos:
    if (periodo[:3] == mes):
        geraGrafico(periodo, mes)

geraGif(periodos, mes)

  


## Evolução absoluta das matrículas x demanda

O segundo agrupamento será relacionado a como se comportaram as taxas de evolução do atendimento e da demanda. Temos dois casos: o primeiro é para as taxas absolutas.

In [10]:
dados_atendimento = dados_educ_pop[['DISTRITO', 'MAT_CRECHE', 'DEM_CRECHE', 'MES_ANO_REF']]
dados_jun_2006 = dados_atendimento[dados_atendimento['MES_ANO_REF'] == 'jun-06']
dados_jun_2006.columns = ['DISTRITO', 'MAT_JUN_06', 'DEM_JUN_06', 'MES_ANO_REF']
dados_dez_2017 = dados_atendimento[dados_atendimento['MES_ANO_REF'] == 'dez-17']
dados_dez_2017.columns = ['DISTRITO', 'MAT_DEZ_17', 'DEM_DEZ_17', 'MES_ANO_REF']

dados_atendimento = dados_jun_2006.merge(dados_dez_2017, on = ['DISTRITO'])
dados_atendimento = dados_atendimento[['DISTRITO', 'MAT_JUN_06', 'MAT_DEZ_17', 'DEM_JUN_06', 'DEM_DEZ_17']]

dados_atendimento['EV_MAT_NUM'] = dados_atendimento['MAT_DEZ_17'] - dados_atendimento['MAT_JUN_06']
dados_atendimento['EV_MAT_PC'] = dados_atendimento['MAT_DEZ_17'] / dados_atendimento['MAT_JUN_06']
dados_atendimento['EV_DEM_NUM'] = dados_atendimento['DEM_DEZ_17'] - dados_atendimento['DEM_JUN_06']
dados_atendimento['EV_DEM_PC'] = dados_atendimento['DEM_DEZ_17'] / dados_atendimento['DEM_JUN_06']

for distrito in dados_atendimento['DISTRITO'].unique():
    plt.ioff()
    plt.scatter(dados_atendimento['EV_MAT_NUM'], dados_atendimento['EV_DEM_NUM'], color='#440154')
    dados_distrito = dados_atendimento[dados_atendimento['DISTRITO'] == distrito]
    plt.annotate(distrito,
                xy=(dados_distrito['EV_MAT_NUM'], dados_distrito['EV_DEM_NUM']),  # theta, radius
                xytext=(0.05, 0.05),    # fraction, fraction
                textcoords='figure fraction',
                arrowprops=dict(facecolor='black', shrink=0.01),
                horizontalalignment='left',
                verticalalignment='bottom',
                )
    plt.xlabel('Evolução absoluta das matrículas')
    plt.ylabel('Evolução absoluta da demanda')
    plt.savefig('graficos/agrupamentos/evolucao_abs_' + distrito + '.png', bbox_inches='tight')
    plt.close()

## Evolução relativa das matrículas x demanda

O segundo caso é das taxas relativas.

In [11]:
for distrito in dados_atendimento['DISTRITO'].unique():
    plt.ioff()
    plt.scatter(dados_atendimento['EV_MAT_PC'], dados_atendimento['EV_DEM_PC'], color='#440154')
    dados_distrito = dados_atendimento[dados_atendimento['DISTRITO'] == distrito]
    plt.annotate(distrito,
                xy=(dados_distrito['EV_MAT_PC'], dados_distrito['EV_DEM_PC']),  # theta, radius
                xytext=(0.05, 0.05),    # fraction, fraction
                textcoords='figure fraction',
                arrowprops=dict(facecolor='black', shrink=0.01),
                horizontalalignment='left',
                verticalalignment='bottom')
    plt.xlabel('Evolução relativa das matrículas, em relação à população')
    plt.ylabel('Evolução relativa da demanda, em relação à população')
    plt.xlim(0, 15)
    plt.ylim(0, 6.5)
    plt.savefig('graficos/agrupamentos/evolucao_rel_' + distrito + '.png', bbox_inches='tight')
    plt.close()