<a href="https://colab.research.google.com/github/dxdiego5/storytelling/blob/main/prova_final_storytelling.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

! pip install -U kaleido

In [None]:
# Leitura de dados da base
df_censo_2021 = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/storytelling/microdados_ed_basica_2021.csv', encoding = "iso-8859-1", sep=';')
df_censo_2021.info()

In [3]:
# Filtrando pelo estado pela colna SG_UF (sigla do estado) no caso da pesquisa o RS de Rio Grande do Sul
df_censo_2021_RS = df_censo_2021[df_censo_2021['SG_UF'] == 'RS']

In [None]:
# Mapeamentos de tipo localizacao diferenciada da localizacao das escolas
tp_localizacao_dif = {1:'Área de assentamento',2:'Terra indígena',3:'Área remanescente de quilombos'}
df_censo_2021_RS['TP_LOCALIZACAO_DIFERENCIADA'] = df_censo_2021_RS['TP_LOCALIZACAO_DIFERENCIADA'].map(tp_localizacao_dif)

df_censo_2021_RS.dropna(subset=['TP_LOCALIZACAO_DIFERENCIADA'], inplace=True)

In [None]:
# Mapeamentos de tipo localizacao da localizacao das escolas sendo Rural ou Urbana
tp_localizacao = {1:'Urbana',2:'Rural'}
df_censo_2021_RS['TP_LOCALIZACAO'] = df_censo_2021_RS['TP_LOCALIZACAO'].map(tp_localizacao)

df_censo_2021_RS.dropna(subset=['TP_LOCALIZACAO'], inplace=True)

In [None]:
# Trocando todos os valores que são Nan pelo numero ZERO 
df_censo_2021_RS.fillna(0, inplace=True)

### Start apllication 


In [8]:
cores = {'Área de assentamento': 'brown','Terra indígena': 'orange', 'Área remanescente de quilombos': 'turquoise'}
ordem = {'TP_LOCALIZACAO_DIFERENCIADA' : list(df_censo_2021_RS.TP_LOCALIZACAO_DIFERENCIADA.unique())}

# Responde a questao: 1, 2, 8, 9, 10,15, 14
fig = px.scatter(
    df_censo_2021_RS, 
    x = "QT_MAT_BAS", 
    y = "QT_DOC_BAS", 
    facet_col = "TP_LOCALIZACAO",  
    size = "QT_TUR_BAS",
    size_max = 30,
    opacity=0.75,
    color = "TP_LOCALIZACAO_DIFERENCIADA", 
    color_discrete_map = cores,
    category_orders = ordem,
)

fig.update_traces(marker_line_width = 1, marker_line_color = "black")

# Responde a questao: 3
fig.update_layout(template='ggplot2')

# Responde a questao: 4
title_font=dict(size =14, color='Black', family='Arial Bold, sans-serif')
fig.update_layout(title='<b>Censo Escolar 2021: Análise de Localização Diferenciada (RS)</b>', titlefont=title_font)

# Responde a questao: 5
fig.update_layout(width=1200, height=600)

# Responde a questao: 6, 7
fig.update_layout(
    legend=dict(
        title = '<b> Localização Diferenciada:</b>',
        orientation = 'h',
        font_size = 12,
        x = 0,
        y = -0.2
    )
)

# Responde a questao: 16
fig.add_annotation(
    text="Fonte: INEP",
    xref="paper",
    yref="paper",
    font_color = "darkgrey",
    font_size = 12,
    xanchor = 'right',
    yanchor = 'top',
    x=1,
    y=1.1,
    showarrow=False)

# Responde a questao: 11
fig.layout.annotations[0].text= ' Localização Rural'
fig.layout.annotations[1].text= ' Localização Urbana'

# Responde a questao: 12, 13
fig.update_layout(
    xaxis_title="Quantidade Matrículas",
    xaxis2_title="Quantidade Matrículas",
    yaxis_title="Quantidade Docentes",
    font_size=11
)

fig.update_yaxes(range = [-14,200])
fig.update_xaxes(range = [-14,500])

# FIG SHOW 
fig.show()

# Responde a questao: 17
fig.write_html("localizacao_diferenciada_rs.html")