<a href="https://colab.research.google.com/github/MarcusPauloFaustino1/Exercicios-Growdev/blob/main/%20Avalia%C3%A7%C3%A3o_Final_M%C3%B3dulo_Visualiza%C3%A7%C3%A3o_Dados_Storytelling.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Criação de visual utilizando Python + Plotly**

### Impotações e leitura de csv

In [7]:
import pandas as pd
import csv
import plotly.express as px


data = pd.read_csv('microdados_ed_basica_2021.csv', sep=';', encoding='latin-1')




Columns (27) have mixed types.Specify dtype option on import or set low_memory=False.



### Filtragem do dataframe

In [8]:
data_filter_1 = data.query('SG_UF == "RS"& 0 < TP_LOCALIZACAO_DIFERENCIADA < 4')   # filtrando por estado e por localização diferenciada

data_filter_2 = data_filter_1[['QT_MAT_BAS',
                               'QT_DOC_BAS',
                               'QT_TUR_BAS',
                               'TP_LOCALIZACAO',                # filtrando colunas de interesse
                               'TP_LOCALIZACAO_DIFERENCIADA',
                               'NO_ENTIDADE',
                               'NO_MUNICIPIO']]

data_filter_2 = data_filter_2.dropna(subset=['QT_TUR_BAS'])   # excluindo linha NaN do filtro

data_filter_2['TP_LOCALIZACAO_DIFERENCIADA'] = data_filter_2['TP_LOCALIZACAO_DIFERENCIADA'].astype(str)   # convertendo para tipo string.



### Gráfico

In [13]:
colors = {'1.0':"brown",'2.0':"orange",'3.0':"turquoise"}    # definindo cores
order = {'TP_LOCALIZACAO_DIFERENCIADA':['1.0','2.0','3.0']}  # definindo a ordem

fig = px.scatter(                                   # plotando o gráfico scatter
    data_filter_2, 
    x='QT_MAT_BAS',                                 # definindo o eixo X por quantidade de matrículas
    y='QT_DOC_BAS',                                 # definindo o eixo Y por quantidade de docentes
    color = 'TP_LOCALIZACAO_DIFERENCIADA',          # definindo as cores por localização diferenciada
    size = 'QT_TUR_BAS',                            # definindo o tamanho por quantidade de turmas
    hover_data = ["NO_ENTIDADE", "NO_MUNICIPIO"],   # acrescentando informações
    facet_col = 'TP_LOCALIZACAO',                   # dividindo o grafico em duas partes (urbano e rural)
    size_max = 30,                                  # defimindo o tamanho máximo dos marcadores
    color_discrete_map = colors,                    # adicionando as cores previamente definidas
    category_orders = order,                        # adicionando a ordem previamente definida
    opacity = 0.75                                  # definindo a opacidade em 75%
    )

### Updates no gráfico

In [14]:
fig.update_traces(marker_line_width = 1, marker_line_color = 'black')   # atualizando espessura e cor dos marcadores
fig.update_layout(width = 1200, height = 600)                           # atualizando o tamanho das dimensões da imagem
fig.update_layout(
    legend = dict(
        orientation = 'h',        # orientação da legenda horizontal
        yanchor = 'bottom',       # legenda no fundo
        y = -0.2,
        xanchor = 'center',       # legenda centralizada
        x = 0.5
    )
)

rotulos = {'1.0':"Área de Assentamento", '2.0':"Terra Indígena", '3.0':"Áreas Remanescentes de Quilombos"}   # definindo os rótulos

fig.for_each_trace(
    lambda t: t.update(                   # modificando a legenda inserindo os rótulos
        name = rotulos[t.name],
        legendgroup = rotulos[t.name]
    )
)

fig.update_layout(
    legend = dict(
        title = "<b>Localização Diferenciada:<b>",      # atualizando o título da legenda
        font_size = 12                                  # atualizando o tamanho da legenda
    )
)


fig.update_layout(                                                                    # adicionando o título do gráfico 
    title = '<b>Censo Escolar 2021:</b> Análise de Localização Diferenciada (RS)',    # decidi colocar parte em negrito e parte normal por questão estética
    xaxis = dict(titlefont_size = 14, tickfont_size = 11),                            # atualizando o tamanho da fonte
    yaxis = dict(titlefont_size = 14, tickfont_size = 11)
    
    
)
fig.update_xaxes(
    title_text = '<b>Quantidade de Matrículas',       # atualizando o título do eixo X
    title_font_size = 11,                             # atualizando o tamanho da da fonte
    range = [-20,500],                                # fixando o range
    tick0 = 0,                                        # fixando o ponto de início
    dtick = 25                                        # definindo os intervalos
)

fig.update_yaxes(
    title_text = '<b>Quantidade de Docentes',        # atualizando o título do eixo X
    title_font_size = 11,                            # atualizando o tamanho da da fonte
    range = [-20,200],                               # fixando o range
    tick0 = 0,                                       # fixando o ponto de início
    dtick = 20                                       # definindo os intervalos

)

fig.update_layout(yaxis2_title = '')   # decidi remover o título do eixo y do segundo gráfico, pois achei que não estava estéticamente agradável

fig.update_layout(template = 'ggplot2')  # atualizando o layout

fig.add_annotation(               # acrescentando a fonte
     text= "Fonte: INEP",
    xref= "paper",
    yref= "paper",
    font_color= "darkgrey",
    font_size= 12,
    showarrow= False,
    y= 1.05,
    x= 1)

fig.layout.annotations[0].text= "Rural"       # alterando os nomes das localizações
fig.layout.annotations[1].text= "Urbano"

fig.show()

### Exportando o gráfico


In [16]:
fig.write_html("localizacao_diferenciada_rs.html")