In [232]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

In [233]:
df_censo_escolar = pd.read_csv("microdados_ed_basica_2021.csv", sep = ";", encoding = "iso-8859-1")


Columns (27) have mixed types. Specify dtype option on import or set low_memory=False.



#### Geral

In [234]:
df_censo_local_dif_in_RS = df_censo_escolar.query("SG_UF == 'RS'")

df_censo_local_dif_in_RS =  df_censo_local_dif_in_RS.query("NO_MUNICIPIO == 'Parobé'"
    "| NO_MUNICIPIO == 'Dois Irmãos'"
    "| NO_MUNICIPIO == 'Nova Petrópolis'"
)

df_censo_local_dif_in_RS = df_censo_local_dif_in_RS[["QT_MAT_BAS","QT_DOC_BAS","QT_TUR_BAS","NO_ENTIDADE", "NO_MUNICIPIO"]]

In [235]:

df_censo_local_dif_in_RS = df_censo_local_dif_in_RS.dropna(subset=["QT_TUR_BAS"])

In [236]:
df_censo_local_dif_in_RS["QT_MAT_POR_DOC"] = df_censo_local_dif_in_RS['QT_MAT_BAS'] / df_censo_local_dif_in_RS['QT_DOC_BAS']

In [237]:
grafic = px.scatter(df_censo_local_dif_in_RS, 
    x= "QT_MAT_BAS", 
    y= "QT_DOC_BAS", 
    facet_col= "NO_MUNICIPIO",
    size= "QT_MAT_POR_DOC",
    hover_data=["NO_ENTIDADE"],
    color= "NO_MUNICIPIO",
    color_discrete_map= {"Parobé": "brown","Dois Irmãos": "orange", "Nova Petrópolis": "turquoise"},
    size_max= 60,
    template= "ggplot2",
    height= 800,
    width= 1600,
    opacity= .75,
    range_x=[-4,1050],
    range_y=[-4,70]

)

In [238]:

# Alterando titulo e tamanho da fonte do gráfico
grafic.update_layout(
  title="<b>Censo Escolar 2021: Análise da quantidade de Alunos/Professores<b>",
  font_size= 14
)

#Aplicando borda nos circulos
grafic.update_traces(marker_line_width = 1, marker_line_color= "black")

# Alterando a posição, fonte e titulo da legenda:
grafic.update_layout(
  legend= dict(
    title= "Cidade:",
    orientation= "h",
    font_size= 12,
    yanchor= "top",
    xanchor= "center",
    y= -0.2,
    x= 0.3
  )
)

# Alterando os títulos dos eixos x e y:
grafic.update_layout(
    xaxis_title= "Quantidade de Matículas",
    xaxis2_title= "Quantidade de Matículas",
    xaxis3_title= "Quantidade de Matículas",
    yaxis_title= "Quantidade de Docentes",
    font_size= 11
)

# Incluindo a fonte
grafic.add_annotation(
    text= "Fonte: INEP",
    xref= "paper",
    yref= "paper",
    font_color= "darkgrey",
    font_size= 12,
    showarrow= False,
    y= 1.1,
    x= 1,
    
)

# Renomenado os Gráficos
grafic.layout.annotations[0].text= "Dois Irmãos"
grafic.layout.annotations[1].text= "Nova Petrópolis"
grafic.layout.annotations[2].text= "Parobé"

##### Botão


In [239]:
grafic.show()

#### DOIS IRMAOS

In [240]:
df_di = df_censo_local_dif_in_RS.query("NO_MUNICIPIO == 'Dois Irmãos'")

df_di = df_di[["QT_MAT_BAS","QT_DOC_BAS","QT_TUR_BAS","NO_ENTIDADE", "NO_MUNICIPIO"]]

df_di = df_di.dropna(subset=["QT_TUR_BAS"])

df_di["QT_MAT_POR_DOC"] = df_di['QT_MAT_BAS'] / df_di['QT_DOC_BAS']


In [241]:
grafic_dois_irmaos= px.scatter(df_di, 
    x= "QT_MAT_BAS", 
    y= "QT_DOC_BAS", 
    size= "QT_MAT_POR_DOC",
    hover_data=["NO_ENTIDADE"],
    size_max= 60,
    template= "ggplot2",
    height= 500,
    width= 1000,
    opacity= .75,
    range_x=[-4,1050],
    range_y=[-4,50]
)

In [242]:
grafic_dois_irmaos.update_layout(
  title="<b>Censo Escolar 2021: Análise da quantidade de Alunos / Professores no municipio de Dois Irmãos<b>",
  font_size= 14
)

grafic_dois_irmaos.update_traces(marker_color = "orange")
#Aplicando borda nos circulos
grafic_dois_irmaos.update_traces(marker_line_width = 1, marker_line_color= "black")


# Alterando os títulos dos eixos x e y:
grafic_dois_irmaos.update_layout(
    xaxis_title= "Quantidade de Matículas",
    yaxis_title= "Quantidade de Docentes",
    font_size= 12
)

# Incluindo a fonte
grafic_dois_irmaos.add_annotation(
    text= "Fonte: INEP",
    xref= "paper",
    yref= "paper",
    font_color= "darkgrey",
    font_size= 12,
    showarrow= False,
    y= 1,
    x= 0.99
)

#### Nova Petropólis

In [243]:
df_np = df_censo_local_dif_in_RS.query("NO_MUNICIPIO == 'Nova Petrópolis'")

df_np = df_np[["QT_MAT_BAS","QT_DOC_BAS", "QT_TUR_BAS", "NO_ENTIDADE", "NO_MUNICIPIO"]]

df_np = df_np.dropna(subset=["QT_TUR_BAS"])

df_np["QT_MAT_POR_DOC"] = df_np['QT_MAT_BAS'] / df_np['QT_DOC_BAS']

In [244]:
grafic_np = px.scatter(df_np, 
    x= "QT_MAT_BAS", 
    y= "QT_DOC_BAS", 
    size= "QT_MAT_POR_DOC",
    hover_data=["NO_ENTIDADE"],
    size_max= 60,
    template= "ggplot2",
    height= 500,
    width= 1000,
    opacity= .75,
    range_x=[-5,600],
    range_y=[-4,40]
)

In [245]:
grafic_np.update_layout(
  title="<b>Censo Escolar 2021: Análise da quantidade de Alunos / Professores no municipio de Nova Petrópolis<b>",
  font_size= 14
)

grafic_np.update_traces(marker_color = "turquoise")

#Aplicando borda nos circulos

grafic_np.update_traces(marker_line_width = 1, marker_line_color= "black")


# Alterando os títulos dos eixos x e y:
grafic_np.update_layout(
    xaxis_title= "Quantidade de Matículas",
    yaxis_title= "Quantidade de Docentes",
    font_size= 12
)

# Incluindo a fonte
grafic_np.add_annotation(
    text= "Fonte: INEP",
    xref= "paper",
    yref= "paper",
    font_color= "darkgrey",
    font_size= 12,
    showarrow= False,
    y= 1,
    x= 0.99
)


#### Parobé

In [246]:
df_parobe = df_censo_local_dif_in_RS.query("NO_MUNICIPIO == 'Parobé'")

df_parobe = df_parobe[["QT_MAT_BAS","QT_DOC_BAS","QT_TUR_BAS","NO_ENTIDADE", "NO_MUNICIPIO"]]

df_parobe = df_parobe.dropna(subset=["QT_TUR_BAS"])

df_parobe["QT_MAT_POR_DOC"] = df_parobe['QT_MAT_BAS'] / df_parobe['QT_DOC_BAS']

In [247]:
grafic_parobe = px.scatter(df_parobe, 
    x= "QT_MAT_BAS", 
    y= "QT_DOC_BAS", 
    size= "QT_MAT_POR_DOC",
    hover_data=["NO_ENTIDADE"],
    size_max= 60,
    template= "ggplot2",
    height= 500,
    width= 1000,
    opacity= .75,
    range_x=[-4,1000],
    range_y=[-9,70]
)

In [248]:
grafic_parobe.update_layout(
  title="<b>Censo Escolar 2021: Análise da quantidade de Alunos / Professores no municipio de Parobé<b>",
  font_size= 14
)

grafic_parobe.update_traces(marker_color = "brown")

#Aplicando borda nos circulos

grafic_parobe.update_traces(marker_line_width = 1, marker_line_color= "black")


# Alterando os títulos dos eixos x e y:
grafic_parobe.update_layout(
    xaxis_title= "Quantidade de Matículas",
    yaxis_title= "Quantidade de Docentes",
    font_size= 12
)

# Incluindo a fonte
grafic_parobe.add_annotation(
    text= "Fonte: INEP",
    xref= "paper",
    yref= "paper",
    font_color= "darkgrey",
    font_size= 12,
    showarrow= False,
    y= 1,
    x= 0.99
)


#### Exportação

In [249]:
grafic.write_html("Geral.html")
grafic_dois_irmaos.write_html("Dois_Irmãos.html")
grafic_np.write_html("Nova_Petrópolis.html")
grafic_parobe.write_html("Parobé.html")