In [29]:
import pandas as pd
import geopandas as gpd
import folium
import os
import numpy as np
from branca.colormap import linear
from folium.plugins import MarkerCluster

# Caminhos dos arquivos Shapefile do IBGE
shp_municipios_path = "/IA/jupyter_notebook/BR_Municipios_2023.shp"
shp_ufs_path = "/IA/jupyter_notebook/BR_UF_2023.shp"

# Verificar a existência dos arquivos Shapefile antes de carregar
if os.path.exists(shp_municipios_path) and os.path.exists(shp_ufs_path):
    try:
        gdf_municipios = gpd.read_file(shp_municipios_path)
        gdf_ufs = gpd.read_file(shp_ufs_path)
        print("Arquivos Shapefile carregados com sucesso!")
        print("Colunas do Shapefile de municípios:", gdf_municipios.columns)
        gdf_municipios["NM_MUN"] = gdf_municipios["NM_MUN"].str.upper()
        gdf_ufs["NM_UF"] = gdf_ufs["NM_UF"].str.upper()
    except Exception as e:
        print(f"Erro ao carregar os arquivos Shapefile: {e}")
        gdf_municipios = None
        gdf_ufs = None
else:
    print("Arquivos Shapefile não encontrados. Verifique a pasta e tente novamente.")
    gdf_municipios = None
    gdf_ufs = None

# Função para carregar os dados
def load_data():
    df = pd.read_csv("consolidado_matriculas.csv")
    df.columns = df.columns.str.upper()
    df = df.apply(lambda x: x.astype(str).str.upper() if x.dtype == "object" else x)
    return df

# Carregar os dados
df = load_data()

# Remover colunas irrelevantes
df = df.drop(columns=['PROF MONITORES', 'AEE', 'ATIVIDADE COMPLEMENTAR', 'QTDE MATRÍCULAS'], errors='ignore')

# Criar dataframe agregando por município
df_agg_mun = df.groupby("NOME MUNICÍPIO").size().reset_index(name='QUANTIDADE DE ESCOLAS')

# Criar dataframe agregando por UF
df_agg_uf = df.groupby("UF").size().reset_index(name='QUANTIDADE DE ESCOLAS')

# Identificar municípios não localizados
municipios_nao_encontrados = df_agg_mun[~df_agg_mun["NOME MUNICÍPIO"].isin(gdf_municipios["NM_MUN"])]
municipios_nao_encontrados.to_csv("municipios_nao_localizados.csv", index=False)
print("Arquivo municipios_nao_localizados.csv salvo com sucesso.")

# Criar o mapa coroplético
m = folium.Map(location=[-15.788497, -47.879873], zoom_start=4)

# Aplicar um degradê de cores para os estados
colormap = linear.YlOrRd_09.scale(df_agg_uf["QUANTIDADE DE ESCOLAS"].min(), df_agg_uf["QUANTIDADE DE ESCOLAS"].max())

def style_function_uf(feature):
    uf = feature["properties"]["NM_UF"]
    quantidade = df_agg_uf[df_agg_uf["UF"] == uf]["QUANTIDADE DE ESCOLAS"].values
    color = colormap(quantidade[0]) if len(quantidade) > 0 else "#ffffff"
    return {
        "fillColor": color,
        "color": "black",
        "weight": 1,
        "fillOpacity": 0.6
    }

if gdf_ufs is not None:
    gdf_ufs["geometry"] = gdf_ufs["geometry"].simplify(0.01)
    folium.GeoJson(
        gdf_ufs,
        name="Estados",
        style_function=style_function_uf,
        tooltip=folium.GeoJsonTooltip(fields=["NM_UF"], aliases=["Estado"])
    ).add_to(m)

# Criar categorias de cores para os pins
bins = np.linspace(df_agg_mun["QUANTIDADE DE ESCOLAS"].min(), df_agg_mun["QUANTIDADE DE ESCOLAS"].max(), 10)
colors = ["blue", "green", "yellow", "orange", "red", "purple", "brown", "pink", "gray", "black"]

def get_pin_color(value):
    return colors[np.digitize(value, bins) - 1]

# Criar um cluster de marcadores
marker_cluster = MarkerCluster().add_to(m)

# Adicionar marcadores nos municípios
if gdf_municipios is not None:
    df_agg_mun = df_agg_mun.merge(gdf_municipios[["NM_MUN", "geometry"]], left_on="NOME MUNICÍPIO", right_on="NM_MUN", how="left")
    for _, row in df_agg_mun.dropna(subset=["geometry"]).iterrows():
        centroide = row["geometry"].centroid
        pin_color = get_pin_color(row["QUANTIDADE DE ESCOLAS"])
        popup_text = f"Município: {row['NOME MUNICÍPIO']}<br>Quantidade de Escolas: {row['QUANTIDADE DE ESCOLAS']}"
        folium.Marker([centroide.y, centroide.x], popup=popup_text, icon=folium.Icon(color=pin_color)).add_to(marker_cluster)

# Adicionar controle de camadas
folium.LayerControl().add_to(m)

# Salvar o mapa como HTML
m.save("meu_mapa.html")
print("Mapa salvo como 'meu_mapa.html'")


Arquivos Shapefile carregados com sucesso!
Colunas do Shapefile de municípios: Index(['CD_MUN', 'NM_MUN', 'CD_RGI', 'NM_RGI', 'CD_RGINT', 'NM_RGINT', 'CD_UF',
       'NM_UF', 'CD_REGIAO', 'NM_REGIAO', 'CD_CONCURB', 'NM_CONCURB',
       'AREA_KM2', 'geometry'],
      dtype='object')
Arquivo municipios_nao_localizados.csv salvo com sucesso.
Mapa salvo como 'meu_mapa.html'


In [26]:
df_municipios = pd.read_csv("municipios_lat_long.csv")
print(df_municipios.columns)

Index(['codigo_ibge', 'nome', 'latitude', 'longitude', 'capital', 'codigo_uf',
       'siafi_id', 'ddd', 'fuso_horario'],
      dtype='object')


In [14]:
print(gdf_municipios.columns)

Index(['CD_MUN', 'NM_MUN', 'CD_RGI', 'NM_RGI', 'CD_RGINT', 'NM_RGINT', 'CD_UF',
       'NM_UF', 'CD_REGIAO', 'NM_REGIAO', 'CD_CONCURB', 'NM_CONCURB',
       'AREA_KM2', 'geometry'],
      dtype='object')


In [38]:
import pandas as pd
import geopandas as gpd
import folium
import os
import numpy as np
from branca.colormap import linear
from folium.plugins import MarkerCluster, Fullscreen

# Caminhos dos arquivos Shapefile do IBGE
shp_municipios_path = "/IA/jupyter_notebook/BR_Municipios_2023.shp"
shp_ufs_path = "/IA/jupyter_notebook/BR_UF_2023.shp"

# Verificar a existência dos arquivos Shapefile antes de carregar
if os.path.exists(shp_municipios_path) and os.path.exists(shp_ufs_path):
    try:
        gdf_municipios = gpd.read_file(shp_municipios_path)
        gdf_ufs = gpd.read_file(shp_ufs_path)
        print("Arquivos Shapefile carregados com sucesso!")
        print("Colunas do Shapefile de municípios:", gdf_municipios.columns)
        gdf_municipios["NM_MUN"] = gdf_municipios["NM_MUN"].str.upper()
        gdf_ufs["NM_UF"] = gdf_ufs["NM_UF"].str.upper()
    except Exception as e:
        print(f"Erro ao carregar os arquivos Shapefile: {e}")
        gdf_municipios = None
        gdf_ufs = None
else:
    print("Arquivos Shapefile não encontrados. Verifique a pasta e tente novamente.")
    gdf_municipios = None
    gdf_ufs = None

# Função para carregar os dados
def load_data():
    df = pd.read_csv("consolidado_matriculas.csv")
    df.columns = df.columns.str.upper()
    df = df.apply(lambda x: x.astype(str).str.upper() if x.dtype == "object" else x)
    return df

# Carregar os dados
df = load_data()

# Remover colunas irrelevantes
df = df.drop(columns=['PROF MONITORES', 'AEE', 'ATIVIDADE COMPLEMENTAR', 'QTDE MATRÍCULAS'], errors='ignore')

# Criar dataframe agregando por município
df_agg_mun = df.groupby("NOME MUNICÍPIO").size().reset_index(name='QUANTIDADE DE ESCOLAS')

# Criar dataframe agregando por UF
df_agg_uf = df.groupby("UF").size().reset_index(name='QUANTIDADE DE ESCOLAS')

# Garantir que todas as UF's no shapefile estão presentes e converter para maiúsculas
df_agg_uf["UF"] = df_agg_uf["UF"].str.upper()
print("Antes do merge, colunas de df_agg_uf:", df_agg_uf.columns)
print(df_agg_uf.head())

gdf_ufs = gdf_ufs.merge(df_agg_uf, left_on="NM_UF", right_on="UF", how="left")
gdf_ufs["QUANTIDADE DE ESCOLAS"].fillna(0, inplace=True)

# Verificar se o merge foi bem-sucedido
print("Depois do merge, colunas de gdf_ufs:", gdf_ufs.columns)
print(gdf_ufs[["NM_UF", "QUANTIDADE DE ESCOLAS"]].sort_values(by="QUANTIDADE DE ESCOLAS", ascending=False))

# Criar o mapa coroplético
m = folium.Map(location=[-15.788497, -47.879873], zoom_start=4)

# Aplicar um degradê de cores mais perceptível
colormap = linear.YlOrRd_09.scale(gdf_ufs["QUANTIDADE DE ESCOLAS"].min(), gdf_ufs["QUANTIDADE DE ESCOLAS"].max())
colormap.caption = "Quantidade de Escolas por Estado"
colormap.add_to(m)

def style_function_uf(feature):
    uf = feature["properties"].get("NM_UF", "")
    quantidade = gdf_ufs.loc[gdf_ufs["NM_UF"] == uf, "QUANTIDADE DE ESCOLAS"].values
    if len(quantidade) == 0:
        color = "#ffffff"
    else:
        color = colormap(quantidade[0])
    return {
        "fillColor": color,
        "color": "black",
        "weight": 1,
        "fillOpacity": 0.7
    }

if gdf_ufs is not None:
    gdf_ufs["geometry"] = gdf_ufs["geometry"].simplify(0.01)
    folium.GeoJson(
        gdf_ufs,
        name="Estados",
        style_function=style_function_uf,
        tooltip=folium.GeoJsonTooltip(fields=["NM_UF", "QUANTIDADE DE ESCOLAS"], aliases=["Estado", "Quantidade de Escolas"])
    ).add_to(m)

# Criar categorias de cores para os pins
bins = np.linspace(df_agg_mun["QUANTIDADE DE ESCOLAS"].min(), df_agg_mun["QUANTIDADE DE ESCOLAS"].max(), 10)
colors = ["blue", "green", "yellow", "orange", "red", "purple", "brown", "pink", "gray", "black"]

def get_pin_color(value):
    return colors[np.digitize(value, bins) - 1]

# Criar um cluster de marcadores
marker_cluster = MarkerCluster().add_to(m)

# Adicionar marcadores nos municípios
if gdf_municipios is not None:
    df_agg_mun = df_agg_mun.merge(gdf_municipios[["NM_MUN", "geometry"]], left_on="NOME MUNICÍPIO", right_on="NM_MUN", how="left")
    for _, row in df_agg_mun.dropna(subset=["geometry"]).iterrows():
        centroide = row["geometry"].centroid
        pin_color = get_pin_color(row["QUANTIDADE DE ESCOLAS"])
        popup_text = f"Município: {row['NOME MUNICÍPIO']}<br>Quantidade de Escolas: {row['QUANTIDADE DE ESCOLAS']}"
        folium.Marker([centroide.y, centroide.x], popup=popup_text, icon=folium.Icon(color=pin_color)).add_to(marker_cluster)

# Adicionar controle de camadas
folium.LayerControl().add_to(m)
Fullscreen().add_to(m)

# Salvar o mapa como HTML
m.save("meu_mapa.html")
print("Mapa salvo como 'meu_mapa.html'")


Arquivos Shapefile carregados com sucesso!
Colunas do Shapefile de municípios: Index(['CD_MUN', 'NM_MUN', 'CD_RGI', 'NM_RGI', 'CD_RGINT', 'NM_RGINT', 'CD_UF',
       'NM_UF', 'CD_REGIAO', 'NM_REGIAO', 'CD_CONCURB', 'NM_CONCURB',
       'AREA_KM2', 'geometry'],
      dtype='object')
Antes do merge, colunas de df_agg_uf: Index(['UF', 'QUANTIDADE DE ESCOLAS'], dtype='object')
   UF  QUANTIDADE DE ESCOLAS
0  AC                    711
1  AL                   2662
2  AM                   2934
3  AP                    565
4  BA                  14242
Depois do merge, colunas de gdf_ufs: Index(['CD_UF', 'NM_UF', 'SIGLA_UF', 'CD_REGIAO', 'NM_REGIAO', 'AREA_KM2',
       'geometry', 'UF', 'QUANTIDADE DE ESCOLAS'],
      dtype='object')
                  NM_UF  QUANTIDADE DE ESCOLAS
0              RONDÔNIA                    0.0
1                  ACRE                    0.0
2              AMAZONAS                    0.0
3               RORAIMA                    0.0
4                  PARÁ       

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  gdf_ufs["QUANTIDADE DE ESCOLAS"].fillna(0, inplace=True)


Mapa salvo como 'meu_mapa.html'


In [1]:
import pandas as pd
import geopandas as gpd
import folium
import os
import numpy as np
from branca.colormap import linear
from folium.plugins import MarkerCluster, Fullscreen

# Caminhos dos arquivos Shapefile do IBGE
shp_municipios_path = "/IA/jupyter_notebook/BR_Municipios_2023.shp"
shp_ufs_path = "/IA/jupyter_notebook/BR_UF_2023.shp"

# Dicionário de siglas para nomes completos das UF's
sigla_para_nome = {
    "AC": "ACRE", "AL": "ALAGOAS", "AM": "AMAZONAS", "AP": "AMAPÁ", "BA": "BAHIA",
    "CE": "CEARÁ", "DF": "DISTRITO FEDERAL", "ES": "ESPÍRITO SANTO", "GO": "GOIÁS", "MA": "MARANHÃO",
    "MT": "MATO GROSSO", "MS": "MATO GROSSO DO SUL", "MG": "MINAS GERAIS", "PA": "PARÁ", "PB": "PARAÍBA",
    "PR": "PARANÁ", "PE": "PERNAMBUCO", "PI": "PIAUÍ", "RJ": "RIO DE JANEIRO", "RN": "RIO GRANDE DO NORTE",
    "RS": "RIO GRANDE DO SUL", "RO": "RONDÔNIA", "RR": "RORAIMA", "SC": "SANTA CATARINA", "SP": "SÃO PAULO",
    "SE": "SERGIPE", "TO": "TOCANTINS"
}

# Verificar a existência dos arquivos Shapefile antes de carregar
if os.path.exists(shp_municipios_path) and os.path.exists(shp_ufs_path):
    try:
        gdf_municipios = gpd.read_file(shp_municipios_path)
        gdf_ufs = gpd.read_file(shp_ufs_path)
        print("Arquivos Shapefile carregados com sucesso!")
        print("Colunas do Shapefile de municípios:", gdf_municipios.columns)
        gdf_municipios["NM_MUN"] = gdf_municipios["NM_MUN"].str.upper()
        gdf_ufs["NM_UF"] = gdf_ufs["NM_UF"].str.upper()
    except Exception as e:
        print(f"Erro ao carregar os arquivos Shapefile: {e}")
        gdf_municipios = None
        gdf_ufs = None
else:
    print("Arquivos Shapefile não encontrados. Verifique a pasta e tente novamente.")
    gdf_municipios = None
    gdf_ufs = None

# Função para carregar os dados
def load_data():
    df = pd.read_csv("consolidado_matriculas.csv")
    df.columns = df.columns.str.upper()
    df = df.apply(lambda x: x.astype(str).str.upper() if x.dtype == "object" else x)
    return df

# Carregar os dados
df = load_data()

# Remover colunas irrelevantes
df = df.drop(columns=['PROF MONITORES', 'AEE', 'ATIVIDADE COMPLEMENTAR', 'QTDE MATRÍCULAS'], errors='ignore')

# Criar dataframe agregando por município
df_agg_mun = df.groupby("NOME MUNICÍPIO").size().reset_index(name='QUANTIDADE DE ESCOLAS')

# Criar dataframe agregando por UF
df_agg_uf = df.groupby("UF").size().reset_index(name='QUANTIDADE DE ESCOLAS')

# Converter siglas para nomes completos antes do merge
df_agg_uf["NM_UF"] = df_agg_uf["UF"].map(sigla_para_nome)

# Mesclar os dados ao GeoDataFrame das UF's
gdf_ufs = gdf_ufs.merge(df_agg_uf, on="NM_UF", how="left")
gdf_ufs["QUANTIDADE DE ESCOLAS"].fillna(0, inplace=True)

# Criar o mapa coroplético
m = folium.Map(location=[-15.788497, -47.879873], zoom_start=4)

# Aplicar um degradê de cores mais perceptível
colormap = linear.YlOrRd_09.scale(gdf_ufs["QUANTIDADE DE ESCOLAS"].min(), gdf_ufs["QUANTIDADE DE ESCOLAS"].max())
colormap.caption = "Quantidade de Escolas por Estado"
colormap.add_to(m)

def style_function_uf(feature):
    uf = feature["properties"].get("NM_UF", "")
    quantidade = gdf_ufs.loc[gdf_ufs["NM_UF"] == uf, "QUANTIDADE DE ESCOLAS"].values
    if len(quantidade) == 0:
        color = "#ffffff"
    else:
        color = colormap(quantidade[0])
    return {
        "fillColor": color,
        "color": "black",
        "weight": 1,
        "fillOpacity": 0.7
    }

if gdf_ufs is not None:
    gdf_ufs["geometry"] = gdf_ufs["geometry"].simplify(0.01)
    folium.GeoJson(
        gdf_ufs,
        name="Estados",
        style_function=style_function_uf,
        tooltip=folium.GeoJsonTooltip(fields=["NM_UF", "QUANTIDADE DE ESCOLAS"], aliases=["Estado", "Quantidade de Escolas"])
    ).add_to(m)

# Criar categorias de cores para os pins
bins = np.linspace(df_agg_mun["QUANTIDADE DE ESCOLAS"].min(), df_agg_mun["QUANTIDADE DE ESCOLAS"].max(), 10)
colors = ["blue", "green", "yellow", "orange", "red", "purple", "brown", "pink", "gray", "black"]

def get_pin_color(value):
    return colors[np.digitize(value, bins) - 1]

# Criar um cluster de marcadores
marker_cluster = MarkerCluster().add_to(m)

# Adicionar marcadores nos municípios
if gdf_municipios is not None:
    df_agg_mun = df_agg_mun.merge(gdf_municipios[["NM_MUN", "geometry"]], left_on="NOME MUNICÍPIO", right_on="NM_MUN", how="left")
    for _, row in df_agg_mun.dropna(subset=["geometry"]).iterrows():
        centroide = row["geometry"].centroid
        pin_color = get_pin_color(row["QUANTIDADE DE ESCOLAS"])
        popup_text = f"Município: {row['NOME MUNICÍPIO']}<br>Quantidade de Escolas: {row['QUANTIDADE DE ESCOLAS']}"
        folium.Marker([centroide.y, centroide.x], popup=popup_text, icon=folium.Icon(color=pin_color)).add_to(marker_cluster)

# Adicionar controle de camadas
folium.LayerControl().add_to(m)
Fullscreen().add_to(m)

# Salvar o mapa como HTML
m.save("meu_mapa.html")
print("Mapa salvo como 'meu_mapa.html'")


Arquivos Shapefile carregados com sucesso!
Colunas do Shapefile de municípios: Index(['CD_MUN', 'NM_MUN', 'CD_RGI', 'NM_RGI', 'CD_RGINT', 'NM_RGINT', 'CD_UF',
       'NM_UF', 'CD_REGIAO', 'NM_REGIAO', 'CD_CONCURB', 'NM_CONCURB',
       'AREA_KM2', 'geometry'],
      dtype='object')


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  gdf_ufs["QUANTIDADE DE ESCOLAS"].fillna(0, inplace=True)


Mapa salvo como 'meu_mapa.html'
