In [1]:
#pandas para manipulação de dados,
!pip install pandas
import pandas as pd
import unicodedata

# Carregando os dados
escolas_df = pd.read_csv('escolas.csv', encoding='utf-8', sep=',')

def remover_acentos(texto):
    if isinstance(texto, str):
        return ''.join(c for c in unicodedata.normalize('NFD', texto) if unicodedata.category(c) != 'Mn').upper()
    else:
        return str(texto).upper()  # Converte para string e aplica o upper()
    
# Aplicar a função 'remover_acentos' a todas as células do DataFrame
escolas_df = escolas_df.applymap(remover_acentos)
# Limpe e padronize as colunas relevantes
colunas_limpar = ['Escolas_Postos', 'ENDEREÇO', 'BAIRRO']
for coluna in colunas_limpar:
    escolas_df[coluna] = escolas_df[coluna].apply(remover_acentos)

# Vamos criar um dicionário que mapeia as primeiras palavras para os tipos de escola
primeira_palavra_para_tipo = {
    'CENTRO': 'CENTRO',
    'EM': 'EM',
    'ESCOLA': 'ESCOLA',
    'E.M': 'E.M',
    'CIEP': 'CIEP'
}

# Função para classificar o tipo de escola com base na primeira palavra
def classificar_tipo_escola(texto):
    palavras = texto.split()  # Dividir o texto em palavras
    primeira_palavra = palavras[0].upper() if palavras else None  # Pegar a primeira palavra (se existir)
    return primeira_palavra_para_tipo.get(primeira_palavra, 'OUTRO')  # Mapear para o tipo ou 'OUTRO' se não for encontrado

# Aplicar a função à coluna 'Escolas_Postos' para criar uma nova coluna 'tipo_escola'
escolas_df['tipo_escola'] = escolas_df['Escolas_Postos'].apply(classificar_tipo_escola)

# Cruzamento subprefeituras
# Carregue o DataFrame 'subprefeituras_df' com os dados do arquivo 'subprefeituras.csv'
subprefeituras_df = pd.read_csv('subprefeituras.csv', encoding='utf-8', sep=',')

# Padronize as strings para maiúsculas e remova acentos nas colunas relevantes em 'subprefeituras_df'
colunas_padronizar = ['nome', 'subprefeitura']
for coluna in colunas_padronizar:
    subprefeituras_df[coluna] = subprefeituras_df[coluna].apply(remover_acentos).str.upper()

# Realize a mesclagem (merge) entre 'escolas_df' e 'subprefeituras_df' com base na correspondência entre 'BAIRRO' e 'nome'
escolas_df = escolas_df.merge(subprefeituras_df[['nome', 'subprefeitura']], left_on='BAIRRO', right_on='nome', how='left')

# Verifique o resultado
print(escolas_df)

escolas_df['subprefeitura'].fillna('', inplace=True)  # Preencher valores nulos com uma string vazia
escolas_df['subprefeitura'] = escolas_df['subprefeitura'].apply(lambda x: remover_acentos(x).upper())

# Converter a coluna 'lat' e 'lon' para números de ponto flutuante
escolas_df['lat'] = escolas_df['lat'].str.replace(',', '.').astype(float)
escolas_df['lon'] = escolas_df['lon'].str.replace(',', '.').astype(float)

# Formatar latitude e longitude com 5 casas decimais
escolas_df['lat'] = escolas_df['lat'].apply(lambda x: round(x, 5))
escolas_df['lon'] = escolas_df['lon'].apply(lambda x: round(x, 5))

# Adicionar zeros à esquerda nos IDs das escolas para que eles tenham 3 caracteres
escolas_df['id'] = escolas_df['id'].apply(lambda x: str(x).zfill(3))

# coordenadas
# Criando o arquivo com a quantidade total de material escolar por subprefeitura
material_didatico_df = pd.read_csv('material_didatico.csv', encoding='utf-8')


                                                    id Escolas_Postos BAIRRO  \
0    178,CENTRO INTEGRADO DE EDUCACAO PUBLICA HENFI...            NAN    NAN   
1    634,EM ALICE DO AMARAL PEIXOTO,BENFICA,RUA EBA...            NAN    NAN   
2    483,EM CELESTINO SILVA,CENTRO,"R. DO LAVRADIO,...            NAN    NAN   
3    476,ESCOLA MUNICIPAL FLORIANO PEIXOTO,SAO CRIS...            NAN    NAN   
4    132,EM PEREIRA PASSOS,RIO COMPRIDO,PRACA CONDE...            NAN    NAN   
..                                                 ...            ...    ...   
147  474,EM ENGENHEIRO GASTAO RANGEL,GUARATIBA,ESTR...            NAN    NAN   
148  301,EM JONATAS SERRANO,GUARATIBA,"ESTRADA DO M...            NAN    NAN   
149  215,E.M. NARCISA AMALIA,ILHA DE GUARATIBA,ESTR...            NAN    NAN   
150  606,EM PROFESSOR CASTILHO,ILHA DE GUARATIBA,CA...            NAN    NAN   
151  69,ESCOLA MUNICIPAL CARDEAL ARCOVERDE,MADUREIR...            NAN    NAN   

    ENDEREÇO  lat  lon tipo_escola nome

In [54]:
#pandas para manipulação de dados,
!pip install pandas
import pandas as pd
import unicodedata

# Carregando os dados
escolas_df = pd.read_csv('escolas.csv', encoding='utf-8', sep=',')
material_didatico_df = pd.read_csv('material_didatico.csv', encoding='utf-8')
print(escolas_df)
print(escolas_df)


                                                    id Escolas_Postos BAIRRO  \
0    178,CENTRO INTEGRADO DE EDUCAÇÃO PÚBLICA HENFI...            NaN    NaN   
1    634,EM ALICE DO AMARAL PEIXOTO,BENFICA,Rua Éba...            NaN    NaN   
2    483,EM CELESTINO SILVA,CENTRO,"R. do Lavradio,...            NaN    NaN   
3    476,ESCOLA MUNICIPAL FLORIANO PEIXOTO,SÃO CRIS...            NaN    NaN   
4    132,EM PEREIRA PASSOS,RIO COMPRIDO,Praça Conde...            NaN    NaN   
..                                                 ...            ...    ...   
147  474,EM ENGENHEIRO GASTÃO RANGEL,GUARATIBA,Estr...            NaN    NaN   
148  301,EM JONATAS SERRANO,GUARATIBA,"Estrada Do M...            NaN    NaN   
149  215,E.M. NARCISA AMALIA,ILHA DE GUARATIBA,Estr...            NaN    NaN   
150  606,EM PROFESSOR CASTILHO,ILHA DE GUARATIBA,Ca...            NaN    NaN   
151  69,ESCOLA MUNICIPAL CARDEAL ARCOVERDE,MADUREIR...            NaN    NaN   

    ENDEREÇO  lat  lon  
0        NaN  

In [None]:
# geopy para cálculos de distâncias, networkx para encontrar a melhor rota. folium para criar um mapa interativo com a rota encontrada.#
!pip install pandas geopy networkx folium
from geopy.distance import great_circle
import networkx as nx
import folium
# Salve o mapa em um arquivo HTML
mapa.save('rota.html')
# Exibir o mapa interativo (opcional)
# folium.view(mapa)
# Calculando a rota otimizada
G = nx.Graph()

# Adicione os nós do grafo com as coordenadas das escolas
for index, escola in escolas_df.iterrows():
    G.add_node(escola['id'], coordenadas=escola['coordenadas'])

# Adicione as arestas do grafo com as distâncias entre as escolas
for escola1 in G.nodes():
    for escola2 in G.nodes():
        if escola1 != escola2:
            distancia = great_circle(G.nodes[escola1]['coordenadas'], G.nodes[escola2]['coordenadas']).kilometers
            G.add_edge(escola1, escola2, weight=distancia)

# Encontre a melhor rota
melhor_rota = nx.approximation.traveling_salesman_problem(G, cycle=False)
melhor_rota.append(melhor_rota[0])  # Para fechar o ciclo

# Criando um mapa interativo com a rota
mapa = folium.Map(location=escolas_df['coordenadas'].mean(), zoom_start=13)
coords_rota = [G.nodes[node]['coordenadas'] for node in melhor_rota]
folium.PolyLine(coords_rota, color="blue", weight=2.5, opacity=1).add_to(mapa)
