# Localização de Postos de Carregamento para Carros Elétricos

Seguindo nosta ideia este projeto utiliza o algoritmo K-Nearest Neighbors (KNN) para encontrar os postos de carregamento mais próximos a uma localização fornecida pelo usuário, com base em dados de latitude e longitude. O projeto também avalia o desempenho do modelo utilizando métricas como Erro Médio Absoluto (MAE) e Acurácia de Proximidade.

---

## **Pré-requisitos**

Antes de executar o projeto, certifique-se de ter os seguintes pacotes Python instalados:
- `pandas`: Para manipulação de dados tabulares.
- `numpy`: Para cálculos matemáticos eficientes.
- `scikit-learn`: Para implementar o algoritmo de Machine Learning.

Para instalar as dependências, execute:
```bash
pip install pandas numpy scikit-learn

# **Etapas do Projeto**
## 1. **Carregamento dos Dados**
O projeto começa carregando os dados do arquivo CSV com informações de localização dos postos de carregamento:

In [None]:
import pandas as pd
from sklearn.neighbors import NearestNeighbors
from sklearn.model_selection import train_test_split
import numpy as np


df = pd.read_csv("locais_carregamento_expandido.csv")


## 2. **Divisão dos Dados**
Os dados são divididos em conjuntos de treinamento e teste:
Entradas (X): Latitude e longitude dos postos.
Saídas (y): Nomes dos postos correspondentes.
Divisão: 70% dos dados para treinamento e 30% para teste

In [None]:

X = df[["Latitude", "Longitude"]]

In [None]:

X_train, X_test = train_test_split(X, test_size=0.2, random_state=42)


## 3. **Treinamento do Modelo**
O algoritmo KNN (K-Nearest Neighbors) é configurado e treinado:


Configuração: Utiliza n_neighbors=3, ou seja, o modelo busca os três postos mais próximos.
Métrica: A distância entre as localizações é calculada usando a fórmula haversine, que leva em conta a curvatura da Terra.

In [16]:

knn = NearestNeighbors(n_neighbors=3, metric="haversine")
knn.fit(np.radians(X_train))  

# 4. **Modelo de Predição de Distâncias com K-Nearest Neighbors (KNN)**

O código utiliza um conjunto de dados com coordenadas geográficas para prever a proximidade entre pontos. A abordagem se baseia nos seguintes passos principais:

1. **Inicialização de Listas**: São criadas duas listas (`true_distances` e `predicted_distances`) para armazenar as distâncias reais e previstas durante o processo.

2. **Iteração Sobre os Pontos de Teste**: Cada ponto no conjunto de teste (`X_test`) é processado individualmente, acessando suas coordenadas (latitude e longitude).

3. **Conversão de Coordenadas para Radianos**: Como a fórmula de cálculo utilizada pelo KNN considera a curvatura da Terra, as coordenadas geográficas são convertidas para radianos.

4. **Cálculo de Distâncias com KNN**: Para cada ponto de teste, o modelo KNN calcula as distâncias e os índices dos K vizinhos mais próximos.

5. **Armazenamento de Resultados**: As distâncias calculadas pelo modelo são armazenadas nas listas para posterior análise.

6. **Avaliação do Modelo**: As distâncias armazenadas podem ser usadas para calcular métricas de desempenho, como o Erro Médio Absoluto (MAE), e para visualizar a precisão do modelo.




In [None]:

true_distances = []
predicted_distances = []

for _, test_point in X_test.iterrows():
    
    test_location = np.radians([[test_point["Latitude"], test_point["Longitude"]]])
    
    
    distances, indices = knn.kneighbors(test_location)

    true_distances.append(distances[0][0])
    
  
    predicted_distances.append(distances[0][0])

# 5.**Cálculo do Erro Médio Absoluto (MAE) das Distâncias**

Este código tem como objetivo calcular o **Erro Médio Absoluto (MAE)** das distâncias entre localizações geográficas, comparando as distâncias reais com as distâncias previstas. O MAE é uma métrica de avaliação de modelo amplamente utilizada para medir a precisão de previsões, indicando o quão próximo o modelo está da realidade.




In [17]:

mae = np.mean(np.abs(np.array(true_distances) - np.array(predicted_distances)))
print(f"Erro Médio Absoluto (MAE) das distâncias: {mae:.2f} km")


Erro Médio Absoluto (MAE) das distâncias: 0.00 km


# 6.**Cálculo da Acurácia Dentro de um Limiar de Distância (Threshold)**

Este código tem como objetivo calcular a **acurácia** do modelo de previsão de distâncias geográficas, avaliando a porcentagem de previsões que estão dentro de uma distância máxima (limiar) definida, como 10 km, entre os valores reais e previstos. Essa métrica é útil para verificar se o modelo está fazendo previsões suficientemente próximas da realidade para um intervalo de erro aceitável.


In [15]:
threshold_km = 10  
accuracy = np.mean(np.array(true_distances) <= threshold_km) * 100
print(f"Acurácia dentro de {threshold_km} km: {accuracy:.2f}%")

Acurácia dentro de 10 km: 100.00%
