<a href="https://colab.research.google.com/github/biagmes/Classifica-o-de-regi-es/blob/main/Distancia_reta_cidade_capital.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [6]:
import math
import pandas as pd
import numpy as np
import os  # para manipular caminhos de arquivos

def calculate_distances_vectorized(df):
    """
    Calcula distâncias entre dois pontos na superfície da Terra usando cálculos vetorizados.

    Parâmetros:
        df (pandas DataFrame): O DataFrame contendo as colunas lon1, lat1, lon2 e lat2.

    Retorna:
        pandas Series: As distâncias entre os dois pontos em quilômetros.
    """
    lon1 = np.radians(df['lon1'])
    lat1 = np.radians(df['lat1'])
    lon2 = np.radians(df['lon2'])
    lat2 = np.radians(df['lat2'])

    dlon = lon2 - lon1
    dlat = lat2 - lat1
    a = np.sin(dlat / 2)**2 + np.cos(lat1) * np.cos(lat2) * np.sin(dlon / 2)**2
    c = 2 * np.arctan2(np.sqrt(a), np.sqrt(1 - a))

    R = 6371  # Raio da Terra em km
    distances = R * c
    return distances

def main():
    # 🟢 Defina o caminho completo do arquivo Excel aqui:
    file_path = r'C:\Users\Binca Gomes\OneDrive - DIEL ENERGIA LTDA\Classificação de regioes_new.xlsx'

    try:
        # 🟢 Verifica se o caminho contém uma extensão .xlsx ou .xls
        if not os.path.splitext(file_path)[1] in ['.xlsx', '.xls']:
            print("Por favor, selecione um arquivo Excel válido.")
            return

        print(f"Lendo arquivo: {file_path}")

        # 🟢 Carrega o arquivo Excel em um DataFrame pandas
        df = pd.read_excel(file_path)

        # 🟢 Converte o nome das colunas para minúsculas para evitar falhas na verificação
        df.columns = df.columns.str.lower()

        # 🟢 Verifica se as colunas obrigatórias estão presentes
        required_columns = ['lon1', 'lat1', 'lon2', 'lat2']
        if set(required_columns).issubset(df.columns):
            print("Calculando distâncias...")

            # Remove linhas com valores ausentes (NaN) para evitar erros no cálculo
            df = df.dropna(subset=required_columns)

            # 🟢 Calcula as distâncias
            df['Distance (km)'] = calculate_distances_vectorized(df)

            # 🟢 Salva o arquivo Excel com as distâncias adicionadas
            output_path = r'C:\Users\Binca Gomes\OneDrive - DIEL ENERGIA LTDA\Classificação de regioes_new_atualizado.xlsx'
            df.to_excel(output_path, index=False)
            print(f"Arquivo atualizado com as distâncias e salvo em: {output_path}")
        else:
            print(f"O arquivo não contém as colunas necessárias: {required_columns}.")
    except Exception as e:
        print(f"Ocorreu um erro ao processar o arquivo: {type(e).__name__} - {e}")

if __name__ == "__main__":
    main()


Lendo arquivo: C:\Users\Binca Gomes\OneDrive - DIEL ENERGIA LTDA\Classificação de regioes_new.xlsx
Ocorreu um erro ao processar o arquivo: FileNotFoundError - [Errno 2] No such file or directory: 'C:\\Users\\Binca Gomes\\OneDrive - DIEL ENERGIA LTDA\\Classificação de regioes_new.xlsx'
