In [388]:
import pandas as pd
import requests
import json
import os
import sys
from datetime import datetime, timedelta

ref_month = datetime.now().date().month
ref_day = datetime.now().date().day

BRONZE_DIR = os.path.join(fr'..\data\bronze\{ref_month}\{ref_day}')

xx = pd.read_parquet(os.path.join(BRONZE_DIR, 'city_information.parquet'), columns=['city','id_city','lon','lat'])
xx

Unnamed: 0,city,id_city,lon,lat
0,Arasselva,3471712,-54.8167,-22.0
1,Coração de Jesus,3465542,-44.365,-16.6853
2,Senador José Bento,3447851,-46.1789,-22.1644
3,Arês,3407151,-35.1603,-6.1944
4,Silveira Martins,3447575,-53.5856,-29.6425
5,Pedras de Fogo,3392478,-35.1164,-7.4019
6,Bom Jesus da Lapa,3469437,-43.4181,-13.255
7,Bom Sucesso,3469374,-44.7581,-21.0331
8,Franca,3463011,-47.4008,-20.5386
9,Itacorubi,7874475,-48.495,-27.5832


In [1]:
import os
import sys
from dotenv import load_dotenv


# Sua chave de API do Google Maps
API_TRANSITO_KEY = os.getenv('API_TRANSITO_KEY')
API_TRANSITO_KEY

'AIzaSyBdPIx9YFDfRNHW91jAZjtHeXIDxyLhmEQ'

In [8]:
src_dir = os.path.join(os.getcwd().split)
sys.path.insert(0, src_dir)
src_dir

TypeError: expected str, bytes or os.PathLike object, not builtin_function_or_method

In [7]:
import pandas as pd
import requests
import json
import os
import sys
import pytz
from datetime import datetime, timedelta
from dotenv import load_dotenv

# Importações locais
src_dir = os.path.join(os.getcwd().split('src')[0], 'src')
sys.path.insert(0, src_dir)
from utils.database_operations import DatabaseOps
src_dir = os.path.join(os.getcwd().split('src')[0], 'src','utils')
sys.path.insert(0, src_dir)

class TrafficData:
    """
    Classe para coleta e processamento de dados de tráfego entre cidades usando a API do Google Maps.
    """

    def __init__(self):
        """
        Inicializa a instância da classe TrafficData com data atual e outras variáveis necessárias para a integração dos dados.
        """
        self.today = datetime.now().date()  # Define a data atual
        self.ref_month = self.today.month  # Define o mês de referência
        self.ref_day = self.today.day  # Define o dia de referência
        self.directions_results = []  # Lista para armazenar os resultados das direções
        self.cidades_origem = []  # Lista para armazenar as cidades de origem
        self.cidades_destino = []  # Lista para armazenar as cidades de destino
        self.df_trafego = pd.DataFrame()  # DataFrame para armazenar os dados de tráfego

    # Função para obter dados da API de Directions
    def get_directions_data(self, origin, destination):
        """
        Obtém dados de direção da API do Google Maps entre dois pontos geográficos.

        Parâmetros:
        origin (str): Coordenadas de origem no formato 'latitude,longitude'.
        destination (str): Coordenadas de destino no formato 'latitude,longitude'.

        Retorna:
        dict: Dados JSON com informações de direção das cidades.
        """
        API_TRANSITO_KEY = os.getenv('API_TRANSITO_KEY')  # Chave da API de tráfego

        # Monta a URL da API
        url = f"https://maps.googleapis.com/maps/api/directions/json?origin={origin}&destination={destination}&key={API_TRANSITO_KEY}"
        response = requests.get(url)  # Faz a requisição GET

        if response.status_code == 200:  # Verifica se a requisição foi bem-sucedida
            return response.json()  # Retorna os dados JSON
        else:
            return None  # Retorna None em caso de falha na requisição

    def collect_directions(self):
        """
        Coleta dados de direção para todas as combinações de cidades.
        """
        # Carrega os dados de cidades da camada Bronze
        BRONZE_DIR = os.path.join(fr'..\data\bronze\{self.ref_month}\{self.ref_day}')
        dir_information = pd.read_parquet(os.path.join(BRONZE_DIR, 'city_information.parquet'), columns=['city','id_city','lon','lat'])

        # Loop para todas as combinações de cidades
        for i in range(len(dir_information)):
            for j in range(i + 1, len(dir_information)):
                origin = f"{dir_information.iloc[i]['lat']},{dir_information.iloc[i]['lon']}"  # Coordenadas de origem
                destination = f"{dir_information.iloc[j]['lat']},{dir_information.iloc[j]['lon']}"  # Coordenadas de destino
                directions_data = self.get_directions_data(origin, destination)  # Obtém os dados de direção
                
                if directions_data:  # Verifica se os dados foram obtidos com sucesso
                    # Adiciona os resultados às listas
                    self.directions_results.append({'directions': directions_data})
                    self.cidades_origem.append(dir_information.iloc[i]['id_city'])
                    self.cidades_destino.append(dir_information.iloc[j]['id_city'])
                else:
                    # Imprime uma mensagem de erro se os dados não puderem ser obtidos
                    print(f"Não foi possível obter os dados de direção para o par {dir_information.iloc[i]['city']} -> {dir_information.iloc[j]['city']}.")

    def process_directions(self):
        """
        Processa os dados de direção coletados e os organiza em um DataFrame.
        """
        direction_information = pd.DataFrame(self.directions_results)  # DataFrame com os resultados de direção
        distances_results = []  # Lista para armazenar as distâncias

        # Loop sobre os resultados de direção
        for directions_data in direction_information['directions']:
            routes = directions_data.get('routes', [])  # Obtém as rotas
            for route in routes:
                legs = route.get('legs', [])  # Obtém as pernas da rota
                for leg in legs:
                    distance = leg.get('distance', {}).get('text')  # Obtém a distância
                    duration = leg.get('duration', {}).get('text')  # Obtém a duração
                    start_address = leg.get('start_address')  # Obtém o endereço de partida
                    end_address = leg.get('end_address')  # Obtém o endereço de chegada
                    distances_results.append({  # Adiciona os resultados à lista
                        'start_address': start_address,
                        'end_address': end_address,
                        'distance': distance,
                        'duration': duration
                    })

        # Cria o DataFrame de tráfego a partir dos resultados de distância
        self.df_trafego = pd.json_normalize(distances_results)
        self.df_trafego['id_city_origem'] = self.cidades_origem  # Adiciona a cidade de origem
        self.df_trafego['id_city_destino'] = self.cidades_destino  # Adiciona a cidade de destino
        self.df_trafego['dt_ingestao'] = self.today  # Adiciona a data de ingestão

    def connect_databases(self):
        """
        Método para conectar ao banco de dados.
        """
        global database, database_connection

        database = DatabaseOps()
        database_connection = database.connect_db()

    def insert_database(self, df, schmea, tabela):
        """
        Método para inserir dados no banco de dados.

        Parâmetros:
        df (DataFrame): DataFrame contendo os dados a serem inseridos.
        schema (str): Nome do schema no banco de dados.
        table (str): Nome da tabela no banco de dados.

        Retorna:
        bool: True se a inserção for bem-sucedida, False caso contrário.
        """
        try:
            database.insert(dataframe=df, schema=schmea, table=tabela, if_exists='append')
            return True  # Retorna True se a inserção for bem-sucedida
        except Exception as e:
            print(f"Erro durante a inserção no banco de dados: {e}")
            return False  # Retorna False em caso de erro na inserção

    def pipeline(self):
        """
        Executa a coleta e o processamento dos dados de tráfego.

        Retorna:
        DataFrame: Dados de tráfego processados.
        """
        try:
            self.collect_directions()  # Coleta os dados de direção
            self.process_directions()  # Processa os dados de direção
            self.insert_database(self.df_trafego, 'bronze', 'traffic_direction')  # Insere os dados no banco de dados

            return self.df_trafego  # Retorna os dados de tráfego processados

        except Exception as e:
            print(f"Erro durante a inserção no banco de dados: {e}")
            return False  # Retorna False em caso de erro durante o pipeline


In [8]:
traffic_data = TrafficData()
df_trafego = traffic_data.pipeline()
df_trafego

Unnamed: 0,start_address,end_address,distance,duration,id_city_origem,id_city_destino,dt_ingestao
0,"R. Delegado Pedro Silveira, 279, Bom Sucesso -...","Av. Castelo Branco, 34, Feijó - AC, 69960-000,...","3,684 km",2 days 1 hour,3469367,3664243,2024-05-25
1,"R. Delegado Pedro Silveira, 279, Bom Sucesso -...","R. Ari Barroso, 614, Terra Boa - PR, 87240-000...",93.2 km,1 hour 17 mins,3469367,3446598,2024-05-25
2,"R. Delegado Pedro Silveira, 279, Bom Sucesso -...","RO-133, Vale do Paraíso - RO, 76923-000, Brazil","2,514 km",1 day 8 hours,3469367,3969388,2024-05-25
3,"R. Delegado Pedro Silveira, 279, Bom Sucesso -...","R. Padre Acelino, 53 - Centro, Tabuleiro do No...","3,305 km",1 day 18 hours,3469367,3386984,2024-05-25
4,"Av. Castelo Branco, 34, Feijó - AC, 69960-000,...","R. Ari Barroso, 614, Terra Boa - PR, 87240-000...","3,673 km",2 days 1 hour,3664243,3446598,2024-05-25
5,"Av. Castelo Branco, 34, Feijó - AC, 69960-000,...","RO-133, Vale do Paraíso - RO, 76923-000, Brazil","1,238 km",17 hours 35 mins,3664243,3969388,2024-05-25
6,"Av. Castelo Branco, 34, Feijó - AC, 69960-000,...","R. Padre Acelino, 53 - Centro, Tabuleiro do No...","4,618 km",2 days 21 hours,3664243,3386984,2024-05-25
7,"R. Ari Barroso, 614, Terra Boa - PR, 87240-000...","RO-133, Vale do Paraíso - RO, 76923-000, Brazil","2,500 km",1 day 8 hours,3446598,3969388,2024-05-25
8,"R. Ari Barroso, 614, Terra Boa - PR, 87240-000...","R. Padre Acelino, 53 - Centro, Tabuleiro do No...","3,283 km",1 day 19 hours,3446598,3386984,2024-05-25
9,"RO-133, Vale do Paraíso - RO, 76923-000, Brazil","R. Padre Acelino, 53 - Centro, Tabuleiro do No...","4,062 km",2 days 8 hours,3969388,3386984,2024-05-25
