In [1]:
import pandas as pd
import numpy as np
import requests

pd.options.display.max_columns=50

In [2]:
#Funciona somente local no MySQL

# from sqlalchemy import create_engine

# Configurar a conexão com o banco de dados MySQL
# engine = create_engine('mysql://root:luxapi3@localhost/database_api3')

In [3]:
from google.colab import drive

# Monta o Google Drive
drive.mount('/content/drive')

Mounted at /content/drive


In [4]:
# Define o diretório onde estão os arquivos (Google Drive)
base_rotas = '/content/drive/My Drive/Colab Notebooks/bases/Rotas.csv'
base_clientes = '/content/drive/My Drive/Colab Notebooks/bases/Clientes.csv'
base_fabricas = '/content/drive/My Drive/Colab Notebooks/bases/Fabricas.csv'
base_demanda = '/content/drive/My Drive/Colab Notebooks/bases/Demanda cliente.csv'
base_producao = '/content/drive/My Drive/Colab Notebooks/bases/Capacidade fabrica.csv'

In [5]:
# dicionário de tipos
dict_type_rotas={'Dt.Emissao':str,
                 'Dt.Entrega':str,
                 'Mes.Base':str,
                 'Ano.Exec':str,
                 'CO.Fabrica':str,
                 'CO.Cliente':str,
                 'Incoterm':str,
                 'Veiculo':str,
                 'Qtd/pallets':int,
                 'Qtd.Transp':int,
                 'Moeda':str,
                 'Vlr.Frete':float,
                 'Dist':float  }

dict_type_fabricas={'CO.Fabrica':str,
                    'NO_MUN':str,
                    'NO_MUN_MIN':str,
                    'SG_UF':str,
                    'LAT':float,
                    'LONG':float }

dict_type_clientes={'CO.Cliente':str,
                    'MUN':str,
                    'LAT':float,
                    'LONG':float }

dict_type_demanda={'CO.Cliente':str,
                    'Demanda':int }

dict_type_producao={'CO.Fabrica':str,
                    'Producao':int }

In [6]:
# lendo as bases csv
df_rotas=pd.read_csv(base_rotas, sep=",", dtype=dict_type_rotas)
df_fabricas=pd.read_csv(base_fabricas, sep=",", dtype=dict_type_fabricas, encoding = 'latin1')
df_clientes=pd.read_csv(base_clientes, sep=",", dtype=dict_type_clientes)
df_demanda=pd.read_csv(base_demanda, sep=";", dtype=dict_type_demanda)
df_producao=pd.read_csv(base_producao, sep=";", dtype=dict_type_producao)

#### Tratamento das inconsistências da base Rotas

In [7]:
df_rotas.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 106262 entries, 0 to 106261
Data columns (total 13 columns):
 #   Column       Non-Null Count   Dtype  
---  ------       --------------   -----  
 0   Dt.Emissao   106262 non-null  object 
 1   Dt.Entrega   106262 non-null  object 
 2   Mes.Base     106262 non-null  object 
 3   Ano.Exec     106262 non-null  object 
 4   CO.Fabrica   106262 non-null  object 
 5   CO.Cliente   106262 non-null  object 
 6   Incoterm     106262 non-null  object 
 7   Veiculo      106262 non-null  object 
 8   Qtd/pallets  106262 non-null  int64  
 9   Qtd.Transp   106262 non-null  int64  
 10  Moeda        106262 non-null  object 
 11  Vlr.Frete    106262 non-null  float64
 12  Dist         106262 non-null  float64
dtypes: float64(2), int64(2), object(9)
memory usage: 10.5+ MB


In [8]:
df_rotas.head()

Unnamed: 0,Dt.Emissao,Dt.Entrega,Mes.Base,Ano.Exec,CO.Fabrica,CO.Cliente,Incoterm,Veiculo,Qtd/pallets,Qtd.Transp,Moeda,Vlr.Frete,Dist
0,01/01/23,05/01/23,1,2023,3423909,2311,FOB,P24,24,3600,BRL,0.0,71.41
1,01/01/23,03/01/23,1,2023,3424402,2333,FOB,P12,12,1500,BRL,0.0,74.02
2,01/01/23,04/01/23,1,2023,3403208,2347,FOB,P12,12,1800,BRL,0.0,85.92
3,01/01/23,06/01/23,1,2023,3424402,2332,FOB,P12,12,1800,BRL,0.0,90.01
4,01/01/23,04/01/23,1,2023,3424402,2332,FOB,P12,12,1500,BRL,0.0,90.01


In [9]:
# mudando tipo data
df_rotas['Dt.Emissao']= pd.to_datetime(df_rotas['Dt.Emissao'], format='%d/%m/%y')
df_rotas['Dt.Entrega']= pd.to_datetime(df_rotas['Dt.Entrega'], format='%d/%m/%y')

##### Data Inconsistente

In [10]:
# regra de data de faturamento < data de entrega (se false, data inconsistente)
df_rotas['flag_dt_inconsist'] = df_rotas['Dt.Emissao'] > df_rotas['Dt.Entrega']

In [11]:
# contagem da flag de inconsistência de data
df_rotas['flag_dt_inconsist'].value_counts()

flag_dt_inconsist
False    106257
True          5
Name: count, dtype: int64

In [12]:
# Condição para selecionar as linhas onde queremos trocar os valores
condicao_troca = df_rotas['flag_dt_inconsist'] == True

In [13]:
# Trocar os valores das colunas coluna_A e coluna_B apenas nas linhas selecionadas pela condição
df_rotas.loc[condicao_troca, ['Dt.Emissao', 'Dt.Entrega']] = df_rotas.loc[condicao_troca, ['Dt.Entrega', 'Dt.Emissao']].values

In [14]:
# Aplicar a condição e verificar se há valores True
data_inconsist = df_rotas['Dt.Emissao'] > df_rotas['Dt.Entrega']
data_inconsist.sum()

0

##### Incoterm Inconsistente

In [15]:
# regra de FOB != 0 (se false, FOB com valor > 0)
df_rotas['flag_incoterm_valor_inconsist'] = ((df_rotas['Incoterm'] == 'FOB') & (df_rotas['Vlr.Frete'] > 0)).astype(bool)

In [16]:
# contagem da flag de inconsistência FOB
df_rotas['flag_incoterm_valor_inconsist'].value_counts()

flag_incoterm_valor_inconsist
False    97495
True      8767
Name: count, dtype: int64

In [17]:
# Condição para selecionar as linhas onde queremos fazer a substituição
condicao_substituir = df_rotas['flag_incoterm_valor_inconsist'] == True

In [18]:
# Substituir a palavra 'FOB' por 'CIF' apenas nas linhas selecionadas pela condição
df_rotas.loc[condicao_substituir, 'Incoterm'] = df_rotas.loc[condicao_substituir, 'Incoterm'].replace('FOB', 'CIF', regex=True)

In [19]:
# Verificar se há valores 'FOB' inconsistentes após a substituição
FOB_inconsist = (df_rotas['Incoterm'] == 'FOB') & (df_rotas['Vlr.Frete'] > 0)
FOB_inconsist.sum()

0

In [20]:
df_rotas.drop(columns=['flag_dt_inconsist', 'flag_incoterm_valor_inconsist'], inplace=True)

### Enriquecendo a Base Rotas com Clientes e Fábricas

In [21]:
# enriquecimento da base rotas com a clientes e fabricas
df_merge=pd.merge(pd.merge(df_rotas, df_clientes, how="outer", on="CO.Cliente"), df_fabricas, how="outer", on="CO.Fabrica")

In [22]:
# realocação das colunas
df_merge.insert(14,'CO.Cliente', df_merge.pop('CO.Cliente'))
df_merge.insert(17,'CO.Fabrica', df_merge.pop('CO.Fabrica'))

In [23]:
df_merge = df_merge.rename(columns={'MUN': 'MUN.Cliente',
                                    'LAT_x': 'LAT.Cliente',
                                    'LONG_x': 'LONG.Cliente',
                                    'NO_MUN': 'MUN.Fabrica',
                                    'LAT_y': 'LAT.Fabrica',
                                    'LONG_y': 'LONG.Fabrica' })

In [24]:
df_merge.head(3)

Unnamed: 0,Dt.Emissao,Dt.Entrega,Mes.Base,Ano.Exec,Incoterm,Veiculo,Qtd/pallets,Qtd.Transp,Moeda,Vlr.Frete,Dist,MUN.Cliente,LAT.Cliente,CO.Cliente,LONG.Cliente,MUN.Fabrica,NO_MUN_MIN,CO.Fabrica,SG_UF,LAT.Fabrica,LONG.Fabrica
0,2023-01-01,2023-01-05,1,2023,FOB,P24,24,3600,BRL,0.0,71.41,PIRACICABA,-22.74145,2311,-47.60181,ITU,Itu,3423909,SP,-23.251784,-47.343908
1,2023-01-02,2023-01-05,1,2023,FOB,P12,12,1500,BRL,0.0,71.41,PIRACICABA,-22.74145,2311,-47.60181,ITU,Itu,3423909,SP,-23.251784,-47.343908
2,2023-01-02,2023-01-05,1,2023,FOB,P24,24,3600,BRL,0.0,71.41,PIRACICABA,-22.74145,2311,-47.60181,ITU,Itu,3423909,SP,-23.251784,-47.343908


In [25]:

# concatenando strings e criando cod-nome e rota (fabrica-cliente)
df_merge['cod_mun_cliente']=df_merge['CO.Cliente']+' - '+df_merge['MUN.Cliente']
df_merge['cod_mun_fabrica']=df_merge['CO.Fabrica']+' - '+df_merge['MUN.Fabrica']
df_merge['rota']=df_merge['MUN.Fabrica']+' - '+df_merge['MUN.Cliente']

In [26]:
df_merge['LAT.Cliente'] = df_merge['LAT.Cliente'].astype(str)
df_merge['LONG.Cliente'] = df_merge['LONG.Cliente'].astype(str)
df_merge['LAT.Fabrica'] = df_merge['LAT.Fabrica'].astype(str)
df_merge['LONG.Fabrica'] = df_merge['LONG.Fabrica'].astype(str)

In [27]:
# concatenando strings e criando lat-long das fabricas e clientes
df_merge['loc_cliente']=df_merge['LAT.Cliente']+','+df_merge['LONG.Cliente']
df_merge['loc_fabrica']=df_merge['LAT.Fabrica']+','+df_merge['LONG.Fabrica']

In [28]:
# criação de um dataframe de rotas com lat-long da origem-destino
df_rota_lat_long=df_merge[['rota', 'loc_cliente', 'loc_fabrica']].drop_duplicates().reset_index(drop=True)

In [29]:
df_rota_lat_long

Unnamed: 0,rota,loc_cliente,loc_fabrica
0,ITU - PIRACICABA,"-22.74145,-47.60181","-23.25178418,-47.3439079"
1,ITU - SAO PAULO,"-23.46722,-46.58475","-23.25178418,-47.3439079"
2,ITU - RIBEIRAO PRETO,"-21.19498,-47.75589","-23.25178418,-47.3439079"
3,ITU - SAO PAULO,"-23.48552,-46.73883","-23.25178418,-47.3439079"
4,ITU - OSASCO,"-23.55164,-46.79466","-23.25178418,-47.3439079"
...,...,...,...
112,JACAREI - SOROCABA,"-23.49563,-47.51121","-23.28713588,-45.9849763"
113,JACAREI - CAMPINAS,"-22.83309,-47.07943","-23.28713588,-45.9849763"
114,JACAREI - SAO CARLOS,"-22.03848,-47.86018","-23.28713588,-45.9849763"
115,JACAREI - AMERICANA,"-22.72237,-47.3074","-23.28713588,-45.9849763"


In [30]:
#chave API maps
google_maps_key = "AIzaSyCSfp-lJf1SC2X0X-L8AfjNAi4NLMoBXsg"

In [31]:
# consulta na API Google para calcular a distância e tempo das rotas

def get_route_info(origin, destination, google_maps_key):
    url = 'https://maps.googleapis.com/maps/api/directions/json'
    params = {
        'origin': origin,
        'destination': destination,
        'key': google_maps_key
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        route = response.json()['routes'][0]['legs'][0]
        distance = route['distance']['value'] / 1000.0
        duration = route['duration']['value'] / 60.0
        return distance, duration
    else:
        return None, None

In [32]:
# criação de listas vazias de distancia e tempo para API preencher
distances = []
durations = []

In [33]:
%%time

# consulta linha a linha do dataframe de rotas
for index, row in df_rota_lat_long.iterrows():
    origin = row['loc_fabrica']
    destination = row['loc_cliente']
    distance, duration = get_route_info(origin, destination, google_maps_key)
    distances.append(distance)
    durations.append(duration)

CPU times: user 10.8 s, sys: 210 ms, total: 11 s
Wall time: 23.2 s


In [34]:
# criação das colunas quilometragem e tempo de viagem
df_rota_lat_long['km_api'] = distances
df_rota_lat_long['tempo_min_api'] = durations

In [35]:
df_rota_lat_long.head()

Unnamed: 0,rota,loc_cliente,loc_fabrica,km_api,tempo_min_api
0,ITU - PIRACICABA,"-22.74145,-47.60181","-23.25178418,-47.3439079",71.15,55.383333
1,ITU - SAO PAULO,"-23.46722,-46.58475","-23.25178418,-47.3439079",117.496,98.15
2,ITU - RIBEIRAO PRETO,"-21.19498,-47.75589","-23.25178418,-47.3439079",263.19,185.283333
3,ITU - SAO PAULO,"-23.48552,-46.73883","-23.25178418,-47.3439079",94.751,75.983333
4,ITU - OSASCO,"-23.55164,-46.79466","-23.25178418,-47.3439079",88.048,71.8


In [36]:
# merge entre o dataframe com quilometragem e tempo de viagem com a base rotas enriquecida
df_rotas_enriq=pd.merge(df_merge, df_rota_lat_long, how="left", on=['rota','loc_cliente','loc_fabrica'])

In [37]:
df_rotas_enriq.head(3)

Unnamed: 0,Dt.Emissao,Dt.Entrega,Mes.Base,Ano.Exec,Incoterm,Veiculo,Qtd/pallets,Qtd.Transp,Moeda,Vlr.Frete,Dist,MUN.Cliente,LAT.Cliente,CO.Cliente,LONG.Cliente,MUN.Fabrica,NO_MUN_MIN,CO.Fabrica,SG_UF,LAT.Fabrica,LONG.Fabrica,cod_mun_cliente,cod_mun_fabrica,rota,loc_cliente,loc_fabrica,km_api,tempo_min_api
0,2023-01-01,2023-01-05,1,2023,FOB,P24,24,3600,BRL,0.0,71.41,PIRACICABA,-22.74145,2311,-47.60181,ITU,Itu,3423909,SP,-23.25178418,-47.3439079,2311 - PIRACICABA,3423909 - ITU,ITU - PIRACICABA,"-22.74145,-47.60181","-23.25178418,-47.3439079",71.15,55.383333
1,2023-01-02,2023-01-05,1,2023,FOB,P12,12,1500,BRL,0.0,71.41,PIRACICABA,-22.74145,2311,-47.60181,ITU,Itu,3423909,SP,-23.25178418,-47.3439079,2311 - PIRACICABA,3423909 - ITU,ITU - PIRACICABA,"-22.74145,-47.60181","-23.25178418,-47.3439079",71.15,55.383333
2,2023-01-02,2023-01-05,1,2023,FOB,P24,24,3600,BRL,0.0,71.41,PIRACICABA,-22.74145,2311,-47.60181,ITU,Itu,3423909,SP,-23.25178418,-47.3439079,2311 - PIRACICABA,3423909 - ITU,ITU - PIRACICABA,"-22.74145,-47.60181","-23.25178418,-47.3439079",71.15,55.383333


In [38]:
df_rotas_enriq.drop(columns=['Dist', 'NO_MUN_MIN', 'SG_UF','loc_cliente', 'loc_fabrica', 'cod_mun_cliente', 'cod_mun_fabrica'], inplace=True)

In [39]:
# merge entre o dataframe com quilometragem e tempo de viagem com a base rotas enriquecida
df_rotas_real=pd.merge(pd.merge(df_rotas_enriq, df_demanda, how="outer", on="CO.Cliente"), df_producao, how="outer", on="CO.Fabrica")

In [None]:
df_historico_rotas = df_rotas_real

In [None]:
# gravando .csv
df_historico_rotas.to_csv('historico_rotas.csv', index=False)

In [None]:
# Salvar o DataFrame no MySQL - funciona somente local
# df_historico_rotas.to_sql('historico_rotas', con=engine, if_exists='replace', index=False)

# print("DataFrame salvo no MySQL com sucesso!")

## Agrupando a base mensalmente e criando kpis



In [None]:
# criando rota fabrica-cliente por código
df_rotas_enriq['cod_rota']= df_rotas_enriq['CO.Fabrica'] + '-' + df_rotas_enriq['CO.Cliente']

In [None]:
# criando kpi custo/km
df_rotas_enriq['custo/km'] = df_rotas_enriq['Vlr.Frete']/df_rotas_enriq['km_api']

In [None]:
# criando kpi custo/unid
df_rotas_enriq['custo/unid'] = df_rotas_enriq['Vlr.Frete']/df_rotas_enriq['Qtd.Transp']

In [None]:
# quantidade máxima transportada por cada tipo de caminhão
max_quantidade = df_rotas_enriq.groupby(['Mes.Base', 'cod_rota', 'Veiculo'])['Qtd.Transp'].max().reset_index()
max_quantidade.rename(columns={'Qtd.Transp': 'qtd_max_veiculo'}, inplace=True)

In [None]:
# número de viagens por mês, rota e tipo de caminhão
num_viagens = df_rotas_enriq.groupby(['Mes.Base', 'cod_rota', 'Veiculo']).size().reset_index(name='num_viagens')

In [None]:
df_aux = pd.merge(max_quantidade, num_viagens, on=['Mes.Base', 'cod_rota', 'Veiculo'])

In [None]:
df_aux.head(2)

Unnamed: 0,Mes.Base,cod_rota,Veiculo,qtd_max_veiculo,num_viagens
0,1,3403208-2301,P12,1800,111
1,1,3403208-2301,P24,3600,97


In [None]:
df_rotas_enriq = pd.merge(df_rotas_enriq, df_aux, on=['Mes.Base', 'cod_rota', 'Veiculo'])

In [None]:
df_rotas_enriq.head(3)

Unnamed: 0,Dt.Emissao,Dt.Entrega,Mes.Base,Ano.Exec,Incoterm,Veiculo,Qtd/pallets,Qtd.Transp,Moeda,Vlr.Frete,MUN.Cliente,LAT.Cliente,CO.Cliente,LONG.Cliente,MUN.Fabrica,CO.Fabrica,LAT.Fabrica,LONG.Fabrica,rota,km_api,tempo_min_api,cod_rota,custo/km,custo/unid,qtd_max_veiculo,num_viagens
0,2023-01-01,2023-01-05,1,2023,FOB,P24,24,3600,BRL,0.0,PIRACICABA,-22.74145,2311,-47.60181,ITU,3423909,-23.25178418,-47.3439079,ITU - PIRACICABA,71.15,55.316667,3423909-2311,0.0,0.0,3600,18
1,2023-01-02,2023-01-05,1,2023,FOB,P24,24,3600,BRL,0.0,PIRACICABA,-22.74145,2311,-47.60181,ITU,3423909,-23.25178418,-47.3439079,ITU - PIRACICABA,71.15,55.316667,3423909-2311,0.0,0.0,3600,18
2,2023-01-02,2023-01-06,1,2023,FOB,P24,24,3600,BRL,0.0,PIRACICABA,-22.74145,2311,-47.60181,ITU,3423909,-23.25178418,-47.3439079,ITU - PIRACICABA,71.15,55.316667,3423909-2311,0.0,0.0,3600,18


In [None]:
# Agrupando e agregando por múltiplas colunas
df_real_mensal = df_rotas_enriq.groupby(['Mes.Base','Ano.Exec','Veiculo', 'CO.Cliente', 'CO.Fabrica', 'rota', 'cod_rota']).agg({
    'Qtd.Transp': 'sum',
    'Vlr.Frete' :'sum',
    'km_api': 'mean',
    'custo/km': 'mean',
    'custo/unid': 'mean',
    'qtd_max_veiculo':'mean',
    'num_viagens':'mean'
}).reset_index()

### Cálculo da Produtividade

In [None]:
df_real_mensal['qtd_max_transp'] = df_real_mensal['qtd_max_veiculo']*df_real_mensal['num_viagens']

In [None]:
# Calcular a taxa de ocupação
df_real_mensal['taxa_ocupacao'] = df_real_mensal['Qtd.Transp'] / df_real_mensal['qtd_max_transp']

In [None]:
df_real_mensal.head()

Unnamed: 0,Mes.Base,Ano.Exec,Veiculo,CO.Cliente,CO.Fabrica,rota,cod_rota,Qtd.Transp,Vlr.Frete,km_api,custo/km,custo/unid,qtd_max_veiculo,num_viagens,qtd_max_transp,taxa_ocupacao
0,1,2023,P12,2301,3403208,ARARAQUARA - VALINHOS,3403208-2301,176700,0.0,193.55,0.0,0.0,1800.0,111.0,199800.0,0.884384
1,1,2023,P12,2301,3424402,JACAREI - VALINHOS,3424402-2301,216900,15318.63,145.62,0.779229,0.069625,1800.0,135.0,243000.0,0.892593
2,1,2023,P12,2302,3403208,ARARAQUARA - CAMPINAS,3403208-2302,163200,0.0,182.669,0.0,0.0,1800.0,102.0,183600.0,0.888889
3,1,2023,P12,2302,3424402,JACAREI - CAMPINAS,3424402-2302,227700,33941.95,141.311,1.668009,0.14961,1800.0,144.0,259200.0,0.878472
4,1,2023,P12,2303,3403208,ARARAQUARA - CAMPINAS,3403208-2303,221400,0.0,187.278,0.0,0.0,1800.0,137.0,246600.0,0.89781


In [None]:
# gravando .csv
df_real_mensal.to_csv('rotas_mensal_real.csv', index=False)

In [None]:
# Salvar o DataFrame no MySQL - funciona somente local
# df_rotas_real.to_sql('rotas_mensal_real', con=engine, if_exists='replace', index=False)

# print("DataFrame salvo no MySQL com sucesso!")