<a href="https://colab.research.google.com/github/sergio-g-rubio/baseball_stats/blob/main/Previsao_Logistica_ML.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üöö Previs√£o de Tempo de Opera√ß√£o Log√≠stica com Machine Learning
Este notebook treina um modelo de regress√£o para prever a dura√ß√£o de opera√ß√µes log√≠sticas com base em atributos como tipo de opera√ß√£o, produto, peso, turno, etc.

In [66]:
# Imports
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import OneHotEncoder
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error

# üìÇ Carregamento e Visualiza√ß√£o do Dataset Log√≠stico

In [62]:
# Carregar dataset (fa√ßa upload manual do CSV gerado anteriormente)
from google.colab import files
uploaded = files.upload()
df = pd.read_csv(next(iter(uploaded)))
df.head()

Saving dataset_logistica_1000_linhas.csv to dataset_logistica_1000_linhas (3).csv


Unnamed: 0,tipo_operacao,tipo_produto,quantidade,peso_total_kg,turno,hora_inicio,dia_semana,tempo_total_min
0,recebimento,paletizado,228,587.37,tarde,12:00,quinta,42
1,expedi√ß√£o,paletizado,156,145.25,tarde,16:30,s√°bado,41
2,recebimento,fracionado,229,657.76,tarde,12:00,quarta,41
3,recebimento,mat√©ria-prima,239,550.0,manh√£,6:30,quinta,37
4,expedi√ß√£o,fracionado,125,321.97,tarde,16:45,ter√ßa,46


In [63]:
# Separar vari√°veis independentes (X) e alvo (y)
X = df.drop(["tempo_total_min", "hora_inicio"], axis=1)  # Remove a string 'hora_inicio'
y = df["tempo_total_min"]

In [64]:
# Definir colunas categ√≥ricas e num√©ricas
cat_cols = ["tipo_operacao", "tipo_produto", "turno", "dia_semana"]
num_cols = ["quantidade", "peso_total_kg", "hora_minutos"]

# Pr√©-processamento
preprocessador = ColumnTransformer([
    ("cat", OneHotEncoder(handle_unknown='ignore'), cat_cols)
], remainder='passthrough')

In [65]:
# Pipeline com Random Forest
modelo = Pipeline([
    ("pre", preprocessador),
    ("rf", RandomForestRegressor(n_estimators=100, random_state=42))
])

# Dividir em treino/teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Treinar
modelo.fit(X_train, y_train)

# Prever
y_pred = modelo.predict(X_test)

# Avalia√ß√£o
mae = mean_absolute_error(y_test, y_pred)
print(f"O modelo erra, em m√©dia, cerca de {mae:.2f} minutos ao prever a dura√ß√£o de uma opera√ß√£o log√≠stica.")
print("Esse valor representa a diferen√ßa m√©dia entre o tempo real e o tempo previsto, em minutos.")

O modelo erra, em m√©dia, cerca de 5.50 minutos ao prever a dura√ß√£o de uma opera√ß√£o log√≠stica.
Esse valor representa a diferen√ßa m√©dia entre o tempo real e o tempo previsto, em minutos.


# üìä Avalia√ß√£o de Desempenho do Modelo Preditivo Log√≠stico

In [59]:
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
import numpy as np

# C√°lculos das m√©tricas
mae = mean_absolute_error(y_test, y_pred)
rmse = np.sqrt(mean_squared_error(y_test, y_pred))
r2 = r2_score(y_test, y_pred)
erro_percentual_medio = np.mean(np.abs((y_test - y_pred) / y_test)) * 100

print("üìä Resultado da An√°lise do Modelo de Previs√£o Log√≠stica:\n")

print(f"‚û°Ô∏è Em m√©dia, o modelo erra {mae:.2f} minutos na estimativa do tempo de opera√ß√£o.")
print(f"‚û°Ô∏è O desvio m√©dio dos erros mais graves (RMSE) √© de {rmse:.2f} minutos.")
print(f"‚û°Ô∏è Em termos proporcionais, o erro m√©dio representa cerca de {erro_percentual_medio:.2f}% do tempo real.")
print(f"‚û°Ô∏è O modelo consegue explicar aproximadamente {r2:.2%} da varia√ß√£o dos tempos reais registrados.")

print("\nüîç Como interpretar esses n√∫meros:")

if erro_percentual_medio < 5:
    print("‚úÖ As previs√µes do modelo s√£o muito pr√≥ximas da realidade. Isso √© excelente para planejamento e monitoramento de SLAs.")
elif erro_percentual_medio < 10:
    print("üü° As previs√µes s√£o boas, com alguns desvios aceit√°veis. Pode ser √∫til para gerar estimativas em pain√©is log√≠sticos.")
else:
    print("üî¥ O modelo ainda apresenta certa imprecis√£o. Isso pode ser causado por vari√°veis importantes que est√£o faltando, dados fora do padr√£o ou por inconsist√™ncia nas opera√ß√µes.")

print("\nüí° Sugest√µes para melhorar:")
print("- Verifique se h√° informa√ß√µes importantes que n√£o est√£o sendo usadas (ex: tipo de cliente, SKU, equipamento).")
print("- Remova valores muito fora do padr√£o (outliers) que distorcem a m√©dia.")
print("- Considere separar modelos por tipo de opera√ß√£o ou turno, se os comportamentos forem muito diferentes.")


üìä Resultado da An√°lise do Modelo de Previs√£o Log√≠stica:

‚û°Ô∏è Em m√©dia, o modelo erra 5.50 minutos na estimativa do tempo de opera√ß√£o.
‚û°Ô∏è O desvio m√©dio dos erros mais graves (RMSE) √© de 6.47 minutos.
‚û°Ô∏è Em termos proporcionais, o erro m√©dio representa cerca de 8.92% do tempo real.
‚û°Ô∏è O modelo consegue explicar aproximadamente 93.20% da varia√ß√£o dos tempos reais registrados.

üîç Como interpretar esses n√∫meros:
üü° As previs√µes s√£o boas, com alguns desvios aceit√°veis. Pode ser √∫til para gerar estimativas em pain√©is log√≠sticos.

üí° Sugest√µes para melhorar:
- Verifique se h√° informa√ß√µes importantes que n√£o est√£o sendo usadas (ex: tipo de cliente, SKU, equipamento).
- Remova valores muito fora do padr√£o (outliers) que distorcem a m√©dia.
- Considere separar modelos por tipo de opera√ß√£o ou turno, se os comportamentos forem muito diferentes.


# üß™ Simula√ß√£o de Dimensionamento de Equipe com Base em Previs√£o de Tempo Operacional

In [70]:
import numpy as np
import pandas as pd

fator_escala = (operacoes_turno["quantidade"] / 1000).clip(lower=1)
operacoes_turno["tempo_previsto_corrigido"] = operacoes_turno["tempo_previsto_min"] * fator_escala

# ‚öôÔ∏è Simula√ß√£o: lista de opera√ß√µes em um turno
operacoes_turno = pd.DataFrame([
    {'tipo_operacao': 'recebimento', 'tipo_produto': 'mat√©ria-prima', 'quantidade': 15000, 'peso_total_kg': 8000, 'turno': 'manh√£', 'dia_semana': 'segunda', 'hora_inicio': '08:00'},
    {'tipo_operacao': 'expedi√ß√£o', 'tipo_produto': 'produto_acabado', 'quantidade': 3000, 'peso_total_kg': 1500, 'turno': 'manh√£', 'dia_semana': 'segunda', 'hora_inicio': '09:00'},
    {'tipo_operacao': 'recebimento', 'tipo_produto': 'paletizado', 'quantidade': 800, 'peso_total_kg': 6000, 'turno': 'manh√£', 'dia_semana': 'segunda', 'hora_inicio': '10:30'},
    # adicione mais linhas conforme o cen√°rio
])

# Converter hora_inicio para minutos
operacoes_turno["hora_minutos"] = operacoes_turno["hora_inicio"].apply(lambda x: int(x.split(":")[0]) * 60 + int(x.split(":")[1]))

# Remover coluna n√£o usada
X_simulacao = operacoes_turno.drop("hora_inicio", axis=1)

# Prever tempo estimado de cada opera√ß√£o
tempos_previstos = modelo.predict(X_simulacao)
operacoes_turno["tempo_previsto_min"] = np.round(tempos_previstos, 2)
fator_escala = (operacoes_turno["quantidade"] / 1000).clip(lower=1)
operacoes_turno["tempo_previsto_corrigido"] = operacoes_turno["tempo_previsto_min"] * fator_escala

# üî¢ Somar tempo total do turno
tempo_total_turno = operacoes_turno["tempo_previsto_corrigido"].sum()

# ‚ö†Ô∏è Definir tempo de trabalho de um operador no turno (em minutos)
tempo_util_operador = 6.5 * 60  # 6h30min = 390 minutos √∫teis

# üßÆ Calcular necessidade de operadores
operadores_necessarios = np.ceil(tempo_total_turno / tempo_util_operador)

# üìä Resultado
print("üì¶ Simula√ß√£o de dimensionamento de equipe log√≠stica (turno da manh√£):\n")
print(operacoes_turno[["tipo_operacao", "tipo_produto", "quantidade", "tempo_previsto_min"]])
print(f"\n‚è±Ô∏è Tempo total previsto do turno: {tempo_total_turno:.1f} minutos")
print(f"üë∑ Operadores necess√°rios para dar conta da demanda: {int(operadores_necessarios)} operador(es)")

üì¶ Simula√ß√£o de dimensionamento de equipe log√≠stica (turno da manh√£):

  tipo_operacao     tipo_produto  quantidade  tempo_previsto_min
0   recebimento    mat√©ria-prima       15000              118.02
1     expedi√ß√£o  produto_acabado        3000              107.94
2   recebimento       paletizado         800               91.02

‚è±Ô∏è Tempo total previsto do turno: 2185.1 minutos
üë∑ Operadores necess√°rios para dar conta da demanda: 6 operador(es)


## ‚úÖ Conclus√£o

Este notebook mostra como √© poss√≠vel aplicar intelig√™ncia artificial, mesmo com dados simples, para prever tempos operacionais, identificar gargalos e simular o dimensionamento ideal de equipes em armaz√©ns.

Ferramentas como essa podem apoiar supervisores, analistas e gestores na tomada de decis√£o di√°ria, com base em dados reais.