# Projeto 1 - Construção e Deploy de Modelo de Machine Learning

## Exemplo de Processo para a área de logística:

Problema: Uma  das  questões  cruciais  enfrentadas  pelas  empresas  de  logística  é  a  identificação rápida e precisa do conteúdo das embalagens, para garantir que sejam manuseadas de maneira adequada, evitando danos. Muitas vezes, as embalagens externas não dão indicaçõesclaras sobre o seu conteúdo, o que pode levar a tratamentos inadequados e, consequentemente, a custos adicionais e insatisfação do cliente. 

Solução Proposta: Desenvolver um modelo de Machine Learning que, com base em duas variáveis simples: o peso do pacote e o tipo de embalagem, seja capaz de prever o produto eletrônico contido dentro  da  embalagem.  Este  modelo  permitirá  que  os  funcionários  do  centro  logístico rapidamente identifiquem e classifiquem os pacotes, garantindo que cada produto receba o tratamento adequado durante o processo logístico.

Coleta de dados: Será essencial coletar dados sobre o peso e tipo de embalagem de diferentes produtos eletrônicos. Esse dataset será a base para o treinamento do modelo.

Desenvolvimento  do  Modelo:  Utilizando  técnicas  modernas  de  Machine  Learning,  o modelo será treinado para correlacionar peso e tipo de embalagem com o produto eletrônico específico.

Avaliação e Otimização: Uma vez treinado, o modelo será avaliado em sua capacidade de prever  com  precisão  o  conteúdo  das  embalagens  em  um  conjunto  de  dados  de  teste. Dependendo dos resultados, ajustes e otimizações podem ser necessários.

Deploy: Com o modelo treinado e otimizado, ele será implantado em uma aplicação web, permitindo que os funcionários do centro logístico insiram o peso e o tipo de embalagem e recebam uma previsão do conteúdo da embalagem em tempo real.

## Construção do Modelo de Machine Learning

### Pacotes e bibliotecas

In [None]:
%pip install joblib
%pip install scikit-learn
%pip install pandas

In [2]:
# Imports
import joblib
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn.metrics import classification_report

### Dados
dados sobre o peso e tipo de embalagem de diferentes produtos eletrônicos

In [3]:
# Dados de de produtos
dsa_dados = {
    'Peso_Embalagem_Gr': [212, 215, 890, 700, 230, 240, 730, 780, 218, 750, 202, 680],
    'Tipo_Embalagem': ['Caixa de Papelão', 'Caixa de Papelão', 'Plástico Bolha', 'Plástico Bolha', 'Caixa de Papelão', 'Caixa de Papelão', 'Plástico Bolha', 'Plástico Bolha', 'Caixa de Papelão', 'Plástico Bolha', 'Caixa de Papelão', 'Plástico Bolha'],
    'Tipo_Produto': ['Smartphone', 'Tablet', 'Tablet', 'Tablet', 'Smartphone', 'Smartphone', 'Tablet', 'Smartphone', 'Smartphone', 'Tablet', 'Smartphone', 'Tablet']  # Alterei o segundo e o oitavo rótulo
}


df = pd.DataFrame(dsa_dados)

### Preparação dos dados

In [4]:
# Separa X (entrada) e Y (saída)
X = df[['Peso_Embalagem_Gr', 'Tipo_Embalagem']]
y = df['Tipo_Produto']

# Divide os dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 1)  


`LabelEncoder()` é uma classe da biblioteca scikit-learn em Python usada para transformar variáveis categóricas em números inteiros. Converte cada categoria em um número único.

In [5]:
# Criado os codificadores para as variáveis categóricas
le_tipo_embalagem = LabelEncoder()
le_tipo_produto = LabelEncoder()

# Ajuste do codificador aos dados
le_tipo_embalagem.fit(X_train['Tipo_Embalagem'])
le_tipo_produto.fit(y_train)

# Aplica a transformação nos dados de treinamento e teste 
X_train['Tipo_Embalagem'] = le_tipo_embalagem.transform(X_train['Tipo_Embalagem'])
X_test['Tipo_Embalagem'] = le_tipo_embalagem.transform(X_test['Tipo_Embalagem'])
y_train = le_tipo_produto.transform(y_train)
y_test = le_tipo_produto.transform(y_test)

### Desenvolvimento do modelo

In [6]:
# Cria o modelo
modelo = DecisionTreeClassifier()

# Treina o modelo
modelo.fit(X_train, y_train)

# Faz previsão com o modelo
y_pred = modelo.predict(X_test)

# Calcula a acurácia
acc_modelo = accuracy_score(y_test, y_pred)

# Print
print(f"\nAcurácia: ", round(acc_modelo,2))

print("\nRelatório de Classificação:\n")

# Obtém o classification report
report = classification_report(y_test, y_pred)

# Imprimir o report
print(report)


Acurácia:  0.67

Relatório de Classificação:

              precision    recall  f1-score   support

           0       0.50      1.00      0.67         1
           1       1.00      0.50      0.67         2

    accuracy                           0.67         3
   macro avg       0.75      0.75      0.67         3
weighted avg       0.83      0.67      0.67         3



Primeira verão do modelo, o modelo pode melhorar.

In [7]:
# Salva o modelo treinado
joblib.dump(modelo, 'modelos/modelo_logistica.pkl')

# Salva os transformadores
joblib.dump(le_tipo_embalagem, 'modelos/transformador_tipo_embalagem.pkl')
joblib.dump(le_tipo_produto, 'modelos/transformador_tipo_produto.pkl')

['modelos/transformador_tipo_produto.pkl']