### 1. **Objetivos**

**Objetivo do Modelo**:  
O modelo tem como objetivo principal prever três fatores cruciais para otimizar a produção:

1. **Duração recomendada da nova ordem**, estimando a quantidade de dias necessária para produzir a quantidade de frascos solicitada pelo cliente, levando em consideração o total produzido (incluindo os frascos defeituosos).

2. **Total de defeitos esperados** para uma nova ordem de produção, com base em medidas físicas (peso, comprimento e diâmetro) e duração da produção.

3. **Distribuição dos defeitos por dia**, prevendo o total esperado de defeitos para cada dia de produção, possibilitando a identificação de dias críticos com maior probabilidade de problemas.

4. **Total Produzido Esperado**, considerando a quantidade de frascos solicitados pelo cliente e o total de defeitos previstos. O modelo estima o total necessário para garantir que a quantidade entregue ao cliente seja a solicitada, incluindo os frascos defeituosos.


### 2. **Solução**

**Solução Proposta**:  
- Para prever o **total de defeitos**, foi desenvolvido um modelo de **regressão**, utilizando dados históricos sobre medidas físicas (peso, comprimento e diâmetro) e os defeitos observados em ordens anteriores.
- O modelo também prevê a **duração recomendada da nova ordem**, com base no total de frascos solicitados pelo cliente e nas características das gotas. Ele considera que, para atender à demanda de frascos entregáveis, é necessário produzir uma quantidade maior de frascos, devido aos defeitos esperados.
- Além disso, foi realizada uma análise de sazonalidade para identificar os **dias críticos de defeitos**, ou seja, os dias da produção em que o número de defeitos tende a ser maior.
- O modelo também prevê o **total produzido esperado**, ou seja, a quantidade total necessária de frascos para que a quantidade solicitada pelo cliente seja entregue, incluindo os frascos defeituosos.

#### **Importante**:  
O **total de frascos produzidos** refere-se à quantidade total necessária para atender ao pedido do cliente, incluindo os frascos defeituosos, que não serão entregues. **Exemplo**: Para entregar ***x*** frascos, precisamos produzir/cortar ***(x + n)*** frascos/gotas, onde ***n*** representa o número estimado de defeitos previstos. O **total produzido esperado** leva em consideração essa soma de defeitos previstos.


### 3. **Como o Modelo Vai Funcionar (Inputs e Outputs)**

**Inputs (Entradas do Modelo)**:  
- **Medidas da Ordem**:
  - Peso médio (g)
  - Comprimento médio (mm)
  - Diâmetro
- **Total de Frascos Solicitados**:
  - Quantidade pedida pelo cliente.
- **Dados Históricos**:
  - Características das ordens passadas, duração da produção e número de defeitos registrados.

**Outputs (Saídas do Modelo)**:
- **Previsão do Total de Defeitos**: Quantidade de defeitos esperada para a nova ordem, com base nas características fornecidas.
- **Duração Recomendada da Ordem**: Estimativa do número de dias necessários para produzir a quantidade pedida pelo cliente, considerando os defeitos esperados.
- **Previsão dos Dias Críticos de Defeitos**: Identificação dos dias da produção com maior probabilidade de apresentar defeitos.
- **Total Produzido Esperado**: Quantidade total de frascos a serem produzidos para atender ao pedido do cliente, incluindo os defeitos previstos.


### 4. **Conclusão**

- **Benefícios**:
  - **Planejamento mais eficiente**: O modelo ajuda a determinar não apenas o total de defeitos, mas também a duração recomendada da produção para atender à demanda com menor desperdício e maior precisão no total produzido.
  - **Ação preventiva**: A previsão de dias críticos de defeitos permite que a produção se prepare para possíveis problemas e otimize os processos.
  - **Redução de erros**: Com mais dados e ajustes contínuos, o modelo pode melhorar significativamente a precisão das previsões, ajudando a reduzir os custos relacionados a defeitos.


### 5. **Próximos Passos**

1. **Coleta e Análise de Mais Dados**:  
   - Incluir dados históricos mais detalhados sobre o comportamento dos defeitos, considerando diferentes tipos de defeitos, condições ambientais e ajustes na linha de produção.  
   - Incorporar informações sobre a relação entre **quantidade solicitada** (X) e **quantidade necessária para produção** (Y), para atender ao pedido do cliente, levando em conta os defeitos.

2. **Melhorar a Previsão da Duração**:  
   - Ajustar o modelo para prever com maior precisão a duração necessária, considerando não apenas os defeitos, mas também a eficiência da linha de produção em diferentes cenários.

3. **Previsão Detalhada de Defeitos**:  
   - Aperfeiçoar o modelo para prever a quantidade de defeitos diária com maior granularidade, incluindo sazonalidade e variáveis adicionais.

4. **Iteração e Validação Contínua**:  
   - Realizar ajustes regulares no modelo com novos dados para garantir maior precisão e confiabilidade, aplicando validação cruzada e técnicas de otimização.


In [140]:
import pandas as pd

In [141]:
dados = pd.read_csv('../dados_modelo.csv')
df = pd.DataFrame(dados)

In [142]:
df.head().round(2)

Unnamed: 0,Ordem de prod,Ref. do Artigo,Duração da ordem,Temperatura (F°),Peso médio (g),Comprimento médio (mm),Diâmetro (mm),Gotas cortadas (toneladas),Total de Frascos,Total de Defeitos,Sujo de óleo,Aderido,Dobra,Trinca por choque térmico,Ombro mal cheio,Racho na terminação,Lascado em produção,Frio
0,192970,C0516.0000R,9,2125.51,169.91,125.51,30.97,178.79,1052031,2148,437,2,77,176,68,28,12,7
1,193112,C1164.0000R,3,2173.68,168.17,88.73,38.57,44.73,265727,584,259,0,35,22,0,9,2,0
2,193164,C1280.0000R,12,2119.41,147.47,100.12,35.43,236.13,1600487,2661,851,2,43,129,0,220,33,19
3,193206,C1284.0000R,4,2170.66,171.15,90.4,36.88,74.31,433842,1041,245,0,26,6,0,65,10,0
4,193207,C1298.0000R,10,2139.29,170.87,98.23,36.56,136.92,801014,2130,754,0,27,87,0,79,45,4


### Trabalhando com defeitos por dia 

In [143]:
dados_dias = pd.read_csv('../dados_dias_modelo.csv')
df_dias = pd.DataFrame(dados_dias)

In [144]:
df_dias.head()

Unnamed: 0,Ordem de prod,Dia Contado,Dias de Duração,Dia Normalizado,Total de Defeitos no Dia
0,192970,1,9,0.111111,222
1,192970,2,9,0.222222,249
2,192970,3,9,0.333333,268
3,192970,4,9,0.444444,242
4,192970,5,9,0.555556,232


### Visualização

Defeitos por dia contado

In [145]:
defeitos_por_dia_contado = df_dias.groupby('Dia Contado')[['Total de Defeitos no Dia']].mean().reset_index()
defeitos_por_dia_contado.columns = ['Dia Contado', 'Média de Defeitos']

In [146]:
import plotly.graph_objects as go

fig = go.Figure()

fig.add_trace(go.Scatter(x=defeitos_por_dia_contado['Dia Contado'],
                         y=defeitos_por_dia_contado['Média de Defeitos'],
                         mode='lines+markers', 
                         marker=dict(size=10),
                         line=dict(color='red'),
                         name='Média de Defeitos'))

fig.update_layout(
    title='Média de Defeitos por Dia Contado',
    title_font_size=16,
    xaxis_title='Dia Contado',
    xaxis_title_font_size=14,
    yaxis_title='Média de Defeitos',
    yaxis_title_font_size=14
)

fig.show()

## Implementando Modelo

### Definindo variáveis e teste

In [147]:
from sklearn.model_selection import train_test_split

# Selecionando as variáveis de entrada e saída
X = df[['Peso médio (g)', 'Comprimento médio (mm)', 
        'Diâmetro (mm)', 'Total de Frascos']]
y = df[['Duração da ordem', 'Total de Defeitos']]

# Divisão em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [148]:
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error, r2_score
import math

# Instanciando o modelo
model = RandomForestRegressor(random_state=42, n_estimators=100)

# Treinando o modelo
model.fit(X_train, y_train)

# Fazendo previsões
y_pred = model.predict(X_test)

# Separando previsões para 'Duração da ordem' e 'Total de Defeitos'
y_test_duracao = y_test['Duração da ordem']
y_test_defeitos = y_test['Total de Defeitos']
y_pred_duracao = y_pred[:, 0]
y_pred_defeitos = y_pred[:, 1]

# Avaliação do modelo
print(f"Mean Squared Error (Duração da ordem): {mean_squared_error(y_test_duracao, y_pred_duracao):.2f}")
print(f"R² Score (Duração da ordem): {r2_score(y_test_duracao, y_pred_duracao):.2f}")
print(f"Mean Squared Error (Total de Defeitos): {mean_squared_error(y_test_defeitos, y_pred_defeitos):.2f}")
print(f"R² Score (Total de Defeitos): {r2_score(y_test_defeitos, y_pred_defeitos):.2f}")

Mean Squared Error (Duração da ordem): 0.56
R² Score (Duração da ordem): 0.77
Mean Squared Error (Total de Defeitos): 28057.65
R² Score (Total de Defeitos): 0.61


### Testando Modelo

In [149]:
# Dados de uma nova ordem
nova_ordem = [[169.3, 40.2, 12.5, 1123456]]

# Fazendo a previsão
nova_predicao = model.predict(nova_ordem)

# Extraindo as previsões
nova_duracao_prevista = math.ceil(nova_predicao[0][0])  # Previsão da duração
novo_total_defeitos_previsto = nova_predicao[0][1]  # Previsão do total de defeitos

print(f"Duração prevista da ordem: {nova_duracao_prevista:.2f} dias")
print(f"Total de defeitos previstos: {novo_total_defeitos_previsto:.2f}")

Duração prevista da ordem: 9.00 dias
Total de defeitos previstos: 1893.56



X does not have valid feature names, but RandomForestRegressor was fitted with feature names



**`math.ceil()`**:
   - Garante que `nova_duracao_prevista` seja arredondada sempre para cima.
   - Por exemplo: `2.50` será arredondado para `3`, e `3.01` também será arredondado para `4`.


> Arredondar para o próximo número inteiro (em vez de truncar) torna o cálculo mais conservador, especialmente em cenários onde o tempo de duração deve ser superestimado para evitar problemas.

### Como seria a soma com o total solicitado: 

O total produzido esperado é a soma do número de frascos solicitados pelo cliente e os defeitos previstos.

In [150]:
# Calculando o total produzido esperado
total_frascos_solicitados = nova_ordem[0][3]  # Total solicitado (ex.: 123456)
total_produzido_esperado = total_frascos_solicitados + math.ceil(novo_total_defeitos_previsto)

In [151]:
print(f"Total solicitados: {total_frascos_solicitados} frascos")
print(f"Total produzido esperado: {total_produzido_esperado} frascos")

Total solicitados: 1123456 frascos
Total produzido esperado: 1125350 frascos


### Distribuição dos defeitos

Distribuindo os defeitos previstos proporcionalmente com base na média histórica:

In [152]:
# Soma total das médias de defeitos
total_medio_defeitos = defeitos_por_dia_contado['Média de Defeitos'].sum()

# Calcula os defeitos previstos proporcionalmente
defeitos_por_dia_contado['Defeitos Previstos'] = (
    (defeitos_por_dia_contado['Média de Defeitos'] / total_medio_defeitos) * novo_total_defeitos_previsto
)

Garantimos que apenas os dias que correspondem à duração prevista da nova ordem sejam considerados:

In [153]:
# Seleciona apenas os dias da nova ordem
df_dias_duracao = defeitos_por_dia_contado.head(nova_duracao_prevista).copy()

Certificando que a soma total dos defeitos para os dias selecionados seja igual ao total de defeitos esperado

In [154]:
# Soma dos defeitos previstos para os dias selecionados
soma_defeitos_dia = df_dias_duracao['Defeitos Previstos'].sum()

# Calcula o fator de ajuste
ajuste_fator = novo_total_defeitos_previsto / soma_defeitos_dia

# Aplica o ajuste nos defeitos previstos
df_dias_duracao.loc[:, 'Defeitos Previstos'] *= ajuste_fator

Visualização

In [155]:
# Gráfico de previsão de defeitos
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_dias_duracao['Dia Contado'],
    y=df_dias_duracao['Defeitos Previstos'],
    mode='lines+markers',
    marker=dict(size=10),
    line=dict(color='green'),
    name='Defeitos Previstos'
))

fig.update_layout(
    title=f'Previsão de Defeitos ao Longo dos {nova_duracao_prevista} Dias da Nova Ordem',
    title_font_size=16,
    xaxis_title='Dia de Produção',
    xaxis_title_font_size=14,
    yaxis_title='Defeitos Previstos',
    yaxis_title_font_size=14
)

print(f"Duração prevista da ordem: {nova_duracao_prevista:.2f} dias")
print(f"Total de defeitos previstos: {novo_total_defeitos_previsto:.2f}")

fig.show()

df_dias_duracao[['Dia Contado', 'Defeitos Previstos']].set_index('Dia Contado')

Duração prevista da ordem: 9.00 dias
Total de defeitos previstos: 1893.56


Unnamed: 0_level_0,Defeitos Previstos
Dia Contado,Unnamed: 1_level_1
1,218.31602
2,240.11343
3,210.242042
4,215.932077
5,210.599351
6,208.889106
7,183.414045
8,196.461623
9,209.592307
