# Introdução

No contexto da indústria moderna, a manutenção eficiente de equipamentos é crucial para garantir a produtividade, reduzir custos e evitar paradas inesperadas na produção. Tradicionalmente, a manutenção é realizada de forma reativa ou preventiva, mas essas abordagens podem resultar em desperdício de recursos ou falhas inesperadas.

Com o avanço da Internet das Coisas (IoT) e da análise de dados, tornou-se possível coletar informações detalhadas de sensores instalados em máquinas, permitindo o desenvolvimento de sistemas inteligentes de manutenção preditiva. Esses sistemas utilizam algoritmos de aprendizado de máquina para analisar dados históricos e identificar padrões que precedem falhas, possibilitando intervenções mais assertivas e eficientes.

 ## Objetivo principal:
 
 Criar um sistema inteligente capaz de prever falhas em máquinas a partir de dados IoT e identificar o tipo de defeito.
    
- **Entradas:**

  - Medições de 8 atributos sensorizados de cada máquina.
    
- **Saídas esperadas:**
    
    - Classe do defeito (uma das 5 possíveis).
        
    - Probabilidade associada à previsão.
        
    - Relatórios e visualizações de insights operacionais e falhas.

## Descrição dos Dados 



|     | Campo                           | Descrição                                                                                 |
| --- | ------------------------------- | ----------------------------------------------------------------------------------------- |
| 0   | id                              | Identificador das amostras do banco.                                                      |
| 1   | id_produto                      | Identificador único do produto. Combinação da variável Tipo e um número de identificação. |
| 2   | tipo                            | Tipo de produto/máquina (L/M/H).                                                          |
| 3   | temperatura_ar                  | Temperatura do ar no ambiente (K).                                                        |
| 4   | temperatura_processo            | Temperatura do processo (K).                                                              |
| 5   | umidade_relativa                | Umidade relativa do ar (%).                                                               |
| 6   | velocidade_rotacional           | Velocidade rotacional da máquina em rotações por minutos (RPM).                           |
| 7   | torque                          | Torque da máquina em Nm.                                                                  |
| 8   | desgaste_da_ferramenta          | Duração do uso da ferramenta em minutos.                                                  |
| 9   | falha_maquina                   | Indica se houve falha na máquina (1) ou não (0).                                          |
| 10  | FDF (Falha Desgaste Ferramenta) | Indica se houve falha por desgaste da ferramenta (1) ou não (0).                          |
| 11  | FDC (Falha Dissipacao Calor)    | Indica se houve falha por dissipação de calor (1) ou não (0).                             |
| 12  | FP (Falha Potencia)             | Indica se houve falha por potência (1) ou não (0).                                        |
| 13  | FTE (Falha Tensao Excessiva)    | Indica se houve falha por tensão excessiva (1) ou não (0).                                |
| 14  | FA (Falha Aleatoria)            | Indica se houve falha aleatória (1) ou não (0).                                           |


# Exploratory Data Analysis - EDA (Análise Exploratória de Dados)

In [1]:
import pandas as pd 

In [2]:
df = pd.read_csv('dataset/bootcamp_train.csv', index_col=0)
df.head()

Unnamed: 0_level_0,id_produto,tipo,temperatura_ar,temperatura_processo,umidade_relativa,velocidade_rotacional,torque,desgaste_da_ferramenta,falha_maquina,FDF (Falha Desgaste Ferramenta),FDC (Falha Dissipacao Calor),FP (Falha Potencia),FTE (Falha Tensao Excessiva),FA (Falha Aleatoria)
id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1
0,L56434,L,298.3,309.1,90.0,1616.0,31.1,195.0,não,False,False,Não,False,Não
1,L48741,L,298.2,308.4,90.0,1388.0,53.8,137.0,Não,False,False,Não,False,Não
2,L48850,L,298.2,307.8,90.0,1528.0,31.1,,Não,N,False,Não,False,Não
3,M20947,M,300.9,310.8,90.0,1599.0,33.0,7.0,não,False,False,Não,False,não
4,L53849,L,-36.0,310.5,90.0,1571.0,33.9,,não,N,False,não,False,Não


In [3]:
df.columns

Index(['id_produto', 'tipo', 'temperatura_ar', 'temperatura_processo',
       'umidade_relativa', 'velocidade_rotacional', 'torque',
       'desgaste_da_ferramenta', 'falha_maquina',
       'FDF (Falha Desgaste Ferramenta)', 'FDC (Falha Dissipacao Calor)',
       'FP (Falha Potencia)', 'FTE (Falha Tensao Excessiva)',
       'FA (Falha Aleatoria)'],
      dtype='object')

In [4]:
df.shape

(35260, 14)