# Análise de dados das falhas
Esse notebook tem o propósito de analisar o arquivo de falhas dos testes.

In [62]:
import pandas as pd
import numpy as np

In [63]:
# carregar os dados
df_falhas = pd.read_csv('FALHAS_TRATADO.csv')

In [64]:
df_falhas.head()

Unnamed: 0.1,Unnamed: 0,KNR,MODELO,COR,MOTOR,ESTACAO,USUARIO,HALLE,FALHA,DATA
0,1,2023-2056234,T-CROSS,2R2R,DHS,HCEQS506,4013334,ZP7,PARALAMA DIANTEIRO 01. AMASSADO,2024-05-20 21:31:51.992000
1,2,2023-2056234,T-CROSS,2R2R,DHS,HCEQS506,4013334,ZP7,PORTA TRASEIRA 04. CAROÇO / PICO,2024-05-20 21:30:22.772000
2,3,2023-2056234,T-CROSS,2R2R,DHS,PCEQS620,2058570,ZP6,MÓDULO DO ACC (13) PEÇA INCORRETA ¨,2024-05-20 20:04:55.534000
3,4,2023-2056234,T-CROSS,2R2R,DHS,PCEQS999,2087715,ESPC,TAMPA TRASEIRA 05. SUJEIRA NA PINTURA,2024-04-11 12:15:39.616000
4,5,2023-3896001,T-CROSS,0Q0Q,,HCEQS203,2043971,ZP5A,TAMPA DIANTEIRA 05. SUJEIRA NA PINTURA,2024-06-05 17:38:51.565000


In [65]:
# mostra quantas colunas e linhas tem o dataframe
df_falhas.shape

(328901, 10)

In [66]:
# mostra quais são as colunas do dataframe
df_falhas.columns

Index(['Unnamed: 0', 'KNR', 'MODELO', 'COR', 'MOTOR', 'ESTACAO', 'USUARIO',
       'HALLE', 'FALHA', 'DATA'],
      dtype='object')

In [67]:
# remove a primeira coluna que está vazia
df_falhas.drop(df_falhas.columns[0], axis=1, inplace=True)

In [68]:
df_falhas.head()

Unnamed: 0,KNR,MODELO,COR,MOTOR,ESTACAO,USUARIO,HALLE,FALHA,DATA
0,2023-2056234,T-CROSS,2R2R,DHS,HCEQS506,4013334,ZP7,PARALAMA DIANTEIRO 01. AMASSADO,2024-05-20 21:31:51.992000
1,2023-2056234,T-CROSS,2R2R,DHS,HCEQS506,4013334,ZP7,PORTA TRASEIRA 04. CAROÇO / PICO,2024-05-20 21:30:22.772000
2,2023-2056234,T-CROSS,2R2R,DHS,PCEQS620,2058570,ZP6,MÓDULO DO ACC (13) PEÇA INCORRETA ¨,2024-05-20 20:04:55.534000
3,2023-2056234,T-CROSS,2R2R,DHS,PCEQS999,2087715,ESPC,TAMPA TRASEIRA 05. SUJEIRA NA PINTURA,2024-04-11 12:15:39.616000
4,2023-3896001,T-CROSS,0Q0Q,,HCEQS203,2043971,ZP5A,TAMPA DIANTEIRA 05. SUJEIRA NA PINTURA,2024-06-05 17:38:51.565000


In [69]:
# colunas e linhas após a remoção da primeira coluna
df_falhas.shape

(328901, 9)

In [70]:
# analisar os dados cujo "HALLE" == "ROD"
df_falhas = df_falhas[df_falhas['HALLE'].str.contains("ROD", na=False)]

In [71]:
df_falhas.head()

Unnamed: 0,KNR,MODELO,COR,MOTOR,ESTACAO,USUARIO,HALLE,FALHA,DATA
203,2024-1346277,T-CROSS,K2K2,CWL,PCEQS709,2079860,ROD,Console central Ruído de corpo estranho,2024-04-05 16:50:34.322000
204,2024-1346277,T-CROSS,K2K2,CWL,PCEQS709,2079860,ROD,CONSOLE CENTRAL RUÍDO DE CORPO ESTRANHO,2024-04-05 16:50:34.322000
321,2024-1346481,T-CROSS,A1A1,DHS,PCEQS709,2043610,ROD,Revestimento coluna A Ruído (-),2024-04-04 06:20:33.126000
322,2024-1346481,T-CROSS,A1A1,DHS,PCEQS709,2043610,ROD,REVESTIMENTO COLUNA A RUÍDO (-),2024-04-04 06:20:33.126000
371,2024-1426013,T-CROSS,0Q0Q,DHS,PCEQS709,2077078,ROD,Tampa traseira Ruído (-),2024-04-04 12:57:36.072000


In [72]:
# colunas e linhas após a filtragem
df_falhas.shape

(4115, 9)

In [73]:
# deixar todos os dados de falhas em minúsculo
df_falhas['FALHA'] = df_falhas['FALHA'].str.lower()
df_falhas.to_csv('teste.csv')

In [74]:
df_falhas.head()

Unnamed: 0,KNR,MODELO,COR,MOTOR,ESTACAO,USUARIO,HALLE,FALHA,DATA
203,2024-1346277,T-CROSS,K2K2,CWL,PCEQS709,2079860,ROD,console central ruído de corpo estranho,2024-04-05 16:50:34.322000
204,2024-1346277,T-CROSS,K2K2,CWL,PCEQS709,2079860,ROD,console central ruído de corpo estranho,2024-04-05 16:50:34.322000
321,2024-1346481,T-CROSS,A1A1,DHS,PCEQS709,2043610,ROD,revestimento coluna a ruído (-),2024-04-04 06:20:33.126000
322,2024-1346481,T-CROSS,A1A1,DHS,PCEQS709,2043610,ROD,revestimento coluna a ruído (-),2024-04-04 06:20:33.126000
371,2024-1426013,T-CROSS,0Q0Q,DHS,PCEQS709,2077078,ROD,tampa traseira ruído (-),2024-04-04 12:57:36.072000


In [75]:
df_falhas.shape

(4115, 9)

In [76]:
# analisar quais são os tipos de falha mais frequentes

contagem_falhas = df_falhas['FALHA'].value_counts()
df_contagem_falhas = contagem_falhas.reset_index()
df_contagem_falhas.columns = ['Valor', 'Contagem']
df_contagem_falhas.head()

Unnamed: 0,Valor,Contagem
0,tampa traseira ruído (-),699
1,batente porta dianteira ruído (-),375
2,revestimento coluna a ruído (-),262
3,porta-luvas ruído (-),220
4,console central ruído (-),206


In [77]:
df_contagem_falhas.head(20)

Unnamed: 0,Valor,Contagem
0,tampa traseira ruído (-),699
1,batente porta dianteira ruído (-),375
2,revestimento coluna a ruído (-),262
3,porta-luvas ruído (-),220
4,console central ruído (-),206
5,painel instrumentos ruído (-),190
6,retrovisor - espelho retrovisor interno ruído (-),114
7,chapa do assoalho (underbody) ruído de corpo e...,114
8,botão de trava do freio estac. ruído (-),98
9,teto/teto moldado (cheio) ruído (-),91
