In [None]:
#Importación de librerías para clasificación
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, accuracy_score

# Cargar los datos desde el archivo CSV
df = pd.read_csv('data_fallas_motores.csv')

In [None]:
# PUEDE EDITAR LOS PARÁMETROS (X) Y LA RESPUESTA (Y) EN CASO ANALICE OTRO TÓPICO (TEMA)
X = df[['temperatura (°C)', 'vibracion (mm/s)', 'corriente (A)', 'rpm',
        'tiempo_operacion (h)', 'presion (Pa)', 'humedad (%)', 'mantenimiento_reciente',
        'eficiencia (%)', 'carga (%)', 'horas_ultimo_mantenimiento']]
y = df['falla']

# Divide los datos en conjuntos de entrenamiento y prueba (80% y 20% respectivamente)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# PUEDE EDITAR EL TIPO DE MODELO EN CASO SEA NECESARIO, en este primer ejemplo
# se entrena el modelo de regresión logística para clasificación binaria
model_binario = LogisticRegression(max_iter=1000)
model_binario.fit(X_train, y_train)

# Predicciones y evaluación
y_pred = model_binario.predict(X_test)
print("Clasificación Binaria")
print("Accuracy:", accuracy_score(y_test, y_pred))
print(classification_report(y_test, y_pred))

Clasificación Binaria
Accuracy: 0.68
              precision    recall  f1-score   support

           0       0.67      0.75      0.71       103
           1       0.69      0.61      0.65        97

    accuracy                           0.68       200
   macro avg       0.68      0.68      0.68       200
weighted avg       0.68      0.68      0.68       200



In [None]:
# PUEDE EDITAR LOS PARÁMETROS (X) Y LA RESPUESTA (Y) EN CASO ANALICE OTRO TÓPICO (TEMA)
# Para clasificación multiclase ha variado la respuesta (Y), desde "falla" a "tipo_falla"
X = df[['temperatura (°C)', 'vibracion (mm/s)', 'corriente (A)', 'rpm',
        'tiempo_operacion (h)', 'presion (Pa)', 'humedad (%)', 'mantenimiento_reciente',
        'eficiencia (%)', 'carga (%)', 'horas_ultimo_mantenimiento']]
y = df['tipo_falla']

# Divide los datos en conjuntos de entrenamiento y prueba (80% y 20% respectivamente)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# PUEDE EDITAR EL TIPO DE MODELO EN CASO SEA NECESARIO, en este segundo ejemplo
# se entrena el modelo de Random Forest para clasificación multiclase
model_multiclase = RandomForestClassifier(n_estimators=100, random_state=42)
model_multiclase.fit(X_train, y_train)

# Predicciones y evaluación
y_pred = model_multiclase.predict(X_test)
print("Clasificación Multiclase")
print("Accuracy:", accuracy_score(y_test, y_pred))
print(classification_report(y_test, y_pred))

Clasificación Multiclase
Accuracy: 0.985
                             precision    recall  f1-score   support

        Falla de eficiencia       0.88      1.00      0.93        14
           Falla de humedad       1.00      0.86      0.92         7
           Falla de presión       1.00      1.00      1.00         7
Falla de sobrecalentamiento       1.00      1.00      1.00        28
         Falla de vibración       1.00      1.00      1.00        66
            Falla eléctrica       1.00      0.60      0.75         5
                  Sin falla       0.99      1.00      0.99        69
                 Sobrecarga       1.00      1.00      1.00         4

                   accuracy                           0.98       200
                  macro avg       0.98      0.93      0.95       200
               weighted avg       0.99      0.98      0.98       200



In [None]:
# Datos reales de motor
datos_reales = {
    'temperatura (°C)': [76],
    'vibracion (mm/s)': [30],
    'corriente (A)': [20],
    'rpm': [1300],
    'tiempo_operacion (h)': [600],
    'presion (Pa)': [40],
    'humedad (%)': [55],
    'mantenimiento_reciente': [1],
    'eficiencia (%)': [80],
    'carga (%)': [85],
    'horas_ultimo_mantenimiento': [250]
}

# Procesar los datos del motor
df_datos = pd.DataFrame(datos_reales)
X_datos = scaler.transform(df_datos)

# Hacer la predicción
prediccion = model_multiclase.predict(X_datos)
probabilidades = model_multiclase.predict_proba(X_datos)

# Mostrar probabilidades
clases = model_multiclase.classes_
resultado = prediccion[0]
probabilidades_claras = {clase: probabilidad for clase, probabilidad in zip(clases, probabilidades[0])}

print(f"Predicción: {resultado}")
print("Probabilidades:")
for clase, probabilidad in probabilidades_claras.items():
    print(f"  {clase}: {probabilidad*100:.2f} %")


Predicción: Falla de sobrecalentamiento
Probabilidades:
  Falla de eficiencia: 0.00 %
  Falla de humedad: 3.00 %
  Falla de presión: 0.00 %
  Falla de sobrecalentamiento: 80.00 %
  Falla de vibración: 10.00 %
  Falla eléctrica: 0.00 %
  Sin falla: 7.00 %
  Sobrecarga: 0.00 %
