In [1]:
import os
import pandas as pd
import pickle
import time
import csv
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import cross_val_predict
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_curve, confusion_matrix

In [2]:
def train_DecisionTreeClassifier(df):
    
    # Dividir los datos en características (X) y etiquetas (y)
    #Además de borrar las caracteristicas sin relevancia para este entrenamiento
    X = df.drop(['Estadio', 'ID', 'archivo'], axis=1)
    y = df['Estadio']

    # Poner los valores vacios con la medio
    X_filled = X.fillna(X.mean())

    # Crear dos nuevas columanas desde la columna geenro para que sean integros
    X_encoded = pd.get_dummies(X_filled, columns=['Genero'])

    # Crear una instancia del modelo arbol de decisiones
    tree_classifier = DecisionTreeClassifier()

    # Hacemos la validación cruzada para conseguir las predicciones
    y_pred = cross_val_predict(tree_classifier, X_encoded, y, cv=5)
    
    # Entrenamiento del modelo
    tree_classifier.fit(X_encoded, y)
    
    # Devolver modelo y los conjuntos de prueba
    return tree_classifier, X_encoded, y, y_pred

def evaluate_model(model, X, y, y_pred, nombre_modelo):
    
    # Creamos un diccionario para acumular los valores de las métricas
    metricas_eval_dict = {}
    
    y_scores = cross_val_predict(model, X, y, cv=5, method='predict_proba')[:, 1]

    # Calcular diversas métricas para evaluar el modelo
    accuracy = accuracy_score(y, y_pred)
    precision = precision_score(y, y_pred)
    recall = recall_score(y, y_pred)
    f1 = f1_score(y, y_pred)
    
    # matriz de confusion
    tn, fp, fn, tp = confusion_matrix(y, y_pred).ravel()
    
    #Valores de la curva ROC
    fpr, tpr, thresholds = roc_curve(y, y_scores)
    
    metricas_eval_dict = {"Exactitud": accuracy,
                    "Precisión":precision,
                    "Sensibilidad": recall,
                    "Puntaje de F1": f1,
                    "TN": tn,
                    "FP": fp,
                    "FN": fn,
                    "TP": tp,
                    "FPR":fpr[1],
                    "TPR":tpr[1]}
    
    carpeta_csv = "Clasificador_arbol_decision"

    with open(carpeta_csv + "_metricas.csv", 'a', newline='') as archivo_csv:
        writer = csv.writer(archivo_csv, delimiter=';')
        
        archivo_vacio = archivo_csv.tell() == 0

        if archivo_vacio:
            # Escribir las métricas como encabezados de columnas
            writer.writerow(['modelo'] + list(metricas_eval_dict.keys()))

        # Escribir los valores de las métricas por fila
        writer.writerow([nombre_modelo] + list(metricas_eval_dict.values()))
        print("Metricas correctamente guardadas.")

        
def guardar_modelo(modelo, nombre_archivo):
    with open(nombre_archivo, 'wb') as archivo:
        pickle.dump(modelo, archivo)
    print(f"El modelo ha sido guardado correctamente en el archivo {nombre_archivo}.")

In [9]:
import pandas as pd

def entrenar_y_evaluar_modelo(ruta_csv, nombre_modelo):
    # Cargar los datos del CSV
    df = pd.read_csv(ruta_csv, delimiter=';')

    # Entrenar el modelo y obtener los conjuntos de prueba
    modelo, X, y, y_pred = train_DecisionTreeClassifier(df)

    # Evaluar el modelo
    evaluate_model(modelo, X, y, y_pred, nombre_modelo)

    # Guardar el modelo
    guardar_modelo(modelo, nombre_modelo + '.plk')



In [106]:
'''
#Entrenar el modelo para el tipo de audio 1: vocal A
# Cargar los datos del CSV Spicy
ruta_csv_S_1 = '../../Extraccion_caracteristicas/Union_dataset_completos/union_carac_Spicy/unificacion_caracteristicas_audios_Scipy_1.csv'
nombre_modelo_S_1 = 'modelo_entrenado_DecisionTreeClassifier_tipo1_spicy'
entrenar_y_evaluar_modelo(ruta_csv_S_1, nombre_modelo_S_1)
'''

"\n#Entrenar el modelo para el tipo de audio 1: vocal A\n# Cargar los datos del CSV Spicy\nruta_csv_S_1 = '../../Extraccion_caracteristicas/Union_dataset_completos/union_carac_Spicy/unificacion_caracteristicas_audios_Scipy_1.csv'\nnombre_modelo_S_1 = 'modelo_entrenado_DecisionTreeClassifier_tipo1_spicy'\nentrenar_y_evaluar_modelo(ruta_csv_S_1, nombre_modelo_S_1)\n"

In [13]:
#Entrenar el modelo para el tipo de audio 1: vocal A
# Cargar los datos del CSV Spicy
ruta_csv_S_1 = 'prueba/unificacion_caracteristicas_audios_Scipy_1.csv'
nombre_modelo_S_1 = 'prueba_modelo_entrenado_DecisionTreeClassifier_tipo1_spicy'
entrenar_y_evaluar_modelo(ruta_csv_S_1, nombre_modelo_S_1)


  X_filled = X.fillna(X.mean())


ValueError: could not convert string to float: '2,15E-03'

In [8]:
#Entrenar el modelo para el tipo de audio 1: vocal A
# Cargar los datos del CSV pytorch
ruta_csv_P_1 = 'unificacion_caracteristicas_audios_Vgg-pythorch_1.csv'
nombre_modelo_P_1 = 'modelo_entrenado_DecisionTreeClassifier_tipo1_pytorch'
entrenar_y_evaluar_modelo(ruta_csv_P_1, nombre_modelo_P_1)

Metricas correctamente guardadas.
El modelo ha sido guardado correctamente en el archivo modelo_entrenado_DecisionTreeClassifier_tipo1_pytorch.plk.


  X_filled = X.fillna(X.mean())


In [10]:
#Entrenar el modelo para el tipo de audio 2: vocal I
# Cargar los datos del CSV Spicy
ruta_csv_S_2 = 'unificacion_caracteristicas_audios_Scipy_2.csv'
nombre_modelo_S_2 = 'prueba_modelo_entrenado_DecisionTreeClassifier_tipo2_spicy'
entrenar_y_evaluar_modelo(ruta_csv_S_2, nombre_modelo_S_2)

Metricas correctamente guardadas.
El modelo ha sido guardado correctamente en el archivo prueba_modelo_entrenado_DecisionTreeClassifier_tipo2_spicy.plk.


  X_filled = X.fillna(X.mean())


In [10]:
#Entrenar el modelo para el tipo de audio 2: vocal I
# Cargar los datos del CSV pytorch
ruta_csv_P_2 = 'unificacion_caracteristicas_audios_Vgg-pythorch_2.csv'
nombre_modelo_P_2 = 'modelo_entrenado_DecisionTreeClassifier_tipo2_pytorch'
entrenar_y_evaluar_modelo(ruta_csv_P_2, nombre_modelo_P_2)

Metricas correctamente guardadas.
El modelo ha sido guardado correctamente en el archivo modelo_entrenado_DecisionTreeClassifier_tipo2_pytorch.plk.


  X_filled = X.fillna(X.mean())


In [11]:
#Entrenar el modelo para el tipo de audio 3: vocal U
# Cargar los datos del CSV Spicy
ruta_csv_S_3 = 'unificacion_caracteristicas_audios_Scipy_3.csv'
nombre_modelo_S_3 = 'modelo_entrenado_DecisionTreeClassifier_tipo3_spicy'
entrenar_y_evaluar_modelo(ruta_csv_S_3, nombre_modelo_S_3)

Metricas correctamente guardadas.
El modelo ha sido guardado correctamente en el archivo modelo_entrenado_DecisionTreeClassifier_tipo3_spicy.plk.


  X_filled = X.fillna(X.mean())


In [14]:
#Entrenar el modelo para el tipo de audio 3: vocal U
# Cargar los datos del CSV pytorch
ruta_csv_P_3 = 'unificacion_caracteristicas_audios_Vgg-pythorch_3.csv'
nombre_modelo_P_3 = 'modelo_entrenado_DecisionTreeClassifier_tipo3_pytorch'
entrenar_y_evaluar_modelo(ruta_csv_P_3, nombre_modelo_P_3)

Metricas correctamente guardadas.
El modelo ha sido guardado correctamente en el archivo modelo_entrenado_DecisionTreeClassifier_tipo3_pytorch.plk.


  X_filled = X.fillna(X.mean())


In [5]:
#Entrenar el modelo para el tipo de audio 4: palabra "campana"
# Cargar los datos del CSV Spicy
ruta_csv_S_4 = 'prueba/unificacion_caracteristicas_audios_Scipy_4.csv'
nombre_modelo_S_4 = 'prueba_modelo_entrenado_DecisionTreeClassifier_tipo4_spicy'
entrenar_y_evaluar_modelo(ruta_csv_S_4, nombre_modelo_S_4)

  X_filled = X.fillna(X.mean())


ValueError: could not convert string to float: '-8,32E-04'

In [16]:
#Entrenar el modelo para el tipo de audio 4: palabra "campana"
# Cargar los datos del CSV pytorch
ruta_csv_P_4 = 'unificacion_caracteristicas_audios_Vgg-pythorch_4.csv'
nombre_modelo_P_4 = 'modelo_entrenado_DecisionTreeClassifier_tipo4_pytorch'
entrenar_y_evaluar_modelo(ruta_csv_P_4, nombre_modelo_P_4)

Metricas correctamente guardadas.
El modelo ha sido guardado correctamente en el archivo modelo_entrenado_DecisionTreeClassifier_tipo4_pytorch.plk.


  X_filled = X.fillna(X.mean())


In [17]:
#Entrenar el modelo para el tipo de audio 5: palabra "gato"
# Cargar los datos del CSV Spicy
ruta_csv_S_5 = 'unificacion_caracteristicas_audios_Scipy_5.csv'
nombre_modelo_S_5 = 'modelo_entrenado_DecisionTreeClassifier_tipo5_spicy'
entrenar_y_evaluar_modelo(ruta_csv_S_5, nombre_modelo_S_5)

Metricas correctamente guardadas.
El modelo ha sido guardado correctamente en el archivo modelo_entrenado_DecisionTreeClassifier_tipo5_spicy.plk.


  X_filled = X.fillna(X.mean())


In [18]:
#Entrenar el modelo para el tipo de audio 5: palabra "gato"
# Cargar los datos del CSV pytorch
ruta_csv_P_5 = 'unificacion_caracteristicas_audios_Vgg-pythorch_5.csv'
nombre_modelo_P_5 = 'modelo_entrenado_DecisionTreeClassifier_tipo5_pytorch'
entrenar_y_evaluar_modelo(ruta_csv_P_5, nombre_modelo_P_5)

Metricas correctamente guardadas.
El modelo ha sido guardado correctamente en el archivo modelo_entrenado_DecisionTreeClassifier_tipo5_pytorch.plk.


  X_filled = X.fillna(X.mean())


In [19]:
#Entrenar el modelo para el tipo de audio 6: palabra "petaca"
# Cargar los datos del CSV Spicy
ruta_csv_S_6 = 'unificacion_caracteristicas_audios_Scipy_6.csv'
nombre_modelo_S_6 = 'modelo_entrenado_DecisionTreeClassifier_tipo6_spicy'
entrenar_y_evaluar_modelo(ruta_csv_S_6, nombre_modelo_S_6)

Metricas correctamente guardadas.
El modelo ha sido guardado correctamente en el archivo modelo_entrenado_DecisionTreeClassifier_tipo6_spicy.plk.


  X_filled = X.fillna(X.mean())


In [20]:
#Entrenar el modelo para el tipo de audio 6: palabra "petaca"
# Cargar los datos del CSV pytorch
ruta_csv_P_6 = 'unificacion_caracteristicas_audios_Vgg-pythorch_6.csv'
nombre_modelo_P_6 = 'modelo_entrenado_DecisionTreeClassifier_tipo6_pytorch'
entrenar_y_evaluar_modelo(ruta_csv_P_6, nombre_modelo_P_6)

Metricas correctamente guardadas.
El modelo ha sido guardado correctamente en el archivo modelo_entrenado_DecisionTreeClassifier_tipo6_pytorch.plk.


  X_filled = X.fillna(X.mean())
