In [1]:
# Algoritmo de Regresión Lineal
!pip install --upgrade scikit-learn
import pandas as pd
import numpy as np
import datetime
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
from sklearn.metrics import r2_score
from sklearn.metrics import mean_squared_error, mean_absolute_error
from datetime import datetime

fecha_actual = datetime.now().strftime('%Y-%m-%d')

archivo = f'datos_{fecha_actual}_ia.csv'

def aplicar_modelo_regresion(csv_file):
    # Cargar datos desde el archivo CSV
    datos = pd.read_csv(csv_file)
    
    # Dividir los datos en características (X) y etiquetas (y) para la regresión
    X_regresion = datos.iloc[:, :-1]  # Selecciona todas las filas y todas las columnas excepto la última
    y_regresion = datos.iloc[:, -1] # Selecciona todas las filas y la última columna

    # Dividir los datos en conjuntos de entrenamiento y prueba para regresión
    X_train_regresion, X_test_regresion, y_train_regresion, y_test_regresion = train_test_split(X_regresion, y_regresion, test_size=0.2, random_state=42)

    # Inicializar y entrenar el modelo de regresión lineal
    modelo_regresion = LinearRegression()
    modelo_regresion.fit(X_train_regresion, y_train_regresion)

    # Evaluar el rendimiento del modelo de regresión
    puntuacion_regresion = modelo_regresion.score(X_test_regresion, y_test_regresion)
    
    # Realizar predicciones en el conjunto de prueba
    predicciones = modelo_regresion.predict(X_test_regresion)
    
    # Calcular el Error Cuadrático Medio (ECM)
    ecm = mean_squared_error(y_test_regresion, predicciones)

    # Calcular el Error Absoluto Medio (EAM)
    eam = mean_absolute_error(y_test_regresion, predicciones)

    # Coeficientes de Regresión (pendiente e intercepto)
    pendiente = modelo_regresion.coef_
    intercepto = modelo_regresion.intercept_
    
    # Coeficiente de determinación R2 
    r2 = r2_score(y_test_regresion, predicciones)
    
    return puntuacion_regresion, predicciones, y_train_regresion, y_test_regresion, X_train_regresion, X_test_regresion, ecm, eam, pendiente, intercepto, r2

# Aplicar modelo regresión
puntuacion_regresion, predicciones, y_train_regresion, y_test_regresion, X_train_regresion, X_test_regresion, ecm, eam, pendiente, intercepto, r2 = aplicar_modelo_regresion(archivo)

# Mostrar las predicciones y la puntuacion
print("Puntuación de la regresión lineal:", puntuacion_regresion)
print("Parámetros de entrada:\n", X_test_regresion)
print("Predicciones de la regresión lineal:\n", predicciones)
print("Error Cuadrático Medio (ECM):", ecm)
print("Error Absoluto Medio (EAM):", eam)
print("Coeficiente de Pendiente:", pendiente)
print("Coeficiente de Intercepto:", intercepto)
print("Coeficiente de determinación (R^2) de las predicciones:", r2)

Requirement already up-to-date: scikit-learn in c:\users\anune\anaconda3\lib\site-packages (1.3.2)
Puntuación de la regresión lineal: 0.5496551271709036
Parámetros de entrada:
               mf         M           t             p           LHV        bpr  \
521  1383.299341  0.394352  283.614915  86302.984076  4.303808e+07   9.701351   
737  1415.262118  0.383073  268.621519  86889.983840  3.994584e+07  10.076256   
740  1473.049259  0.381253  280.708807  92496.954307  4.431118e+07   9.653684   
660  1449.448941  0.401908  280.956805  90660.513194  4.360290e+07   9.360587   
411  1454.161152  0.398929  285.151774  88737.468425  4.617217e+07   9.348216   
..           ...       ...         ...           ...           ...        ...   
408  1404.442077  0.415226  273.660916  88729.896648  4.034315e+07   9.507704   
332  1490.071900  0.409244  284.929797  92650.925686  4.145547e+07   9.415299   
208  1399.607068  0.383402  289.119347  91521.039806  4.623200e+07   9.403146   
613  1464.611

In [2]:
# Algortimo de Regresión Múltiple con Random Forest
!pip install --upgrade scikit-learn
import pandas as pd
import numpy as np
import datetime
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error
from datetime import datetime

fecha_actual = datetime.now().strftime('%Y-%m-%d')

archivo = f'datos_{fecha_actual}_ia.csv'

def aplicar_modelo_regresion(csv_file):
    # Cargar datos desde el archivo CSV
    datos = pd.read_csv(csv_file)
    
    # Dividir los datos en características (X) y etiquetas (y) para la regresión
    X_regresion = datos.iloc[:, :-1]  # Selecciona todas las filas y todas las columnas excepto la última
    y_regresion = datos.iloc[:, -1] # Selecciona todas las filas y la última columna

    # Dividir los datos en conjuntos de entrenamiento y prueba para regresión
    X_train_regresion, X_test_regresion, y_train_regresion, y_test_regresion = train_test_split(X_regresion, y_regresion, test_size=0.2, random_state=42)

    # Inicializar y entrenar el modelo de regresión múltiple con Random Forest
    modelo_regresion = RandomForestRegressor(random_state=42)
    modelo_regresion.fit(X_train_regresion, y_train_regresion)

    # Evaluar el rendimiento del modelo de regresión
    puntuacion_regresion = modelo_regresion.score(X_test_regresion, y_test_regresion)
    
    # Realizar predicciones en el conjunto de prueba
    predicciones = modelo_regresion.predict(X_test_regresion)
    
    # Calcular el Error Cuadrático Medio (ECM)
    ecm = mean_squared_error(y_test_regresion, predicciones)

    # Calcular el Error Absoluto Medio (EAM)
    eam = mean_absolute_error(y_test_regresion, predicciones)

    # Características más importantes (importancia de las características)
    importancias_caracteristicas = modelo_regresion.feature_importances_
    
    # Coeficiente de determinación R2 
    r2 = r2_score(y_test_regresion, predicciones)
    
    return puntuacion_regresion, predicciones, y_train_regresion, y_test_regresion, X_train_regresion, X_test_regresion, ecm, eam, importancias_caracteristicas, r2

# Aplicar modelo regresión
puntuacion_regresion, predicciones, y_train_regresion, y_test_regresion, X_train_regresion, X_test_regresion, ecm, eam, importancias_caracteristicas, r2 = aplicar_modelo_regresion(archivo)

# Mostrar las predicciones y la puntuacion
print("Puntuación del modelo de regresión múltiple (Random Forest):", puntuacion_regresion)
print("Parámetros de entrada:\n", X_test_regresion)
print("Predicciones del modelo de regresión múltiple (Random Forest):\n", predicciones)
print("Error Cuadrático Medio (ECM):", ecm)
print("Error Absoluto Medio (EAM):", eam)
print("Importancia de las características:", importancias_caracteristicas)
print("Coeficiente de determinación (R^2) de las predicciones:", r2)

Requirement already up-to-date: scikit-learn in c:\users\anune\anaconda3\lib\site-packages (1.3.2)
Puntuación del modelo de regresión múltiple (Random Forest): 0.552785028553257
Parámetros de entrada:
               mf         M           t             p           LHV        bpr  \
521  1383.299341  0.394352  283.614915  86302.984076  4.303808e+07   9.701351   
737  1415.262118  0.383073  268.621519  86889.983840  3.994584e+07  10.076256   
740  1473.049259  0.381253  280.708807  92496.954307  4.431118e+07   9.653684   
660  1449.448941  0.401908  280.956805  90660.513194  4.360290e+07   9.360587   
411  1454.161152  0.398929  285.151774  88737.468425  4.617217e+07   9.348216   
..           ...       ...         ...           ...           ...        ...   
408  1404.442077  0.415226  273.660916  88729.896648  4.034315e+07   9.507704   
332  1490.071900  0.409244  284.929797  92650.925686  4.145547e+07   9.415299   
208  1399.607068  0.383402  289.119347  91521.039806  4.623200e+07   

In [3]:
# Algoritmo de clasificación con Random Forest
!pip install --upgrade scikit-learn
import pandas as pd
import numpy as np
import datetime
from sklearn.preprocessing import label_binarize
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, precision_score, recall_score, f1_score, roc_auc_score, roc_curve, auc, precision_recall_curve
from datetime import datetime

fecha_actual = datetime.now().strftime('%Y-%m-%d')

archivo = f'datos_{fecha_actual}_ia_clasif.csv'
    
def aplicar_modelo_clasificacion(csv_file):
    # Cargar datos desde el archivo CSV
    datos = pd.read_csv(csv_file)
    
    # Dividir los datos en características (X) y etiquetas (y) para la clasificación
    X_clasificacion = datos.iloc[:, :-1]  # Selecciona todas las filas y todas las columnas excepto la última
    y_clasificacion = datos.iloc[:, -1]   # Selecciona todas las filas y la última columna
    
    # Dividir los datos en conjuntos de entrenamiento y prueba para clasificación
    X_train_clasificacion, X_test_clasificacion, y_train_clasificacion, y_test_clasificacion = train_test_split(X_clasificacion, y_clasificacion, test_size=0.2, random_state=42)

    # Inicializar y entrenar el modelo de clasificación de bosque aleatorio
    modelo_clasificacion = RandomForestClassifier()
    modelo_clasificacion.fit(X_train_clasificacion, y_train_clasificacion)

    # Realizar predicciones y evaluar el rendimiento del modelo de clasificación
    predicciones_clasificacion = modelo_clasificacion.predict(X_test_clasificacion)
    exactitud = accuracy_score(y_test_clasificacion, predicciones_clasificacion)
    matriz_confusion = confusion_matrix(y_test_clasificacion, predicciones_clasificacion)
    precision = precision_score(y_test_clasificacion, predicciones_clasificacion, average='macro', zero_division=0)
    recall = recall_score(y_test_clasificacion, predicciones_clasificacion, average='macro')
    f1 = f1_score(y_test_clasificacion, predicciones_clasificacion, average='macro')
    # fpr, tpr, _ = roc_curve(y_test_clasificacion, predicciones_clasificacion)
    # auc_roc = roc_auc_score(y_test_clasificacion, predicciones_clasificacion)
    # precision, recall, thresholds = precision_recall_curve(y_test_clasificacion, predicciones_clasificacion)
    
    # Convertir las etiquetas a formato binario
    y_test_bin = label_binarize(y_test_clasificacion, classes=np.unique(y_test_clasificacion))
    predicciones_bin = label_binarize(predicciones_clasificacion, classes=np.unique(y_test_clasificacion))

    # Calcular la curva precision-recall y AUC-PR para cada clase individualmente
    precision, recall, _ = precision_recall_curve(y_test_bin.ravel(), predicciones_bin.ravel())
    auc_pr = auc(recall, precision)
    
    # Calcular la curva ROC y el AUC-ROC para cada clase individualmente
    fpr = dict()
    tpr = dict()
    auc_roc = dict()
    n_classes = y_test_bin.shape[1]
    for i in range(n_classes):
        fpr[i], tpr[i], _ = roc_curve(y_test_bin[:, i], predicciones_bin[:, i])
        auc_roc[i] = auc(fpr[i], tpr[i])

    return predicciones_clasificacion, exactitud, precision, recall, f1, matriz_confusion, auc_roc, fpr, tpr, X_train_clasificacion, X_test_clasificacion, y_train_clasificacion, y_test_clasificacion

# Aplicar modelo clasificación
predicciones_clasificacion, exactitud, precision, recall, f1, matriz_confusion, auc_roc, fpr, tpr, X_train_clasificacion, X_test_clasificacion, y_train_clasificacion, y_test_clasificacion = aplicar_modelo_clasificacion(archivo)

# Mostrar las métricas
print("Parmetros de entrada:\n", X_test_clasificacion)
print("Predicciones de clasificación:\n", predicciones_clasificacion)
print("Exactitud:", exactitud)
print("Precisión:", precision)
print("Recall:", recall)
print("F1-Score:", f1)
print("Matriz de Confusión:\n", matriz_confusion)
print("AUC-ROC:", auc_roc)
print("Curva ROC - FPR:", fpr)
print("Curva ROC - TPR:", tpr)

Requirement already up-to-date: scikit-learn in c:\users\anune\anaconda3\lib\site-packages (1.3.2)
Parmetros de entrada:
               mf         M           t             p           LHV        bpr  \
521  1383.299341  0.394352  283.614915  86302.984076  4.303808e+07   9.701351   
737  1415.262118  0.383073  268.621519  86889.983840  3.994584e+07  10.076256   
740  1473.049259  0.381253  280.708807  92496.954307  4.431118e+07   9.653684   
660  1449.448941  0.401908  280.956805  90660.513194  4.360290e+07   9.360587   
411  1454.161152  0.398929  285.151774  88737.468425  4.617217e+07   9.348216   
..           ...       ...         ...           ...           ...        ...   
408  1404.442077  0.415226  273.660916  88729.896648  4.034315e+07   9.507704   
332  1490.071900  0.409244  284.929797  92650.925686  4.145547e+07   9.415299   
208  1399.607068  0.383402  289.119347  91521.039806  4.623200e+07   9.403146   
613  1464.611219  0.415987  269.594861  94166.511075  4.227834e+07  

In [6]:
# Tree decision classifier
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
from datetime import datetime

fecha_actual = datetime.now().strftime('%Y-%m-%d')

archivo = f'datos_{fecha_actual}_ia_clasif.csv'

def aplicar_arbol_clasificacion(csv_file):
    # Cargar datos desde el archivo CSV
    datos = pd.read_csv(csv_file)

    # Cargar el conjunto de datos de ejemplo (iris dataset)
    X = datos.iloc[:, :-1]  # Todas las filas, todas las columnas excepto la última
    y = datos.iloc[:, -1]   # Todas las filas, sólo la última columna

    # Dividir los datos en conjuntos de entrenamiento y prueba
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

    # Inicializar el clasificador de árbol de decisión
    clf = DecisionTreeClassifier()

    # Entrenar el modelo utilizando el conjunto de entrenamiento
    clf.fit(X_train, y_train)
    
    # Predecir las etiquetas para el conjunto de prueba
    y_pred = clf.predict(X_test)

    # Calcular la precisión del modelo
    accuracy = accuracy_score(y_test, y_pred)
    precision = precision_score(y_test, y_pred, average='weighted')
    recall = recall_score(y_test, y_pred, average='weighted')
    f1 = f1_score(y_test, y_pred, average='weighted')

    return accuracy, precision, recall, f1, y_pred

# Aplicar árbol de clasificacion
accuracy, precision, recall, f1, y_pred = aplicar_arbol_clasificacion(archivo)

# Mostrar las métricas
print("Precisión del modelo:", accuracy)
print("Precisión:", precision)
print("Recall:", recall)
print("F1 Score:", f1)
print("Clasificación:", y_pred)

Precisión del modelo: 1.0
Precisión: 1.0
Recall: 1.0
F1 Score: 1.0
Clasificación: ['Bien' 'Deficiente' 'Notable' 'Notable' 'Bien' 'Bien' 'Notable' 'Bien'
 'Bien' 'Deficiente' 'Deficiente' 'Deficiente' 'Bien' 'Bien' 'Notable'
 'Notable' 'Muy deficiente' 'Notable' 'Deficiente' 'Sobresaliente' 'Bien'
 'Bien' 'Deficiente' 'Notable' 'Deficiente' 'Bien' 'Deficiente'
 'Deficiente' 'Notable' 'Deficiente' 'Bien' 'Bien' 'Bien' 'Sobresaliente'
 'Notable' 'Notable' 'Notable' 'Sobresaliente' 'Deficiente' 'Bien'
 'Deficiente' 'Bien' 'Bien' 'Bien' 'Notable' 'Sobresaliente' 'Deficiente'
 'Notable' 'Bien' 'Deficiente' 'Deficiente' 'Bien' 'Sobresaliente' 'Bien'
 'Bien' 'Bien' 'Deficiente' 'Deficiente' 'Bien' 'Notable' 'Notable' 'Bien'
 'Bien' 'Bien' 'Deficiente' 'Bien' 'Notable' 'Notable' 'Bien' 'Bien'
 'Bien' 'Bien' 'Bien' 'Sobresaliente' 'Notable' 'Deficiente' 'Deficiente'
 'Sobresaliente' 'Deficiente' 'Bien' 'Deficiente' 'Notable' 'Bien'
 'Notable' 'Muy deficiente' 'Bien' 'Bien' 'Deficiente' 'Notable