<a href="https://colab.research.google.com/github/SilverFoxMedia-Tesis/IA_02/blob/main/Random_Forest_Model_Flby.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
import numpy as np
import joblib
import tensorflow as tf
import sklearn

# Make numpy values easier to read.
# np.set_printoptions(precision=3, suppress=True)

from tensorflow.keras import layers
from google.colab import files
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report

datos = pd.read_csv("/dataset_final_v4.csv")
print(datos.head())

In [6]:
# Columnas de entrada para ejercicios
exercise_input_columns = ["AbdominalCircumference", "PhysicalActivity"]

# Columnas de salida relacionadas con ejercicios
exercise_output_columns = ["ejercicio_1", "ejercicio_2", "ejercicio_3", "ejercicio_4", "ejercicio_5"]

# Filtra solo las columnas relevantes para ejercicios
exercise_df = datos[exercise_input_columns + exercise_output_columns].dropna()

# Convierte las columnas de salida de ejercicios a valores numéricos
exercise_mappings = {}
for col in exercise_output_columns:
    exercise_df[col], exercise_mappings[col] = exercise_df[col].factorize()

# Separa las características de entrada (X) y las salidas (y) para ejercicios
X_exercise = exercise_df[exercise_input_columns].values
y_exercise = exercise_df[exercise_output_columns].values

# Divide el conjunto de datos en entrenamiento (80%) y prueba (20%)
X_exercise_train, X_exercise_test, y_exercise_train, y_exercise_test = train_test_split(X_exercise, y_exercise, test_size=0.2, random_state=42)

# Inicializa modelos RandomForest para cada columna de salida de ejercicios
exercise_models = {col: RandomForestClassifier(n_estimators=100, random_state=42) for col in exercise_output_columns}

# Entrena un modelo para cada columna de salida de ejercicios
for idx, col in enumerate(exercise_output_columns):
    exercise_models[col].fit(X_exercise_train, y_exercise_train[:, idx])

# Guarda los modelos de ejercicios y los mapeos
for col, model in exercise_models.items():
    joblib.dump(model, f'{col}_model.pkl')
joblib.dump(exercise_mappings, 'exercise_mappings.pkl')


['exercise_mappings.pkl']

In [7]:
import joblib
import os
from zipfile import ZipFile

# Guarda los modelos de ejercicio
for col, model in exercise_models.items():
    joblib.dump(model, f'{col}_model.pkl')
joblib.dump(exercise_mappings, 'exercise_mappings.pkl')

# Crea un archivo .zip
with ZipFile('exercise_models.zip', 'w') as zipf:
    for col in exercise_models.keys():
        zipf.write(f'{col}_model.pkl')
    zipf.write('exercise_mappings.pkl')

# Descarga el archivo .zip
files.download('exercise_models.zip')


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [None]:
input_columns = [
    "Deficit",
    "desayuno_carbs",
    "desayuno_proten",
    "desayuno_grasas",
    "almuerzo_carbs",
    "almuerzo_proten",
    "almuerzo_grasas",
    "cena_carbs",
    "cena_proten",
    "cena_grasas"
]
output_columns = [
    "desayuno_1",
    "desayuno_2",
    "desayuno_3",
    "almuerzo_1",
    "almuerzo_2",
    "almuerzo_3",
    "cena_1",
    "cena_2"
]

filtered_df = datos[input_columns + output_columns].dropna()
output_mappings = {}
for col in output_columns:
    filtered_df[col], output_mappings[col] = filtered_df[col].factorize()
X = filtered_df[input_columns].values
y = filtered_df[output_columns].values
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
models = {col: RandomForestClassifier(n_estimators=100, random_state=42) for col in output_columns}

for idx, col in enumerate(output_columns):
    models[col].fit(X_train, y_train[:, idx])

predictions = np.zeros(y_test.shape)
for idx, col in enumerate(output_columns):
    predictions[:, idx] = models[col].predict(X_test)



In [None]:
# Selecciona un único dato de prueba (por ejemplo, el primer dato del conjunto de prueba)
single_test = X_test[6].reshape(1, -1)
true_labels = y_test[6]

# Predice para el único dato
single_predictions = []
for idx, col in enumerate(output_columns):
    single_predictions.append(models[col].predict(single_test)[0])

# Comparar predicciones con etiquetas reales
print("Predicciones:", single_predictions)
print("Etiquetas reales:", true_labels)

# Puedes decodificar las etiquetas usando los mapeos inversos para obtener los nombres de comida
decoded_predictions = [list(output_mappings[col])[pred] for col, pred in zip(output_columns, single_predictions)]
decoded_true_labels = [list(output_mappings[col])[true_label] for col, true_label in zip(output_columns, true_labels)]

print("Predicciones decodificadas:", decoded_predictions)
print("Etiquetas reales decodificadas:", decoded_true_labels)


Predicciones: [4, 2, 15, 27, 9, 5, 7, 28]
Etiquetas reales: [ 5  2  1 14 46 16  6 21]
Predicciones decodificadas: ['Buttermilk', 'Swiss', 'Pineapple juice', 'Oyster stew', 'Lettuce', 'Spaghetti with meat sauce', 'Bean soups', 'Watercress stems raw']
Etiquetas reales decodificadas: ['Cheddar', 'Swiss', 'figs Canned with syrup ', 'Bacon', 'Split cooked peas', 'Puffed wheat presweetened', 'Beef soup', 'Apples raw']


In [None]:
# Guardar cada modelo en archivos individuales
for col, model in models.items():
    joblib.dump(model, f'{col}_model.pkl')

# Guardar también los mapeos para las etiquetas
joblib.dump(output_mappings, 'output_mappings.pkl')

# Descargar todos los modelos usando un bucle
for col in models.keys():
    files.download(f'{col}_model.pkl')

# Descargar también el archivo de mapeo de etiquetas
files.download('output_mappings.pkl')


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [None]:
print(sklearn.__version__)

1.2.2
