
# Entrena un modelo simple de clasificación binaria utilizando Tensorflow
Muestra del conjunto de datos Iris si pertenece a la clase 0 o 1.

*  Clase 0: Setosa
*  Clase 1: Versicolor

[IRIS](https://archive.ics.uci.edu/dataset/53/iris)



TensorFlow ciclo Vida

* Preparación de datos
* Definición del modelo
* Entrenamiento del modelo
* Evaluación del modelo en el conjunto de prueba



In [1]:
import tensorflow as tf
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score


iris = load_iris()
X, y = iris.data, iris.target


X, y = X[:100, :], y[:100]


scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)


X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Transforma los datos en tensores de TensorFlow
X_train_tensor = tf.constant(X_train, dtype=tf.float32)
y_train_tensor = tf.constant(y_train, dtype=tf.float32)
X_test_tensor = tf.constant(X_test, dtype=tf.float32)


class BinaryClassificationModel(tf.Module):
    def __init__(self, num_features):
        self.W = tf.Variable(tf.random.normal([num_features, 1]), name='weights')
        self.b = tf.Variable(tf.zeros([1]), name='bias')

    def __call__(self, X):
        return tf.sigmoid(tf.matmul(X, self.W) + self.b)


num_features = X_train_tensor.shape[1]
model = BinaryClassificationModel(num_features)

#
def binary_cross_entropy_loss(y_true, y_pred):
    epsilon = 1e-15
    y_pred = tf.clip_by_value(y_pred, epsilon, 1 - epsilon)
    return -tf.reduce_mean(y_true * tf.math.log(y_pred) + (1 - y_true) * tf.math.log(1 - y_pred))

optimizer = tf.optimizers.Adam(learning_rate=0.01)


epochs = 100
for epoch in range(epochs):
    with tf.GradientTape() as tape:
        predictions = model(X_train_tensor)
        loss = binary_cross_entropy_loss(y_train_tensor, predictions)

    gradients = tape.gradient(loss, [model.W, model.b])
    optimizer.apply_gradients(zip(gradients, [model.W, model.b]))

    if (epoch + 1) % 10 == 0:
        print(f'Epoch {epoch + 1}/{epochs}, Loss: {loss.numpy()}')


# Evalúa el rendimiento del modelo en el conjunto de prueba
test_predictions = model(X_test_tensor)
rounded_predictions = tf.round(test_predictions)
accuracy = accuracy_score(y_test, rounded_predictions.numpy().astype(int))
print(f'Accuracy on test set: {accuracy}')


Epoch 10/100, Loss: 0.9517161846160889
Epoch 20/100, Loss: 0.8638670444488525
Epoch 30/100, Loss: 0.8015820384025574
Epoch 40/100, Loss: 0.7618882656097412
Epoch 50/100, Loss: 0.7387213110923767
Epoch 60/100, Loss: 0.7258583307266235
Epoch 70/100, Loss: 0.7180382013320923
Epoch 80/100, Loss: 0.7122979760169983
Epoch 90/100, Loss: 0.7076823711395264
Epoch 100/100, Loss: 0.7040011882781982
Accuracy on test set: 0.25


Inserta y comprueba los valores insertados de la nueva flor e indica de que tipo es.

In [2]:
# Insertar una nueva flor con los siguientes valores

#Longitud del sépalo (en centímetros).5.1
#Ancho del sépalo (en centímetros). 3.5
#Longitud del pétalo (en centímetros). 1.4
#Ancho del pétalo (en centímetros). 0.2

#codigo aqui



#El codigo se mantien el mismo
# Escala la nueva flor utilizando el mismo escalador
new_flower_scaled = scaler.transform(new_flower)

# Convierte la nueva flor en un tensor de TensorFlow
new_flower_tensor = tf.constant(new_flower_scaled, dtype=tf.float32)

# Realiza la predicción con el modelo entrenado
prediction = model(new_flower_tensor).numpy()[0][0]

# Clasifica la flor en función de la predicción
predicted_class = 'Clase 1' if prediction >= 0.5 else 'Clase 0'

print(f'La nueva flor se clasifica como: {predicted_class} con una probabilidad de {prediction}')


La nueva flor se clasifica como: Clase 1 con una probabilidad de 0.5663756728172302


1. Explica la salida del código para cada valor


*   Epoch
*   Loss
*   Accuracy



2. En que línea del código se realiza la **backpropagation**  
*    Explica y comenta



3. Ajusta la tasa de aprendizaje (learning rate) y Aumentar el número de épocas.

Explica la salida del código para cada valor


*   Epoch
*   Loss
*   Accuracy


#Capas Ocultas

4. Agrega una capa oculta (hidden_output) con 4 neuronas, utiliza la función de activación ReLU antes de la capa de salida.

Explica la salida del código

*   Epoch
*   Loss
*   Accuracy


In [None]:

import tensorflow as tf
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score

# Carga y prepara el conjunto de datos Iris
iris = load_iris()
X, y = iris.data, iris.target

# Realiza clasificación binaria entre clases 0 y 1
X, y = X[:100, :], y[:100]

# Escala los datos
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Divide los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Convierte los datos a tensores de TensorFlow
X_train_tensor = tf.constant(X_train, dtype=tf.float32)
y_train_tensor = tf.constant(y_train, dtype=tf.float32)
X_test_tensor = tf.constant(X_test, dtype=tf.float32)

class ModifiedModel(tf.Module):
    def __init__(self, num_features):

'''Crea una variable llamada 'W' que represente los pesos, inicializada con valores aleatorios utilizando una distribución normal, 
  y una variable 'b' que represente el sesgo, inicializada con ceros.
'''


    def __call__(self, X):
   '''utilizando  la función de activación sigmoide realiza una operación de multiplicación de matrices 
   entre la matriz de características de entrada 'X' y los pesos del modelo 'W', seguido de la adición del sesgo 'b'.'''

        return output

# Instancia del modelo
num_features = X_train_tensor.shape[1]
model = ModifiedModel(num_features)

# Función de pérdida y optimizador
def binary_cross_entropy_loss(y_true, y_pred):
    epsilon = 1e-15
    y_pred = tf.clip_by_value(y_pred, epsilon, 1 - epsilon)
    return -tf.reduce_mean(y_true * tf.math.log(y_pred) + (1 - y_true) * tf.math.log(1 - y_pred))

optimizer = tf.optimizers.Adam(learning_rate=0.01)

# Entrenamiento del modelo
epochs = 100
for epoch in range(epochs):
    with tf.GradientTape() as tape:
        predictions = model(X_train_tensor)
        loss = binary_cross_entropy_loss(y_train_tensor, predictions)

    gradients = tape.gradient(loss, [model.W_hidden, model.b_hidden, model.W_output, model.b_output])
    optimizer.apply_gradients(zip(gradients, [model.W_hidden, model.b_hidden, model.W_output, model.b_output]))

    if (epoch + 1) % 10 == 0:
        print(f'Epoch {epoch + 1}/{epochs}, Loss: {loss.numpy()}')

# Evaluación del modelo en el conjunto de prueba
test_predictions = model(X_test_tensor)
rounded_predictions = tf.round(test_predictions)
accuracy = accuracy_score(y_test, rounded_predictions.numpy().astype(int))
print(f'Accuracy on test set: {accuracy}')


5.Crea otra  capa adicional con tres neuronas  (self.W_hidden2, self.b_hidden2)  entre la primera capa oculta (self.W_hidden1, self.b_hidden1)   y la capa de salida (self.W_output, self.b_output

Entrada (num_features) -> [hidden1 (4 neuronas)] -----> [hidden2 (3 neuronas)  -----> [output (1 neurona)]


In [None]:
import tensorflow as tf
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score

# Carga y prepara el conjunto de datos Iris
iris = load_iris()
X, y = iris.data, iris.target

# Realiza clasificación binaria entre clases 0 y 1
X, y = X[:100, :], y[:100]

# Escala los datos
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Divide los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Convierte los datos a tensores de TensorFlow
X_train_tensor = tf.constant(X_train, dtype=tf.float32)
y_train_tensor = tf.constant(y_train, dtype=tf.float32)
X_test_tensor = tf.constant(X_test, dtype=tf.float32)

# Modelo  capas ocultas y función de activación ReLU
class ModifiedModel(tf.Module):
    def __init__(self, num_features):
        self.W_hidden1 = tf.Variable(tf.random.normal([num_features, 4]), name='hidden1_weights')
        self.b_hidden1 = tf.Variable(tf.zeros([4]), name='hidden1_bias')

        # (capa oculta adicional con 3 neuronas) codigo aquí
    '''
    Crea una variable llamada 'W_hidden2', que represente los pesos de la capa oculta, 
    inicializados con valores aleatorios utilizando una distribución normal, 
    además de una variable llamada 'b_hidden2', que represente el sesgo de la capa oculta, inicializado con ceros. 
    
    '''
    ################## capa de salida
    '''
    crea una variable llamada 'W_output', que represente los pesos de la capa de salida, 
    inicializados con valores aleatorios utilizando una distribución normal, 
    una variable llamada 'b_output', que representa el sesgo de la capa de salida, inicializado con ceros.
    '''


    def __call__(self, X):
        # Operación de la primera capa oculta con ReLU
        hidden1_output = tf.nn.relu(tf.matmul(X, self.W_hidden1) + self.b_hidden1)

        # Líneas añadidas (operación de la segunda capa oculta con ReLU) añade codigo aquí
      '''
      utiliza la función de activación ReLU (Rectified Linear Unit) 
      y que se  realice una operación de multiplicación de matrices entre la salida de la primera capa oculta 'hidden1_output' 
      y los pesos de la segunda capa oculta 'W_hidden2', seguido de la adición del sesgo 'b_hidden2'
      '''

        # Operación de la capa de salida con función sigmoide
     '''
     utiliza la función de activación sigmoide, realiza una operación de multiplicación de matrices entre la salida de la primera capa oculta 'hidden1_output' 
     y los pesos de la capa de salida 'W_output', seguido de la adición del sesgo 'b_output'
          '''

        return output

# Instancia del modelo
num_features = X_train_tensor.shape[1]
model = ModifiedModel(num_features)

# Función de pérdida y optimizador
def binary_cross_entropy_loss(y_true, y_pred):
    epsilon = 1e-15
    y_pred = tf.clip_by_value(y_pred, epsilon, 1 - epsilon)
    return -tf.reduce_mean(y_true * tf.math.log(y_pred) + (1 - y_true) * tf.math.log(1 - y_pred))

optimizer = tf.optimizers.Adam(learning_rate=0.01)

# Entrenamiento del modelo
epochs = 100
for epoch in range(epochs):
    with tf.GradientTape() as tape:
        predictions = model(X_train_tensor)
        loss = binary_cross_entropy_loss(y_train_tensor, predictions)

    gradients = tape.gradient(loss, [model.W_hidden1, model.b_hidden1, model.W_output, model.b_output])
    optimizer.apply_gradients(zip(gradients, [model.W_hidden1, model.b_hidden1, model.W_output, model.b_output]))

    if (epoch + 1) % 10 == 0:
        print(f'Epoch {epoch + 1}/{epochs}, Loss: {loss.numpy()}')

# Evaluación del modelo en el conjunto de prueba
test_predictions = model(X_test_tensor)
rounded_predictions = tf.round(test_predictions)
accuracy = accuracy_score(y_test, rounded_predictions.numpy().astype(int))
print(f'Accuracy on test set: {accuracy}')


5.1 Es mas eficiente el ejercicio 4 o 5 ?


6.¿Cuál es el propósito de la función binary_cross_entropy_loss?
a) Definir la estructura del modelo
b) Calcular la precisión del modelo
c) Calcular la función de pérdida
d) Entrenar el modelo
Respuesta correcta: c) Calcular la función de pérdida

7.¿Qué ocurre en cada iteración del bucle de entrenamiento? Describe brevemente el proceso de entrenamiento del modelo y cómo se actualizan los pesos y sesgos en cada iteración.


8.¿Cuál es la métrica utilizada para evaluar el rendimiento del modelo en el conjunto de prueba? Explica cómo se calcula esta métrica y su significado en el contexto de la clasificación binaria.