<a href="https://colab.research.google.com/github/cbadenes/curso-pln/blob/main/notebooks/05_Red_Neuronas_Keras.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Introducción a Redes Neuronales con Keras

Este notebook está diseñado para demostrar cómo construir y entrenar un modelo simple de red neuronal utilizando la biblioteca Keras en TensorFlow. Usaremos un conjunto de datos muy básico de frases en español para clasificar su sentimiento como positivo o negativo.

##1) Cargamos y preparamos los datos

El conjunto de datos consiste en frases etiquetadas manualmente para simplificar el uso y la comprensión. Las frases son las siguientes:

- "Me gusta mucho este curso." -> Positivo   
- "Estoy aburrido de la rutina diaria." -> Negativo   
- "El clima hoy está maravilloso." -> Positivo   
- "No estoy satisfecho con el servicio." -> Negativo  

In [25]:
# Import necessary libraries
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, Flatten, Dense
from tensorflow.keras.preprocessing.text import one_hot
from tensorflow.keras.preprocessing.sequence import pad_sequences

# Example sentences and their labels
sentences = ['Me gusta mucho este curso',
             'Estoy aburrido de la rutina diaria',
             'El clima hoy está maravilloso',
             'No estoy satisfecho con el servicio']
labels = [1, 0, 1, 0]  # 1: Positivo, 0: Negativo

# One-hot encode sentences
vocab_size = 50
encoded_sentences = [one_hot(sentence, vocab_size) for sentence in sentences]

# Pad sequences to ensure uniform input size
padded_sentences = pad_sequences(encoded_sentences, maxlen=10, padding='post')

##2) Creamos el modelo basado en una red de neuronas

A continuación, configuraremos un modelo `Sequential`. Este modelo es una pila lineal de capas. Podemos añadir capas con el método `add` y experimentar con diferentes arquitecturas cambiando el número y tipo de capas o ajustando parámetros como el número de neuronas por capa o las funciones de activación.

In [30]:
######## Red de Neuronas
# Capa de Embedding: Transforma los índices de palabras en vectores densos
# Capa de Aplanado (Flatten): Aplana la entrada, convirtiendo los datos multidimensionales en un vector unidimensional
# Capa Densa (Dense): Una capa densamente conectada que es la capa de salida con una función de activación sigmoid para clasificación binaria
max_length = 10
model = Sequential([
    Embedding(vocab_size, 8, input_length=max_length),  # Embedding layer
    Flatten(),
    Dense(1, activation='sigmoid')  # Output layer with sigmoid activation for binary classification
])

# Compile the model
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Summary of the model
model.summary()

##3) Entrenamos el modelo

In [27]:
import numpy as np

# Ensure that inputs are numpy arrays
padded_sentences = np.array(padded_sentences)
labels = np.array(labels)

# Train the model
model.fit(padded_sentences, labels, epochs=10)


Epoch 1/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1s/step - accuracy: 0.5000 - loss: 0.6948
Epoch 2/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 29ms/step - accuracy: 0.5000 - loss: 0.6914
Epoch 3/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 34ms/step - accuracy: 0.5000 - loss: 0.6880
Epoch 4/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step - accuracy: 0.5000 - loss: 0.6846
Epoch 5/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 53ms/step - accuracy: 1.0000 - loss: 0.6813
Epoch 6/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 28ms/step - accuracy: 1.0000 - loss: 0.6779
Epoch 7/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - accuracy: 1.0000 - loss: 0.6746
Epoch 8/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 27ms/step - accuracy: 1.0000 - loss: 0.6713
Epoch 9/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m

<keras.src.callbacks.history.History at 0x7b194182ccd0>

##4) Realizamos algunas predicciones

In [33]:
# Nueva frase de ejemplo
new_sentences = ["Este producto es excelente", "El resultado de este servicio es horroroso"]
encoded_new_sentences = [one_hot(sentence, vocab_size) for sentence in new_sentences]
padded_new_sentences = pad_sequences(encoded_new_sentences, maxlen=10, padding='post')

# Realizar predicciones
predictions = model.predict(padded_new_sentences)

# Interpretar las predicciones
print("Predicciones (probabilidad de sentimiento positivo):")
for i, sentence in enumerate(new_sentences):
    print(f"{sentence}: {predictions[i][0]:.4f}")


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 501ms/step
Predicciones (probabilidad de sentimiento positivo):
Este producto es excelente: 0.4926
El resultado de este servicio es horroroso: 0.4758


##5) Mejora con uso de Embeddings Preentrenados en vez de one-hot encoding

Existen varios embeddings preentrenados disponibles que se podrían utilizar. Algunos de los más populares incluyen:

Word2Vec: Entrenado en Google News dataset, disponible en varios tamaños.
GloVe (Global Vectors for Word Representation): Disponible en varios tamaños y entrenado en diferentes corpus como Wikipedia o Twitter.
FastText: Ofrecido por Facebook, similar a Word2Vec pero también considera subpalabras.

####5.1) Descarga los embeddings preentrenados

https://github.com/rohanrao619/Twitter_Sentiment_Analysis/blob/master/glove.6B.100d.txt

In [None]:
import requests

url = "https://github.com/rohanrao619/Twitter_Sentiment_Analysis/raw/master/glove.6B.100d.txt"
response = requests.get(url)

# Asegúrate de que la petición se completó con éxito
response.raise_for_status()

# Escribir el contenido del archivo a un fichero local
with open("glove.6B.100d.txt", "wb") as f:
    f.write(response.content)


#### 5.2) Cargar los Embeddings
Primero, hay que descargar los embeddings y cargarlos en nuestro entorno.

In [None]:
import numpy as np

# Cargar los embeddings de GloVe
embeddings_index = {}
with open('glove.6B.100d.txt', 'r', encoding='utf-8') as f:
    for line in f:
        values = line.split()
        word = values[0]
        coefs = np.asarray(values[1:], dtype='float32')
        embeddings_index[word] = coefs

print('Found %s word vectors.' % len(embeddings_index))


Found 400000 word vectors.


####5.3) Preparar la Matriz de Embeddings
Vamos a crear una matriz de embeddings para usar en la capa de Embedding de Keras. Esta matriz debe tener un vector para cada palabra del vocabulario:

In [None]:
from tensorflow.keras.preprocessing.text import Tokenizer


# Crea el Tokenizer y ajusta a los datos
tokenizer = Tokenizer(num_words=vocab_size)
tokenizer.fit_on_texts(sentences)

# Ahora puedes acceder a word_index, que mapea palabras a índices
word_index = tokenizer.word_index

max_length = 100
embedding_dim = 100  # Asegúrate de que coincida con las dimensiones del embedding que elegiste
embedding_matrix = np.zeros((vocab_size, embedding_dim))

for word, i in word_index.items():
    embedding_vector = embeddings_index.get(word)
    if embedding_vector is not None:
        # Las palabras no encontradas en el embedding index serán vectores de ceros.
        embedding_matrix[i] = embedding_vector


####5.4) Crear el Modelo con la Capa de Embedding Preentrenada
Ahora ya podemos crear el modelo utilizando la matriz de embeddings en la capa de Embedding. Es importante establecer trainable=False para no modificar los embeddings durante el entrenamiento:

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, Flatten, Dense

model = Sequential([
    Embedding(vocab_size, embedding_dim, input_length=100,
              weights=[embedding_matrix], trainable=False),
    Flatten(),
    Dense(1, activation='sigmoid')
])

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.summary()


## 6) Mejora añadir más capas

Agregar más capas a un modelo Sequential es sencillo. Basta con usar el método .add() para incluir nuevas capas. A continuación se añade una capa densa adicional y una capa de dropout para regularización:

In [None]:
from tensorflow.keras.layers import Dropout

model = Sequential([
    Embedding(vocab_size, embedding_dim, input_length=max_length),
    Flatten(),
    Dense(128, activation='relu'),  # Añadiendo una nueva capa densa con activación ReLU
    Dropout(0.5),                   # Añadiendo dropout para regularización
    Dense(1, activation='sigmoid')  # Capa de salida
])

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.summary()

####6.1) Cambiando las funciones de activación

Cambiar la función de activación es tan simple como actualizar el argumento de activación en las capas que lo permitan. Por ejemplo, para cambiar la función de activación de la nueva capa densa a tanh, se puede hacer así:

In [None]:
model = Sequential([
    Embedding(vocab_size, embedding_dim, input_length=max_length),
    Flatten(),
    Dense(128, activation='tanh'),  # Cambiando a tanh
    Dropout(0.5),
    Dense(1, activation='sigmoid')
])

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.summary()

##7) Mejora con RNN

Para implementar un modelo que utilice redes neuronales recurrentes en Keras, basta con incluir capas como SimpleRNN, LSTM (Long Short-Term Memory), o GRU (Gated Recurrent Units), que son diseñadas para manejar dependencias de secuencias a lo largo del tiempo:

In [32]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, SimpleRNN, Dense

model = Sequential([
    Embedding(input_dim=vocab_size, output_dim=embedding_dim, input_length=max_length),
    SimpleRNN(units=64),  # SimpleRNN con 64 unidades
    Dense(1, activation='sigmoid')
])

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.summary()

###7.1) LSTM

In [34]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense

model = Sequential([
    Embedding(input_dim=vocab_size, output_dim=embedding_dim, input_length=max_length),
    LSTM(units=50),  # LSTM con 50 unidades
    Dense(1, activation='sigmoid')
])
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.summary()

###7.2)GRU

In [35]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, GRU, Dense

model = Sequential([
    Embedding(input_dim=vocab_size, output_dim=embedding_dim, input_length=max_length),
    GRU(units=50),  # GRU con 50 unidades
    Dense(1, activation='sigmoid')
])
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.summary()