<a href="https://colab.research.google.com/github/Projas-14/Inteligencia_artificial/blob/master/Clasificaci%C3%B3n%20de%20Opiniones%20de%20Pel%C3%ADculas%20con%20Redes%20Neuronales%20Recurrentes%20(RNN).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Clasificación de Opiniones de Películas con Redes Neuronales Recurrentes (RNN)

**Descripción del Proyecto:**

En este proyecto, vamos a construir un modelo de aprendizaje profundo utilizando redes neuronales recurrentes (RNN) para clasificar opiniones de películas como positivas o negativas utilizando el conjunto de datos IMDB. Las RNN son especialmente adecuadas para procesar secuencias de datos, como texto, y son ampliamente utilizadas en tareas de procesamiento del lenguaje natural (NLP).

## Pasos a seguir:

Carga de Datos:

Cargar el conjunto de datos IMDB, que ya está disponible en keras.datasets.

In [1]:
# Importar las bibliotecas necesarias
import numpy as np
from keras.datasets import imdb

# Cargar el conjunto de datos IMDB
vocabulario = 10000  # Tamaño del vocabulario (las 10000 palabras más frecuentes)
(X_train, y_train), (X_test, y_test) = imdb.load_data(num_words=vocabulario)


Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb.npz


## Preprocesamiento de Datos:

Convertir las opiniones de las películas en secuencias de números utilizando tokenización y padding.
Dividir los datos en conjuntos de entrenamiento y prueba.

In [2]:
# Preprocesamiento de datos: Padding de secuencias
from keras.preprocessing.sequence import pad_sequences

max_longitud = 200  # Máxima longitud de la secuencia (en palabras)
X_train = pad_sequences(X_train, maxlen=max_longitud)
X_test = pad_sequences(X_test, maxlen=max_longitud)


## Construcción del Modelo:

Construir una red neuronal recurrente (RNN) utilizando capas de embeddings y capas LSTM (Long Short-Term Memory).
Compilar el modelo con una función de pérdida adecuada y un optimizador.

In [3]:
# Construir el modelo RNN
from keras.models import Sequential
from keras.layers import Embedding, LSTM, Dense

embedding_dim = 128

model = Sequential()
model.add(Embedding(vocabulario, embedding_dim, input_length=max_longitud))
model.add(LSTM(64, return_sequences=True))
model.add(LSTM(32))
model.add(Dense(1, activation='sigmoid'))

# Compilar el modelo
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])


## Entrenamiento del Modelo:

Entrenar el modelo utilizando el conjunto de entrenamiento.

Monitorear el rendimiento del modelo en el conjunto de validación y ajustar los hiperparámetros si es necesario.

In [4]:
# Entrenar el modelo
history = model.fit(X_train, y_train, epochs=5, batch_size=128, validation_split=0.2)


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


## Evaluación del Modelo:

Evaluar el rendimiento del modelo utilizando el conjunto de prueba.
Visualizar las métricas de rendimiento, como precisión y pérdida, a lo largo del tiempo.

In [5]:
# Evaluar el modelo
loss, accuracy = model.evaluate(X_test, y_test)
print("Pérdida en el conjunto de prueba:", loss)
print("Precisión en el conjunto de prueba:", accuracy)


Pérdida en el conjunto de prueba: 0.5002129077911377
Precisión en el conjunto de prueba: 0.8505600094795227


## Optimización del Modelo:

Experimentar con diferentes arquitecturas de redes neuronales, hiperparámetros y técnicas de regularización para mejorar el rendimiento del modelo.

Para optimizar el modelo, podríamos experimentar con diferentes arquitecturas de redes neuronales, hiperparámetros y técnicas de regularización. Por ejemplo, podríamos probar diferentes valores de la tasa de aprendizaje del optimizador Adam o ajustar el tamaño de las capas LSTM.

In [6]:
# Experimentar con diferentes hiperparámetros y arquitecturas de redes neuronales
# Por ejemplo, podemos probar una LSTM bidireccional o agregar capas Dropout para regularización
from keras.layers import Bidirectional, Dropout

model = Sequential()
model.add(Embedding(vocabulario, embedding_dim, input_length=max_longitud))
model.add(Bidirectional(LSTM(64, return_sequences=True)))
model.add(Dropout(0.5))
model.add(LSTM(32))
model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=5, batch_size=128, validation_split=0.2)


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7fc6a8326200>

## Despliegue del Modelo
Guardar el modelo entrenado para su uso futuro y/o implementar una interfaz donde los usuarios puedan ingresar reseñas de películas y obtener la predicción del modelo.

Para desplegar el modelo entrenado, podemos guardar el modelo en un archivo y luego cargarlo para hacer predicciones sobre nuevas reseñas de películas.

In [9]:
# Guardar el modelo entrenado
model.save('imdb_rnn_model.h5')

# Cargar el modelo para hacer predicciones
from keras.models import load_model

loaded_model = load_model('imdb_rnn_model.h5')

# Ejemplo de predicción sobre una nueva reseña de película
new_review = "This movie was amazing! I loved every moment of it."
# Preprocesar la nueva reseña
new_review_encoded = imdb.get_word_index()
new_review_sequence = [new_review_encoded[word] if word in new_review_encoded and new_review_encoded[word] < vocabulario else 0 for word in new_review.split()]
new_review_padded = pad_sequences([new_review_sequence], maxlen=max_longitud)
# Realizar la predicción
prediction = loaded_model.predict(new_review_padded)
if prediction >= 0.5:
    print("La reseña es positiva.")
else:
    print("La reseña es negativa.")


La reseña es negativa.
