### **Sentiment Analysis** ###

El Análisis de Sentimiento tiene como objetivo determinar y clasificar la polaridad emocional de un fragmento de texto. La polaridad emocional puede ser positiva, negativa o neutra, y el objetivo del análisis de sentimiento es comprender la actitud, opinión o emoción expresada en el texto.

Vamos a trabajar en un [ejemplo](https://www.tensorflow.org/text/tutorials/text_classification_rnn) que permita clasificar comentarios sobre películas como positivo, negativo o neutro.

**Módulos:**

In [None]:
import os
import numpy as np
import tensorflow as tf
from keras.datasets import imdb
from keras.utils import pad_sequences

**Dataset:**

Vamos a trabajar con el Dataset de Comentarios de Películas IMDB de Keras. Contiene 25.000 comentarios, cada uno de ellos preprocesados y clasificados como Positivo o Negativo. Cada comentarios está codificado con enteros que representan la frecuencia de una palabra en el Dataset completo. Por ejemplo, una palabra codificada con el entero 3 significa que es la tercera palabra más común en el Dataset.

In [None]:
VOCAB_SIZE = 88584 # Parabras en nuestro diccionario

MAXLEN = 250       # Longitud máxima de cada comentario
BATCH_SIZE = 64    # Tamaño de Batch

(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words = VOCAB_SIZE)

In [None]:
print(len(train_data[0])) # Para conocer la longitud de un comentario
print(train_data[0])      # Para visualizar un comentario

Los comentarios cargados en nuestro Dataset tienen diferentes longitudes. No podemos pasar elementos de diferente tamaño a nuestra Red Neuronal. Por tanto, debemos hacer que todos los comentarios tengan la misma longitud.
1. Si el Comentario tiene más de 250 palabras, nos quedamos con las primeras 250.
2. Si el Comentario tiene menos de 250 palabras, lo completamos con 0s.

In [None]:
train_data = pad_sequences(train_data, MAXLEN)
test_data = pad_sequences(test_data, MAXLEN)

**Creación del Modelo:**

Vamos a utilizar una capa de Word Embedding como primera capa del modelo y añadir una capa LSTM después, que entregará los datos resultantes a una capa Densa. Ésta última será la encargada de predecir el Sentimiento (Positivo, Negativo).

In [None]:
model = tf.keras.Sequential([
    tf.keras.layers.Embedding(VOCAB_SIZE, 32), ## Creamos la capa de Word Embedding con vectores resultantes de 32 dimensiones por palabra
    tf.keras.layers.LSTM(32),
    tf.keras.layers.Dense(1, activation='sigmoid')
])

In [None]:
model.summary()

**Entrenamiento del Modelo:**

In [None]:
model.compile(loss='binary_crossentropy', optimizer='rmsprop', metrics=['acc'])
history = model.fit(train_data, train_labels, epochs=10, validation_split=0.2)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 9/10
Epoch 10/10
