## Ejemplo muy simple de incrustación 

In [None]:
import numpy as np

In [None]:
frases = ["Yo amo chocolate", "Yo odio brocoli"]
etiquetas = np.array([1, 0])  # 1 para positivo, 0 para negativo (sentimiento)


## Pre-procesar los datos

In [None]:
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

# Tokenizar las frases
tokenizador = Tokenizer()
tokenizador.fit_on_texts(frases)
secuencias = tokenizador.texts_to_sequences(frases)

# Rellenar (Pad) las secuencias para que tengan la misma longitud
secuencias_rellenas = pad_sequences(secuencias, padding='post')

print(secuencias_rellenas)  # [[1 2 3], [1 4 5]]


## Definir el modelo con una capa de incrustación

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, Flatten, Dense

long_vocab = len(tokenizador.word_index) + 1
dim_incrustamiento = 2  # Representar cada palabra por un vector 2D

modelo = Sequential([
    Embedding(input_dim = long_vocab, output_dim = dim_incrustamiento, input_length = 3),
    Flatten(),  # Aplanar la matriz de 3x2 en un vector 6D para la capa Dense
    Dense(1, activation='sigmoid')  # Clasificación binaria
])

modelo.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])


## Entrenar el modelo

In [None]:
modelo.fit(secuencias_rellenas, etiquetas, epochs = 50)


## Mostrar las incrustaciones

In [None]:
# Extraer las incrustaciones
capa_incrustacion = modelo.layers[0]
incrustaciones = capa_incrustacion.get_weights()[0]

# Desplegar las incrustaciones para cada palabra
for palabra, i in tokenizador.word_index.items():
    print(f"Palabra: {palabra}")
    print(f"Incrustación: {incrustaciones[i]}")
    print("--------------")
