In [None]:
# Importar bibliotecas necesarias
import pandas as pd
import tensorflow as tf
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

In [None]:
# Crear un conjunto de datos sintético y guardarlo como CSV
# Ejemplos de texto y etiquetas
data = {
    "texto": [
        "Me gusta el fútbol",
        "El clima es hermoso hoy",
        "No me gusta la lluvia",
        "El café es delicioso",
        "Prefiero té que café",
        "La comida argentina es increíble",
        "Amo la música",
        "Los días soleados son los mejores",
        "La lectura es un buen pasatiempo",
        "Me gusta aprender cosas nuevas",
        "No me gusta caminar bajo el sol",
        "La playa estaba limpia, pero el día estaba frio",
        "La comida estaba rica, pero fria",
    ],
    "etiquetas": [
        1,  # Positiva
        1,  # Positiva
        0,  # Negativa
        1,  # Positiva
        1,  # Positiva
        1,  # Positiva
        1,  # Positiva
        1,  # Positiva
        1,  # Positiva
        1,  # Positiva
        0,  # Negativa
        0,  # Negativa
        0,  # Negativa
    ]
}

# Convertir a DataFrame
datos = pd.DataFrame(data)

# Guardar como CSV
datos.to_csv("text_dataset.csv", index=False)

print("Archivo 'text_dataset.csv' creado con éxito.")

In [None]:
# Cargar el conjunto de datos de texto
datos = pd.read_csv("text_dataset.csv")

In [None]:
# Tokenización del texto
tokenizer = Tokenizer(num_words=5000)
tokenizer.fit_on_texts(datos["texto"])
secuencias = tokenizer.texts_to_sequences(datos["texto"])
maxlen = 10  # Longitud máxima de las secuencias
X = pad_sequences(secuencias, maxlen=maxlen)
y = datos["etiquetas"].values

In [None]:
# Cambiar el modelo a uno adecuado para texto
modelo = tf.keras.Sequential([
    tf.keras.layers.Embedding(input_dim=5000, output_dim=64, input_length=maxlen),
    tf.keras.layers.GlobalAveragePooling1D(),
    tf.keras.layers.Dense(units=1, activation='sigmoid')  # Cambiar según el caso de uso
])

In [None]:
# Compilación del modelo
modelo.compile(
    optimizer=tf.keras.optimizers.Adam(),
    loss="binary_crossentropy",
    metrics=["accuracy"]
)

In [None]:
# Entrenamiento del modelo
entrenamiento = modelo.fit(X, y, epochs=15, batch_size=2)

In [None]:
# Predicción con ejemplo de texto
texto_ejemplo = "El café es delicioso, pero estaba frio"
secuencia_ejemplo = tokenizer.texts_to_sequences([texto_ejemplo])
secuencia_ejemplo = pad_sequences(secuencia_ejemplo, maxlen=maxlen)
prediccion = modelo.predict(secuencia_ejemplo)
print(f"Predicción para el texto '{texto_ejemplo}': {prediccion[0]}")