In [None]:
# Importar bibliotecas necesarias
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Embedding, Dropout
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.preprocessing.sequence import pad_sequences
from google.colab import files

# Cargar el archivo .txt
uploaded = files.upload()

# Leer el archivo cargado
file_name = list(uploaded.keys())[0]
with open(file_name, 'r', encoding='utf-8') as file:
    text = file.read()

# Preprocesamiento del texto
tokenizer = Tokenizer(char_level=True, filters=None)  # Trabajaremos a nivel de caracteres
tokenizer.fit_on_texts([text])
total_chars = len(tokenizer.word_index) + 1  # Número total de caracteres únicos

# Crear secuencias para entrenamiento
seq_length = 100  # Longitud de cada secuencia de entrada (aumentada para más contexto)
step = 3  # Paso para crear las secuencias
input_sequences = []
output_chars = []

for i in range(0, len(text) - seq_length, step):
    input_sequences.append(text[i: i + seq_length])
    output_chars.append(text[i + seq_length])

# Convertir texto a secuencias numéricas
input_sequences = tokenizer.texts_to_sequences(input_sequences)
output_chars = tokenizer.texts_to_sequences(output_chars)

# Convertir a arrays y categorizar la salida
X = np.array(input_sequences)
y = to_categorical(np.array(output_chars) - 1, num_classes=total_chars)

# Construir el modelo RNN
model = Sequential([
    Embedding(total_chars, 100, input_length=seq_length),  # Tamaño de embedding aumentado
    LSTM(512, return_sequences=True),  # Aumentar las unidades LSTM
    Dropout(0.3),
    LSTM(512),  # Segunda capa LSTM para mayor capacidad
    Dropout(0.3),
    Dense(total_chars, activation='softmax')
])

model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001), loss='categorical_crossentropy')

# Entrenar el modelo
model.fit(X, y, batch_size=128, epochs=100)  # Más épocas y mayor batch_size para eficiencia

# Guardar el modelo para continuar entrenamiento si es necesario
model.save('modelo_mejorado.h5')

# Función para cargar el modelo si se interrumpe el entrenamiento
def load_model():
    from tensorflow.keras.models import load_model
    return load_model('modelo_mejorado.h5')

# Función para generar texto con muestreo de temperatura
def sample_with_temperature(predictions, temperature=1.0):
    predictions = np.asarray(predictions).astype('float64')
    predictions = np.log(predictions + 1e-8) / temperature
    exp_preds = np.exp(predictions)
    predictions = exp_preds / np.sum(exp_preds)
    probas = np.random.multinomial(1, predictions, 1)
    return np.argmax(probas)

# Función para generar texto
def generate_text(seed_text, length, temperature=0.8):
    result = seed_text
    for _ in range(length):
        # Convertir texto a secuencia
        encoded = tokenizer.texts_to_sequences([seed_text])
        encoded = pad_sequences(encoded, maxlen=seq_length, truncating='pre')
        # Predecir el siguiente carácter
        predictions = model.predict(encoded, verbose=0)[0]
        predicted_index = sample_with_temperature(predictions, temperature)
        predicted_char = tokenizer.index_word.get(predicted_index + 1, '')
        result += predicted_char
        seed_text = result[-seq_length:]
    return result

# Modo conversación
def chat_with_model():
    print("Inicia una conversación con el modelo. Escribe 'salir' para terminar.")
    while True:
        prompt = input("Tú: ")
        if prompt.lower() == 'salir':
            break
        response = generate_text(prompt[-seq_length:], 300, temperature=0.8)
        print(f"Modelo: {response}")

# Iniciar conversación
chat_with_model()


Saving intervencionesAbascal.txt to intervencionesAbascal (2).txt




Epoch 1/100
[1m59/59[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 26ms/step - loss: 3.2509
Epoch 2/100
[1m59/59[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 26ms/step - loss: 2.9132
Epoch 3/100
[1m59/59[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 26ms/step - loss: 2.6297
Epoch 4/100
[1m59/59[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 26ms/step - loss: 2.3656
Epoch 5/100
[1m59/59[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 26ms/step - loss: 2.2535
Epoch 6/100
[1m59/59[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 26ms/step - loss: 2.1049
Epoch 7/100
[1m59/59[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 26ms/step - loss: 2.0238
Epoch 8/100
[1m59/59[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 26ms/step - loss: 1.9210
Epoch 9/100
[1m59/59[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 26ms/step - loss: 1.8299
Epoch 10/100
[1m59/59[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 26ms/step - lo



Inicia una conversación con el modelo. Escribe 'salir' para terminar.
Tú: Buenos días.
Modelo: Buenos días. veror anorca mue n so parte de crano que usted nustida de la rubinas de los prudedesta liertido y entración de los prudididaste de la el prisidanta la imporia que usted nn gabierto de nusz ól depesta de del bue y entresidesta os de podem los encañol.
s, han apuertar, por susterteres con esto de run
Tú: No le entiendo muy bien señor Abascal.
Modelo: No le entiendo muy bien señor Abascal. a sus frasias y españoles. aque usted hacicas socialista la opucatiente la apoctaca, señor sánchez, usted hamhomo hos españoles. de los españoles. a0 sha apor unted al señor ispenta el presidente del los cobierno que lo parado en españa y abor la cobida nualas sófun de ha rudida: por esto que unted
Tú: Parece que usted hoy no sabe hablar. ¿Qué medidas va a tomar su partido político?
Modelo: Parece que usted hoy no sabe hablar. ¿Qué medidas va a tomar su partido político? en eso tormato. en suestro