In [None]:
# Importar bibliotecas necesarias
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Embedding, Dropout
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.preprocessing.sequence import pad_sequences

# Cargar el archivo .txt
from google.colab import files
uploaded = files.upload()

# Leer el archivo cargado
file_name = list(uploaded.keys())[0]
with open(file_name, 'r', encoding='utf-8') as file:
    text = file.read()

# Preprocesamiento del texto
tokenizer = Tokenizer(char_level=True)  # Trabajaremos a nivel de caracteres
tokenizer.fit_on_texts([text])
total_chars = len(tokenizer.word_index) + 1  # Número total de caracteres únicos

# Crear secuencias para entrenamiento
seq_length = 40  # Longitud de cada secuencia de entrada
step = 3  # Paso para crear las secuencias
input_sequences = []
output_chars = []

for i in range(0, len(text) - seq_length, step):
    input_sequences.append(text[i: i + seq_length])
    output_chars.append(text[i + seq_length])

# Convertir texto a secuencias numéricas
input_sequences = tokenizer.texts_to_sequences(input_sequences)
output_chars = tokenizer.texts_to_sequences(output_chars)

# Convertir a arrays y categorizar la salida
X = np.array(input_sequences)
y = to_categorical(np.array(output_chars) - 1, num_classes=total_chars)

# Construir el modelo RNN
model = Sequential([
    Embedding(total_chars, 50, input_length=seq_length),
    LSTM(256, return_sequences=False),  # Incrementar la cantidad de unidades LSTM
    Dropout(0.2),  # Añadir Dropout para evitar sobreajuste
    Dense(total_chars, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy')

# Entrenar el modelo
model.fit(X, y, batch_size=64, epochs=30)  # Incrementar el número de épocas

# Función para generar texto con muestreo de temperatura
def sample_with_temperature(predictions, temperature=1.0):
    predictions = np.asarray(predictions).astype('float64')
    predictions = np.log(predictions + 1e-8) / temperature
    exp_preds = np.exp(predictions)
    predictions = exp_preds / np.sum(exp_preds)
    probas = np.random.multinomial(1, predictions, 1)
    return np.argmax(probas)

# Función para generar texto
def generate_text(seed_text, length, temperature=1.0):
    result = seed_text
    for _ in range(length):
        # Convertir texto a secuencia
        encoded = tokenizer.texts_to_sequences([seed_text])
        encoded = pad_sequences(encoded, maxlen=seq_length, truncating='pre')
        # Predecir el siguiente carácter
        predictions = model.predict(encoded, verbose=0)[0]
        predicted_index = sample_with_temperature(predictions, temperature)
        predicted_char = tokenizer.index_word.get(predicted_index + 1, '')
        result += predicted_char
        seed_text = result[-seq_length:]
    return result

# Modo conversación
def chat_with_model():
    print("Inicia una conversación con el modelo. Escribe 'salir' para terminar.")
    while True:
        prompt = input("Tú: ")
        if prompt.lower() == 'salir':
            break
        response = generate_text(prompt[-seq_length:], 100, temperature=0.8)
        print(f"Modelo: {response}")

# Iniciar conversación
chat_with_model()


Saving intervencionesAbascal.txt to intervencionesAbascal.txt




Epoch 1/30
[1m118/118[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 4ms/step - loss: 3.2202
Epoch 2/30
[1m118/118[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - loss: 2.6397
Epoch 3/30
[1m118/118[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - loss: 2.4424
Epoch 4/30
[1m118/118[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 5ms/step - loss: 2.3105
Epoch 5/30
[1m118/118[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - loss: 2.2160
Epoch 6/30
[1m118/118[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - loss: 2.1547
Epoch 7/30
[1m118/118[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - loss: 2.0801
Epoch 8/30
[1m118/118[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - loss: 2.0169
Epoch 9/30
[1m118/118[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - loss: 1.9937
Epoch 10/30
[1m118/118[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 4ms/step - lo