In [31]:
import random #proporciona funciones para generar números aleatorios y realizar operaciones aleatorias
import json #permite trabajar con datos en formato JSON
import pickle #permite serializar y deserializar objetos de Python.
import numpy as np #Proporciona soporte para arreglos y matrices 


In [32]:
import nltk #biblioteca en Python para trabajar con datos de lenguaje natural
from nltk.stem import WordNetLemmatizer #proceso de convertir una palabra a su forma base o lema

In [33]:
# Para crear la red neuronal
from keras.models import Sequential # Importa la clase Sequential de Keras, usada para crear un modelo secuencial de red neuronal
from keras.layers import Dense, Activation, Dropout, Input # Importa las capas Dense, Activation, Dropout e Input de Keras
from keras.optimizers import SGD # Importa el optimizador Stochastic Gradient Descent (SGD) de Keras
from keras.callbacks import EarlyStopping # Importa la función de detención temprana (EarlyStopping) de Keras
from sklearn.model_selection import train_test_split # Importa la función train_test_split de Scikit-learn para dividir los datos en entrenamiento y prueba
lemmatizer = WordNetLemmatizer() # Crea una instancia del lematizador de WordNet de nltk para normalizar palabras

In [34]:
# Cargar el archivo JSON modificado
intents = json.loads(open('intents_veterinaria_sin_tildes.json').read())

In [35]:
# Descargar paquetes necesarios de NLTK
nltk.download('punkt') # Descarga datos necesarios para la tokenización de NLTK
nltk.download('wordnet') # Descarga el diccionario WordNet necesario para la lematización de NLTK
nltk.download('omw-1.4') # Descarga recursos adicionales para la lematización multilingüe de NLTK

[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\cquij\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package wordnet to
[nltk_data]     C:\Users\cquij\AppData\Roaming\nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package omw-1.4 to
[nltk_data]     C:\Users\cquij\AppData\Roaming\nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!


True

In [36]:
# Clasifica los patrones y las categorías
words = []
classes = []
documents = []
ignore_letters = ['?', '!', '¿', '.', ',']

In [37]:
# Clasifica los patrones y las categorías
for intent in intents['intents']:
    for pattern in intent['patterns']:
        word_list = nltk.word_tokenize(pattern) # Tokeniza el patrón actual en una lista de palabras
        words.extend(word_list) # Agrega las palabras tokenizadas a la lista global `words`
        documents.append((word_list, intent["tag"])) # Añade una tupla con el patrón y su etiqueta a `documents`
        if intent["tag"] not in classes:
            classes.append(intent["tag"]) # Añade la etiqueta a `classes` si no está presente

words = [lemmatizer.lemmatize(word) for word in words if word not in ignore_letters] # Lematiza las palabras en `words`, excluyendo caracteres ignorados
words = sorted(set(words)) # Convierte `words` en un conjunto para eliminar duplicados y luego lo ordena alfabéticamente


In [38]:
pickle.dump(words, open('words.pkl', 'wb')) # Guarda la lista de palabras en un archivo 'words.pkl' utilizando pickle
pickle.dump(classes, open('classes.pkl', 'wb')) # Guarda la lista de clases en un archivo 'classes.pkl' utilizando pickle

In [39]:
# Pasa la información a unos y ceros según las palabras presentes en cada categoría para hacer el entrenamiento
training = [] # Lista vacía para almacenar los datos de entrenamiento
output_empty = [0] * len(classes) # Lista de ceros inicializada con la longitud de la lista de clases
for document in documents:
    bag = [] # Lista para representar la bolsa de palabras de cada documento
    word_patterns = document[0] # Patrones de palabras del documento actual
    word_patterns = [lemmatizer.lemmatize(word.lower()) for word in word_patterns] # Lematiza y convierte a minúsculas las palabras del patrón
    for word in words: 
        bag.append(1) if word in word_patterns else bag.append(0) # Si la palabra está presente en el patrón, agrega 1 o 0 a la bolsa (one-hot encoding)
    output_row = list(output_empty) # Crea una copia de la lista de ceros para representar la salida deseada
    output_row[classes.index(document[1])] = 1  # Establece el índice correspondiente a la clase del documento en 1 (one-hot encoding)
    training.append([bag, output_row])  # Agrega la bolsa de palabras y la salida deseada como una entrada de entrenamiento


In [40]:
random.shuffle(training)
print(len(training))  # Muestra la cantidad de patrones de entrenamiento

35


In [41]:
train_x = []
train_y = [] 
# Itera sobre los datos de entrenamiento para extraer las características (train_x) y las etiquetas (train_y)
for i in training: 
    train_x.append(i[0]) # Añade la bolsa de palabras (características) a train_x
    train_y.append(i[1]) # Añade el vector de salida (etiqueta) a train_y

train_x = np.array(train_x) # Convierte train_x a un arreglo numpy
train_y = np.array(train_y) # Convierte train_y a un arreglo numpy

In [42]:
# Creamos la red neuronal
model = Sequential() # Inicializa un modelo secuencial
model.add(Input(shape=(len(train_x[0]),), name="input_layer")) # Añade la capa de entrada especificando el tamaño de entrada
model.add(Dense(128, activation='relu', name="hidden_layer1")) # Añade la primera capa oculta con 128 neuronas y activación ReLU
model.add(Dropout(0.5, name="dropout_layer1")) # Añade una capa de dropout para regularización
model.add(Dense(64, activation='relu', name="hidden_layer2")) # Añade la segunda capa oculta con 64 neuronas y activación ReLU
model.add(Dropout(0.5, name="dropout_layer2")) # Añade otra capa de dropout para regularización
model.add(Dense(len(train_y[0]), activation='softmax', name="output_layer")) # Añade la capa de salida con activación softmax para clasificación multiclase

In [43]:
# Creamos el optimizador y lo compilamos
# learning_rate=0.001 controla el tamaño de los pasos que se dan en dirección opuesta al gradiente para minimizar la pérdida.
# momentum=0.9: Factor de momentum, que ayuda a acelerar la convergencia y a evitar mínimos locales.
sgd = SGD(learning_rate=0.001, momentum=0.9, nesterov=True) # Crea un optimizador SGD con los parámetros especificados
model.compile(loss='categorical_crossentropy', optimizer=sgd, metrics=['accuracy'])

In [52]:
# Entrenamos el modelo y lo guardamos
model.fit(np.array(train_x), np.array(train_y), epochs=100, batch_size=16, verbose=1) # Entrena el modelo con los datos de entrenamiento
model.save("chatbot_model.h5") # Guarda el modelo entrenado en un archivo "chatbot_model.h5"

Epoch 1/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - accuracy: 0.8804 - loss: 0.2991 
Epoch 2/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.9025 - loss: 0.3697 
Epoch 3/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0s/step - accuracy: 1.0000 - loss: 0.2390  
Epoch 4/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0s/step - accuracy: 0.8205 - loss: 0.3622  
Epoch 5/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 8ms/step - accuracy: 0.8804 - loss: 0.3647 
Epoch 6/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 8ms/step - accuracy: 0.9402 - loss: 0.2966 
Epoch 7/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0s/step - accuracy: 0.9558 - loss: 0.3846  
Epoch 8/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0s/step - accuracy: 0.9779 - loss: 0.1810  
Epoch 9/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[3

[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0s/step - accuracy: 0.9558 - loss: 0.2610  
Epoch 70/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 8ms/step - accuracy: 0.9415 - loss: 0.2729 
Epoch 71/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 8ms/step - accuracy: 0.9402 - loss: 0.3054 
Epoch 72/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.9779 - loss: 0.2688 
Epoch 73/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.8960 - loss: 0.3115 
Epoch 74/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.8960 - loss: 0.3614 
Epoch 75/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 8ms/step - accuracy: 0.8973 - loss: 0.2777 
Epoch 76/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.9402 - loss: 0.3065 
Epoch 77/100
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[



In [53]:
# Pasar las palabras de oración a su forma raíz
def clean_up_sentence(sentence):
    sentence_words = nltk.word_tokenize(sentence)
    sentence_words = [lemmatizer.lemmatize(word) for word in sentence_words]
    return sentence_words

# Convertir la información a unos y ceros según si están presentes en los patrones
def bag_of_words(sentence):
    sentence_words = clean_up_sentence(sentence)
    bag = [0] * len(words)
    for w in sentence_words:
        for i, word in enumerate(words):
            if word == w:
                bag[i] = 1
    return np.array(bag)

# Predecir la categoría a la que pertenece la oración
def predict_class(sentence):
    bow = bag_of_words(sentence)
    res = model.predict(np.array([bow]))[0]
    max_index = np.where(res == np.max(res))[0][0]
    category = classes[max_index]
    return category

# Obtener una respuesta aleatoria
def get_response(tag, intents_json):
    list_of_intents = intents_json['intents']
    result = ""
    for i in list_of_intents:
        if i["tag"] == tag:
            result = random.choice(i['responses'])
            break
    return result

def respuesta(message):
    ints = predict_class(message)
    res = get_response(ints, intents)
    return res

# Interacción con el chatbot
#while True:
#    message = input("Tú: ")
#    print("Bot:", respuesta(message))

In [54]:
# Código de la interfaz gráfica con Tkinter
import tkinter as tk
from tkinter import *

In [55]:
# Configuración de la ventana principal
base = Tk()  # Creación de la ventana principal
base.title("Bienvenido a tu asistente virtual Vetbot")  # Título de la ventana
base.geometry("400x500")  # Tamaño de la ventana

''

In [56]:
# Creación de un área de texto para mostrar el chat
ChatLog = Text(base, bd=0, bg="white", height="8", width="50", font="Arial")
ChatLog.config(foreground="black", font=("Verdana", 12))
ChatLog.insert(END, "SALUDOS BIENVENIDO" + '\n\n')  # Mensaje de bienvenida inicial
ChatLog.place(x=6, y=6, height=386, width=370)  # Posicionamiento del área de texto en la ventana

In [57]:
# Creación de una barra de desplazamiento para navegar por el historial del chat
scrollbar = Scrollbar(base, command=ChatLog.yview, cursor="heart")
ChatLog['yscrollcommand'] = scrollbar.set
scrollbar.place(x=376, y=6, height=386)

In [58]:
# Bloquear el área de texto para que no se pueda editar directamente por el usuario
ChatLog.config(state=DISABLED)

In [59]:
# Creación de un cuadro de entrada de texto para que el usuario escriba sus mensajes
EntryBox = Text(base, bd=0, bg="white", width="29", height="5", font="Arial")
EntryBox.place(x=6, y=401, height=90, width=265)

In [60]:
# Función para enviar un mensaje (se llama cuando se presiona Enter o se hace clic en el botón 'Send')
def send(event=None):
    msg = EntryBox.get("1.0", 'end-1c').strip()  # Obtener el mensaje escrito por el usuario
    EntryBox.delete("0.0", END)  # Limpiar el cuadro de entrada después de enviar el mensaje

    if msg != '':
        ChatLog.config(state=NORMAL)  # Permitir la escritura en el área de texto
        ChatLog.insert(END, "You: " + msg + '\n\n')  # Mostrar el mensaje del usuario en el chat
        ChatLog.config(foreground="black", font=("Verdana", 12))

        # Simular la respuesta del chatbot (aquí debería llamarse a una función real de chatbot)
        res = respuesta(msg)
        ChatLog.insert(END, "ChatBOT: " + res + '\n\n')  # Mostrar la respuesta del chatbot en el chat
        ChatLog.config(state=DISABLED)  # Bloquear el área de texto nuevamente
        ChatLog.yview(END)  # Desplazar hacia abajo para mostrar la respuesta más reciente

In [61]:
# Botón para enviar mensajes
SendButton = Button(base, font=("Verdana", 12, 'bold'), text="Send", width="9",
                   height=5, bd=0, bg="blue", activebackground="gold",
                   fg='#ffffff', command=send)
SendButton.place(x=282, y=401, height=90)


In [62]:
# Vincular la tecla Enter para enviar mensajes
base.bind('<Return>', send)

'1590770036224send'

In [63]:
# Iniciar el bucle principal de la interfaz gráfica
base.mainloop()

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 47ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 16ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 25ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step
