# Ejemplo de Chatbot mediante la Similitud del Coseno

**Articulo**: https://www.santiagomarquezsolis.com/tecnologias-para-desarrollo-de-chatbots-parte-1/ 

**Descripción**: Ejemplo de un chatbot que es capaz de responder a diferentes tipos de saludos mediante la técnica de la Similitud del Coseno. Más información en el artículo del blog.

**Librería**: NLTK


**Paso 1. Importar bibliotecas y descargar datos:**


In [None]:
!pip install nltk scikit-learn

import nltk
import numpy as np
import string

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

nltk.download('punkt')
nltk.download('wordnet')




**Paso 2. Preparar los datos de preguntas y respuestas:**


In [None]:
data = {
    "hola": "¡Hola! ¿En qué puedo ayudarte?",
    "buenos días": "Buenos días. ¿En qué puedo ayudarte hoy?",
    "buenas tardes": "Buenas tardes. ¿Cómo puedo asistirte?",
    "buenas noches": "Buenas noches. ¿Hay algo en lo que pueda ayudarte?",
    "¿qué tal?": "Estoy bien, gracias por preguntar. ¿En qué puedo ayudarte?",
    "¿cómo estás?": "Estoy funcionando correctamente. ¿En qué puedo ayudarte?",
    "¿cómo te va?": "Todo va bien. ¿Necesitas información o asistencia?",
    "hola, ¿cómo estás?": "¡Hola! Estoy bien, gracias por preguntar. ¿En qué puedo ayudarte?",
}

additional_data = {
    "hola, ¿qué tal?": "¡Hola! Estoy bien, gracias por preguntar. ¿En qué puedo ayudarte?",
    "hey": "¡Hey! ¿Necesitas ayuda con algo?",
    "saludos": "Saludos. ¿Hay algo en lo que pueda ayudarte?",
    "hola, buenos días": "Hola, buenos días. ¿En qué puedo asistirte hoy?",
    "hola, buenas tardes": "Hola, buenas tardes. ¿Cómo puedo ayudarte?",
    "hola, buenas noches": "Hola, buenas noches. ¿Necesitas información o asistencia?",
    "buen día": "Buen día. ¿En qué puedo ayudarte?",
    "¿cómo te encuentras?": "Me encuentro funcionando correctamente. ¿En qué puedo asistirte?",
    "aló": "¡Aló! ¿En qué puedo ayudarte hoy?",
    "¿cómo va todo?": "Todo va bien, gracias. ¿Hay algo en lo que pueda ayudarte?",
}

# Combina los dos diccionarios de saludos. Es un ejemplo de como puedes añadir más usando otro vector, lo dejo solo como opcionalidad
data.update(additional_data)

questions = list(data.keys())
answers = list(data.values())


**Paso 3. Procesar el texto:**

In [None]:
lemmer = nltk.stem.WordNetLemmatizer()

def LemTokens(tokens):
    return [lemmer.lemmatize(token) for token in tokens]

remove_punct_dict = dict((ord(punct), None) for punct in string.punctuation)

def LemNormalize(text):
    return LemTokens(nltk.word_tokenize(text.lower().translate(remove_punct_dict)))


**Paso 4. Crear una función de respuesta para interactuar con el chatbot:**


In [None]:
def response(user_input):
    chatbot_response = ''

    TfidfVec = TfidfVectorizer(tokenizer=LemNormalize, stop_words='spanish')
    tfidf = TfidfVec.fit_transform(questions + [user_input])
    vals = cosine_similarity(tfidf[-1], tfidf[:-1])
    idx = vals.argsort()[0][-1]
    similarity = vals[0][idx]

    if similarity == 0:
        chatbot_response += "Lo siento, no entiendo tu pregunta."
    else:
        chatbot_response += answers[idx]

    return chatbot_response



**Paso 5. Crear la función principal para interactuar con el chatbot:**


In [None]:
def chatbot():
    print("Chatbot: Hola, ¿en qué puedo ayudarte? Si deseas salir, escribe 'salir'.")

    while True:
        user_input = input("Tú: ")
        user_input = user_input.lower()
        
        if user_input == 'salir':
            print("Chatbot: ¡Adiós! Que tengas un buen día.")
            break
        else:
            print("Chatbot: ", response(user_input))


**Paso 6. Iniciar el chatbot:**


In [None]:
if __name__ == "__main__":
    chatbot()
