# Actividades

1) Elaborar un dataset de preguntas y respuestas para crear un Chatbot para un aplicación particular.

1.   Debe definir la aplicación (atención al cliente bancario, atención a estudiantes universitarios, etc).
2.   El listado de preguntas y respuestas debe tener como mínimo 10 elementos.


2) Crear el chatbot utilizando TFIDF y similitud del coseno.

3) Crear otro chatbot utilizando embeddings. Indique cuál embedding pre-entrenado eligió.

4) Muestra los chatbots funcionando

5) No olvides:
* Adjuntar la lista de preguntas utilizadas para probar el funcionamiento.
* Anunciar en el foro cuál será tu aplicación.
* Anunciar en el foro y postear tu entrega y tus avances.
* Debes subir tu notebook a un repo GitHub público de tu propiedad compartido




## - El objetivo es crear un chatbot para responder a las preguntas frecuentes que pueda realizar un posible cliente de una farmacia
### - Para ello crearé primero el chatbot utilizando TFIDF y similitud del coseno y luego otro chatbot utilizando embeddings.
### - Al final detallaré el proceso y la experiencia que obtuve.

## Primer Chatbot (utilizando TFIDF y similitud del coseno)

In [22]:
# Se importan las librerías necesarias
import pandas as pd
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity
from sklearn.feature_extraction.text import TfidfVectorizer

In [20]:
# Creación del dataset de preguntas y respuestas
datos = {
    'preguntas': ["Como es el trámite para comprar un medicamento con receta archivada",
        "¿Tienen paracetamol disponible?",
    "¿Cuál es el precio del ibuprofeno?",
    "¿Cuál es el horario de atención de la farmacia?",
    "¿Tienen alcohol en gel?",
    "¿Ofrecen servicio de envío a domicilio?",
    "¿Aceptan como forma de pago tarjeta de crédito?",
    "¿Tienen test de pruebas de embarazo?",
    "¿Qué medicamentos me recomiendan para el resfriado?",
    "¿Cuánto cuesta la crema para el dolor muscular?",
    "¿Cómo debo tomar los probióticos?",
    "¿Tienen leche para bebé disponible?",
    "¿Cuánto cuesta un termómetro digital?",
    "¿Puedo devolver un producto si está defectuoso o vencido?",
    "¿Ofrecen descuentos a adultos mayores?",
    "¿Tienen mascarillas disponibles?",
    "¿Cómo debo conservar los antibióticos?",
    "¿Qué productos recomiendan para la gripe?",
    "¿Venden vitaminas?",
    "¿Cuánto cuesta la aspirina?",
    "¿Qué crema recomiendan para quemaduras?",
    "¿Cómo se usa el inhalador?",
    "¿Puedo comprar medicamentos por internet?",
    "¿Cuánto cuesta un oxímetro?",
    "¿Tienen jeringas disponibles?"
    ],
    'respuestas': ["Se necesita contar con una receta médica emitida por duplicado para poder comprar un medicamento con receta archivada, además de ser mayor de edad.",
"Sí, tenemos paracetamol en varias presentaciones.",
    "El ibuprofeno tiene un precio de $3500 por la presentación de 400 mg.",
    "Nuestro horario es de lunes a viernes de 8:00 a.m. a 20:30 p.m., y los sábados de 8:00 a.m. a 13:00 p.m.",
    "Sí, disponemos de alcohol en gel en recipientes de 100 gr, 250 gr, 500 gr y 1000 gr.",
    "Sí, ofrecemos servicio de envío a domicilio para compras mayores a $5000.",
    "Aceptamos pagos con tarjeta de crédito, débito, transferencias y efectivo.",
    "Sí, contamos con test de pruebas de embarazo.",
    "Siempre se sugiere consultar con su médico, pero tenemos varios productos para el resfriado de venta libre.",
    "El precio de las cremas para el dolor muscular varía entre $10000 y $35000, dependiendo de la droga y la presentación.",
    "Los probióticos se deben tomar antes o después de las comidas, según lo indicado.",
    "Sí, contamos con varias marcas de leche para bebés, debe tener en cuenta sobretodo la edad del niño.",
    "El precio del termómetro digital oscila entre $29000 y $42500.",
    "Puede devolver productos defectuosos dentro de los primeros 7 días después de la compra, acompañado de su ticket.",
    "Sí, ofrecemos un descuento del 10% en medicamentos a personas mayores de 60 años.",
    "Sí, tenemos mascarillas disponibles con diferentes capacidad de filtrado de partículas.",
    "Debe conservar los antibióticos en un lugar fresco y seco, generalmente el embase lo especifica.",
    "Siempre debe sonsultar a su médico de cabecera, podemos recomendar antigripales y descongestionantes de venta libre para un estado gripal.",
    "Sí, tenemos varias marcas de vitaminas disponibles, debe consultar con un detalle de un médico preferentemente.",
    "La aspirina cuesta $3500 por caja de 10 comprimidos.",
    "Para quemaduras leves recomendamos cremas con aloe vera o lidocaína, siempre se aconseja consultar con su médico de cabecera.",
    "El inhalador debe usarse según las indicaciones médicas corresponcdientes.",
    "Sí, ofrecemos la posibilidad de comprar medicamentos por internet.",
    "El oxímetro tiene un precio de $32500.",
    "Sí, tenemos jeringas estériles disponibles en diferentes tamaños."
    ]
}

In [21]:
# Creación del DataFrame
df = pd.DataFrame(datos)

# Inicializo el vectorizador TF-IDF
vectorizer = TfidfVectorizer()

# Ajusto y transformo las preguntas
tfidf_matrix = vectorizer.fit_transform(df['preguntas'])

In [23]:
# Defino la función para las respuestas del chatbot
def respuesta(imput):
    # Transformo la entrada del usuario en una representación númerica
    user_tfidf = vectorizer.transform([imput])

    # Calculo la similitud del coseno entre el vector de la pregunta del usuario y el de las preguntas almacenadas
    cosine_similarities = cosine_similarity(user_tfidf, tfidf_matrix).flatten()

    # Se busca el índice de la pregunta con mayor similitud
    index = np.argmax(cosine_similarities)

    # Se constata que la similitud sea suficiente (mayor a 0.1)
    if cosine_similarities[index] < 0.1:
        return "Disculpa, reformula tu pregunta, puede que no tenga esta información."
    # Devuelve la respuesta asociada si la similitud es sufientemente alta
    return df['respuestas'][index]

# Prueba de funcionamiento
# Se ejecuta un bucle para recibir las preguntas del usuario y responder con la respuesta asociada a la pregunta almacenada mas similar
# El bucle se rompe si el usuario tipea "salir"
if __name__ == "__main__":
    while True:
        entrada = input("Ingresa una pregunta (Escribe 'salir' para finalizar): ")
        if entrada.lower() == 'salir':
            break
        respuesta_chat = respuesta(entrada)
        print(f"Respuesta: {respuesta_chat}")

Ingresa una pregunta (Escribe 'salir' para finalizar): puedo pagar con tarjeta de crédito?
Respuesta: Aceptamos pagos con tarjeta de crédito, débito, transferencias y efectivo.
Ingresa una pregunta (Escribe 'salir' para finalizar): que puedo comprar para quemaduras?
Respuesta: Para quemaduras leves recomendamos cremas con aloe vera o lidocaína, siempre se aconseja consultar con su médico de cabecera.
Ingresa una pregunta (Escribe 'salir' para finalizar): Tienen ibuprofeno 600?
Respuesta: El ibuprofeno tiene un precio de $3500 por la presentación de 400 mg.
Ingresa una pregunta (Escribe 'salir' para finalizar): puedo comprar por internet?
Respuesta: Sí, ofrecemos la posibilidad de comprar medicamentos por internet.
Ingresa una pregunta (Escribe 'salir' para finalizar): Tienen aspirina?
Respuesta: La aspirina cuesta $3500 por caja de 10 comprimidos.
Ingresa una pregunta (Escribe 'salir' para finalizar): Salir


## Segundo Chatbot (utilizando embeddings)

In [24]:
#importo spacy
import spacy


In [25]:
!python -m spacy download es_core_news_md

Collecting es-core-news-md==3.7.0
  Downloading https://github.com/explosion/spacy-models/releases/download/es_core_news_md-3.7.0/es_core_news_md-3.7.0-py3-none-any.whl (42.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m42.3/42.3 MB[0m [31m18.1 MB/s[0m eta [36m0:00:00[0m
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('es_core_news_md')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [26]:
# Cargo el modelo de SpaCy en español y proceso las preguntas
nlp = spacy.load('es_core_news_md')
question_docs = [nlp(pregunta) for pregunta in df['preguntas']]

In [34]:
# Defino la función que buscará la respuesta mas acorde para la pregunta hecha por el usuario
def buscar_respuesta(pregunta_usuario):
    vector_pregunta = nlp(pregunta_usuario).vector # Convierte la pregunta del usuario en un vector
    similitud = [] # creo una lista donde se almacenarán los valores de similitud para la pregunta del usuario
# Itero sobre cada pregunta del dataframe para buscar la mayor similitud entre la pregunta del usuario y las almacenadas
    for index, row in df.iterrows():
        vector_respuesta = nlp(row['preguntas']).vector
        similaridad = cosine_similarity([vector_pregunta], [vector_respuesta])[0][0]
        similitud.append(similaridad)
# calculadas las similitudes se busca el índice del valor máximo de similitudes y devuelve la respuesta de ese índice.
    mejor_indice = np.argmax(similitud)
    return df.iloc[mejor_indice]['respuestas']

# Ejemplo de uso:  un bucle continuo, preguntando al usuario por nuevas preguntas hasta que escriba "salir" para terminar la ejecución.
if __name__ == "__main__":
    while True:
        pregunta_usuario = input("Ingresa una pregunta (Escribe 'salir' para finalizar): ")
        if pregunta_usuario.lower() == 'salir':
            break
        respuesta = buscar_respuesta(pregunta_usuario)
        print(f"Respuesta: {respuesta}")

Ingresa una pregunta (Escribe 'salir' para finalizar): hola, cual es el horario de atencion?
Respuesta: Nuestro horario es de lunes a viernes de 8:00 a.m. a 20:30 p.m., y los sábados de 8:00 a.m. a 13:00 p.m.
Ingresa una pregunta (Escribe 'salir' para finalizar): aceptan tarjeta de credito?
Respuesta: Aceptamos pagos con tarjeta de crédito, débito, transferencias y efectivo.
Ingresa una pregunta (Escribe 'salir' para finalizar): hacen descuentos a adultos mayores o jubilados?
Respuesta: Sí, ofrecemos un descuento del 10% en medicamentos a personas mayores de 60 años.
Ingresa una pregunta (Escribe 'salir' para finalizar): que puedo comprar para quemaduras?
Respuesta: Para quemaduras leves recomendamos cremas con aloe vera o lidocaína, siempre se aconseja consultar con su médico de cabecera.
Ingresa una pregunta (Escribe 'salir' para finalizar): puedo devolverlo si esta vencido?
Respuesta: Puede devolver productos defectuosos dentro de los primeros 7 días después de la compra, acompañado

## Enfoque y Aproximación

 * El enfoque adoptado para crear un chatbot de atención a preguntas frecuentes en una farmacia se basa en el uso combinado de TF-IDF (Term Frequency-Inverse Document Frequency) y la similitud del coseno para identificar y responder de manera precisa a las consultas más frecuentes de los usuarios.

TF-IDF: Este algoritmo transforma las preguntas del usuario en vectores numéricos, considerando la frecuencia de las palabras tanto dentro de la consulta como en el conjunto de datos de preguntas frecuentes de la farmacia. Esto permite que el chatbot identifique palabras clave como nombres de medicamentos, síntomas o tratamientos comunes, haciendo que las respuestas sean más precisas y relevantes.

Similitud del Coseno: Utilizada para medir la similitud entre el vector de entrada del usuario y los vectores de las preguntas almacenadas en el dataset de preguntas frecuentes. Este método permite al chatbot encontrar la pregunta más cercana a la consulta del usuario, garantizando que se le brinde la mejor respuesta posible.

## Experiencia
Durante el desarrollo del chatbot de la farmacia fui notando que hay muchos aspectos que hacen dificultoso que el chatbot funcione de manera eficiente. Por ejemplo:


- Es fundamental la creación de un dataset con preguntas y respuestas claras y específicas para garantizar la precisión del chatbot. Las preguntas frecuentes pueden abarcar temas como dosis de medicamentos, efectos secundarios, contraindicaciones y horarios de atención. La calidad de estas preguntas y respuestas directamente influye en la efectividad del sistema y muchas veces fallaba en una respuesta por el hecho de utilizar palabras iguales en distintas preguntas.
 - Otro elemento importante es probar el chatbot continuamente y hacer mejoras basadas en los comentarios de los usuarios. Si el chatbot da respuestas poco claras o no entiende bien algunas preguntas, el sistema puede ajustarse agregando más ejemplos o afinando las respuestas. Esto lo noté al probar el uso y ver que en muchos casos no respondía lo esperado, lo solucionaba simplemente reformulando alguna pregunta almacenada.
- También es decisivo ajustar el umbral, establecer un límite para evitar respuestas incorrectas. Si la consulta del usuario no se parece lo suficiente a las preguntas almacenadas (por ejemplo, la similitud es menor a un 10%), el chatbot puede pedir más detalles o redirigir al usuario a un especialista en lugar de dar una respuesta inexacta
- En resumen el chatbot funciona, pero es muy evidente que necesita de muchos ajustes y pruebas/retroalimentación para poder llegar a ser razonablemente eficiente.


## Beneficios para la Farmacia
Este enfoque permitiria desarrollar un chatbot efectivo y funcional para una farmacia, lo que facilita la interacción entre los clientes y el personal farmacéutico. Al automatizar las respuestas a preguntas frecuentes, se pueden resolver consultas comunes de manera rápida y eficiente, lo que reduce el tiempo de espera y mejora la satisfacción del cliente. Además, el chatbot puede proporcionar orientación básica sobre medicamentos y servicios, y en situaciones donde no pueda responder con precisión, puede redirigir al usuario a un farmacéutico o a atención médica especializada.

