# Aplicación de Consultas de documentos mediante GPT

## Descripción
El proyecto consiste en desarrollar una aplicación en Python que permita cargar un documento como input y realizar consultas específicas sobre dicho documento utilizando un [agente de Langchain](https://github.com/langchain-ai/langchain/blob/master/cookbook/analyze_document.ipynb) y OpenAI. Se espera que la aplicación tenga las siguientes características:

- Un template de frontend que permita la interacción del usuario para cargar el documento y realizar preguntas. También tiene que estar disponible mediante un endpoint, donde se le pueda hacer una petición con un documento y una pregunta, y le devuelva una respuesta.
- Implementación de conexiones y flujos de información para realizar llamadas a las APIs de Langchain y OpenAI.
- Utilización de una base de datos desplegada en AWS para almacenar las preguntas realizadas y sus respectivas respuestas.
- Creación de un repositorio en DockerHub con la imagen de la aplicación para facilitar su despliegue.

<p align="center">
<img src="img/arquitectura.png">
</p>

## Entregables 
El repositorio de Github:

1. Código fuente y scrips necesarios de la aplicación en Python.
2. Tests realizados a la app.
2. Scripts o archivos necesarios para desplegar la base de datos en AWS.
3. Dockerfile utilizado para construir la imagen de la aplicación y el repositorio en DockerHub con dicha imagen.
4. Documentación necesaria.


## Fecha de Entrega

La fecha límite de entrega para el proyecto es **martes 19 a las 9.00**.
Estaréis divididos en los 4 grupos utilizados para el taller de marketing y cada grupo presentará el proyecto junto con una demo de máximo 10 minutos en total.

In [None]:
# Recomendación de versiones de las librerías para que funcione correctamente
# !pip install langchain==0.0.316
# !pip install openai==0.28.1

In [3]:
from langchain.chains import AnalyzeDocumentChain
from langchain.chat_models import ChatOpenAI
from langchain.chains.question_answering import load_qa_chain

llm = ChatOpenAI(model="gpt-3.5-turbo", openai_api_key="")

qa_chain = load_qa_chain(llm, chain_type="map_reduce")

qa_document_chain = AnalyzeDocumentChain(combine_docs_chain=qa_chain)

with open("demo/test_api.py") as f:
    file = f.read()

response = qa_document_chain.run(
    input_document=file,
    question="What is this python script about? Explain it in a didactic way and in spanish",
)

print(response)

Este script de Python es una herramienta automatizada que realiza pruebas en un API local. Imagina que el API es como una especie de servidor que puede recibir diferentes tipos de solicitudes y devolver respuestas. El script se encarga de hacer tres pruebas diferentes en este API.

La primera prueba consiste en enviar datos al API a través de un endpoint llamado "ingest". Estos datos son una lista de listas, donde cada lista representa una fila de información. Después de enviar los datos, el script verifica si el API responde con un código de estado 200, lo cual significa que la solicitud fue exitosa. También verifica si el API devuelve un mensaje que dice "Datos ingresados correctamente", lo cual confirma que los datos se ingresaron de manera correcta.

La segunda prueba se enfoca en el endpoint de "predict". Aquí, el script envía al API una lista de valores numéricos. Luego, verifica si el API responde con un código de estado 200 y si la respuesta contiene la clave 'prediction'. Esto