# Aplicación de Consultas de documentos mediante GPT

## Descripción
El proyecto consiste en desarrollar una aplicación en Python que permita cargar un documento como input y realizar consultas específicas sobre dicho documento utilizando un [agente de Langchain](https://github.com/langchain-ai/langchain/blob/master/cookbook/analyze_document.ipynb) y OpenAI. Se espera que la aplicación tenga las siguientes características:

- Un template de frontend que permita la interacción del usuario para cargar el documento y realizar preguntas. También tiene que estar disponible mediante un endpoint, donde se le pueda hacer una petición con un documento y una pregunta, y le devuelva una respuesta.
- Implementación de conexiones y flujos de información para realizar llamadas a las APIs de Langchain y OpenAI.
- Utilización de una base de datos desplegada en AWS para almacenar las preguntas realizadas y sus respectivas respuestas.
- Creación de un repositorio en DockerHub con la imagen de la aplicación para facilitar su despliegue.

<p align="center">
<img src="img/arquitectura.png">
</p>

## Entregables 
El repositorio de Github:

1. Código fuente y scrips necesarios de la aplicación en Python.
2. Tests realizados a la app.
2. Scripts o archivos necesarios para desplegar la base de datos en AWS.
3. Dockerfile utilizado para construir la imagen de la aplicación y el repositorio en DockerHub con dicha imagen.
4. Documentación necesaria.


## Fecha de Entrega

La fecha límite de entrega para el proyecto es **martes 19 a las 9.00**.
Estaréis divididos en los 4 grupos utilizados para el taller de marketing y cada grupo presentará el proyecto junto con una demo de máximo 10 minutos en total.

In [None]:
# Recomendación de versiones de las librerías para que funcione correctamente
# !pip install langchain==0.0.316
# !pip install openai==0.28.1

In [16]:
# import psycopg2

# db_host = 'database-1.cuwmrnsvir86.eu-north-1.rds.amazonaws.com'
# db_port = '5432'
# db_name = 'database-1'
# db_user = 'postgres'
# db_password = '3hAJvId8YgRrariiO4Gi'

# conn_string = f"host={db_host} port={db_port} dbname={db_name} user={db_user} password={db_password}"

# try:
#     connection = psycopg2.connect(conn_string)
#     print("Conexión exitosa a la base de datos.")

# except Exception as e:
#     print(f"Error al conectar a la base de datos: {e}")

# finally:
#     if connection:
#         connection.close()
#         print("Conexión cerrada.")

In [17]:
import sqlite3
db_file = 'bbdd_pruebas.db'

conn = sqlite3.connect(db_file)

cursor = conn.cursor()

create_table_query = '''
CREATE TABLE IF NOT EXISTS consultas_respuestas (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    consulta TEXT NOT NULL,
    respuesta TEXT NOT NULL
);
'''

cursor.execute(create_table_query)

conn.commit()

cursor.close()
conn.close()

In [20]:
import sqlite3

def guardar_en_base_de_datos(question, response):
    # Nombre del archivo de la base de datos
    db_file = 'bbdd_pruebas.db'

    # Crear una conexión a la base de datos (esto también crea el archivo si no existe)
    conn = sqlite3.connect(db_file)

    # Crear un cursor para ejecutar comandos SQL
    cursor = conn.cursor()

    try:
        # Comando SQL para insertar datos en la tabla
        insert_data_query = 'INSERT INTO consultas_respuestas (consulta, respuesta) VALUES (?, ?)'

        # Ejecutar el comando SQL para insertar los datos
        cursor.execute(insert_data_query, (question, response))

        # Confirmar la inserción de datos
        conn.commit()

        print("Datos insertados en la base de datos.")
    except Exception as e:
        # En caso de un error, imprimirlo
        print(f"Error al insertar datos en la base de datos: {e}")
    finally:
        # Cerrar el cursor y la conexión
        cursor.close()
        conn.close()

In [21]:
from langchain.chains import AnalyzeDocumentChain
from langchain.chat_models import ChatOpenAI
from langchain.chains.question_answering import load_qa_chain


llm = ChatOpenAI(model="gpt-3.5-turbo", openai_api_key="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")

qa_chain = load_qa_chain(llm, chain_type="map_reduce")

qa_document_chain = AnalyzeDocumentChain(combine_docs_chain=qa_chain)

with open("demo/prueba.txt") as f:
    file = f.read()

consulta = "Crear una publicación para Twitter basándote en el archivo prueba.txt"

response = qa_document_chain.run(
    input_document=file,
    question=consulta
)

print(response)

guardar_en_base_de_datos(consulta, response)

"¡Que la Fuerza esté contigo! Descubre la épica saga de Star Wars, que desde 1977 ha cautivado a audiencias en todo el mundo. Jedi, Sith, batallas épicas y personajes icónicos te esperan en esta galaxia muy, muy lejana. ¡No te pierdas la oportunidad de sumergirte en esta aventura intergaláctica! 🚀🎥 #StarWars #Cine #CulturaPop"
Datos insertados en la base de datos.
