# Chatbot para inmobiliaria utilizando GPT

Fecha: 28/04/2023

## Objetivo:

Crear un chatbot que permita responder preguntas a partir de un archivo en formato PDF. El archivo debe de tener texto que permita al chatbot responder preguntas realizadas por un usuario.

El chatbot estará entrenado con datos relacionados al rubro de inmobiliaria.

## Procedimiento:

Considerar la secuencia de pasos indicados.

Los archivos PDF deberán ubicarse en la carpeta o directorio `/content/datos`. Debajo en el código aparece la línea de comando para crear esta carpeta.



## Referencias:

- Word embedding [https://youtu.be/-XVkdIdli0I](https://youtu.be/-XVkdIdli0I)

- Cómo Usar ChatGPT Sobre Información Interna De Tu Negocio [https://youtu.be/hVXpAh1FQCQ?t=725](https://youtu.be/hVXpAh1FQCQ?t=725)


## Paso 0: Conectar a Google Drive



In [None]:
# Conexión con Google Drive
#from google.colab import drive
#drive.mount('/content/drive')

Mounted at /content/drive


## Paso 1: Configuración e instalación de librerías

### Instalar librerías

- langchain: Interactuar con LLMs
- llama-index: Chunks e indexar

In [None]:
!pip install PyPDF2

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting PyPDF2
  Downloading pypdf2-3.0.1-py3-none-any.whl (232 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m232.6/232.6 kB[0m [31m13.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: PyPDF2
Successfully installed PyPDF2-3.0.1


In [None]:
!pip install openai langchain llama-index==0.5.25

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting openai
  Downloading openai-0.27.5-py3-none-any.whl (71 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m71.6/71.6 kB[0m [31m4.2 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting langchain
  Downloading langchain-0.0.152-py3-none-any.whl (666 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m666.9/666.9 kB[0m [31m26.7 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting llama-index
  Downloading llama_index-0.5.27.tar.gz (190 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m190.6/190.6 kB[0m [31m17.9 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting aiohttp
  Downloading aiohttp-3.8.4-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.0/1.0 MB[0m [31m38.8 MB/s[0m eta [36m0:00:00[0m
Collecting d

### Importar librerías

In [None]:
import os
import pandas as pd
import openai
from llama_index import GPTSimpleVectorIndex, SimpleDirectoryReader, LLMPredictor, ServiceContext
from langchain.chat_models import ChatOpenAI
import textwrap

# Procesar datos de PDF
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import CharacterTextSplitter

#import gradio as gr
from openai.embeddings_utils import get_embedding
from openai.embeddings_utils import cosine_similarity

### Clases

#### Clase ChatBotInmobiliaria

In [None]:
class ChatBotInmobiliaria():
    def __init__(self):
        self.embedding_engine = "text-embedding-ada-002"
        self.model_name = "gpt-3.5-turbo"
        self.index = None
    
    def create_dataset(self, directory_path, filepath_dataset):
        # directory_path: Directorio donde se ubican los archivos PDF.
        # filepath_dataset: Nombre del archivo JSON vectorizado.
        if directory_path != None:
            #Leer los PDFs
            pdf = SimpleDirectoryReader(directory_path).load_data()
            #Definir e instanciar el modelo
            modelo = LLMPredictor(llm=ChatOpenAI(temperature=0, model_name=self.model_name))
            #Indexar el contenido de los PDFs
            service_context = ServiceContext.from_defaults(llm_predictor=modelo)
            self.index = GPTSimpleVectorIndex.from_documents(pdf, service_context = service_context)
            self.__save_model(filepath_dataset)

    def __save_model(self, filepath):
        #Guardar el índice a disco para no tener que repetir cada vez
        #Recordar que necesistaríamos persistir el drive para que lo mantenga
        self.index.save_to_disk(filepath)
    
    def load_dataset(self, filepath):
        #Cargar el índice del disco
        self.index = GPTSimpleVectorIndex.load_from_disk(filepath)

    def ask(self, question=""):
        if len(question) == 0:
            print("Debe de ingresar una pregunta.")
        try:
            respuesta = self.index.query(question)
            for frase in textwrap.wrap(respuesta.response, width=100):
                print(frase)
        except Exception as e:
            print(e)

## Paso 2: Configurar variables

In [None]:
# Crear la carpeta datos y mover los archivos PDF a esa carpeta

dataset_directory = "/content/datos"

if os.path.exists(dataset_directory) == False:
    os.mkdir(dataset_directory)

In [None]:
# API de OpenAI
os.environ["OPENAI_API_KEY"] = "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"

DATASET_INMOBILIARIA_JSON = "demo-inmobiliaria.json"

## Paso 3: Procesamiento

In [None]:
chatbot = ChatBotInmobiliaria()

In [None]:
# CUIDADO !!
#
# Carga los datos del PDF y los guarda en un archivo JSON.
# Si ya existe el archivo JSON, obviar este paso.
#

#chatbot.create_dataset(dataset_directory, DATASET_INMOBILIARIA_JSON)



In [None]:
chatbot.load_dataset(DATASET_INMOBILIARIA_JSON)

### Testing

In [None]:
# Ejemplos:
# ¿Cuánto es el precio promedio de una vivienda?
# ¿Qué regulaciones tengo para comprar una vivienda?
# Qué riesgos debo tener en cuenta para comprar una inmobiliaria?
# qué influencia europea hay en la compra de una vivienda?

while True:
    pregunta = input('Escribe tu pregunta   \n') + "Responde en español" 
    chatbot.ask(pregunta)

Escribe tu pregunta   
¿Cuánto es el precio promedio de una vivienda?
 No hay suficiente información para determinar el precio promedio de una vivienda. La información
proporcionada se refiere principalmente a la política pública frente al problema de acceso a la
vivienda de vastos sectores sociales, el aumento del precio de la tierra, la internalización de
ciertas áreas con valores internacionales, y la problemática habitacional.
Escribe tu pregunta   
¿Qué regulaciones tengo para comprar una vivienda?
 Para comprar una vivienda, debería asegurarse de que cumpla con los marcos jurídicos vigentes en el
país, especialmente si el país está sujeto a sanciones, bloqueos económicos u otras medidas
similares dispuestas por organizaciones internacionales como las Naciones Unidas. Debería conocer la
ubicación de la propiedad inmueble, dónde están situados el comprador y el vendedor y cuál es el
propósito y la naturaleza de la relación comercial dentro del país. También debería verificar si los

KeyboardInterrupt: ignored