# Creating the VectorDatabase

Here we only create the vector database to use later with langchain

In [1]:
from langchain_community.document_loaders import CSVLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_openai import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from dotenv import load_dotenv, find_dotenv

Vector Database Setup: Initialize and configure ChromaDB or a similar vector database to store real estate listings.

In [2]:
loader = CSVLoader('documents.csv', encoding='utf-8')
docs = loader.load()
docs[:2]

[Document(page_content='links: https://img10.naventcdn.com/avisos/20/00/60/64/59/75/720x532/322923269.jpg\ndescription: Proyecto de apartamentos , Panamá · Apartamentos en San Francisco - PH Aurora\napartment_description: Planifícate y Vive en ph Aurora, ubicado en el lugar mas "trendy" de la Ciudad de Panamá: San Francisco; cerca de restaurantes, malls, galerías de arte, bancos, supermercados, tiendas de mascotas y mucho más. Mejora tu estilo de vida y disfruta vivir en un lugar moderno y céntrico. Ph Aurora es un proyecto que cuenta con 3 niveles de área social y apartamentos con excelente distribución. No esperes más y contáctanos, te asesoramos para que cumplas este gran sueño de "amanecer en tu nuevo hogar". Para tours virtuales, plantas y disponibilidad, visita phaurora. Co m\nsqm: 126\nroom: 2\nbathroom: 0\nparking: 0\nneighborhood: San Francisco\nprice: 255000\nneighborhood_description: San Francisco en Panamá es una vecindad vibrante y cosmopolita, perfecta para aquellos que b

Generating and Storing Embeddings: Convert the LLM-generated listings into suitable embeddings that capture the semantic content of each listing, and store these embeddings in the vector database.

In [3]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs_splits = text_splitter.split_documents(docs)

In [4]:
load_dotenv(find_dotenv())
embedding = OpenAIEmbeddings()
Chroma.from_documents(docs, embedding=embedding, persist_directory="./chroma_db") 

<langchain_community.vectorstores.chroma.Chroma at 0x1de95ac9e80>