In [1]:
from dotenv import load_dotenv
import openai
import os
from llama_index.core import (
    VectorStoreIndex, 
    SimpleDirectoryReader, 
    StorageContext, 
    load_index_from_storage
)
load_dotenv()

True

In [2]:
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.core import Settings

embed_model = HuggingFaceEmbedding(model_name="BAAI/bge-small-en-v1.5")
Settings.embed_model = embed_model

In [3]:
PERSIST_DIR = "storage_local_embeddings"

if not os.path.exists(PERSIST_DIR):
    documents = SimpleDirectoryReader("data").load_data()
    index = VectorStoreIndex.from_documents(documents, show_progress=True)
    index.storage_context.persist(persist_dir=PERSIST_DIR)
else:
    storage_context = StorageContext.from_defaults(persist_dir=PERSIST_DIR) 
    index = load_index_from_storage(storage_context)

In [4]:
# query_engine = index.as_query_engine()
chat_engine = index.as_chat_engine()

In [6]:
response = chat_engine.chat("cual es el numero de embarazos adolescentes en bolivia en 2022?")

huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


In [7]:
from IPython.display import Markdown, display
display(Markdown(response.response))

El número de embarazos adolescentes en Bolivia en 2022 fue de 35,250 casos. De estos, 2,119 correspondían al grupo de edad de 10 a 14 años y 33,131 eran embarazos del grupo de 15 a 19 años.

In [8]:
response2 = chat_engine.chat("hubo un incremento con respecto al año anterior?")

In [9]:
display(Markdown(response2.response))

El número de embarazos adolescentes en Bolivia en 2022 disminuyó en comparación con el año anterior.