# Embedding of the Bible Interpreted

### Setting the working directory, loading libraries and data

In [38]:
# Importing library
import json
import pandas as pd
import os

# Function to set the wd as the root of the repository
def find_repo_root(repo_name):
    current_dir = os.getcwd()
    while current_dir != '/':
        if os.path.basename(current_dir) == repo_name:
            return current_dir
        current_dir = os.path.dirname(current_dir)
    raise FileNotFoundError(f"Repository root '{repo_name}' not found.")

# Setting the working directory
repo_name = 'orare-model'
repo_root = find_repo_root(repo_name)
os.chdir(repo_root)

# Loading the data
with open('bible/data/bible_by_theme_int.json') as f:
    data = json.load(f)

# Converting json into df
bible_data = pd.DataFrame(data)
bible_data.head()

Unnamed: 0,id,pasaje,texto,interpretación,temas,área_vida
0,vec1,1 Corintios 10:12,"Así que, el que piensa estar firme, mire no ca...",Este versículo nos advierte sobre la importanc...,[orgullo],"[Desarrollo/crecimiento personal, Salud mental..."
1,vec2,1 Corintios 10:13,"No os ha tomado tentación, sino humana: mas fi...",Este versículo nos asegura que cualquier tenta...,"[crecimiento espiritual, maternidad, vicio]","[Salud mental/emocional, Desarrollo/crecimient..."
2,vec3,1 Corintios 10:31,"Si pues coméis, ó bebéis, ó hacéis otra cosa, ...",Este versículo nos enseña que todas nuestras a...,[descanso y vacaciones],"[Misión de vida, Desarrollo/crecimiento personal]"
3,vec4,1 Corintios 11:9,Porque tampoco el varón fué criado por causa d...,Este versículo refleja una perspectiva cultura...,[creación/evolución],[Relaciones familiares/pareja]
4,vec5,1 Corintios 13:13,"Y ahora permanecen la fe, la esperanza, y la c...","En este versículo, San Pablo destaca tres virt...",[amor],"[Relaciones familiares/pareja, Amistad, Desarr..."


### Setting the connection to OpenAI API to do the embeddings

In [9]:
# Setting the libraries and connection
import openai
import os

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())

# Loading api_key
openai.api_key = os.getenv('OPENAI_API_KEY')

# Using OpenAI API to do the embeddings
client = openai.OpenAI()

### Applying the embeddings

In [None]:
# Function to apply the embeddings
def get_embedding(text, model="text-embedding-3-small"):
   text = text.replace("\n", " ")
   return client.embeddings.create(input = [text], model=model).data[0].embedding

In [13]:
# Applying the embeddings
bible_data['texto_vector'] = bible_data.texto.apply(lambda x: get_embedding(x, model='text-embedding-3-small'))
bible_data['interpretacion_vector'] = bible_data.interpretación.apply(lambda x: get_embedding(x, model='text-embedding-3-small'))

In [None]:
# Saving the embeddings in a file
bible_data.to_csv('bible/data/bible_by_theme_int_embedding.txt',sep='|',index=False, encoding='utf-8')