# Embedding of the Bible Interpreted

## OpenAI client and Embedding Function

In [49]:
# Creating OpenAI Client
import openai
import os

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())

# Loading api_key
openai.api_key = os.getenv('OPENAI_API_KEY')

# Using OpenAI API to do the embeddings
client = openai.OpenAI()

In [13]:
# Function to apply the embeddings
def get_embedding(text, model="text-embedding-3-small"):
   text = text.replace("\n", " ")
   return client.embeddings.create(input = [text], model=model).data[0].embedding

## Bible by theme interpreted: v1

In [14]:
# Importing library
import json
import pandas as pd
import os
from utils.os_utils import find_repo_root

# Setting the working directory
repo_root = find_repo_root()
os.chdir(repo_root)

# Loading the data
with open('bible/data/bible_by_theme_int_v1.json') as f:
    data = json.load(f)

# Converting json into df
bible_data = pd.DataFrame(data)
bible_data.head()

Unnamed: 0,id,pasaje,texto,interpretación,temas,área_vida
0,vec1,1 Corintios 10:12,"Así que, el que piensa estar firme, mire no ca...",Este versículo nos advierte sobre la importanc...,[orgullo],"[Desarrollo/crecimiento personal, Salud mental..."
1,vec2,1 Corintios 10:13,"No os ha tomado tentación, sino humana: mas fi...",Este versículo nos asegura que cualquier tenta...,"[crecimiento espiritual, maternidad, vicio]","[Salud mental/emocional, Desarrollo/crecimient..."
2,vec3,1 Corintios 10:31,"Si pues coméis, ó bebéis, ó hacéis otra cosa, ...",Este versículo nos enseña que todas nuestras a...,[descanso y vacaciones],"[Misión de vida, Desarrollo/crecimiento personal]"
3,vec4,1 Corintios 11:9,Porque tampoco el varón fué criado por causa d...,Este versículo refleja una perspectiva cultura...,[creación/evolución],[Relaciones familiares/pareja]
4,vec5,1 Corintios 13:13,"Y ahora permanecen la fe, la esperanza, y la c...","En este versículo, San Pablo destaca tres virt...",[amor],"[Relaciones familiares/pareja, Amistad, Desarr..."


In [19]:
bible_data['id'] = bible_data['id'].str.replace('vec', '').astype(int)
bible_data.rename(columns={'interpretación':'interpretacion', 'área_vida':'area_vida'},inplace=True)

In [10]:
# Applying the embeddings
bible_data['interpretacion_vector'] = bible_data.interpretacion.apply(lambda x: get_embedding(x, model='text-embedding-3-small'))

In [5]:
# Saving the embeddings in a file
bible_data.to_csv('bible/data/bible_by_theme_int_emb_v1.txt',sep='|',index=False, encoding='utf-8')

## Bible by theme interpreted: v2

In [21]:
# Importing library
import json
import pandas as pd
import os
from utils.os_utils import find_repo_root

# Setting the working directory
repo_root = find_repo_root()
os.chdir(repo_root)

# Loading the data
with open('bible/data/bible_by_theme_int_v2.json') as f:
    data = json.load(f)

# Converting json into df
bible_data = pd.DataFrame(data)
bible_data.head()

Unnamed: 0,id,pasaje,texto,interpretación,temas
0,vec1,1 Corintios 10:12,"Así que, el que piensa estar firme, mire no ca...",Este pasaje nos recuerda la importancia de la ...,[orgullo]
1,vec2,1 Corintios 10:13,"No os ha tomado tentación, sino humana: mas fi...",Este pasaje nos recuerda que las tentaciones y...,"[crecimiento espiritual, maternidad, vicio]"
2,vec3,1 Corintios 10:31,"Si pues coméis, ó bebéis, ó hacéis otra cosa, ...",Este pasaje nos recuerda que todas nuestras ac...,[descanso y vacaciones]
3,vec4,1 Corintios 11:9,Porque tampoco el varón fué criado por causa d...,Este pasaje de la primera carta a los Corintio...,[creación/evolución]
4,vec5,1 Corintios 13:13,"Y ahora permanecen la fe, la esperanza, y la c...",Este pasaje subraya la importancia de tres vir...,[amor]


In [22]:
bible_data['id'] = bible_data['id'].str.replace('vec', '').astype(int)
bible_data.rename(columns={'interpretación':'interpretacion'},inplace=True)

In [None]:
# Applying the embeddings
bible_data['interpretacion_vector'] = bible_data.interpretacion.apply(lambda x: get_embedding(x, model='text-embedding-3-small'))

In [None]:
# Saving the embeddings in a file
bible_data.to_csv('bible/data/bible_by_theme_int_emb_v2.txt',sep='|',index=False, encoding='utf-8')

## Catholic Bible interpreted: v3 - OpenAI - Embedding Large

In [34]:
# Importing library
import json
import pandas as pd
import os
from utils.os_utils import find_repo_root

# Setting the working directory
repo_root = find_repo_root()
os.chdir(repo_root)

# Loading the data
with open('bible/data/cat_bible_int_openai.json') as f:
    data = json.load(f)

# Converting json into df
bible_data = pd.DataFrame(data)
bible_data.head()

Unnamed: 0,pasaje,texto,area_vida,interpretacion
0,1 Corintios 10:12,"Por eso, el que se cree muy seguro, ¡cuídese d...",[orgullo],"Un gerente de una empresa, confiado en su expe..."
1,1 Corintios 10:13,"Hasta ahora, ustedes no tuvieron tentaciones q...","[crecimiento espiritual, maternidad, vicio]","Imagina a Laura, una joven profesional que se ..."
2,1 Corintios 10:31,"En resumen, sea que ustedes coman, sea que beb...",[descanso y vacaciones],Anna es una joven profesional que trabaja en u...
3,1 Corintios 11:9,"ni fue creado el hombre a causa de la mujer, s...",[creación/evolución],"En una moderna empresa de tecnología, el papel..."
4,1 Corintios 13:13,"En una palabra, ahora existen tres cosas: la f...",[amor],"Imagina un grupo de amigos que, a pesar de viv..."


In [35]:
# Creating an id column
bible_data['id'] = bible_data.index + 1
bible_data = bible_data[['id','pasaje','texto','interpretacion','area_vida']]
bible_data


Unnamed: 0,id,pasaje,texto,interpretacion,area_vida
0,1,1 Corintios 10:12,"Por eso, el que se cree muy seguro, ¡cuídese d...","Un gerente de una empresa, confiado en su expe...",[orgullo]
1,2,1 Corintios 10:13,"Hasta ahora, ustedes no tuvieron tentaciones q...","Imagina a Laura, una joven profesional que se ...","[crecimiento espiritual, maternidad, vicio]"
2,3,1 Corintios 10:31,"En resumen, sea que ustedes coman, sea que beb...",Anna es una joven profesional que trabaja en u...,[descanso y vacaciones]
3,4,1 Corintios 11:9,"ni fue creado el hombre a causa de la mujer, s...","En una moderna empresa de tecnología, el papel...",[creación/evolución]
4,5,1 Corintios 13:13,"En una palabra, ahora existen tres cosas: la f...","Imagina un grupo de amigos que, a pesar de viv...",[amor]
...,...,...,...,...,...
853,854,Tito 2:13,mientras aguardamos la feliz esperanza y la Ma...,Imagínate a una familia que ha estado separada...,"[Jesús, el hijo de Dios - simplicidad]"
854,855,Tito 2:15,"Así debes hablar, exhortar y reprender con tod...",Un gerente de una oficina ha notado que la mor...,[convicción]
855,856,Tito 3:5,no por las obras de justicia que habíamos real...,Una joven llamada Ana ha dedicado su vida a ay...,[salvación]
856,857,Zacarías 10:12,"Yo los fortaleceré en el Señor, y ellos avanza...",Imagina a un grupo de jóvenes emprendedores qu...,[fuerza y ánimo]


In [36]:
# Applying the embeddings
# Using the text-embedding-3-large model
bible_data['interpretacion_vector'] = bible_data.interpretacion.apply(lambda x: get_embedding(x, model='text-embedding-3-large'))

In [38]:
# Saving the embeddings in a file
bible_data.to_csv('bible/data/cat_bible_int_openai_emb.txt',sep='|',index=False, encoding='utf-8')

## Catholic Bible interpreted: v3 - Claude -  Embedding Large

In [50]:
# Importing library
import json
import pandas as pd
import os
from utils.os_utils import find_repo_root

# Setting the working directory
repo_root = find_repo_root()
os.chdir(repo_root)

# Loading the data
with open('bible/data/cat_bible_int_claude.json') as f:
    data = json.load(f)

# Converting json into df
bible_data = pd.DataFrame(data)
bible_data.head()

Unnamed: 0,id,pasaje,texto,interpretacion,area_vida
0,1,1 Corintios 10:12,"Por eso, el que se cree muy seguro, ¡cuídese d...",Un estudiante universitario que ha mantenido e...,[orgullo]
1,2,1 Corintios 10:13,"Hasta ahora, ustedes no tuvieron tentaciones q...",Una madre soltera lucha con la tentación de ro...,"[crecimiento espiritual, maternidad, vicio]"
2,3,1 Corintios 10:31,"En resumen, sea que ustedes coman, sea que beb...",Un atleta profesional decide donar una parte s...,[descanso y vacaciones]
3,4,1 Corintios 11:9,"ni fue creado el hombre a causa de la mujer, s...","En una empresa tecnológica, un equipo de desar...",[creación/evolución]
4,5,1 Corintios 13:13,"En una palabra, ahora existen tres cosas: la f...","En medio de una crisis global, como una pandem...",[amor]


In [47]:
#repo_root = './orare-model/'
os.getcwd()

'/Users/hiroshi/Documents/ds_projects/orare-model'

In [51]:
# Applying the embeddings
# Using the text-embedding-3-large model
bible_data['interpretacion_vector'] = bible_data.interpretacion.apply(lambda x: get_embedding(x, model='text-embedding-3-large'))

In [52]:
# Saving the embeddings in a file
bible_data.to_csv('bible/data/cat_bible_int_claude_emb.txt',sep='|',index=False, encoding='utf-8')

## Catholic Bible interpreted: v3 - OpenAI - Embedding Small

In [53]:
# Importing library
import json
import pandas as pd
import os
from utils.os_utils import find_repo_root

# Setting the working directory
repo_root = find_repo_root()
os.chdir(repo_root)

# Loading the data
with open('bible/data/cat_bible_int_openai.json') as f:
    data = json.load(f)

# Converting json into df
bible_data = pd.DataFrame(data)
bible_data.head()

Unnamed: 0,pasaje,texto,area_vida,interpretacion
0,1 Corintios 10:12,"Por eso, el que se cree muy seguro, ¡cuídese d...",[orgullo],"Un gerente de una empresa, confiado en su expe..."
1,1 Corintios 10:13,"Hasta ahora, ustedes no tuvieron tentaciones q...","[crecimiento espiritual, maternidad, vicio]","Imagina a Laura, una joven profesional que se ..."
2,1 Corintios 10:31,"En resumen, sea que ustedes coman, sea que beb...",[descanso y vacaciones],Anna es una joven profesional que trabaja en u...
3,1 Corintios 11:9,"ni fue creado el hombre a causa de la mujer, s...",[creación/evolución],"En una moderna empresa de tecnología, el papel..."
4,1 Corintios 13:13,"En una palabra, ahora existen tres cosas: la f...",[amor],"Imagina un grupo de amigos que, a pesar de viv..."


In [54]:
# Creating an id column
bible_data['id'] = bible_data.index + 1
bible_data = bible_data[['id','pasaje','texto','interpretacion','area_vida']]
bible_data


Unnamed: 0,id,pasaje,texto,interpretacion,area_vida
0,1,1 Corintios 10:12,"Por eso, el que se cree muy seguro, ¡cuídese d...","Un gerente de una empresa, confiado en su expe...",[orgullo]
1,2,1 Corintios 10:13,"Hasta ahora, ustedes no tuvieron tentaciones q...","Imagina a Laura, una joven profesional que se ...","[crecimiento espiritual, maternidad, vicio]"
2,3,1 Corintios 10:31,"En resumen, sea que ustedes coman, sea que beb...",Anna es una joven profesional que trabaja en u...,[descanso y vacaciones]
3,4,1 Corintios 11:9,"ni fue creado el hombre a causa de la mujer, s...","En una moderna empresa de tecnología, el papel...",[creación/evolución]
4,5,1 Corintios 13:13,"En una palabra, ahora existen tres cosas: la f...","Imagina un grupo de amigos que, a pesar de viv...",[amor]
...,...,...,...,...,...
853,854,Tito 2:13,mientras aguardamos la feliz esperanza y la Ma...,Imagínate a una familia que ha estado separada...,"[Jesús, el hijo de Dios - simplicidad]"
854,855,Tito 2:15,"Así debes hablar, exhortar y reprender con tod...",Un gerente de una oficina ha notado que la mor...,[convicción]
855,856,Tito 3:5,no por las obras de justicia que habíamos real...,Una joven llamada Ana ha dedicado su vida a ay...,[salvación]
856,857,Zacarías 10:12,"Yo los fortaleceré en el Señor, y ellos avanza...",Imagina a un grupo de jóvenes emprendedores qu...,[fuerza y ánimo]


In [55]:
# Applying the embeddings
# Using the text-embedding-3-large model
bible_data['interpretacion_vector'] = bible_data.interpretacion.apply(lambda x: get_embedding(x, model='text-embedding-3-small'))

In [56]:
# Saving the embeddings in a file
bible_data.to_csv('bible/data/cat_bible_int_openai_emb_small.txt',sep='|',index=False, encoding='utf-8')