## Preprocessing Bible

In [5]:
# Importing library
import json
import pandas as pd
import os

# Setting directory
# os.chdir('root_repository_path')
os.chdir('/Users/hiroshi/Documents/ds_projects/orare-model')

# Importing data
with open('bible/data/bible.json') as f:
    data = json.load(f)

In [6]:
# Merging the verses in each chapter

# Filtering the "Salmos" book
psalms_data = [item for item in data if item['testamento'] == 'El Antiguo Testamento' and item['libro'] == 'SALMOS']

# Creating an empty list
psalms_chapters = []

# For loop to merge the verses in each chapter
for book in psalms_data:
   for chapter in book['capitulos']:
        merged_text = ''.join([verse['texto'] for verse in chapter['versiculos']])
        psalms_chapters.append({
            'capitulo': chapter['numero'],
            'texto': merged_text
        })

# Save psalms_chapters as JSON to a file
output_file = 'bible/data/psalms_chapters.json'
with open(output_file, 'w', encoding='utf-8') as f:
    json.dump(psalms_chapters, f, ensure_ascii=False, indent=4)

In [7]:
for i in psalms_chapters[:10]:
    print(f"Capitulo {i['capitulo']}: {i['texto']}")

Capitulo 1: ¡Feliz el hombre que no sigue el consejo de los malvados, ni se detiene en el camino de los pecadores, ni se sienta en la reunión de los impíos, sino que se complace en la ley del Señor y la medita de día y de noche! El es como un árbol plantado al borde de las aguas, que produce fruto a su debido tiempo, y cuyas hojas nunca se marchitan: todo lo que haga le saldrá bien. No sucede así con los malvados: ellos son como paja que se lleva el viento. Por eso, no triunfarán los malvados en el juicio, ni los pecadores en la asamblea de los justos; porque el Señor cuida el camino de los justos, pero el camino de los malvados termina mal. 
Capitulo 2: ¿Por qué se amotinan las naciones y los pueblos hacen vanos proyectos?Los reyes de la tierra se sublevan, y los príncipes conspiran contra el Señor y contra su Ungido:«Rompamos sus ataduras, librémonos de su yugo».El que reina en el cielo se sonríe; el Señor se burla de ellos.Luego los increpa airadamente y los aterra con su furor:«Yo 

## Interpreting the Bible with ChatGPT

In [8]:
# Setting the libraries and connection
import openai
import os

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())

# Loading api_key
openai.api_key = os.getenv('OPENAI_API_KEY')

### Helper Function

In [9]:
client = openai.OpenAI()

def get_completion_4o(prompt, model="gpt-4o"):
    messages = [{"role": "user", "content": prompt}]
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=0
    )
    return response.choices[0].message.content

### Prompt for Interpreting the Bible

In [10]:
# Prompt instruction
instructions = """
# Rol #
Tu eres el GPT: Catholic Bible Guide by Fr. Abraham Mutholath.
Tu rol será el de un sacerdote de una iglesia Católica. Se te dará distintos fragmentos de la Biblia. Tu tarea será leer los fragmentos y realizar las tareas que se detallen en la siguiente sección.
# Fin Rol #

# Tareas #
- Explicar la Biblia (explicacion): si el fragmento de la Biblia no está escrito en un lenguaje antiguo, es ambiguo o no está claro lo que quiere decir debes hacer una explicación breve y concisa. Solo explica lo que no es tan evidente y esté en un lenguaje antiguo o ambiguo.
- Identificar Area de la vida (areas): de cada fragmento debes identificar el área de la vida de la que se habla. Las áreas de la vida pueden ser: "Relaciones familiares/pareja","Amistad","Salud física","Salud mental/emocional","Desarrollo/crecimiento personal","Misión de vida","Dinero","Trabajo","Diversión/Hobbies","Otros". Para cada fragmento menciona entre 1 y 3 áreas que sean las más importantes.
# fin Tareas #

# Estructura input #
"id_libro | fragmento"
# Fin estructura input #

# Estructura Output # 
El output debe ser presentado en formato json con los siguiente campos:
- id_libro
- fragmento
- explicacion
- areas (en lista)
# Fin output #
"""

In [11]:
# Creating sample to try the prompt
list_to_interpret = []
for i in range(5):
    text = f"salmos{psalms_chapters[i]['capitulo']} | {psalms_chapters[i]['texto']} "
    list_to_interpret.append(text)
print(list_to_interpret)

['salmos1 | ¡Feliz el hombre que no sigue el consejo de los malvados, ni se detiene en el camino de los pecadores, ni se sienta en la reunión de los impíos, sino que se complace en la ley del Señor y la medita de día y de noche! El es como un árbol plantado al borde de las aguas, que produce fruto a su debido tiempo, y cuyas hojas nunca se marchitan: todo lo que haga le saldrá bien. No sucede así con los malvados: ellos son como paja que se lleva el viento. Por eso, no triunfarán los malvados en el juicio, ni los pecadores en la asamblea de los justos; porque el Señor cuida el camino de los justos, pero el camino de los malvados termina mal.  ', 'salmos2 | ¿Por qué se amotinan las naciones y los pueblos hacen vanos proyectos?Los reyes de la tierra se sublevan, y los príncipes conspiran contra el Señor y contra su Ungido:«Rompamos sus ataduras, librémonos de su yugo».El que reina en el cielo se sonríe; el Señor se burla de ellos.Luego los increpa airadamente y los aterra con su furor:«Y

In [12]:
# Merging the prompt with the sample data
prompt = f"""
{instructions}

# Input # 
{list_to_interpret}
# Fin Input #
"""

In [13]:
# Interpreting the Bible with ChatGPT
response_4o = get_completion_4o(prompt)
print('gpt-4o')
print(' ')
print(response_4o)

gpt-4o
 
```json
[
    {
        "id_libro": "salmos1",
        "fragmento": "¡Feliz el hombre que no sigue el consejo de los malvados, ni se detiene en el camino de los pecadores, ni se sienta en la reunión de los impíos, sino que se complace en la ley del Señor y la medita de día y de noche! El es como un árbol plantado al borde de las aguas, que produce fruto a su debido tiempo, y cuyas hojas nunca se marchitan: todo lo que haga le saldrá bien. No sucede así con los malvados: ellos son como paja que se lleva el viento. Por eso, no triunfarán los malvados en el juicio, ni los pecadores en la asamblea de los justos; porque el Señor cuida el camino de los justos, pero el camino de los malvados termina mal.",
        "explicacion": "Este salmo compara a la persona justa con un árbol plantado junto a corrientes de agua, que siempre da fruto y no se marchita. En contraste, los malvados son como paja que el viento dispersa. La justicia y la meditación en la ley del Señor llevan a la prospe

In [15]:
# Loading the response and saving as a plain text file
json_response_4o = json.loads(response_4o[7:-3])
df_response_4o = pd.DataFrame(json_response_4o)
df_response_4o.to_csv('bible/data/psalms_sample_int_gpt4o.txt',sep='|',index=False, encoding='utf-8')


In [17]:
# Printing the sample interpreted
for item in json_response_4o:
    print(f"Libro: {item['id_libro']}")
    print(f"Fragmento: {item['fragmento']}")
    print(f"Explicación: {item['explicacion']}")
    print(f"Áreas: {', '.join(item['areas'])}")
    print()

Libro: salmos1
Fragmento: ¡Feliz el hombre que no sigue el consejo de los malvados, ni se detiene en el camino de los pecadores, ni se sienta en la reunión de los impíos, sino que se complace en la ley del Señor y la medita de día y de noche! El es como un árbol plantado al borde de las aguas, que produce fruto a su debido tiempo, y cuyas hojas nunca se marchitan: todo lo que haga le saldrá bien. No sucede así con los malvados: ellos son como paja que se lleva el viento. Por eso, no triunfarán los malvados en el juicio, ni los pecadores en la asamblea de los justos; porque el Señor cuida el camino de los justos, pero el camino de los malvados termina mal.
Explicación: Este salmo compara a la persona justa con un árbol plantado junto a corrientes de agua, que siempre da fruto y no se marchita. En contraste, los malvados son como paja que el viento dispersa. La justicia y la meditación en la ley del Señor llevan a la prosperidad y la estabilidad, mientras que la maldad lleva a la ruina.


## Interpreting Fragments of the Bible by Theme

### Interpreting fragments of the Bible categorized by theme

In [20]:
# Loading Fragments of the Bible
with open('bible/data/bible_by_theme.json') as f:
    fragments = json.load(f)

In [21]:
# Prompt Instruction
instructions = """
# Rol #
Tu eres el GPT: Catholic Bible Guide by Fr. Abraham Mutholath.
Tu rol será el de un sacerdote de una iglesia Católica. Se te dará distintos fragmentos de la Biblia. Tu tarea será leer los fragmentos y realizar las tareas que se detallen en la siguiente sección.
# Fin Rol #

# Tareas #
- Explicar la Biblia (explicacion): si el fragmento de la Biblia no está escrito en un lenguaje antiguo, es ambiguo o no está claro lo que quiere decir debes hacer una explicación breve y concisa. Solo explica lo que no es tan evidente y esté en un lenguaje antiguo o ambiguo.
- Identificar Area de la vida (areas): de cada fragmento debes identificar el área de la vida de la que se habla. Las áreas de la vida pueden ser: "Relaciones familiares/pareja","Amistad","Salud física","Salud mental/emocional","Desarrollo/crecimiento personal","Misión de vida","Dinero","Trabajo","Diversión/Hobbies","Otros". Para cada fragmento menciona entre 1 y 3 áreas que sean las más importantes.
# fin Tareas #

# Estructura input #
"id_libro | fragmento"
# Fin estructura input #

# Output #
El output debe ser un texto plano separado por | sin "header" ni "footer"
"id_libro | explicacion | areas (separado por comas)"
# Fin Output #
"""

In [22]:
# Creating empty lists to save the data
list_purpose = []
list_passage = []
list_text = []
list_response = []

# For loop to interpret all the fragments of the Bible
for item in fragments:
    purpose = item['purpose']
    verses = item['versiculos']
    for verse in verses:
        passage = verse['pasaje']
        text = verse['texto']
        list_purpose.append(purpose)
        list_passage.append(passage)
        list_text.append(text)
        input_to_interpret = f"{passage} | {text}"
        prompt = f"""
                    {instructions}

                    # Input # 
                    {input_to_interpret}
                    # Fin Input #
                    """
        response_4o = get_completion_4o(prompt)
        list_response.append(response_4o)

In [46]:
# Sometimes ChatGPT's output is not correct and should be fixed
# For the list_response[182] there is one more pipe "|" in the response and this is generating a conflict when merging all the data
import re
pattern = r' \| Este'
replacement = ' Este'

# Replace the pattern in the specified element
list_response[182] = re.sub(pattern, replacement, list_response[182])
list_response[182]

'Proverbios 13:25 | El justo come hasta saciar su alma: Mas el vientre de los impíos tendrá necesidad. Este versículo utiliza una metáfora para contrastar la satisfacción y la plenitud que experimentan los justos con la carencia y la insatisfacción de los impíos. "El justo come hasta saciar su alma" sugiere que aquellos que viven rectamente encuentran satisfacción y plenitud en sus vidas, no solo en el sentido físico, sino también espiritual. En cambio, "el vientre de los impíos tendrá necesidad" indica que los malvados siempre sentirán una falta o vacío, tanto física como espiritualmente. | Salud mental/emocional, Desarrollo/crecimiento personal, Misión de vida'

In [47]:
# Splitting ChatGPT response into passage, interpretatino and areas
list_passage_2 = []
list_interpretation = []
list_areas = []

for item in list_response:
    passage, interpretation, area = item.split('|')
    list_passage_2.append(passage)
    list_interpretation.append(interpretation)
    list_areas.append(area)

In [60]:
# Splitting the list_areas to store them as a list and not as a joined string
# Also trim the white spaces
list_areas_split = [[area.strip() for area in areas.split(',')] for areas in list_areas]
print(list_areas_split)

[['Desarrollo/crecimiento personal', 'Misión de vida'], ['Desarrollo/crecimiento personal', 'Misión de vida'], ['Desarrollo/crecimiento personal', 'Misión de vida'], ['Misión de vida', 'Desarrollo/crecimiento personal', 'Salud mental/emocional'], ['Misión de vida', 'Desarrollo/crecimiento personal', 'Salud mental/emocional'], ['Misión de vida', 'Salud mental/emocional'], ['Misión de vida', 'Desarrollo/crecimiento personal'], ['Relaciones familiares/pareja', 'Misión de vida'], ['Desarrollo/crecimiento personal', 'Salud mental/emocional', 'Misión de vida'], ['Misión de vida', 'Desarrollo/crecimiento personal', 'Salud mental/emocional'], ['Misión de vida', 'Desarrollo/crecimiento personal', 'Salud mental/emocional'], ['Desarrollo/crecimiento personal', 'Misión de vida', 'Salud mental/emocional'], ['Misión de vida', 'Desarrollo/crecimiento personal'], ['Desarrollo/crecimiento personal', 'Misión de vida', 'Salud mental/emocional'], ['Misión de vida', 'Desarrollo/crecimiento personal'], ['Sa

In [61]:
# Saving the raw response as a plain text file.
bible_by_theme_interpreted = pd.DataFrame({"purpose": list_purpose,
"pasaje": list_passage,
"texto": list_text,
"interpretación": list_interpretation,
"áreas de la vida": list_areas_split})
bible_by_theme_interpreted.to_csv('bible/data/bible_by_theme_int.txt',sep='|',index=False, encoding='utf-8')

In [62]:
# Transforming the lists as a json format
# Creating an empty dictionary to store the data
grouped_data = {}

# Iterate through the lists and populate the dictionary
for purpose, passage, text, interpretation, area in zip(list_purpose, list_passage, list_text, list_interpretation, list_areas_split):
    if purpose not in grouped_data:
        grouped_data[purpose] = []
    grouped_data[purpose].append({
        'pasaje': passage,
        'texto': text,
        'interpretación': interpretation,
        'áreas de la vida': area
    })

# Convert the dictionary to the desired list format
output_data = [{'purpose': purpose, 'versículos': verses} for purpose, verses in grouped_data.items()]

# Save the list as a JSON file
with open('bible/data/bible_by_theme_int.json', 'w', encoding='utf-8') as json_file:
    json.dump(output_data, json_file, ensure_ascii=False, indent=4)