In [1]:
from cltk import NLP

# Initialize the NLP engine for Latin
cltk_nlp = NLP(language='lat')

# Example Latin sentence
latin_text = 'Amat'

# Process the text
doc = cltk_nlp.analyze(text=latin_text)

# Access morphological information for each word
for word in doc.words:
    print(f'Original: {word.string}, Lemma: {word.lemma}, Features: {word.features}')

  from .autonotebook import tqdm as notebook_tqdm


‎𐤀 CLTK version '1.2.1'. When using the CLTK in research, please cite: https://aclanthology.org/2021.acl-demo.3/

Pipeline for language 'Latin' (ISO: 'lat'): `LatinNormalizeProcess`, `LatinSpacyProcess`, `LatinEmbeddingsProcess`, `StopsProcess`, `LatinLexiconProcess`.

⸖ ``LatinSpacyProcess`` using LatinCy model by Patrick Burns from https://arxiv.org/abs/2305.04365 . Please cite: https://arxiv.org/abs/2305.04365
⸖ ``LatinEmbeddingsProcess`` using word2vec model by University of Oslo from http://vectors.nlpl.eu/ . Please cite: https://aclanthology.org/W17-0237/
⸖ ``LatinLexiconProcess`` using Lewis's *An Elementary Latin Dictionary* (1890).

⸎ To suppress these messages, instantiate ``NLP()`` with ``suppress_banner=True``.
This part of the CLTK depends upon models from the CLTK project.
Do you want to download 'https://github.com/cltk/lat_models_cltk' to '~/cltk_data/lat'? [Y/n] 
This part of the CLTK depends upon Lewis's *An Elementary Latin Dictionary* (1890).
Do you want to download

In [4]:
# Example Latin sentence
latin_text = 'Cogito ergo sum'

# Process the text
doc = cltk_nlp.analyze(text=latin_text)

# Access morphological information for each word
for word in doc.words:
    print(f'Original: {word.string}, Lemma: {word.lemma}, Features: {word.features}')

Original: Cogito, Lemma: Cogito, Features: {Mood: [indicative], Number: [singular], Person: [second], Tense: [present], VerbForm: [finite], Voice: [passive]}
Original: ergo, Lemma: ergo, Features: {}
Original: sum, Lemma: sum, Features: {}


In [1]:
import requests

class BibleAPI:
    def __init__(self, translation='kjv'):
        self.base_url = "https://bible-api.com/"
        self.translation = translation

    def get_passage(self, passage):
        """
        Fetches a specific passage from the Bible.

        Args:
            passage (str): The passage to fetch, e.g., "John 3:16"

        Returns:
            str: The text of the passage.
        """
        params = {
            'translation': self.translation
        }
        response = requests.get(f"{self.base_url}{passage}", params=params)
        if response.status_code == 200:
            data = response.json()
            return data.get('text', 'No text found')
        else:
            return f"Error: {response.status_code}, message: {response.text}"

# Test
if __name__ == "__main__":
    bible_api = BibleAPI('clementine')
    passage_text = bible_api.get_passage("Joannes 5:7")
    print(passage_text)


Respondit ei languidus : Domine, hominem non habeo, ut, cum turbata fuerit aqua, mittat me in piscinam : dum venio enim ego, alius ante me descendit.


In [3]:
import re

# Define la función para limpiar el texto
def clean_text(file_path, output_path):
    with open(file_path, 'r', encoding='utf-8') as file:
        text = file.read()
        # Eliminar espacios en blanco adicionales
        cleaned_text = re.sub(r'\n\s+\n', '\n\n', text)  # Elimina espacios entre poemas
        cleaned_text = re.sub(r'^\s+', '', cleaned_text, flags=re.MULTILINE)  # Elimina espacios al inicio de cada línea
        cleaned_text = re.sub(r'\s+$', '', cleaned_text, flags=re.MULTILINE)  # Elimina espacios al final de cada línea

    with open(output_path, 'w', encoding='utf-8') as output_file:
        output_file.write(cleaned_text)

# Ruta del archivo original y del archivo de salida
original_file_path = '/home/user/Descargas/all_palladas.txt'
output_file_path = '/home/user/Descargas/all_palladas_limpio.txt'

# Llama a la función para limpiar el texto
clean_text(original_file_path, output_file_path)


In [52]:
import re

def load_epigrams(file_path):
    epigrams = {}  # Diccionario para almacenar los epigramas
    current_ref = None  # Referencia actual del epigrama
    epigram_lines = []  # Líneas actuales del epigrama

    with open(file_path, 'r', encoding='utf-8') as file:
        for line in file:
            line = line.strip()  # Eliminar espacios en blanco al principio y al final
            if line.startswith('AP'):  # Nueva referencia de epigrama
                if current_ref:  # Guardar el epigrama anterior si existe
                    epigrams[current_ref] = '\n'.join(epigram_lines)
                current_ref = line  # Actualizar la referencia actual
                epigram_lines = []  # Reiniciar la lista de líneas para el nuevo epigrama
            else:
                if line:  # Agregar la línea al epigrama actual si no está vacía
                    epigram_lines.append(line)

        # Añadir el último epigrama al diccionario si hay uno
        if current_ref and epigram_lines:
            epigrams[current_ref] = '\n'.join(epigram_lines)

    return epigrams

# Ruta al archivo de los epigramas
file_path = '/home/user/Descargas/all_palladas_limpio.txt'
epigrams = load_epigrams(file_path)

# Imprimir algunos ejemplos para verificar
for ref, text in list(epigrams.items())[:1]:  # Imprimir los primeros tres para verificar
    print(f"{ref}:\n{text}\n\n")


AP 5.72:
τοῦτο βίος, τοῦτ᾽αὐτό: τρυφὴ βίος. ἔρρετ᾽ἀνῖαι:
ζωῆς ἀνθρώποις ὀλίγος χρόνος. ἄρτι Λύαιος,
ἄρτι χοροί, στέφανοί τε φιλανθέες, ἄρτι γυναῖκες:
σήμερον ἐσθλὰ πάθω: τὸ γὰρ αὔριον οὐδενὶ δῆλον.




In [87]:
def process_and_retain_epigrams(epigrams):
    processed_epigrams = {}
    # Regex para identificar palabras y puntuación
    word_pattern = re.compile(r'\b[\w\']+\b|[\.,;:\'’!?]', re.UNICODE)

    for ref, text in epigrams.items():
        lines = text.split('\n')  # Divide el epigrama en líneas
        processed_lines = []

        for i, line in enumerate(lines, 1):  # Enumera las líneas empezando desde 1
            # Encuentra todas las palabras y signos de puntuación en la línea
            words = word_pattern.findall(line)
            processed_lines.append({'line': i, 'words': words})  # Guarda la línea con su número

        # Guardar las líneas procesadas
        processed_epigrams[ref] = {
            'processed_lines': processed_lines
        }

    return processed_epigrams

# Aplicar la función de procesamiento y retención a los epigramas cargados
processed_epigrams = process_and_retain_epigrams(epigrams)
processed_epigrams


{'AP 5.72': {'processed_lines': [{'line': 1,
    'words': ['τοῦτο',
     'βίος',
     ',',
     'τοῦτ',
     'αὐτό',
     ':',
     'τρυφὴ',
     'βίος',
     '.',
     'ἔρρετ',
     'ἀνῖαι',
     ':']},
   {'line': 2,
    'words': ['ζωῆς',
     'ἀνθρώποις',
     'ὀλίγος',
     'χρόνος',
     '.',
     'ἄρτι',
     'Λύαιος',
     ',']},
   {'line': 3,
    'words': ['ἄρτι',
     'χοροί',
     ',',
     'στέφανοί',
     'τε',
     'φιλανθέες',
     ',',
     'ἄρτι',
     'γυναῖκες',
     ':']},
   {'line': 4,
    'words': ['σήμερον',
     'ἐσθλὰ',
     'πάθω',
     ':',
     'τὸ',
     'γὰρ',
     'αὔριον',
     'οὐδενὶ',
     'δῆλον',
     '.']}]},
 'AP 5.257': {'processed_lines': [{'line': 1,
    'words': ['νῦν',
     'καταγιγνώσκω',
     'καὶ',
     'τοῦ',
     'Διὸς',
     'ὡς',
     'ἀνεράστου',
     ',']},
   {'line': 2,
    'words': ['μὴ', 'μεταβαλλομένου', 'τῆς', 'σοβαρᾶς', 'ἕνεκα', ':']},
   {'line': 3,
    'words': ['οὔτε',
     'γὰρ',
     'Εὐρώπης',
     ',',
     'οὐ',
     

In [88]:
import json

# Guardar los epigramas procesados en un archivo JSON
with open('epigrams_processed.json', 'w', encoding='utf-8') as f:
    json.dump(processed_epigrams, f, ensure_ascii=False, indent=4)

In [82]:
def print_processed_epigrams(processed_epigrams):
    for ref, content in processed_epigrams.items():
        print(f"{ref}:")
        for line in content['processed_lines']:
            # Une las palabras y signos de puntuación para formar las líneas del epigrama
            # Se añade un espacio solo entre palabras, no entre palabras y puntuación
            reconstructed_line = ''.join([word if word in [',', '.', ':', ';', '!', '?', '’'] else f' {word}' for word in line]).strip()
            print(reconstructed_line)
        print("\n")  # Espacio extra entre epigramas para mejor lectura

# Llamada a la función para imprimir los epigramas procesados
print_processed_epigrams(processed_epigrams)


AP 5.72:
τοῦτο βίος, τοῦτ αὐτό: τρυφὴ βίος. ἔρρετ ἀνῖαι:
ζωῆς ἀνθρώποις ὀλίγος χρόνος. ἄρτι Λύαιος,
ἄρτι χοροί, στέφανοί τε φιλανθέες, ἄρτι γυναῖκες:
σήμερον ἐσθλὰ πάθω: τὸ γὰρ αὔριον οὐδενὶ δῆλον.


AP 5.257:
νῦν καταγιγνώσκω καὶ τοῦ Διὸς ὡς ἀνεράστου,
μὴ μεταβαλλομένου τῆς σοβαρᾶς ἕνεκα:
οὔτε γὰρ Εὐρώπης, οὐ τῆς Δανάης περὶ κάλλος,
οὔθ ἁπαλῆς Λήδης ἐστ ἀπολειπομένη:
εἰ μὴ τὰς πόρνας παραπέμπεται: οἶδα γὰρ αὐτὸν
τῶν βασιλευουσῶν παρθενικῶν φθορέα


AP 6.60:
ἀντὶ βοὸς χρυσέου τ ἀναθήματος Ἴσιδι τούσδε
θήκατο τοὺς λιπαροὺς Παμφίλιον πλοκάμους:
ἡ δὲ θεὸς τούτοις γάνυται πλέον, ἤπερ Ἀπόλλων
χρυσῷ, ὃν ἐκ Λυδῶν Κροῖσος ἔπεμψε θεῷ.


AP 6.61:
ὦ ξυρὸν οὐράνιον, ξυρὸν ὄλβιον, ᾧ πλοκαμῖδας
κειραμένη πλεκτὰς ἄνθετο Παμφίλιον,
οὔ σέ τις ἀνθρώπων χαλκεύσατο: πὰρ δὲ καμίνῳ
Ἡφαίστου, χρυσέην σφῦραν ἀειραμένη
ἡ λιπαροκρήδεμνος, ἵν εἴπωμεν καθ Ὅμηρον,
χερσί σε ταῖς ἰδίαις: ἐξεπόνησε Χάρις.


AP 6.85:
ἀνάθημα πεπαιγμένον
τὸν θώ, καὶ τὰς κνῆ, τὰν τ ἀσπίδα, καὶ δόρυ, καὶ κρᾶ,
Γορδιοπριλάριος ἄνθετο Τιμοθ