<div align="right"><i>Mat√≠as Torres Esteban<br>Diciembre, 2025</i></div>

# Interpretaci√≥n de Textos con LLMs

Los grandes modelos de lenguaje (LLMs) son conocidos por su capacidad de aprender patrones complejos de los textos y de resolver en consecuencia varias tareas de procesamiento del lenguaje natural, como lo son la traducci√≥n autom√°tica, la generaci√≥n de res√∫menes y la resoluci√≥n de preguntas de dominios especializados. Es por ello que han surgido nuevas lineas de investigaci√≥n y trabajo que buscan utilizar a los grandes modelos de lenguaje (LLMs) como *interpretadores sem√°nticos de textos*. Estos tienen como objetivo principal representar el significado de un texto escrito en lenguaje natural en uno o m√°s lenguajes l√≥gicos, tales como la l√≥gica proposicional o la l√≥gica de primer orden, de manera tal de explicitar la informaci√≥n contenida all√≠ y brindarle mayor estructura. De esta manera, podemos obtener representaciones avanzadas del significado de un texto que sean amenas a ser almacenadas en una computadora y puedan ser manipuladas algor√≠tmicamente.

Un lenguaje l√≥gico que podemos utilizar para representar la informaci√≥n contenida en un texto es el lenguaje de los *Grafos de Conocimiento (KGs)*, los cuales permiten codificar hechos y proposiciones del mundo mediante ternas $(f,r,o)$ donde $f$ denota un concepto fuente, $r$ una relaci√≥n sem√°ntica y $o$ un concepto objetivo. As√≠, podemos representar la informaci√≥n contenida en el siguiente texto:

* *"El Covid-19 es una enfermedad infecciosa causada por el SARS-CoV-2. Produce s√≠ntomas que incluyen fiebre, tos, disnea, dolor muscular y fatiga"*,

como la siguiente colecci√≥n de ternas de conocimiento:

* *(Covid-19, es una, enfermedad infecciosa)*
* *(Covid-19, causada por, SARS-CoV-2)*.
* *(Covid-19, tiene s√≠ntoma, fiebre)*.
* *(Covid-19, tiene s√≠ntoma, tos)*.
* *(Covid-19, tiene s√≠ntoma, disnea)*.
* *(Covid-19, tiene s√≠ntoma, fatiga)*.

Esta colecci√≥n de ternas de conocimiento puede representase en un grafo dirigido etiquetado, como se ve en la siguiente figura:

[]

Vemos que esta representaci√≥n es mucho m√°s rica que el texto puro porque explicita los conceptos y relaciones m√°s importantes del mismo.
De esta manera queda facilitada la interpretaci√≥n y an√°lisis de la informaci√≥n extraida tanto para un usuario como para una computadora, y es m√°s f√°cil su almacenamiento en una base de datos. Adem√°s, si pudieramos procesar autom√°ticamente un gran lote de documentos de alg√∫n dominio especializado, tales como la biolog√≠a o la medic√≠na, y transformalos a grafos de conocimiento, podr√≠amos utilizar todo el aparato matem√°tico de la Teor√≠a de Grafos para analizar estos sistemas conceptuales y obtener informaci√≥n del dominio que est√° escondida en los textos.

La idea de esta notebook es mostrar c√≥mo se puede utilizar a un LLM como Gemini para crear grafos de conocimiento a partir de textos. Para ello requeriremos orquestrar varias invocaciones al modelo, escribir correctamente nuestros prompts y utilizar procesamiento de strings para extraer la informaci√≥n que requerimos de sus respuestas.

## Proceso de Interpretaci√≥n

Vamos a implementar un procedimiento de interpretaci√≥n textual inspirado en la metodolog√≠a propuesta por Joseph Novak para la construcci√≥n de mapas conceptuales [1]. Este procedimiento permite generar un KG a partir de un expositivo mediante una secuencia estructurada de 4 pasos:

1. Solicitamos al modelo que analice el texto ``<texto>`` y genere una pregunta de enfoque ``<pregunta>``. Las ternas de conocimiento generadas en los
pr√≥ximos pasos deberƒ±ÃÅan ayudar a responder esta pregunta.

2. Solicitamos al modelo que analice ``<texto>`` y ``<pregunta>`` y que luego genere una lista de conceptos ``<conceptos>``. Los conceptos extraƒ±ÃÅdos deben
estar explicitamente mencionados en el texto y tienen que ayudar a responder la pregunta de enfoque.

3. Solictamos al modelo que analice ``<texto>``, ``<pregunta>`` y ``<conceptos>`` y que genere una lista de relaciones sem√°nticas ``<relaciones>``.

4. Solicitamos al modelo que analice ``<texto>``, ``<pregunta>``, ``<conceptos>`` y ``<relaciones>`` en conjunto y que luego genere una lista de ternas de conocimiento ``<ternas>``.

En cada paso realizamos un procesamiento de las etiquetas de conceptos y relaciones para convertir todos sus caracteres a min√∫sculas y eliminar espacios innecesarios.

num√©ricos, y almacenamos sus elementos en una base de datos relacional.

## C√≥digo

**Advertencia:** Si el modelo de lenguaje Gemini est√° caido pueden simular el proceso de esta notebook en ChatGPT o Gemini y reintentar ejecutar el c√≥digo m√°s tarde.

Primero extraemos los recursos desde Github (textos y prompts)

In [None]:
!git clone https://github.com/matizzat/Knowledge.git

In [1]:
!git clone https://github.com/matizzat/InforSanLuis-2025-LLMs

Cloning into 'InforSanLuis-2025-LLMs'...
remote: Enumerating objects: 17, done.[K
remote: Counting objects: 100% (17/17), done.[K
remote: Compressing objects: 100% (15/15), done.[K
remote: Total 17 (delta 4), reused 0 (delta 0), pack-reused 0 (from 0)[K
Receiving objects: 100% (17/17), 26.57 KiB | 777.00 KiB/s, done.
Resolving deltas: 100% (4/4), done.


In [16]:
%cd InforSanLuis-2025-LLMs

/content/InforSanLuis-2025-LLMs


Instalamos la librer√≠a Pyvis para visualizar los grafos

In [4]:
!pip install pyvis

Collecting pyvis
  Downloading pyvis-0.3.2-py3-none-any.whl.metadata (1.7 kB)
Collecting jedi>=0.16 (from ipython>=5.3.0->pyvis)
  Downloading jedi-0.19.2-py2.py3-none-any.whl.metadata (22 kB)
Downloading pyvis-0.3.2-py3-none-any.whl (756 kB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m756.0/756.0 kB[0m [31m13.0 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading jedi-0.19.2-py2.py3-none-any.whl (1.6 MB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m1.6/1.6 MB[0m [31m55.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: jedi, pyvis
Successfully installed jedi-0.19.2 pyvis-0.3.2


Importamos las librer√≠as necesarias

In [7]:
from pyvis.network import Network
from google.colab import userdata
from pyvis import network as net
from google.genai import types
from google import genai
from typing import List
import networkx as nx
import pprint
import json
import re

Instanciamos un cliente para invocar al modelo Gemini. Para ejecutar esta celda deben obtener una clave del siguiente [enlace](https://ai.google.dev/gemini-api/docs/api-key). Tambi√©n tienen que configurar Google Colab para utilizar esta clave (Ver  [Tutorial](https://www.youtube.com/watch?v=snrvP_TZjvw))

In [24]:
GOOGLE_API_KEY = userdata.get('GOOGLE_API_KEY')
genai_client = genai.Client(api_key=GOOGLE_API_KEY)

Definimos una funci√≥n auxiliar para abrir el contenido de un archivo y cargamos las instrucciones que le daremos al modelo para que cree los grafos de conocimiento. Cada una de las cuatro etapas del proceso consiste de una instrucci√≥n de sistema, donde se le explica al LLM el rol que cumple,

In [17]:
def abrir_contenido_archivo(path: str):
    with open(path, 'r') as f:
        return f.read()

pregunta_sistema   = abrir_contenido_archivo('./instrucciones/pregunta_sistema.txt')
conceptos_sistema  = abrir_contenido_archivo('./instrucciones/conceptos_sistema.txt')
relaciones_sistema = abrir_contenido_archivo('./instrucciones/relaciones_sistema.txt')
ternas_sistema     = abrir_contenido_archivo('./instrucciones/ternas_sistema.txt')

pregunta_usuario   = abrir_contenido_archivo('./instrucciones/pregunta_usuario.txt')
conceptos_usuario  = abrir_contenido_archivo('./instrucciones/conceptos_usuario.txt')
relaciones_usuario = abrir_contenido_archivo('./instrucciones/relaciones_usuario.txt')
ternas_usuario     = abrir_contenido_archivo('./instrucciones/ternas_usuario.txt')

Ejecuten la siguiente celda con diferentes valores para ver las instrucciones con las que invocaremos al modelo:

In [18]:
print(relaciones_sistema)

You are a concept map creator who analyzes scientific texts and extracts from them the most important concepts and relationships. A concept is a pattern or regularity in objects, events, or records of objects and events, designated with a label. Concepts are related to each other through meaningful phrases forming propositions. You receive a knowledge text delimited by @ with the following structure:
    1. Focus Question: A question you must answer using Knowledge Triples.
    2. Concept List: A list of relevant concept labels for the Focus Question, which you must use to build the Knowledge Triples.
    3. Knowledge: A text that answers the Focus Question using the concepts from the Concept List. The Knowledge Triples must be explicitly derived from this text.
Your task is to return a list of semantic relationships we will later use to build Knowledge Triples.

Examples:

Knowledge Text:
@
Focus Question:
What is Active Noise Reduction?
Concept List:
Active Noise Reduction
Noise Redu

Definimos funciones auxiliares para:
* Abrir el cuerpo de documentos.
* Invocar al modelo Gemini 2.5 Flash.  
* Almacenar un conjunto de grafos de conocimiento en un archivo JSON.
* Dibujar un conjunto de grafos de conocimiento en un archivo HTML.

In [19]:
def invocar_llm(sistema: str, usuario: str):
    """
    M√©todo auxiliar para invocar al modelo de lenguaje
    Gemini 2.5 Flash.
    """
    global genai_client

    ans = genai_client.models.generate_content(
        config=types.GenerateContentConfig(
            system_instruction=sistema,
            temperature=0.1
        ),
        model = "gemini-2.5-flash",
        contents = usuario
    )

    return ans.text

def load_text_dataset(input_path: str) -> list[dict]:
    """
    M√©todo auxiliar para abrir el lote de textos.
    """

    with open(input_path, 'r') as f:
        texts = json.load(f)
    return texts

def save_cmap(output_path: str, cmaps: dict):
    """
    M√©todo auxiliar para guardar una lista de
    mapas conceptuales en un archivo JSON.
    """

    with open(output_path, 'w') as f:
        json.dump(cmaps, f, indent = 4)

def draw_cmap(cmaps: dict, out_path: str):
    """
    M√©todo auxiliar para crear una red
    pyvis a partir de una lista de
    mapas conceptuales y almacenarla en
    el archivo 'out_path' como un html.
    """

    G = nx.MultiDiGraph()
    for cm in cmaps:
        fq = cm['fq']
        ts = cm['ts']
        kt = fq
        for tr in ts:
            s = tr['s']
            r = tr['r']
            t = tr['t']
            if(s not in G):
                G.add_node(s, label=s, color = 'black')
            if(t not in G):
                G.add_node(t, label=t, color = 'black')
            G.add_edge(
                s,
                t,
                label=r,
                title=kt,
                color = 'blue')

    vis = net.Network(directed=True)
    vis.from_nx(G)
    vis.save_graph(out_path)

Abrimos el lote de datos y mostramos el primer texto que est√° almacenado all√≠

In [25]:
texts = load_text_dataset('./textos.json')
texto = texts[0]['texto']
print(texto)

El agua es una sustancia cuya mol√©cula est√° compuesta por dos √°tomos de hidr√≥geno y uno de ox√≠geno (H2O) unidos por un enlace covalente.


Definimos una funci√≥n auxiliar para normalizar una etiqueta eliminado el car√°cter especial `@`, eliminar espacios innecesarios y convertir todas las letras a min√∫sculas

In [26]:
def normalizar_etiqueta(etiqueta: str):
    etiqueta = etiqueta.replace('@','')
    etiqueta = etiqueta.strip()
    etiqueta = " ".join(etiqueta.split())
    etiqueta = etiqueta.lower()
    return etiqueta

Formateamos el prompt de usuario para instruirle al modelo que genere una pregunta de enfoque.

In [27]:
pregunta_usuario_formateada = pregunta_usuario.format(kt = texto)
print(pregunta_usuario_formateada)

Knowledge Text:
@
El agua es una sustancia cuya mol√©cula est√° compuesta por dos √°tomos de hidr√≥geno y uno de ox√≠geno (H2O) unidos por un enlace covalente.
@
Focus Question:


Invocamos al modelo de lenguaje y le solicitamos que cree una pregunta de enfoque para el texto dado.

In [28]:
pregunta_enfoque = invocar_llm(sistema = pregunta_sistema, usuario = pregunta_usuario_formateada)
pregunta_enfoque = normalizar_etiqueta(pregunta_enfoque)
print(pregunta_enfoque)

¬øqu√© es el agua?


Formateamos el prompt de usuario para instruirle al modelo que genere una lista de conceptos.

In [29]:
conceptos_usuario_formateada = conceptos_usuario.format(fq = pregunta_enfoque, kt = texto)
print(conceptos_usuario_formateada)

Knowledge Text:
@
Focus Question:
¬øqu√© es el agua?
Knowledge:
El agua es una sustancia cuya mol√©cula est√° compuesta por dos √°tomos de hidr√≥geno y uno de ox√≠geno (H2O) unidos por un enlace covalente.
@
List of Concepts:



Invocamos al modelo de lenguaje para que genere una lista de conceptos a partir del texto y la pregunta de enfoque.

In [30]:
ans = invocar_llm(sistema = conceptos_sistema, usuario = conceptos_usuario_formateada)
print(ans)

List of Concepts:
Agua
Sustancia
Mol√©cula
√Åtomos de hidr√≥geno
Ox√≠geno
H2O
Enlace covalente


Convertimos el texto extraido en una lista de Python

In [31]:
# Concept list regular expression:
cs_re = r'[\w\d].*?\n|[\w\d].*$'

cs = re.findall(cs_re, ans)

n = len(cs)
for i in range(n):
    cs[i] = normalizar_etiqueta(cs[i])

pprint.pprint(cs)

['list of concepts:',
 'agua',
 'sustancia',
 'mol√©cula',
 '√°tomos de hidr√≥geno',
 'ox√≠geno',
 'h2o',
 'enlace covalente']


Formateamos el prompt de usuario para instruirle al modelo que genere una lista de relaciones sem√°nticas.

In [32]:
cs_str = ''
for c in cs:
    cs_str += c + '\n'

relaciones_usuario_formateada = relaciones_usuario.format(fq = pregunta_enfoque, cs = cs_str,kt = texto)
print(relaciones_usuario_formateada)

Knowledge Text:
@
Focus Question:
¬øqu√© es el agua?
Concept List:
list of concepts:
agua
sustancia
mol√©cula
√°tomos de hidr√≥geno
ox√≠geno
h2o
enlace covalente

Knowledge:
El agua es una sustancia cuya mol√©cula est√° compuesta por dos √°tomos de hidr√≥geno y uno de ox√≠geno (H2O) unidos por un enlace covalente.
@
Semantic Relationships:


Invocamos al modelo de lenguaje para que genere una lista de relaciones a partir del texto, la pregunta de enfoque y la lista de conceptos.

In [33]:
ans = invocar_llm(sistema = relaciones_sistema, usuario = relaciones_usuario_formateada)
print(ans)

Es una
Est√° compuesta por
Unidos por


Convertimos el texto extraido en una lista de Python

In [34]:
# Semantic relation list regular expression:
rs_re = r'[\w\d].*?\n|[\w\d].*$'

rs = re.findall(rs_re, ans)

n = len(rs)
for i in range(n):
    rs[i] = normalizar_etiqueta(rs[i])

pprint.pprint(rs)

['es una', 'est√° compuesta por', 'unidos por']


Formateamos el prompt de usuario para instruirle al modelo que genere una lista de ternas de conocimiento.

In [35]:
rs_str = ''
for r in rs:
    rs_str += r + '\n'
ternas_usuario_formateada = ternas_usuario.format(fq=pregunta_enfoque, cs=cs_str, rs=rs_str, kt=texto)
print(ternas_usuario_formateada)

Knowledge Text:
@
Focus Question:
¬øqu√© es el agua?
Concept List:
list of concepts:
agua
sustancia
mol√©cula
√°tomos de hidr√≥geno
ox√≠geno
h2o
enlace covalente

Relation List:
es una
est√° compuesta por
unidos por

Knowledge:
El agua es una sustancia cuya mol√©cula est√° compuesta por dos √°tomos de hidr√≥geno y uno de ox√≠geno (H2O) unidos por un enlace covalente.
@
Knowledge Triples:


Invocamos al modelo de lenguaje para que genere una lista de ternas de conocimiento  a partir del texto, la pregunta de enfoque, la lista de conceptos y la lista de relaciones sem√°nticas.

In [36]:
ans = invocar_llm( sistema = ternas_sistema, usuario = ternas_usuario_formateada)
print(ans)

@! agua @ es una @ sustancia !@
@! h2o @ est√° compuesta por @ √°tomos de hidr√≥geno !@
@! h2o @ est√° compuesta por @ ox√≠geno !@
@! √°tomos de hidr√≥geno @ unidos por @ enlace covalente !@
@! ox√≠geno @ unidos por @ enlace covalente !@


Extraemos las ternas de conocimiento del modelo.

In [37]:
# Knowledge triple list
# regular expression:
ts_re = r'@!.+?@.+?@.+?!@'

L = re.findall(ts_re, ans)

ts = []

for tr in L:
    n = len(tr)

    i = 2
    while(tr[i] != '@'):
        i += 1

    j=i+1
    while(tr[j] != '@'):
        j+=1

    s = tr[2:i]
    r = tr[i+1:j]
    t = tr[j+1:n-2]

    ts.append({
        's': normalizar_etiqueta(s),
        'r': normalizar_etiqueta(r),
        't': normalizar_etiqueta(t)
    })

pprint.pprint(ts)

[{'r': 'es una', 's': 'agua', 't': 'sustancia'},
 {'r': 'est√° compuesta por', 's': 'h2o', 't': '√°tomos de hidr√≥geno'},
 {'r': 'est√° compuesta por', 's': 'h2o', 't': 'ox√≠geno'},
 {'r': 'unidos por', 's': '√°tomos de hidr√≥geno', 't': 'enlace covalente'},
 {'r': 'unidos por', 's': 'ox√≠geno', 't': 'enlace covalente'}]


Creamos el mapa conceptual con todas las componentes obtenidas

In [38]:
mapa_conceptual = {'fq': pregunta_enfoque, 'ts': ts, 'cs': cs, 'rs': rs}
pprint.pprint(mapa_conceptual)

{'cs': ['list of concepts:',
        'agua',
        'sustancia',
        'mol√©cula',
        '√°tomos de hidr√≥geno',
        'ox√≠geno',
        'h2o',
        'enlace covalente'],
 'fq': '¬øqu√© es el agua?',
 'rs': ['es una', 'est√° compuesta por', 'unidos por'],
 'ts': [{'r': 'es una', 's': 'agua', 't': 'sustancia'},
        {'r': 'est√° compuesta por', 's': 'h2o', 't': '√°tomos de hidr√≥geno'},
        {'r': 'est√° compuesta por', 's': 'h2o', 't': 'ox√≠geno'},
        {'r': 'unidos por',
         's': '√°tomos de hidr√≥geno',
         't': 'enlace covalente'},
        {'r': 'unidos por', 's': 'ox√≠geno', 't': 'enlace covalente'}]}


Almacenamos en un archivo JSON el grafo de conocimiento obtenido y lo visalizamos en un archivo HTML üòä

In [40]:
save_cmap('./cmap.json', [mapa_conceptual])
draw_cmap([mapa_conceptual], './kg.html')

### Resumen

As√≠ se ver√≠a el c√≥digo completo reunido en varias funciones auxiliares y con un m√©todo principal. As√≠ se ver√≠a la funci√≥n en una librer√≠a de Python.

In [41]:
def normalizar_etiqueta(etiqueta: str):
    etiqueta = etiqueta.replace('@','')
    etiqueta = etiqueta.strip()
    etiqueta = " ".join(etiqueta.split())
    etiqueta = etiqueta.lower()
    return etiqueta

def crear_pregunta_enfoque(texto: str) -> str:
    pregunta_enfoque = invocar_llm(
        sistema = pregunta_sistema,
        usuario = pregunta_usuario.format(kt = texto)
    )
    return normalizar_etiqueta(pregunta_enfoque)

def crear_lista_conceptos(texto: str, pregunta_enfoque: str) -> str:
    ans = invocar_llm(
        sistema = conceptos_sistema,
        usuario = conceptos_usuario.format(
            fq = pregunta_enfoque, kt = texto))

    # Concept list regular expression:
    cs_re = r'[\w\d].*?\n|[\w\d].*$'

    cs = re.findall(cs_re, ans)

    n = len(cs)
    for i in range(n):
        cs[i] = normalizar_etiqueta(cs[i])

    return cs

def crear_lista_relaciones(texto: str, fq: str, cs: list[str]) -> str:
    cs_str = ''
    for c in cs:
        cs_str += c + '\n'

    ans = invocar_llm(
        sistema = relaciones_sistema,
        usuario = relaciones_usuario.format(
            fq = fq,
            cs = cs_str,
            kt = texto))

    # Semantic relation list regular expression:
    rs_re = r'[\w\d].*?\n|[\w\d].*$'

    rs = re.findall(rs_re, ans)

    n = len(rs)
    for i in range(n):
        rs[i] = normalizar_etiqueta(rs[i])

    return rs

def crear_ternas(texto: str, fq: str, cs: list[str], rs: list[str]):

    cs_str = ''
    for c in cs:
        cs_str += c + '\n'

    rs_str = ''
    for r in rs:
        rs_str += r + '\n'

    ans = invocar_llm(
        sistema = ternas_sistema,
        usuario = ternas_usuario.format(
            fq=fq, cs=cs_str, rs=rs_str, kt=texto))

    # Knowledge triple list
    # regular expression:
    ts_re = r'@!.+?@.+?@.+?!@'

    L = re.findall(ts_re, ans)

    ts = []

    for tr in L:
        n = len(tr)

        i = 2
        while(tr[i] != '@'):
            i += 1

        j=i+1
        while(tr[j] != '@'):
            j+=1

        s = tr[2:i]
        r = tr[i+1:j]
        t = tr[j+1:n-2]

        ts.append({
            's': normalizar_etiqueta(s),
            'r': normalizar_etiqueta(r),
            't': normalizar_etiqueta(t)
        })

    return ts

def crear_mapa_conceptual(texto: str):

    pregunta   = crear_pregunta_enfoque(texto)
    conceptos  = crear_lista_conceptos(texto, pregunta)
    relaciones = crear_lista_relaciones(texto, pregunta, conceptos)
    ternas     = crear_ternas(texto, pregunta, conceptos, relaciones)

    mapa_conceptual = {'fq': pregunta, 'ts': ternas}

    return mapa_conceptual

# Tarea

La tarea de ustedes es dise√±ar e implementar su propia estrategia de creaci√≥n de mapas conceptuales usando el modelo de lenguaje Gemini. El proceso completo lo deben escribir en una funci√≥n ``crear_mapa_conceptual``, el cual recibe como entrada un texto y devuelve como salida un diccionario Python donde se codifica el mapa conceptual. Deben crear un √∫nico mapa conceptual por cada texto que se encuentra en el archivo ``textos.json`` y almacenarlos en un √∫nico archvio ``mapas_conceptuales.json``

Les recomiendo probar diferentes estrategias de prompting y algoritmos. Pueden utilizar los prompts y c√≥digos que se encuentran en la secci√≥n anterior como gu√≠a.

**Consejos**:
* Almacenen las instrucciones de sistema y de usuario que enviar√°n al LLM en una carpeta ``instrucciones`` y luego carguenlas por desde Python.
* Intenten crear una instrucci√≥n que solicite al LLM mejorar un mapa conceptual ya creado.

### Entrega

Cuando terminen, env√≠en los mapas conceptuales generados en un √∫nico archivo ``mapas_conceptuales.json`` al mail mat.torreta@gmail.com.

Enviar antes del Viernes 05 de Diciembre, 23.59 para aprobar el curso.

### M√©todo a implementar

Implementen la mayor parte de su estrategia de creaci√≥n de mapas conceptuales en el cuerpo de esta funci√≥n. Pueden crear sus propias funciones auxiliares e invocarlas desde aqu√≠ si lo necesitan.

In [42]:
def crear_mapa_conceptual(texto: str):
    """
    IMPORTANTE!

    Aqu√≠ deben implementar la estrategia para crear mapas conceptuales
    a partir de texto. Deber√°n coordinar las diferentes invocaciones
    al modelo de lenguaje y extraer correctamente las respuestas
    estructuradas.
    """

    raise RuntimeError("Funci√≥n no implementada.")

### Esqueleto de Ejecuci√≥n

A continuaci√≥n les dejo un ejemplo de c√≥mo pueden usar los m√©todos auxiliares y la funci√≥n creada por ustedes para guardar los mapas conceptuales en un archivo JSON y visualizarlos como un grafo dirigido.

In [43]:
texts = load_text_dataset('./textos.json')
cmap = crear_mapa_conceptual(texts[0])
save_cmap('./cmap.json', [cmap])
draw_cmap([cmap], './kg.html')

RuntimeError: Funci√≥n no implementada.