# **Resumidor**

Este notebook muestra cómo generar un una minuta resumen de tres cartas relacionadas con el sistema eléctrico chileno, utilizando **LangChain** y un modelo de lenguaje.  

El resumen se basa en un *prompt* detallado que exige una síntesis clara, concisa e imparcial, siguiendo las reglas específicas descritas en `prompt_summarizer`.



# 1. Instalación de dependencias y librerías


In [1]:
import os

from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

In [2]:
def read_txt(path):
    with open(path, 'r', encoding='utf-8') as file:
        return file.read()

# 2. Configuración de variables de entorno


In [3]:
os.environ["OPENAI_API_KEY"] = "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"

# 3. Definición del prompt de resumen


In [5]:
prompt_summarizer = """
# Función
Resume el contenido de los siguientes documentos en una minuta. El texto que elabores debe tener en cuenta los siguientes puntos:
1. La información proviene de un OCR  y podría o no estar en formato markdown.
2. Elabora una minuta lo más extensa posible, maximizando la cantidad de detalles.
3. Tus analisis deben ser neutrales y objetivos.
4. Usa markdown para estructurar tu respuesta.

# Documento 1
{doc_1}

# Documento 2
{doc_2}

# Documento 3
{doc_3}

# Respuesta
"""

print("Prompt cargado correctamente.")


Prompt cargado correctamente.


# 4. Clase Summarizer

In [6]:
class Summarizer:
    """
    Clase que combina un prompt predefinido (prompt_summarizer)
    con un modelo de lenguaje para generar un resumen especializado.
    """
    def __init__(self, model="gpt-4o-2024-11-20", temperature=0):
        """
        model: str con el nombre del modelo OpenAI (ej. gpt-4o-2024-11-20).
        temperature: Control de 'creatividad' (0 -> más determinista).
        """
        # Definimos el LLM de OpenAI
        llm = ChatOpenAI(model=model, temperature=temperature)

        # Creamos una plantilla (PromptTemplate) que usa 'prompt_summarizer'
        # e introduce las variables "doc_1", "doc_2", "doc_3" donde irán los textos a resumir
        prompt = PromptTemplate(
            template=prompt_summarizer,
            input_variables=["doc_1", "doc_2", "doc_3"] # input_variables
        )

        # Encadenamos el prompt y el modelo en un solo paso
        self.chain = prompt | llm

    def __call__(self, input_texts):
        """
        Llama a la cadena (prompt + modelo) con uno o varios textos a resumir.
        Retorna el resumen generado.
        """

        # Ejecutamos la cadena con los textos correspondientes a doc_1, doc_2 y doc_3
        output = self.chain.invoke({"doc_1": input_texts[0], "doc_2": input_texts[1], "doc_3": input_texts[2]})

        return output.content

# 5. Ejemplo de uso

Prueba diferentes LLMs para encontrar la configuración que mejor funcione. El siguiente link contiene los [modelos de OpenAI](https://platform.openai.com/docs/models) disponibles.


In [7]:
# Creamos una instancia del resumidor con GPT-4o y temperatura=0 (más determinista)
summarizer = Summarizer(model="gpt-4o-2024-11-20", temperature=0)

# Debes importar los documentos a tu carpeta principal en colab
doc_1 = read_txt("documentos_prueba/doc_1.md")
doc_2 = read_txt("documentos_prueba/doc_2.txt")
doc_3 = read_txt("documentos_prueba/doc_3.txt")

input_docs = [doc_1, doc_2, doc_3]

# Llamamos a la clase con el texto a resumir
resumen_generado = summarizer(input_docs)

print("=== RESUMEN GENERADO === \n")
print(resumen_generado)


=== RESUMEN GENERADO === 

# Minuta de los Documentos Analizados

## **1. Contexto General**
Los documentos analizados corresponden a comunicaciones oficiales entre el Coordinador Eléctrico Nacional y la empresa UKA Chile y Compañía, relacionadas con proyectos de infraestructura eléctrica en Chile. Los temas principales incluyen la inviabilidad de una solicitud de conexión para un parque eólico, la solicitud de prórroga para entregar antecedentes adicionales sobre una obra urgente, y la respuesta del Coordinador a dicha solicitud. A continuación, se detallan los puntos clave de cada documento.

---

## **2. Resumen de los Documentos**

### **Documento 1: Rechazo de Solicitud de Uso de Capacidad Técnica Disponible (SUCTD)**
- **Fecha:** 31 de diciembre de 2024  
- **Emisor:** Coordinador Eléctrico Nacional  
- **Destinatario:** Simon Göbel, Representante Legal de UKA Chile y Compañía  
- **Asunto:** Inviabilidad de la solicitud de conexión del proyecto Parque Eólico Rodolmo Sur (196 MW)