# **Summarizer**

Este notebook muestra cómo generar un resumen de un documento (o texto) relativo a una noticia del sistema eléctrico chileno, utilizando **LangChain** y un modelo de lenguaje.  

El resumen se basa en un *prompt* detallado que exige una síntesis clara, concisa e imparcial, siguiendo las reglas específicas descritas en `prompt_summarizer`.



# 1. Instalación de dependencias y librerías


In [1]:
!pip install langchain_openai

Collecting langchain_openai
  Downloading langchain_openai-0.3.6-py3-none-any.whl.metadata (2.3 kB)
Collecting tiktoken<1,>=0.7 (from langchain_openai)
  Downloading tiktoken-0.9.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (6.7 kB)
Downloading langchain_openai-0.3.6-py3-none-any.whl (54 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m54.9/54.9 kB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading tiktoken-0.9.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.2 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.2/1.2 MB[0m [31m21.6 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: tiktoken, langchain_openai
Successfully installed langchain_openai-0.3.6 tiktoken-0.9.0


In [2]:
import os

from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

# 2. Configuración de variables de entorno


In [3]:
os.environ["OPENAI_API_KEY"] = "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"

# 3. Definición del prompt de resumen


In [4]:
prompt_summarizer = """
[MISION]
Eres un consultor experto del sector eléctrico chileno y se han pedido tus servicios para realizar un resúmen claro, conciso e imparcial, que detalle todos los aspectos involucrados en una noticia sobre un acontecimiento competente al sector eléctrico chileno.


[INSTRUCCIONES]
1. Debes examinar exhaustiva y detenidamente la noticia provista.
2. Debes identificar, comprender, sintetizar y clarificar el tema principal de la noticia, los distintos aspectos que abarca y su contexto subyacente.
3. Debes maximizar el detalle y el significado de tu respuesta. Enfócate únicamente en el contenido del documento presentado, sin agregar información adicional externa.
4. No uses viñetas ni guiones.
6. El resumen debe ser de un solo párrafo.
5. No está permitido que la extensión del resumen supere los 1000 caracteres.
6. Si incluyes en el resumen una opinión o comentario, es imprescindible que cites al autor de dicha opinión o comentario.
7. Concéntrate en discernir entre la información objetiva y el lenguaje subjetivo o sensacionalista en las noticias. Tu misión es desarrollar un criterio objetivo para clasificar las noticias, reduciendo al mínimo la influencia del estilo narrativo del periodista en la determinación de la categoría.

[OBSERVACIONES]
-Vas a responder siguiendo paso a paso la misión, las instrucciones y el ejemplo proporcionado.
-Toma un momento para respirar profundamente antes de comenzar tu respuesta.

[EJEMPLO]
CNE aprueba modificación a bases de licitación de suministro a clientes regulados
Proceso 2023/01 contempla un total de 3.600 GWh a adjudicar en dos bloques, con fecha de presentación de ofertas previsto para el 9 de abril próximo.
La Comisión Nacional de Energía (CNE) emitió la Resolución Exenta N°47, a través de la cual se modifica la Resolución Exenta N°284 de 2023, que aprobó las Bases de Licitación Pública Nacional e Internacional para el Suministro de Energía y Potencia Eléctrica destinados al abastecimiento de los consumos de clientes sometidos a regulación de precios.
Producto de la de la Resolución Exenta N°2, del 8 de enero de 2024, que aprobó el Informe Final Definitivo de Licitaciones a que se refiere el artículo 131° ter de la ley, el documento emitido por la Comisión establece un nuevo volumen de energía a licitar en la Licitación de Suministro 2023/01, contemplando un total de 3.600 GWh, repartidos en dos bloques de suministro, por 1.500 GWh y 2.100 GWh, con inicio de suministro en los años 2027 y 2028 respectivamente, y ambos con segmentaciones zonales y horarias.
Los Bloques de Suministro N°1-Z1-A, N°1-Z1-B y N°1-Z1-C, se dividirán cada uno en 13 Sub-Bloques, mientras que los Bloques N°1-Z2-A, N°1-Z2-B y N°1-Z2-C lo harán cada uno en 26 Sub-Bloques, y los Bloques N°1-Z3-A, N°1-Z3-B y N°1-Z3-C se dividirán cada uno en 36 Sub-Bloques, con inicio de suministro en enero de 2027 y una duración de 20 años.
Por su parte, los Bloques de Suministro N°2-Z1-A, N°2-Z1-B, N°2-Z1-C, se dividirán cada uno en 18 Sub-Bloques, mientras que los bloques N°2-Z2-A, N°2-Z2-B, N°2-Z2-C lo harán cada uno en 36 Sub-Bloques, y los Bloques N°2-Z3-A, N°2-Z3-B, N°2-Z3-C se dividirán cada uno en 50 Sub-Bloques, con inicio de suministro en enero de 2028 y una duración de 20 años.
Secretario ejecutivo
Marco Mancilla, Secretario Ejecutivo de la CNE, destacó el avance de este proceso, detallando los elementos innovadores de la licitación 2023/01, como los cambios al mecanismo de fomento a proyectos de almacenamiento y de energías renovables no variables, conforme al cual "se amplió el universo de proyectos que pueden optar a este beneficio, incluyendo así a proyectos hidráulicos que puedan aportar flexibilidad al sistema".
"Otro cambio relevante que ha incorporado este proceso es considerar que los proyectos nuevos de almacenamiento deben contemplar al menos 4 horas de duración para acceder al incentivo señalado, además de permitir el traspaso de Costos Sistémicos, donde se incluye la posibilidad de incorporar otros costos sistémicos futuros que puedan aparecer, previa aprobación de la CNE", afirmó.
[RESUMEN]
La CNE aprobó modificaciones a las bases de licitación de suministro a clientes regulados. El proceso 2023/01 contempla un total de 3.600 GWh a adjudicar en dos bloques, con fecha de presentación de ofertas prevista para el 9 de abril próximo. La Resolución Exenta N°47 modifica la Resolución Exenta N°284 de 2023, estableciendo un nuevo volumen de energía a licitar. Se dividen en dos bloques de suministro, por 1.500 GWh y 2.100 GWh, con inicio en los años 2027 y 2028 respectivamente, y segmentaciones zonales y horarias.  El Secretario Ejecutivo de la CNE, Marco Mancilla, resaltó cambios en el proceso, como la ampliación del universo de proyectos que pueden optar a beneficios, incluyendo proyectos hidráulicos que aporten flexibilidad al sistema. Los proyectos nuevos de almacenamiento deben contemplar al menos 4 horas de duración para acceder a incentivos, y se permite el traspaso de Costos Sistémicos con aprobación de la CNE.


[NOTICIA A RESUMIR]
{input}
[RESUMEN]
"""

print("Prompt cargado correctamente.")


Prompt cargado correctamente.


# 4. Clase Summarizer

In [5]:
class Summarizer:
    """
    Clase que combina un prompt predefinido (prompt_summarizer)
    con un modelo de lenguaje  para generar
    un resumen especializado.
    """
    def __init__(self, model="gpt-4o-2024-11-20", temperature=0):
        """
        model: str con el nombre del modelo OpenAI (ej. gpt-4o-2024-11-20).
        temperature: Control de 'creatividad' (0 -> más determinista).
        """
        # Definimos el LLM de OpenAI
        llm = ChatOpenAI(model=model, temperature=temperature)

        # Creamos una plantilla (PromptTemplate) que usa 'prompt_summarizer'
        # e introduce la variable "input" donde irá el texto a resumir
        prompt = PromptTemplate(
            template=prompt_summarizer,
            input_variables=["input"]
        )

        # La notación `prompt | llm` en langchain_core permite "encadenar" (como un chain)
        # el template y el modelo en un solo paso
        self.chain = prompt | llm

    def __call__(self, input_text):
        """
        Llama a la cadena (prompt + modelo) con el texto a resumir.
        Retorna la respuesta generada.
        """
        output = self.chain.invoke(input_text)

        return output.content


# 5. Ejemplo de uso

Prueba diferentes LLMs para encontrar la configuración que mejor funcione. El siguiente link contiene los [modelos de OpenAI](https://platform.openai.com/docs/models) disponibles.


In [6]:
# Creamos una instancia del resumidor con GPT-4o y temperatura=0 (más determinista)
summarizer = Summarizer(model="gpt-4o-2024-11-20", temperature=0)

# Ejemplo de texto de discrepancia
texto_prueba = """
Wpd Chile ejecuta fase inicial de su proyecto de H2V en Magallanes con destacada inversión
La empresa avanza en la región con un proyecto de energía eólica destinado a la producción de hidrógeno verde, que busca generar hasta 1.000 MW.

Wpd Chile comenzó la primera etapa de su proyecto de energía eólica para la producción de hidrógeno verde en la región de Magallanes.
La compañía instaló una torre de medición para iniciar el proceso de medición de perfil de viento en la zona, que permitirá realizar el diseño del proyecto, el cual tendrá una capacidad instalada de entre 500 y 1.000 MW.
“La compañía tiene presencia en 31 países y queremos aprovechar nuestra experiencia en generación eléctrica renovable para seguir invirtiendo en Chile. La estrategia de crecimiento consiste en el desarrollo de proyectos propios y la compra de proyectos en etapa de desarrollo de terceros. Proyectamos una cartera de proyectos por 1GW al 2026”, sostuvo Lutz Kindermann, gerente General en Wpd Chile.
El proyecto contempla una inversión de USD$1.000 millones y está ubicado en la comuna de Laguna Blanca, a 60 kilómetros de la ciudad de Punta Arenas. Para la producción de hidrógeno verde, la compañía se encuentra en conversaciones y acuerdos con socios estratégicos expertos para el proceso químico y su posterior exportación.
La compañía ha sido constantemente parte de las discusiones regulatorias del sector eléctrico, pues consideran “urgente modernizar la legislación vigente”, comentó Kindermann. Y aunque aún creen en el potencial de Chile como un actor relevante de la transición energética, son enfáticos en insistir en cambios normativos.
El ejecutivo agregó que “la propuesta de Plan de Descarbonización y la Ley de Transición Energética son buenas señales para los cambios que necesita la industria. Esperamos que ambas se implementen con convicción y liderazgo para viabilizar de forma eficiente la descarbonización de la matriz energética de Chile, por medio de nuevos proyectos de energías limpias”.
Wpd se caracteriza por participar en todas las etapas de sus proyectos, lo que comprende su financiamiento, desarrollo, construcción y operación. Actualmente cuenta con 370 MW de capacidad instalada en el país, con sus tres parques eólicos: Lomas de Duqueco y Negrete, en la región del Biobío, y Malleco, en la región de La Araucanía.
"""

# Llamamos a la clase con el texto a resumir
resumen_generado = summarizer(texto_prueba)

print("=== RESUMEN GENERADO === \n")
print(resumen_generado)


=== RESUMEN GENERADO === 

Wpd Chile inició la primera etapa de su proyecto de energía eólica en Magallanes, destinado a la producción de hidrógeno verde con una capacidad instalada proyectada de entre 500 y 1.000 MW. La empresa instaló una torre de medición para analizar el perfil de viento en la comuna de Laguna Blanca, a 60 km de Punta Arenas, como parte del diseño del proyecto, que contempla una inversión de USD$1.000 millones. Según Lutz Kindermann, gerente general de Wpd Chile, la compañía busca aprovechar su experiencia global en energías renovables para expandir su presencia en Chile, con una cartera de proyectos de 1 GW al 2026. Además, están en conversaciones con socios estratégicos para el proceso químico y la exportación del hidrógeno verde. Kindermann destacó la necesidad de modernizar la legislación vigente y valoró iniciativas como el Plan de Descarbonización y la Ley de Transición Energética, instando a su implementación eficiente. Wpd, que opera tres parques eólicos en