# Aplicación de resumenes con LangChain y OpenAI

## Preparando los Datos

In [1]:
pip install -r ./requirements.txt -q

Note: you may need to restart the kernel to use updated packages.


In [2]:
import os
from dotenv import load_dotenv, find_dotenv

In [3]:
load_dotenv(find_dotenv(), override=True)

True

# Resumen Básico

In [4]:
texto = """
La inteligencia artificial (IA), en el contexto de las 
ciencias de la computación, es una disciplina y un conjunto 
de capacidades cognoscitivas e intelectuales expresadas por 
sistemas informáticos o combinaciones de algoritmos cuyo propósito 
es la creación de máquinas que imiten la inteligencia humana para 
realizar tareas, y que pueden mejorar conforme recopilan información
. A diferencia de la inteligencia sintética, la inteligencia 
artificial no tiene como finalidad reemplazar a los humanos, 
sino mejorar significativamente las capacidades y contribuciones 
de estos. Se hizo presente poco después de la Segunda Guerra 
Mundial con el desarrollo de la «prueba de Turing», mientras 
que la locución fue acuñada en 1956 por el informático John 
McCarthy en la Conferencia de Dartmouth.

En la actualidad, la inteligencia artificial abarca una 
gran variedad de subcampos. Éstos van desde áreas de propósito 
general, aprendizaje y percepción, a otras más específicas como 
el reconocimiento de voz, el juego de ajedrez, la demostración 
de teoremas matemáticos, la escritura de poesía y el diagnóstico 
de enfermedades. La inteligencia artificial sintetiza y automatiza 
tareas que en principio son intelectuales y, por lo tanto, es 
potencialmente relevante para cualquier ámbito de diversas 
actividades intelectuales humanas. En este sentido, es un campo 
genuinamente universal.3

La arquitectura de las inteligencias artificiales y los procesos 
por los cuales aprenden, se mejoran y se implementan en algún área 
de interés varían según el enfoque de utilidad que se les quiera 
dar, pero de manera general, estos van desde la ejecución de 
sencillos algoritmos hasta la interconexión de complejas redes 
neuronales artificiales que intentan replicar los circuitos 
neuronales del cerebro humano y que aprenden mediante diferentes 
modelos de aprendizaje tales como el aprendizaje automático, el 
aprendizaje por refuerzo, el aprendizaje profundo o el aprendizaje 
supervisado.

Por otro lado, el desarrollo y aplicación de la inteligencia 
artificial en muchos aspectos de la vida cotidiana también ha 
propiciado la creación de nuevos campos de estudio como la robótica 
y la ética de las máquinas que abordan aspectos relacionados con 
la ética en la inteligencia artificial y que se encargan de 
analizar cómo los avances en este tipo de tecnologías impactarían
en diversos ámbitos de la vida, así como el manejo responsable y 
ético que se les debería dar a los mismos, además de establecer 
cuál debería ser la manera correcta de proceder de las máquinas y 
las reglas que deberían cumplir.

En cuanto a su clasificación, tradicionalmente se divide a la 
inteligencia artificial en inteligencia artificial débil, la cual
es la única que existe en la actualidad y que se ocupa de realizar 
tareas específicas, e inteligencia artificial fuerte, que sería 
una IA que excediese las capacidades humanas. Algunos expertos 
creen que si alguna vez se alcanza este nivel, se podría dar 
lugar a la aparición de una singularidad tecnológica, es decir, 
una entidad tecnológica superior que se mejoraría a sí misma 
constantemente, volviéndose incontrolable para los humanos, 
dando pie a teorías como el basilisco de Roko.

Algunas de las inteligencias artificiales más conocidas y 
utilizadas en la actualidad alrededor del mundo incluyen 
inteligencia artificial en el campo de la salud, asistentes 
virtuales como Alexa, el asistente de Google o Siri, traductores 
automáticos como el traductor de Google y DeepL, sistemas de 
recomendación como el de la plataforma digital de YouTube, motores 
de ajedrez y otros juegos como Stockfish y AlphaZero, chatbots 
como ChatGPT, creadores de arte de inteligencia artificial como 
Midjourney, Dall-e y Stable Diffusion, e incluso la conducción de 
vehículos autónomos como Tesla Autopilot.
"""

In [5]:
from langchain.chat_models import ChatOpenAI
from langchain.schema import(
    AIMessage,
    HumanMessage,
    SystemMessage
)

In [6]:
mensajes = [
    SystemMessage(content='Usted es un "copywriter" experto con gran experiencia en resumir documentos'),
    HumanMessage(content=f'haz un resumen breve y conciso del siguiente texto:\n Texto: {texto}')
]

In [7]:
llm = ChatOpenAI(temperature=0, model_name='gpt-3.5-turbo')

  llm = ChatOpenAI(temperature=0, model_name='gpt-3.5-turbo')


In [8]:
llm.get_num_tokens(texto)

988

In [9]:
resumen = llm(mensajes)

  resumen = llm(mensajes)


In [10]:
print(resumen)

content='La inteligencia artificial (IA) es un conjunto de capacidades cognitivas expresadas por sistemas informáticos que imitan la inteligencia humana para realizar tareas. Surgió después de la Segunda Guerra Mundial y abarca diversos subcampos, desde reconocimiento de voz hasta diagnóstico de enfermedades. Se basa en algoritmos y redes neuronales artificiales, y su aplicación ha dado lugar a nuevos campos como la robótica y la ética de las máquinas. Se clasifica en inteligencia artificial débil y fuerte, esta última con capacidades que exceden las humanas. Ejemplos incluyen asistentes virtuales, traductores automáticos, sistemas de recomendación y vehículos autónomos.' additional_kwargs={} response_metadata={'token_usage': {'completion_tokens': 163, 'prompt_tokens': 1033, 'total_tokens': 1196, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_

In [11]:
print(resumen.content)

La inteligencia artificial (IA) es un conjunto de capacidades cognitivas expresadas por sistemas informáticos que imitan la inteligencia humana para realizar tareas. Surgió después de la Segunda Guerra Mundial y abarca diversos subcampos, desde reconocimiento de voz hasta diagnóstico de enfermedades. Se basa en algoritmos y redes neuronales artificiales, y su aplicación ha dado lugar a nuevos campos como la robótica y la ética de las máquinas. Se clasifica en inteligencia artificial débil y fuerte, esta última con capacidades que exceden las humanas. Ejemplos incluyen asistentes virtuales, traductores automáticos, sistemas de recomendación y vehículos autónomos.


## Usando Plantillas de Promts (Prompt Templates)

In [12]:
from langchain import PromptTemplate
from langchain.chains import LLMChain

In [13]:
template = '''
Escriba un resumen conciso y breve del siguiente texto:
TEXTO: {texto}
Traduzca el resumen al {idioma}.
'''

In [14]:
prompt = PromptTemplate(
    input_variables=['texto', 'idioma'],
    template=template
)

In [15]:
llm.get_num_tokens(prompt.format(texto=texto, idioma='Inglés'))

1017

In [16]:
chain = LLMChain(llm=llm, prompt=prompt)
resumen = chain.run({'texto': texto, 'idioma':'Español'})

  chain = LLMChain(llm=llm, prompt=prompt)
  resumen = chain.run({'texto': texto, 'idioma':'Español'})


In [17]:
print(resumen)

La inteligencia artificial es una disciplina que busca imitar la inteligencia humana a través de sistemas informáticos. Se desarrolló después de la Segunda Guerra Mundial y abarca una amplia variedad de subcampos, desde el reconocimiento de voz hasta la escritura de poesía. Las inteligencias artificiales aprenden y se mejoran a través de diferentes modelos de aprendizaje, como el aprendizaje automático. Su aplicación en la vida cotidiana ha dado lugar a nuevos campos de estudio, como la ética de las máquinas. Se clasifica en inteligencia artificial débil, que realiza tareas específicas, y en inteligencia artificial fuerte, que excedería las capacidades humanas. Algunas de las inteligencias artificiales más conocidas incluyen asistentes virtuales, traductores automáticos y sistemas de recomendación.


## Resumenes de documentos usando SuffDocumentChain

In [18]:
from langchain import PromptTemplate
from langchain.chat_models import ChatOpenAI
from langchain.chains.summarize import load_summarize_chain
from langchain.docstore.document import Document

In [19]:
with open('minecraft.txt', encoding='utf-8') as f:
    texto = f.read()

print(texto)

Minecraft

Minecraft es un videojuego de construcción de tipo «mundo abierto» o sandbox creado originalmente por el sueco Markus Persson (conocido comúnmente como «Notch»),19 y posteriormente desarrollado por Mojang Studios (actualmente parte de Microsoft).20 Fue lanzado el 17 de mayo de 2009, y después de numerosos cambios, su primera versión estable «1.0» fue publicada el 18 de noviembre de 2011.
 Markus Persson, el creador de Minecraft.
Un mes antes del lanzamiento de su versión completa se estrenó una versión para dispositivos móviles llamada Minecraft: Pocket Edition en Android,21 y el 17 de noviembre del mismo año fue lanzada la misma versión para iOS.22 El 9 de mayo de 2012 fue lanzada la versión del juego para Xbox 360 y PS3. Todas las versiones de Minecraft reciben actualizaciones constantes desde su lanzamiento. En octubre de 2014, Minecraft lanzó su edición para PlayStation Vita,23 desarrollada por Mojang y 4J Studios. Esta versión presenta las mismas actualizaciones y simil

In [20]:
llm.get_num_tokens(texto)

4827

In [21]:
docs = [Document(page_content=texto)]
llm = ChatOpenAI(temperature=0, model_name='gpt-4')

In [22]:
template = '''
Escriba un resumen conciso y breve del siguiente texto:
TEXTO: {text}.
'''
prompt = PromptTemplate(
    input_variables=['text'],
    template=template
)

In [23]:
chain = load_summarize_chain(
    llm,
    chain_type='stuff',
    prompt=prompt,
    verbose=False
)
resumen = chain.run(docs)

In [24]:
print(resumen)

Minecraft es un videojuego de construcción de tipo "mundo abierto" creado por el sueco Markus Persson y desarrollado por Mojang Studios, ahora parte de Microsoft. Lanzado en 2009, el juego permite a los jugadores construir y destruir bloques en un mundo tridimensional. Minecraft ha sido adaptado para varias plataformas, incluyendo dispositivos móviles, Xbox 360, PS3 y PlayStation Vita. En 2014, Microsoft adquirió Minecraft por $2500 millones de dólares. A marzo de 2023, se habían vendido más de 238 millones de copias, convirtiéndolo en el videojuego más vendido de la historia. Minecraft también tiene varias ediciones, incluyendo Bedrock Edition, Console Edition y Education Edition, y ha inspirado varios spin-offs como Minecraft: Story Mode, Minecraft Dungeons, Minecraft Earth y Minecraft Legends.



## Resume Documentos largos usando map_reduce

In [25]:
from langchain import PromptTemplate
from langchain.chat_models import ChatOpenAI
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter

In [26]:
with open('ia.txt', encoding='utf-8') as f:
    texto = f.read()

llm = ChatOpenAI(temperature=0, model_name='gpt-3.5-turbo')

In [27]:
llm.get_num_tokens(texto)

13466

In [28]:
len(texto)

54987

In [29]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=12000, chunk_overlap=100)
chunks = text_splitter.create_documents([texto])

In [30]:
len(chunks)

5

In [31]:
print(chunks[4].page_content)

Una de las principales diferencias entre el aprendizaje automático y el aprendizaje profundo es que el último es capaz de procesar y analizar grandes cantidades de datos de manera más eficiente y precisa que el primero, especialmente cuando se trata de datos no estructurados, como imágenes, texto y audio. Además, el aprendizaje profundo tiene la capacidad de identificar patrones y características más complejas en los datos, lo que puede llevar a mejores resultados en aplicaciones como el reconocimiento de voz, la visión por computadora y el procesamiento del lenguaje natural.

Como se mencionó anteriormente, en resumen, la inteligencia artificial es la ciencia que entrena máquinas para que realicen tareas humanas, por lo que todo nuestro alrededor está rodeado de ella y mientras existan recursos con ese tipo de lenguaje la IA estará presente. El «aprendizaje automatizado» es una rama de la inteligencia artificial que le entrena a una máquina a cómo aprender, esta se encarga de ver patr

In [32]:
for i in range (0, 5):
    print(llm.get_num_tokens(chunks[i].page_content))

2462
3043
2886
2715
2360


In [33]:
chain = load_summarize_chain(
    llm,
    chain_type='map_reduce',
    verbose=False
)
resumen = chain.run(chunks)

In [34]:
print(resumen)

La inteligencia artificial (IA) es un campo de las ciencias de la computación que busca crear máquinas que imiten la inteligencia humana para realizar tareas. Se divide en inteligencia artificial débil y fuerte, con aplicaciones en áreas como la salud, asistentes virtuales y sistemas de recomendación. La regulación de la IA es importante para proteger los derechos individuales y garantizar el bienestar social. La IA ha tenido avances significativos a lo largo de la historia, con hitos como la creación de la primera red neuronal en 1943 y el desarrollo de sistemas expertos en las décadas de 1970 y 1980. La ética y las implicaciones sociales de la IA han sido temas de debate, con preocupaciones sobre el impacto en el empleo y la necesidad de pautas éticas en su desarrollo y uso. La IA tiene aplicaciones en ciberseguridad, descubrimiento de conocimientos y diversos campos, aunque ha generado controversias y desafíos en su capacidad para imitar por completo a un ser humano. La diferencia e

##  map_reduce con Prompts Personalizados

In [35]:
map_prompt = '''
Escriba un resumen conciso y breve del siguiente texto:
Que el resumen esté en español.
TEXTO: {text}
'''
map_prompt_template = PromptTemplate(
    input_variables=['text'],
    template=map_prompt
)

In [36]:
prompt_combinado = '''
Escriba un resumen conciso del siguiente texto que abarque los puntos claves.
Añade un título al resumen.
Comience su resumen con un PÁRRAFO DE INTRODUCCIÓN que ofrezca una visión general del tema SEGUIDO
por los PUNTOS tipo "BULLET Point" si es posible Y termine el resumen con una CONCLUSIÓN.
Texto: {text}
'''
prompt_template_combinado = PromptTemplate(template=prompt_combinado, input_variables=['text'])

In [37]:
llm = ChatOpenAI(temperature=0, model_name='gpt-4')

In [38]:
cadena_resumen = load_summarize_chain(
    llm=llm,
    chain_type='map_reduce',
    map_prompt=map_prompt_template,
    combine_prompt=prompt_template_combinado,
    verbose=False
)
resumen = cadena_resumen.run(chunks)

In [39]:
print(resumen)

Título: Inteligencia Artificial: Evolución, Aplicaciones y Desafíos

La Inteligencia Artificial (IA) es una rama de las ciencias de la computación que busca desarrollar máquinas capaces de imitar la inteligencia humana y mejorar a través de la recopilación de información. Aunque la IA ha experimentado avances significativos desde su concepción, también ha planteado cuestiones éticas y filosóficas. Además, el derecho juega un papel crucial en su uso y desarrollo, y se están estableciendo normas para garantizar el bienestar social y proteger los derechos individuales.

• La IA busca mejorar las capacidades humanas, no reemplazarlas.
• Los subcampos de la IA incluyen el reconocimiento de voz, el juego de ajedrez, la demostración de teoremas matemáticos, la escritura de poesía y el diagnóstico de enfermedades.
• La IA ha propiciado la creación de nuevos campos de estudio como la roboética y la ética de las máquinas.
• El término "inteligencia artificial" fue acuñado en 1956 durante la Conf

### Resumenes usando refine Chain 

In [40]:
pip install unstructured -q

Note: you may need to restart the kernel to use updated packages.


In [41]:
pip install pdf2image

Note: you may need to restart the kernel to use updated packages.


In [42]:
from langchain.chat_models import ChatOpenAI
from langchain import PromptTemplate
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.document_loaders import UnstructuredPDFLoader

In [43]:
import os
from dotenv import load_dotenv, find_dotenv
load_dotenv(find_dotenv(), override=True)

True

In [44]:
loader = UnstructuredPDFLoader('ia.pdf')
data = loader.load()

ModuleNotFoundError: No module named 'pdfminer'

In [None]:
print(data[0].page_content)

In [None]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=12000, chunk_overlap=100)
chunks = text_splitter.split_documents(data)

In [None]:
len(chunks)

In [None]:
llm = ChatOpenAI(temperature=0, model_name='gpt-3.5-turbo')

In [None]:
chain = load_summarize_chain(
    llm=llm,
    chain_type='refine',
    verbose=False
)
resumen = chain.run(chunks)

In [None]:
print(resumen)

## Refine con prompt personalizados

In [None]:
from langchain.chat_models import ChatOpenAI
from langchain import PromptTemplate
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.document_loaders import UnstructuredPDFLoader

In [None]:
loader = UnstructuredPDFLoader('FIFA 23 Modo Carrera.pdf')
data = loader.load()

In [None]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=2000, chunk_overlap=100)
chunks = text_splitter.split_documents(data)

In [None]:
llm = ChatOpenAI(temperature=0, model_name='gpt-4')

In [None]:
prompt_template = """Escribe un resumen conciso de lo siguiente extrayendo la información clave:
Text: {text}
Resumen:"""
prompt_inicial = PromptTemplate(template=prompt_template, input_variables=['text'])

In [None]:
refine_template = '''
    Tu trabajo consiste en elaborar un resumen final.
    He proporcionado un resumen existente hasta cierto punto: {existing_answer}.
    Por favor, perfeccione el resumen existente con algo más de contexto a continuación.
    ------------
    {text}
    ------------
    Comience el resumen final con una "Introducción" que ofrezca una visión general del tema seguido
    por los puntos más importantes ("Bullet Ponts"). Termina el resumen con una conslusión.
'''
refine_prompt = PromptTemplate(
    template=refine_template,
    input_variables=['existing_answer', 'text'])

In [None]:
chain = load_summarize_chain(
    llm=llm,
    chain_type='refine',
    question_prompt=prompt_inicial,
    refine_prompt=refine_prompt,
    return_intermediate_steps=False
    
)
resumen = chain.run(chunks)

In [None]:
print(resumen)

## Resume usando Agentes de LangChains

In [None]:
from langchain.chat_models import ChatOpenAI
from langchain.agents import initialize_agent, Tool
from langchain.utilities import WikipediaAPIWrapper

In [None]:
import os
from dotenv import load_dotenv, find_dotenv
load_dotenv(find_dotenv(), override=True)

In [None]:
llm = ChatOpenAI(temperature=0, model_name='gpt-4')
wikipedia = WikipediaAPIWrapper()

In [None]:
tools = [
    Tool(
        name="Wikipedia", 
        func=wikipedia.ruu,
        description="Útil para cuando necesitas obtener información de wikipedia sobre un solo tema"
    )

]

In [None]:
agent_executor = initialize_agent(tools, llm, agent='zero-shot-react-description', verbose=True)

In [None]:
respuesta = agent_executor.run('¿Podría resumir brevemente la copa del mundo qatar 2022, quién fue el campeón y por cuánto ganaron?')

In [None]:
print(respuesta)