In [4]:
import os, getpass

os.environ["OPENAI_API_KEY"] = getpass.getpass("Ingresa tu API Key de OpenAI : ")

## Usando la API de OpenAI

In [5]:
from langchain.chat_models import ChatOpenAI

llm = ChatOpenAI(model_name = "gpt-4") #"gpt-3.5-turbo"
print(llm.predict("¿quién ganó el último mundial de fútbol"))

El último Mundial de Fútbol fue en 2018 y fue ganado por Francia.


## Usando template en Langchain

In [11]:
from langchain.prompts import PromptTemplate

prompt = PromptTemplate.from_template(
    "quién fue el premio nobel de {categoria} en el año {anio}"
)

prompt.format(categoria = "literatura", anio = 1999)

'quién fue el premio nobel de literatura en el año 1999'

In [12]:
print(llm.predict(prompt.format(categoria = "literatura", anio = 1999)))

El premio Nobel de Literatura en el año 1999 fue otorgado a la escritora alemana Günter Grass.


In [14]:
from langchain.prompts.chat import ChatPromptTemplate

template = "You are a helpful assistant that translates {input_language} to {output_language}."
human_template = "{text}"

chat_prompt = ChatPromptTemplate.from_messages([
    ("system", template),
    ("human", human_template)
])

chat_prompt.format_messages(input_language = "English", output_language = "Spanish", text = "I like Langchain")

[SystemMessage(content='You are a helpful assistant that translates English to Spanish.'),
 HumanMessage(content='I like Langchain')]

In [15]:
from langchain.chat_models import ChatOpenAI

llm = ChatOpenAI(model_name = "gpt-3.5-turbo")

llm(chat_prompt.format_messages(input_language = "English", output_language = "Spanish", text = "I like Langchain"))

AIMessage(content='Me gusta Langchain')

## Usando chain

Usar un LLM de forma aislada está bien para aplicaciones simples, pero las aplicaciones más complejas requieren encadenar LLM, ya sea entre sí o con otros componentes.

LangChain proporciona dos marcos de alto nivel para "encadenar" componentes. El enfoque heredado es utilizar LLMChain. 
El enfoque actualizado es utilizar el lenguaje de expresión LangChain (LCEL).
Al crear nuevas aplicaciones, recomendamos utilizar LCEL para la composición de la cadena.

In [16]:
from langchain.chains import LLMChain
from langchain.chat_models import ChatOpenAI
from langchain.prompts.chat import ChatPromptTemplate

llm = ChatOpenAI(model_name = "gpt-3.5-turbo")

template = "You are a helpful assistant that translates {input_language} to {output_language}."
human_template = "{text}"

chat_prompt = ChatPromptTemplate.from_messages([
    ("system", template),
    ("human", human_template)
])

chain = LLMChain(llm = llm, prompt = chat_prompt)
chain.run(input_language = "English", output_language = "French", text = "I love programming.")

"J'adore programmer."

## Nueva versión de chain con LangChain Expression Language (LCEL)

In [17]:
llm = ChatOpenAI(model_name = "gpt-3.5-turbo")
chain = prompt | llm

In [19]:
chain.input_schema.schema()

{'title': 'PromptInput',
 'type': 'object',
 'properties': {'anio': {'title': 'Anio', 'type': 'string'},
  'categoria': {'title': 'Categoria', 'type': 'string'}}}

In [20]:
chain.invoke({"categoria" : "química", "anio" : "2018"})

AIMessage(content='El Premio Nobel de Química en el año 2018 fue otorgado conjuntamente a Frances H. Arnold, George P. Smith y Sir Gregory P. Winter "por la evolución dirigida de enzimas y la visualización de los fagos de presentación de péptidos".')

In [21]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts.chat import ChatPromptTemplate

llm = ChatOpenAI(model_name = "gpt-3.5-turbo")

prompt = ChatPromptTemplate.from_messages(
    [
        ("system","Eres un experto en mundiales de fútbol desde 1930 al 2022"),
        ("human", "{pregunta}")
    ]
)

chain = prompt | llm

In [22]:
chain.input_schema.schema()

{'title': 'PromptInput',
 'type': 'object',
 'properties': {'pregunta': {'title': 'Pregunta', 'type': 'string'}}}

In [23]:
chain.invoke({"pregunta" : "¿quien ganó el último mundial?"})

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 4.0 seconds as it raised ServiceUnavailableError: The server is overloaded or not ready yet..


AIMessage(content='Hasta la fecha de mi conocimiento, el último mundial de fútbol fue el celebrado en 2018 en Rusia y el ganador fue la selección nacional de Francia. Fue su segundo título mundial, habiendo ganado anteriormente en 1998. En la final vencieron a Croacia por 4-2.')

## Usando la memoria

La mayoría de las aplicaciones LLM tienen una interfaz conversacional. Un componente esencial de una conversación es poder hacer referencia a la información presentada anteriormente en la conversación.


![imagen](https://python.langchain.com/assets/images/memory_diagram-0627c68230aa438f9b5419064d63cbbc.png)

In [24]:
from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationChain

conversation = ConversationChain(
    llm = llm, 
    verbose = True, 
    memory = ConversationBufferMemory()
)

conversation.predict(input = "quién es Leonel Messi")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: quién es Leonel Messi
AI:[0m

[1m> Finished chain.[0m


'Leonel Messi es un futbolista argentino considerado uno de los mejores jugadores de fútbol de todos los tiempos. Nació el 24 de junio de 1987 en Rosario, Argentina. Messi comenzó su carrera en el fútbol profesional en el FC Barcelona, donde pasó la mayor parte de su carrera y ganó numerosos títulos, incluyendo la Liga de Campeones de la UEFA y múltiples títulos de La Liga. También ha representado a la selección argentina en varias competiciones internacionales, incluyendo la Copa del Mundo. Messi es conocido por su habilidad técnica, velocidad y habilidades de regate, y ha sido galardonado con el premio Balón de Oro en múltiples ocasiones, reconocido como el mejor jugador del mundo. ¿Hay algo más que te gustaría saber sobre Messi?'

In [25]:
conversation.predict(input = "en qué clubes y cuántos títulos ha ganado")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: quién es Leonel Messi
AI: Leonel Messi es un futbolista argentino considerado uno de los mejores jugadores de fútbol de todos los tiempos. Nació el 24 de junio de 1987 en Rosario, Argentina. Messi comenzó su carrera en el fútbol profesional en el FC Barcelona, donde pasó la mayor parte de su carrera y ganó numerosos títulos, incluyendo la Liga de Campeones de la UEFA y múltiples títulos de La Liga. También ha representado a la selección argentina en varias competiciones internacionales, incluyendo la Copa del Mundo. Messi es conocido por su habilidad técnica, velocidad y habilidades de regate, y ha sido galardonado con el premio Balón de Oro


[1m> Finished chain.[0m


'Leonel Messi ha jugado en dos clubes principales en su carrera: el FC Barcelona y el Paris Saint-Germain (PSG). Durante su tiempo en el FC Barcelona, Messi ganó un total de 34 títulos. Esto incluye 10 La Liga, 7 Copas del Rey, 8 Supercopas de España, 4 Liga de Campeones de la UEFA, 3 Supercopas de la UEFA y 3 Copas Mundiales de Clubes de la FIFA. \n\nEn cuanto a su tiempo en el PSG, hasta el momento de nuestra conversación, Messi ha ganado un título con el club, la Supercopa de Francia. Sin embargo, es importante tener en cuenta que esta información puede cambiar ya que Messi es un jugador activo y los títulos se disputan cada temporada. ¿Hay algo más que te gustaría saber?'

In [26]:
conversation.predict(input = "cuántos goles ha marcado en total y cuántos fueron en la Champions League")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: quién es Leonel Messi
AI: Leonel Messi es un futbolista argentino considerado uno de los mejores jugadores de fútbol de todos los tiempos. Nació el 24 de junio de 1987 en Rosario, Argentina. Messi comenzó su carrera en el fútbol profesional en el FC Barcelona, donde pasó la mayor parte de su carrera y ganó numerosos títulos, incluyendo la Liga de Campeones de la UEFA y múltiples títulos de La Liga. También ha representado a la selección argentina en varias competiciones internacionales, incluyendo la Copa del Mundo. Messi es conocido por su habilidad técnica, velocidad y habilidades de regate, y ha sido galardonado con el premio Balón de Oro

'Hasta el momento de nuestra conversación, Leonel Messi ha marcado un total de 672 goles en competiciones de clubes. De estos, 120 goles fueron en la Liga de Campeones de la UEFA. Es importante tener en cuenta que estos números pueden cambiar, ya que Messi sigue activo y continúa jugando al fútbol. ¿Hay algo más en lo que pueda ayudarte?'

In [27]:
conversation.predict(input = "quién es su esposa y cuántos hijos tiene")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: quién es Leonel Messi
AI: Leonel Messi es un futbolista argentino considerado uno de los mejores jugadores de fútbol de todos los tiempos. Nació el 24 de junio de 1987 en Rosario, Argentina. Messi comenzó su carrera en el fútbol profesional en el FC Barcelona, donde pasó la mayor parte de su carrera y ganó numerosos títulos, incluyendo la Liga de Campeones de la UEFA y múltiples títulos de La Liga. También ha representado a la selección argentina en varias competiciones internacionales, incluyendo la Copa del Mundo. Messi es conocido por su habilidad técnica, velocidad y habilidades de regate, y ha sido galardonado con el premio Balón de Oro


[1m> Finished chain.[0m


'La esposa de Leonel Messi es Antonela Roccuzzo. Se conocieron cuando eran niños en su ciudad natal de Rosario, Argentina, y comenzaron a salir en 2008. Se casaron el 30 de junio de 2017 y tienen tres hijos juntos. Sus nombres son Thiago Messi Roccuzzo, Mateo Messi Roccuzzo y Ciro Messi Roccuzzo. ¿Hay algo más que te gustaría saber?'

## Usando Document Loader

Los Document Loader proporcionan un método de ingesta para cargar datos como documentos desde una fuente que puede ser un PDF, csv, videos de youtube, archivos en S3, Slack, website, etc.

Se usan estos documentos para múltiples propósitos en los cuales destacan la carga de datos a una base de conocimiento (Base de datos vectorial).


![Imagen](https://python.langchain.com/assets/images/qa_data_load-70fac3ea6593b986613784dc056df21a.png)

## Web

In [28]:
from langchain.document_loaders import WebBaseLoader

loader = WebBaseLoader("https://www.marca.com/co/2023/10/17/652e070f22601d73648b4585.html") #WebBaseLoader(["https://url1/", "https://url2"])
dataweb = loader.load()

In [29]:
len(dataweb), dataweb

(1,
 [Document(page_content='\n\n\n\n\n\n\n\n\n\nTabla de posiciones Eliminatorias Mundial 2026: Clasificación y resultados de la cuarta fecha en Sudamérica | Marca \n\n\n\n\n\n\n\n\n\n\n\n\n\n\n \n\n\n\n\n\n\n\n \n\n\n\n\n\n\n\n\n \n \n\n\n\n\n\n\n  \n\n\n\n\n\n\n\n\n\n\n\n\n\n \n\n\nEs noticia: Clasificacion F1 hoyLibres F1Sorteo Copa del ReyLibres y Clasificación F1 Brasil horariosLas Palmas - Atlético TVWembanyamaBarcelona - Panathinaikos TVGP Brasil F1 horarioMr Olympia TVYoung MikoTamara FalcóDaniel SanchoMasterChef CelebrityBárbara ReySalvese quien puedaGH VIP 8Pase de batalla y skins de FortniteFortnite nueva temporadaEmpresa transplante CristianoInvitados PasapalabraInvitados El HormigueroPrecio luz hoyResultados fútbolCalendario F1Champions League \n\n\n\n\n\nPortada de Marca\n\n\n\n\nEdición seleccionada\nES \n\n\nEdiciones:\n\n\n\nES (España)\n\n\n\nEN (English)\n\n\n\n\nMX (México)\n\n\n\n\nUS (USA)\n\n\n\n\n\n\n\nEscoge tu edición de Marca.com favorita\n\n\n\n\nSiempre qu

## PDF

In [30]:
from langchain.document_loaders import PyPDFLoader

loader = PyPDFLoader("pdf/StateofAI-Espanol.pdf")
datapdf = loader.load()

In [31]:
len(datapdf), datapdf

(79,
 [Document(page_content='Estado de la IA .\nAmérica Latina 2023\nReporte de investigación de ALLVP\n', metadata={'source': 'pdf/StateofAI-Espanol.pdf', 'page': 0}),
  Document(page_content='ha surgido  como  una fuerza  transformadora  a nivel mundial , con el potencial  de \nrevolucionar  industrias  y generar  impactos  tangibles en diversos  sectores . Sin embargo, América Latina \naún carece  de un recurso  integral que fomente  conversaciones  de alto nivel sobre  el estado  de la IA en la \nregión  y su potencial  de crecimiento  e innovación .\nEn respuesta  a esta brecha , ALLVP se complace  en presentar  el informe  Estado de la IA en América \nLatina. Nuestro  equipo  de investigación  encuestó  a una amplia  gama  de actores , recopiló  diligentemente  \nlas últimas  investigaciones  en el campo y llevó a cabo  conversaciones  en profundidad  con expertos . El \nresultado  es una visión  panorámica  de las tendencias  de la IA, casos  de uso y potencial  en la región .\

## S3

In [32]:
from langchain.document_loaders import S3FileLoader

loader = S3FileLoader(
    "bigdataiotcloudaws", 
    "book/1000cóctelesdetodoelmundo.pdf", 
    aws_access_key_id = "AKIA6EMKHKC74ULG3635", 
    aws_secret_access_key = "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"
)

datas3 = loader.load()

In [33]:
len(datas3), datas3

(1,
 [Document(page_content='Antonio Primiceri con la colaboración de Roberto Savioli\n\nA pesar de haber puesto el máximo cuidado en la redacción de esta obra, el autor o el editor no pueden en modo alguno responsabilizarse por las informaciones (fórmulas, recetas, técnicas, etc.) vertidas en el texto. Se aconseja, en el caso de problemas específicos —a menudo únicos— de cada lector en particular, que se consulte con una persona cualificada para obtener las informaciones más completas, más exactas y lo más actualizadas posible. DE VECCHI EDICX IONES, S. A.\n\nTraducción de Sònia Rodríguez Bernal. Diseño gráfico de la cubierta de Design 3. Fotografías de archivo DVE. Ilustraciones de Michela Ameli.\n\n© De Vecchi Ediciones, S. A. 2012 Diagonal 519-521, 2º 08029 Barcelona Depósito Legal: B. 19.420-2012 ISBN: 978-84-315-5498-9\n\nEditorial De Vecchi, S. A. de C. V. Nogal, 16 Col. Sta. María Ribera 06400 Delegación Cuauhtémoc México\n\nReservados todos los derechos. Ni la totalidad ni par

# CSV

In [34]:
from langchain.document_loaders.csv_loader import CSVLoader

loader = CSVLoader(file_path = "minerasdelmundo.csv")
datacsv = loader.load()

In [35]:
len(datacsv), datacsv

(56,
 [Document(page_content='N: 1\nMina: Escondida\nPaís: Chile\nEmpresa: BHP\nAñoOperación: 1990\nTipoMina: Open pit\nMetal: Cobre', metadata={'source': 'minerasdelmundo.csv', 'row': 0}),
  Document(page_content='N: 2\nMina: Chuquicamata\nPaís: Chile\nEmpresa: Codelco\nAñoOperación: 1915\nTipoMina: Open pit\nMetal: Cobre', metadata={'source': 'minerasdelmundo.csv', 'row': 1}),
  Document(page_content='N: 3\nMina: Collahuasi\nPaís: Chile\nEmpresa: Anglo American\nAñoOperación: 1993\nTipoMina: Open pit\nMetal: Cobre', metadata={'source': 'minerasdelmundo.csv', 'row': 2}),
  Document(page_content='N: 4\nMina: Radom\nPaís: Polonia\nEmpresa: KGHM Polska Mied?\nAñoOperación: 1957\nTipoMina: Underground\nMetal: Cobre', metadata={'source': 'minerasdelmundo.csv', 'row': 3}),
  Document(page_content='N: 5\nMina: Cerro Verde\nPaís: Perú\nEmpresa: Freeport-McMoRan\nAñoOperación: 1992\nTipoMina: Open pit\nMetal: Cobre', metadata={'source': 'minerasdelmundo.csv', 'row': 4}),
  Document(page_conten

## Youtube

In [36]:
from langchain.document_loaders.generic import GenericLoader
from langchain.document_loaders.parsers import OpenAIWhisperParser
from langchain.document_loaders.blob_loaders.youtube_audio import YoutubeAudioLoader

url = "https://www.youtube.com/watch?v=5yyB6qmafuc" #5 minutos
save_dir = "docs/youtube/"
loader = GenericLoader(
    YoutubeAudioLoader([url], save_dir),
    OpenAIWhisperParser()
)
datayoutube = loader.load()

[youtube] Extracting URL: https://www.youtube.com/watch?v=5yyB6qmafuc
[youtube] 5yyB6qmafuc: Downloading webpage
[youtube] 5yyB6qmafuc: Downloading ios player API JSON
[youtube] 5yyB6qmafuc: Downloading android player API JSON
[youtube] 5yyB6qmafuc: Downloading m3u8 information
[info] 5yyB6qmafuc: Downloading 1 format(s): 140
[download] Destination: docs/youtube//Los límites físicos de la inteligencia artificial.m4a
[download] 100% of    4.64MiB in 00:00:00 at 5.01MiB/s   
[FixupM4a] Correcting container of "docs/youtube//Los límites físicos de la inteligencia artificial.m4a"
[ExtractAudio] Not converting audio docs/youtube//Los límites físicos de la inteligencia artificial.m4a; file is already in target format m4a
Transcribing part 1!


In [37]:
len(datayoutube), datayoutube

(1,
 [Document(page_content='¿Qué pasaría si la inteligencia artificial, la que está detrás de nuestro feed de redes sociales, de los pagos bancarios o de las búsquedas de Google, se detiene? ¿Qué pasa si deja de funcionar? Estamos todavía lejos de que eso pase, pero lo que sí está claro es que, antes de que la inteligencia artificial se apodere del planeta, es más fácil quedarnos sin recursos físicos para entrenar y hacer funcionar esta tecnología, que va creciendo más rápido de lo que todos esperaban. Aquí les cuento más. La computación, los cálculos computacionales de los programas de inteligencia artificial, normalmente se hacen en centros de datos. Esos son edificios que albergan miles de computadoras y servidores. Pero esta capacidad física, obvio, también puede llegar a sus límites, de seguir usando la inteligencia artificial al ritmo al que lo venimos haciendo. Esto nos deja con dos opciones, o construir más centros de datos, o hacer que la computación sea más eficiente. Y cual

## Document transformers

Una vez que haya cargado los documentos, a menudo querrá transformarlos para que se adapten mejor a su aplicación. El ejemplo más simple es que desee dividir un documento largo en partes más pequeñas que puedan entrar en la ventana de contexto de un modelo de lenguaje (GPT4, Llama 2, Mistral, Falcon, Palm 2, etc). 
(https://python.langchain.com/docs/modules/data_connection/document_transformers/)

![image](https://miro.medium.com/v2/resize:fit:828/format:webp/1*n4XS0XkKM8RsRwgJxWpNpQ.jpeg)

In [52]:
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size = 500,
    chunk_overlap  = 20
)

docs = text_splitter.split_documents(documents = datapdf)

In [53]:
len(docs), docs


(134,
 [Document(page_content='Estado de la IA .\nAmérica Latina 2023\nReporte de investigación de ALLVP', metadata={'source': 'pdf/StateofAI-Espanol.pdf', 'page': 0}),
  Document(page_content='ha surgido  como  una fuerza  transformadora  a nivel mundial , con el potencial  de \nrevolucionar  industrias  y generar  impactos  tangibles en diversos  sectores . Sin embargo, América Latina \naún carece  de un recurso  integral que fomente  conversaciones  de alto nivel sobre  el estado  de la IA en la \nregión  y su potencial  de crecimiento  e innovación .\nEn respuesta  a esta brecha , ALLVP se complace  en presentar  el informe  Estado de la IA en América', metadata={'source': 'pdf/StateofAI-Espanol.pdf', 'page': 1}),
  Document(page_content='Latina. Nuestro  equipo  de investigación  encuestó  a una amplia  gama  de actores , recopiló  diligentemente  \nlas últimas  investigaciones  en el campo y llevó a cabo  conversaciones  en profundidad  con expertos . El \nresultado  es una visió

In [54]:
from langchain.text_splitter import CharacterTextSplitter

text_splitter = CharacterTextSplitter.from_tiktoken_encoder(
    chunk_size = 400, 
    chunk_overlap = 20
)

docs = text_splitter.split_documents(documents = datapdf)

In [55]:
len(docs), docs

(78,
 [Document(page_content='Estado de la IA .\nAmérica Latina 2023\nReporte de investigación de ALLVP', metadata={'source': 'pdf/StateofAI-Espanol.pdf', 'page': 0}),
  Document(page_content='ha surgido  como  una fuerza  transformadora  a nivel mundial , con el potencial  de \nrevolucionar  industrias  y generar  impactos  tangibles en diversos  sectores . Sin embargo, América Latina \naún carece  de un recurso  integral que fomente  conversaciones  de alto nivel sobre  el estado  de la IA en la \nregión  y su potencial  de crecimiento  e innovación .\nEn respuesta  a esta brecha , ALLVP se complace  en presentar  el informe  Estado de la IA en América \nLatina. Nuestro  equipo  de investigación  encuestó  a una amplia  gama  de actores , recopiló  diligentemente  \nlas últimas  investigaciones  en el campo y llevó a cabo  conversaciones  en profundidad  con expertos . El \nresultado  es una visión  panorámica  de las tendencias  de la IA, casos  de uso y potencial  en la región .\nA

In [57]:
from langchain.text_splitter import RecursiveCharacterTextSplitter, Language

PYTHON_CODE = """
def hello_world():
    print("Hello, World!")

def suma(num1, num2):
    return num1 + num2

# Call the function
hello_world()
"""
python_splitter = RecursiveCharacterTextSplitter.from_language(
    language = Language.PYTHON, 
    chunk_size = 50, 
    chunk_overlap = 0
)

python_docs = python_splitter.create_documents([PYTHON_CODE])
python_docs

[Document(page_content='def hello_world():\n    print("Hello, World!")'),
 Document(page_content='def suma(num1, num2):\n    return num1 + num2'),
 Document(page_content='# Call the function\nhello_world()')]

In [58]:
JS_CODE = """
function helloWorld() {
  console.log("Hello, World!");
}

// Call the function
helloWorld();
"""

js_splitter = RecursiveCharacterTextSplitter.from_language(
    language = Language.JS, 
    chunk_size = 60, 
    chunk_overlap = 0
)
js_docs = js_splitter.create_documents([JS_CODE])
js_docs

[Document(page_content='function helloWorld() {\n  console.log("Hello, World!");\n}'),
 Document(page_content='// Call the function\nhelloWorld();')]