# Instalar librerías

In [10]:
# Instalar las librerías contenidas en el archivo requirements. La bandera -q es para que no muestre los mensajes de instalación.
# ! Sirve para indicar al notebook que el comando se ejecuta en el shell y no en Python.
!pip install -r ./requirements.txt -q

In [7]:
# Ver la librería de LangChain instalada.
!pip show langchain

Name: langchain
Version: 0.0.302
Summary: Building applications with LLMs through composability
Home-page: https://github.com/langchain-ai/langchain
Author: 
Author-email: 
License: MIT
Location: C:\Users\Admin\anaconda3\envs\LangChain\Lib\site-packages
Requires: aiohttp, anyio, dataclasses-json, jsonpatch, langsmith, numexpr, numpy, pydantic, PyYAML, requests, SQLAlchemy, tenacity
Required-by: 


In [11]:
# Si la librería ya está instalada, actualizarla de ser necesario.
!pip install langchain --upgrade -q

# Configurar dotenv

In [12]:
# Importar librerías os (para acceder a variables de entorno) y dotenv (para cargar variables de entorno desde un archivo .env).
import os
from dotenv import load_dotenv, find_dotenv

In [13]:
# Cargar variables de entorno desde el archivo .env.
load_dotenv('./.env')

True

In [14]:
# Validar que el archivo .env se haya cargado correctamente obteniendo el valor de la variable de entorno OPENAI_API_KEY.
os.environ.get('OPENAI_API_KEY')

'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'

In [15]:
# Otra forma de cargar el archivo .env es con la función find_dotenv() (es más recomendable).
# La propiedad override=True permite sobreescribir las variables de entorno que ya existen.
load_dotenv(find_dotenv(), override=True)

True

In [16]:
# Validar que el archivo .env se haya cargado correctamente obteniendo el valor de la variable de entorno OPENAI_API_KEY.
os.environ.get('OPENAI_API_KEY')

'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'

# LLM Models (GPT 3.5)

In [2]:
from langchain.llms import OpenAI

In [10]:
# El modelo text-davinci-003 es suficiente para generar textos de calidad.
# La temperatura, mientras más alta, más creativo será el texto generado (0-2).
# max_tokens representa el número máximo de tokens a generar.
gpt3 = OpenAI(model_name='text-davinci-003', temperature=0.7, max_tokens=1024)

In [11]:
print(gpt3)

[1mOpenAI[0m
Params: {'model_name': 'text-davinci-003', 'temperature': 0.7, 'max_tokens': 1024, 'top_p': 1, 'frequency_penalty': 0, 'presence_penalty': 0, 'n': 1, 'request_timeout': None, 'logit_bias': {}}


In [18]:
respuesta = gpt3("Explica qué es una base de datos.")
print(respuesta)



Una base de datos es una colección organizada de datos almacenados en una computadora y accesibles para su uso por programas de aplicaciones. Los datos almacenados en una base de datos se relacionan entre sí y están estructurados en un formato específico que permite a los usuarios recuperar y procesar información de manera eficiente. Las bases de datos se utilizan para almacenar y administrar grandes cantidades de información que de otra manera sería difícil de manejar.


In [19]:
# Obtener el número de tokens de la respuesta generada. Se consideran los tokens de entrada y salida.
# El costo de la API es de 4 tokens por cada 1,000 tokens generados.
print(gpt3.get_num_tokens("Explica qué es una base de datos."))
print(gpt3.get_num_tokens(respuesta))

12
156


In [17]:
# Hacer múltiples solicitudes al modelo.
respuestas = gpt3.generate(["El luchador mexicano más popular fue: ", 
                           "Lista 5 palabras que definan la filosofía: ",
                           "Explica brevemente qué es big data: "])

In [20]:
print(respuestas)

generations=[[Generation(text='\n\nEl luchador mexicano más popular es sin duda el "Rey" Místico, también conocido como El Solitario. Es un luchador profesional mexicano que ha ganado numerosos títulos en toda su carrera. Ha participado en varias promociones profesionales de lucha libre, incluyendo la Consejo Mundial de Lucha Libre (CMLL) y la Asistencia Asesoría y Administración (AAA). Es uno de los luchadores más queridos en México y se le considera un ícono de la lucha libre profesional mexicana.', generation_info={'finish_reason': 'stop', 'logprobs': None})], [Generation(text='\n\n1. Ética \n2. Razón \n3. Existencia \n4. Verdad \n5. Pensamiento', generation_info={'finish_reason': 'stop', 'logprobs': None})], [Generation(text='\n\nBig Data es un término que se refiere a los conjuntos de datos masivos, estructurados o no estructurados, que son demasiado grandes o complejos para ser procesados y analizados con herramientas tradicionales de procesamiento de datos. Esta información se p

In [21]:
# Hacer más legibles las múltiples respuestas generadas.
print(respuestas.generations)

[[Generation(text='\n\nEl luchador mexicano más popular es sin duda el "Rey" Místico, también conocido como El Solitario. Es un luchador profesional mexicano que ha ganado numerosos títulos en toda su carrera. Ha participado en varias promociones profesionales de lucha libre, incluyendo la Consejo Mundial de Lucha Libre (CMLL) y la Asistencia Asesoría y Administración (AAA). Es uno de los luchadores más queridos en México y se le considera un ícono de la lucha libre profesional mexicana.', generation_info={'finish_reason': 'stop', 'logprobs': None})], [Generation(text='\n\n1. Ética \n2. Razón \n3. Existencia \n4. Verdad \n5. Pensamiento', generation_info={'finish_reason': 'stop', 'logprobs': None})], [Generation(text='\n\nBig Data es un término que se refiere a los conjuntos de datos masivos, estructurados o no estructurados, que son demasiado grandes o complejos para ser procesados y analizados con herramientas tradicionales de procesamiento de datos. Esta información se puede usar pa

In [22]:
# Obtener el segundo elemento de la lista de respuestas generadas.
print(respuestas.generations[1])

[Generation(text='\n\n1. Ética \n2. Razón \n3. Existencia \n4. Verdad \n5. Pensamiento', generation_info={'finish_reason': 'stop', 'logprobs': None})]


In [23]:
# Obtener el primer elemento de la lista anterior. Cada vez se está más cerca del resultado final.
print(respuestas.generations[1][0])

text='\n\n1. Ética \n2. Razón \n3. Existencia \n4. Verdad \n5. Pensamiento' generation_info={'finish_reason': 'stop', 'logprobs': None}


In [25]:
# La respuesta anterior es un diccionario. Obtener el valor de la llave text.
print(respuestas.generations[1][0].text)




1. Ética 
2. Razón 
3. Existencia 
4. Verdad 
5. Pensamiento
