In [None]:
import os
from dotenv import load_dotenv, find_dotenv

result = load_dotenv(find_dotenv(), override=True)

if result:
    print("Variables de entorno cargadas exitosamente.")
else:
    print("No se pudo cargar el archivo .env.")

    # Crear el archivo .env con las variables deseadas si no existe
    with open(".env", "w") as f:
        f.write(f"OPENAI_API_KEY=MY_OPENAI_API_KEY\n")
        f.write(f"PINECONE_API_KEY=MY_PINECONE_API_KEY\n")
        f.write(f"PINECONE_ENVIRONMENT=MY_PINECONE_ENVIRONMENT\n")

    print("Se creó el archivo .env con las variables iniciales.")
    # Vuelve a cargar las variables de entorno después de crear el archivo
    load_dotenv()

os.environ['OPENAI_API_KEY'] = os.getenv("OPENAI_API_KEY") or "MY_OPENAI_API_KEY"
os.environ['PINECONE_API_KEY'] =  os.getenv("PINECONE_API_KEY") or "MY_PINECONE_API_KEY"
os.environ["PINECONE_ENVIRONMENT"] = os.getenv("PINECONE_ENVIRONMENT") or "MY_PINECONE_ENVIRONMENT"

# LLM Models (GPT-3.5)

In [None]:
from langchain_openai import ChatOpenAI
from langchain_community.callbacks import get_openai_callback

In [None]:
gpt3 = ChatOpenAI(openai_api_key=os.environ['OPENAI_API_KEY'],
                  model_name='gpt-3.5-turbo-1106', 
                  temperature=0.5, max_tokens = 1024)

hacemos el modelo al que le vamos a pedir que nos responda, dandole la api_key, el nombre del modelo, la temperatura y el maximo de tokens

In [None]:
print(gpt3)

In [None]:
from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate.from_messages([
    ('system', 'Responde segun el idioma que te escriban en el prompt. Ejemplo: input en Espanol: Hola como estas? Respondes en espanol, input en Ingles: Hello how are you? respondes en ingles'),#contexto del modelo,
    ('user', '{input}')#mensaje
])

Utilizamos una plantilla de prompt donde en system le damos un contexto al modelo para que pueda responder, en user agregaremos el prompt

In [None]:
chain = prompt | gpt3

Creamos la cadena uniendo el prompt y el modelo

In [None]:
#chain.invoke({"input":"dime un chiste corto  nuevo sobre montanas"})

In [None]:
from langchain_core.output_parsers import StrOutputParser

output_parser =  StrOutputParser()

In [None]:
chain = prompt | gpt3 | output_parser

Para poder ver mejor el mensaje de respuesta del modelo, creamos una cadena agregandole la funcion de output

In [None]:
with get_openai_callback() as cb:
    salida = chain.invoke({"input":"Hola, buenos dias, como estas?"})
    print(f"Total Tokens: {cb.total_tokens}")
    print(f"Prompt Tokens: {cb.prompt_tokens}")
    print(f"Completion Tokens: {cb.completion_tokens}")
    print(f"Total Cost (USD): ${cb.total_cost}")

con la llamada a openai, aqui podemos ver la cantidad de tokens utolizados y el precio total de ellos

In [None]:
print(salida)

Con esto podemos notar que solo es un chatbot 

# Cuenta de cuantos tokens puede tener una entrada y una salidad

In [None]:
from langchain.text_splitter import CharacterTextSplitter

text_splitter = CharacterTextSplitter.from_tiktoken_encoder(
    chunk_size=100, chunk_overlap=0
)

texts = text_splitter.split_text(salida)

In [None]:
print(texts)

In [None]:
from langchain.text_splitter import TokenTextSplitter

text_splitter = TokenTextSplitter(chunk_size=10, chunk_overlap=0)

texts = text_splitter.split_text(salida)

In [None]:
print(texts[0])

# Otra manera de contar tokens con Tiktoken

In [None]:
import tiktoken

In [None]:
#definimos una funcion para contar los tokens

def num_tokens_from_strings(string, encoding_name=str) -> str:
    "Retorna el numero de tokens"
    encoding =  tiktoken.encoding_for_model(encoding_name) #Encoding_for_model es para encodear especificamente bajo el modelo que se este utilizando
    num_tokens = len(encoding.encode(string))
    print(f"El numero de tokens de salida es: {num_tokens}")

In [None]:
num_tokens_from_strings(salida, "gpt-3.5-turbo-1106")