## Estructura

Claves:
1. Conexión con modelos
2. Conexión con datos
3. Encadenamiento de procesos


https://python.langchain.com/docs/integrations/providers/

# Fundamentos

In [1]:
from transformers import AutoTokenizer, pipeline
import torch

# model = "tiiuae/falcon-40b-instruct" # Generacion de texto
# model = "stabilityai/stablelm-tuned-alpha-3b"
model = "tiiuae/falcon-7b-instruct"

tokenizer = AutoTokenizer.from_pretrained(model)

pipeline = pipeline(
    "text-generation",
    model=model,
    tokenizer= tokenizer,
    torch_dtype=torch.bfloat16,
    trust_remote_code=True,
    device_map="auto"
)

  from .autonotebook import tqdm as notebook_tqdm


Fetching 2 files: 100%|██████████| 2/2 [03:21<00:00, 100.80s/it]
Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.13s/it]
Some parameters are on the meta device because they were offloaded to the disk.
Device set to use mps


In [2]:
type(pipeline)

transformers.pipelines.text_generation.TextGenerationPipeline

In [4]:
from langchain import HuggingFacePipeline

llm_falcon = HuggingFacePipeline(
    pipeline = pipeline,
    model_kwargs = {
        "temperature": 0,
        "max_length": 200,
        "do_sample": True,
        "top_k": 10,
        "num_return_sequences": 1,
        "eos_token_id": tokenizer.eos_token_id
    }
)

In [5]:
llm_falcon

HuggingFacePipeline(pipeline=<transformers.pipelines.text_generation.TextGenerationPipeline object at 0x10fdceba0>, model_kwargs={'temperature': 0, 'max_length': 200, 'do_sample': True, 'top_k': 10, 'num_return_sequences': 1, 'eos_token_id': 11})

In [6]:
llm_falcon("what is AI?")

  llm_falcon("what is AI?")
Setting `pad_token_id` to `eos_token_id`:11 for open-end generation.


'what is AI?\nAI stands for Artificial Intelligence. It is a branch of computer science that focuses on creating intelligent machines'

# Models with openAI

In [13]:
import os
from dotenv import load_dotenv

load_dotenv()

OPENAI_API_KEY = os.getenv("OPEN_AI_KEY")
os.environ['OPENAI_API_KEY'] = OPENAI_API_KEY

In [24]:
from langchain_openai import ChatOpenAI

llm_gpt3_5 = ChatOpenAI(
    model_name = "gpt-3.5-turbo",
    n = 1, #numero de diferentes respuestas
    temperature = 0.3
)

In [25]:
llm_gpt3_5

ChatOpenAI(client=<openai.resources.chat.completions.completions.Completions object at 0x16abe9fd0>, async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x16abf67b0>, root_client=<openai.OpenAI object at 0x16a847b60>, root_async_client=<openai.AsyncOpenAI object at 0x16abea120>, temperature=0.3, model_kwargs={}, openai_api_key=SecretStr('**********'), n=1)

In [27]:
llm_gpt3_5.invoke('Como puedo lograr una clase mas interaciva para estudiantes virtuales?')

AIMessage(content='Para lograr una clase más interactiva para estudiantes virtuales, puedes implementar las siguientes estrategias:\n\n1. Utilizar herramientas de videoconferencia que permitan la participación activa de los estudiantes, como la función de chat, la posibilidad de levantar la mano para hacer preguntas o comentar, y la opción de compartir la pantalla para mostrar trabajos o presentaciones.\n\n2. Fomentar la participación de los estudiantes a través de preguntas abiertas, encuestas en tiempo real, debates y discusiones grupales.\n\n3. Utilizar herramientas de colaboración en línea, como Google Docs o Padlet, para que los estudiantes puedan trabajar juntos en proyectos y compartir ideas de forma simultánea.\n\n4. Incorporar actividades interactivas, como juegos educativos, cuestionarios en línea, simulaciones y ejercicios prácticos, que motiven a los estudiantes a participar activamente en la clase.\n\n5. Proporcionar retroalimentación constante a los estudiantes, tanto ind

In [28]:
llm_davinci = ChatOpenAI(
    model_name = "text-davinci-003",
    n = 2, #numero de diferentes respuestas
    temperature = 0.3
)

In [30]:
generacion = llm_gpt3_5.generate(
    [
        "Dime un consejo de vida para alguien de 30 años",
        "Recomiendame libros similares a Hyperion Cantos"
    ]
)

In [36]:
generacion.generations[0]

[ChatGeneration(text='No te compares con los demás, cada persona tiene su propio camino y ritmo de vida. Enfócate en tus metas y sueños, trabaja duro para alcanzarlos y disfruta el proceso. Aprovecha cada oportunidad que se te presente y no tengas miedo de tomar riesgos. Recuerda que nunca es tarde para empezar de nuevo o cambiar de dirección si es lo que realmente deseas. Vive el presente, aprende del pasado y visualiza un futuro brillante.', generation_info={'finish_reason': 'stop', 'logprobs': None}, message=AIMessage(content='No te compares con los demás, cada persona tiene su propio camino y ritmo de vida. Enfócate en tus metas y sueños, trabaja duro para alcanzarlos y disfruta el proceso. Aprovecha cada oportunidad que se te presente y no tengas miedo de tomar riesgos. Recuerda que nunca es tarde para empezar de nuevo o cambiar de dirección si es lo que realmente deseas. Vive el presente, aprende del pasado y visualiza un futuro brillante.', additional_kwargs={'refusal': None}, r

In [37]:
generacion.generations[1]

[ChatGeneration(text='1. "Dune" by Frank Herbert - A classic science fiction novel that explores themes of politics, religion, and ecology in a richly imagined universe.\n\n2. "The Expanse series" by James S.A. Corey - A gripping space opera series that follows a diverse cast of characters as they navigate political intrigue and interstellar conflict.\n\n3. "Foundation series" by Isaac Asimov - A seminal work of science fiction that explores the rise and fall of civilizations in a vast galactic empire.\n\n4. "Altered Carbon" by Richard K. Morgan - A gritty cyberpunk novel that follows a former soldier turned private investigator as he navigates a world where consciousness can be transferred between bodies.\n\n5. "The Culture series" by Iain M. Banks - A series of space opera novels that explore a post-scarcity society run by artificial intelligences known as the Culture.', generation_info={'finish_reason': 'stop', 'logprobs': None}, message=AIMessage(content='1. "Dune" by Frank Herbert

In [39]:
generacion.llm_output

{'token_usage': {'completion_tokens': 288,
  'prompt_tokens': 40,
  'total_tokens': 328,
  'completion_tokens_details': {'accepted_prediction_tokens': 0,
   'audio_tokens': 0,
   'reasoning_tokens': 0,
   'rejected_prediction_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
 'model_name': 'gpt-3.5-turbo'}

In [41]:
llm_gpt3_5.get_num_tokens('Mis jefes se van a preocupar si gasto mucho en openai')

16