<a href="https://colab.research.google.com/github/Alex112525/LangChain-with-LLMs/blob/main/LangChain_BufferMemory.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install transformers einops accelerate langchain bitsandbytes xformers

In [2]:
!nvidia-smi

Wed Jul 12 03:06:28 2023       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.85.12    Driver Version: 525.85.12    CUDA Version: 12.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|   0  Tesla T4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   59C    P8    10W /  70W |      0MiB / 15360MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Proces

In [3]:
from langchain import HuggingFacePipeline
from transformers import AutoTokenizer, pipeline
from langchain import PromptTemplate, LLMChain

import torch
import langchain
from IPython.display import display, Markdown

In [4]:
def printmd(string):
    display(Markdown(string))

**bertin-project/bertin-gpt-j-6B-alpaca** is an artificial intelligence language model based on the GPT-J 6B model. It is a Spanish version of this model that has been trained to generate Spanish text. The model was trained using the Alpaca dataset, which is a clean version of the Alpaca dataset created at Stanford.

In [None]:
model = "bertin-project/bertin-gpt-j-6B-alpaca"  # The name of the model to use.

tokenizer = AutoTokenizer.from_pretrained(model)  # The tokenizer to use to encode and decode text.

pipeline = pipeline("text-generation",  # The name of the pipeline to use.
                    model=model,  # The model to use for text generation.
                    tokenizer=tokenizer,  # The tokenizer to use to encode and decode text.
                    torch_dtype=torch.bfloat16,  # The data type to use for the model's computations.
                    trust_remote_code=True,  # Whether to trust remote code when loading the model. This should only be set to True if you trust the source of the model.
                    device_map="auto",  # The device to use for the model's computations.
                    max_length=512 ,  # The maximum length of the text to generate.
                    do_sample=True,  # Whether to use sampling when generating text.
                    top_k=2,  # The number of candidates to keep when sampling.
                    num_return_sequences=1,  # The number of text sequences to generate.
                    eos_token_id=tokenizer.eos_token_id  # The ID of the end-of-sequence token.
                    )

In [63]:
llm = HuggingFacePipeline(pipeline=pipeline, model_kwargs={"temperature": 0.0})

## Buffer Memory

In [7]:
from langchain.memory import ConversationBufferMemory
from langchain import LLMChain, PromptTemplate
from langchain.chains import ConversationChain

In [102]:
memory = ConversationBufferMemory(ai_prefix="IA")
template = """
Eres una IA conversacional de "pregunta-respuesta".
El humano introducirá una pregunta y la IA responderá únicamente con la respuesta.
Tu tarea es generar la respuesta de la IA y esperar la siguiente pregunta.
Debes responder solo a las preguntas sin generar nada más.

EJEMPLO:
Humano: Hola, ¿cómo estás?
IA: Bien, ¿y tú?
Humano: Bien, gracias por preguntar.
IA: ¿En qué puedo ayudarte?

NO DEBES CONTINUAR LA CONVERSACIÓN, SOLO GENERAR LA RESPUESTA A LA PREGUNTA.

Conversación actual:
{history}
Humano: {input}
IA:"""
PROMPT = PromptTemplate(input_variables=["history", "input"], template=template)
chatbot = ConversationChain(
    prompt=PROMPT,
    llm=llm,
    verbose=True,
    memory=memory,
)

In [103]:
ans = chatbot.predict(input = "Hola, mi nombre es Alex, que cosas puedes hacer? ")
printmd(ans)

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.




[1m> Entering new  chain...[0m
Prompt after formatting:
[32;1m[1;3m
Eres una IA conversacional de "pregunta-respuesta". 
El humano introducirá una pregunta y la IA responderá únicamente con la respuesta. 
Tu tarea es generar la respuesta de la IA y esperar la siguiente pregunta. 
Debes responder solo a las preguntas sin generar nada más.

EJEMPLO:
Humano: Hola, ¿cómo estás?
IA: Bien, ¿y tú?
Humano: Bien, gracias por preguntar.
IA: ¿En qué puedo ayudarte?

NO DEBES CONTINUAR LA CONVERSACIÓN, SOLO GENERAR LA RESPUESTA A LA PREGUNTA.

Conversación actual:

Humano: Hola, mi nombre es Alex, que cosas puedes hacer? 
IA:[0m

[1m> Finished chain.[0m


 Puedo ayudarte a encontrar información, leer noticias y conectarte con personas.

In [104]:
ans = chatbot.predict(input = "Me podrias dar consejos sobre como organizar mi tiempo?")
printmd(ans)

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.




[1m> Entering new  chain...[0m
Prompt after formatting:
[32;1m[1;3m
Eres una IA conversacional de "pregunta-respuesta". 
El humano introducirá una pregunta y la IA responderá únicamente con la respuesta. 
Tu tarea es generar la respuesta de la IA y esperar la siguiente pregunta. 
Debes responder solo a las preguntas sin generar nada más.

EJEMPLO:
Humano: Hola, ¿cómo estás?
IA: Bien, ¿y tú?
Humano: Bien, gracias por preguntar.
IA: ¿En qué puedo ayudarte?

NO DEBES CONTINUAR LA CONVERSACIÓN, SOLO GENERAR LA RESPUESTA A LA PREGUNTA.

Conversación actual:
Human: Hola, mi nombre es Alex, que cosas puedes hacer? 
IA:  Puedo ayudarte a encontrar información, leer noticias y conectarte con personas.
Humano: Me podrias dar consejos sobre como organizar mi tiempo?
IA:[0m

[1m> Finished chain.[0m


 Sí, por supuesto, puedo ayudarte a planificar y organizar tu día, establecer metas y crear un horario.

In [105]:
ans = chatbot.predict(input = "Como puedo ser mas eficiente en mi trabajo?")
printmd(ans)

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.




[1m> Entering new  chain...[0m
Prompt after formatting:
[32;1m[1;3m
Eres una IA conversacional de "pregunta-respuesta". 
El humano introducirá una pregunta y la IA responderá únicamente con la respuesta. 
Tu tarea es generar la respuesta de la IA y esperar la siguiente pregunta. 
Debes responder solo a las preguntas sin generar nada más.

EJEMPLO:
Humano: Hola, ¿cómo estás?
IA: Bien, ¿y tú?
Humano: Bien, gracias por preguntar.
IA: ¿En qué puedo ayudarte?

NO DEBES CONTINUAR LA CONVERSACIÓN, SOLO GENERAR LA RESPUESTA A LA PREGUNTA.

Conversación actual:
Human: Hola, mi nombre es Alex, que cosas puedes hacer? 
IA:  Puedo ayudarte a encontrar información, leer noticias y conectarte con personas.
Human: Me podrias dar consejos sobre como organizar mi tiempo?
IA:  Sí, por supuesto, puedo ayudarte a planificar y organizar tu día, establecer metas y crear un horario.
Humano: Como puedo ser mas eficiente en mi trabajo?
IA:[0m

[1m> Finished chain.[0m


 Puedo ayudarte a identificar formas de optimizar tu flujo de trabajo y hacer tu trabajo más eficientemente. También puedo proporcionarte consejos sobre cómo priorizar tareas y administrar tu tiempo de manera efectiva.

In [106]:
ans = chatbot.predict(input = "Recuerdas cual es mi nombre?")
printmd(ans)

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.




[1m> Entering new  chain...[0m
Prompt after formatting:
[32;1m[1;3m
Eres una IA conversacional de "pregunta-respuesta". 
El humano introducirá una pregunta y la IA responderá únicamente con la respuesta. 
Tu tarea es generar la respuesta de la IA y esperar la siguiente pregunta. 
Debes responder solo a las preguntas sin generar nada más.

EJEMPLO:
Humano: Hola, ¿cómo estás?
IA: Bien, ¿y tú?
Humano: Bien, gracias por preguntar.
IA: ¿En qué puedo ayudarte?

NO DEBES CONTINUAR LA CONVERSACIÓN, SOLO GENERAR LA RESPUESTA A LA PREGUNTA.

Conversación actual:
Human: Hola, mi nombre es Alex, que cosas puedes hacer? 
IA:  Puedo ayudarte a encontrar información, leer noticias y conectarte con personas.
Human: Me podrias dar consejos sobre como organizar mi tiempo?
IA:  Sí, por supuesto, puedo ayudarte a planificar y organizar tu día, establecer metas y crear un horario.
Human: Como puedo ser mas eficiente en mi trabajo?
IA:  Puedo ayudarte a identificar formas de optimizar tu flujo de trab

 Sí, claro, me acuerdo de Alex.

In [107]:
memory.chat_memory.messages

[HumanMessage(content='Hola, mi nombre es Alex, que cosas puedes hacer? ', additional_kwargs={}, example=False),
 AIMessage(content=' Puedo ayudarte a encontrar información, leer noticias y conectarte con personas.', additional_kwargs={}, example=False),
 HumanMessage(content='Me podrias dar consejos sobre como organizar mi tiempo?', additional_kwargs={}, example=False),
 AIMessage(content=' Sí, por supuesto, puedo ayudarte a planificar y organizar tu día, establecer metas y crear un horario.', additional_kwargs={}, example=False),
 HumanMessage(content='Como puedo ser mas eficiente en mi trabajo?', additional_kwargs={}, example=False),
 AIMessage(content=' Puedo ayudarte a identificar formas de optimizar tu flujo de trabajo y hacer tu trabajo más eficientemente. También puedo proporcionarte consejos sobre cómo priorizar tareas y administrar tu tiempo de manera efectiva.', additional_kwargs={}, example=False),
 HumanMessage(content='Recuerdas cual es mi nombre?', additional_kwargs={}, 