## Enlaces de interes

1.   Huggingface: https://huggingface.co/

> Incluye un amplio repositorio de modelos, sets de datos, "spaces", documentación y cursos.


2.   Langchain + huggingface: https://huggingface.co/blog/Andyrasika/agent-helper-langchain-hf

> Blog de hugging face con mucho material para estar al dia que incluye codigo.

3. Langchain: https://python.langchain.com/docs/get_started/introduction

> Documentación de langChain







## Practica
LLM: Chatea con GPT

## LangChain
Para desarrollar aplicaciones basadas en modelos de lenguaje, en concreto está centrada en los LLMs.

El valor principal que nos aporta es la **ABSTRACCIÓN**, te abstrae de mucho código que no te genera ningún tipo de valor. Por ejemplo, un código para enganchar diferentes piezas de una app basada en un LLM.

Para ello provee de 3 piezas:

* Componentes: Abstracción para trabajar con diferentes modelos sin preocuparte de tener que utilizar por ejemplo diferentes librerías para cada LLM en particular.

* Chains: Sistemas para ensamblar diferentes componentes que permiten realizar tareas más complejas.

* Off-the-shelf chain: Cadenas o componentes ya configuradas para las tareas más comunes. Muy útiles para empezar rápido. Por ejemplo, preguntas y respuestas sobre un documento.

Principales componentes (hay más):

* Models: Building blocks que te provee una interfaz común para invocar modelos de diferentes proveedores. Por ejemplo, puedes llamar de la misma manera el LLM de Google y el LLM de OpenAI.

* Prompts: Configuración/programación de un modelo.

* Indexes: Componentes para trabajar con datos/documentos de diferentes fuentes, te permite cargarlos, procesarlos, almacenarlos y recuperarlos.

* Chains: Las cadenas es esa manera de ensamblar piezas para que una aplicación realmente te aporte valor. Los LLM aceptas un texto de entrada y te devuelven uno de salida, cuando quieres encadenar cosas con sentido te das cuenta que te falta como hacerlo.

* Agents: Algunas acciones dependen de lo que Introduzca el usuario y los agentes son los encargados de decir que herramienta se utilizara en función de la entrada. Por ejemplo, una pregunta sobre la actualidad no puede ser contestada por GPT, en este caso el agente decidiría utilizar Google para buscar la información para contestar.

* Memory: Para mantener el contexto de la conversación. Por si solo un LLM no es capaz, simplemente contesta la pregunta que le haces.



Primeros pasos:


1.   Hacerse una cuenta en OpenAI https://openai.com/
2.   Obtener APIKey https://platform.openai.com/api-keys
3. Crear un archivo.env con la variable 'OPENAI_API_KEY'
4. Crear una carpeta en drive y añadir el archivo



In [1]:
mkdir LLM

In [1]:
cd LLM

c:\Users\gjbet\Desktop\My_projects\Tecnoday-LLM\LLM


Instalamos las librerias necesarias

In [4]:
# pip install python-dotenv
# pip install openai --upgrade

Declaramos la variable 'OPENAI_API_KEY' como variable de entorno.

In [None]:
import warnings
warnings.filterwarnings("ignore")
import os
import openai

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv()) # lectura .env
openai.api_key = os.environ['OPENAI_API_KEY']

Definimos el modelo que vamos a utilizar

In [None]:
llm_model = "gpt-3.5-turbo"

In [None]:
def get_completion(prompt, client_instance, model=llm_model):
  messages = [{"role": "user", "content": prompt}]
  response = client.chat.completions.create(
  model=model,
  messages=messages,
  max_tokens=50,
  temperature=0,
  )
  return response.choices[0].message.content

Iniciamos en cliente incluyendo como argumento la APIKey

In [None]:
import os
from openai import OpenAI

client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"),)


Definimos una función para hacer llamadas directamente a la API de OPENAI.

Argumentos:


> **prompt**: Instrucción o texto que se utiliza para interactuar con sistemas de inteligencia artificial.

> **client_instance**: intermediario entre aplicaciones, permite comunicarse e intercambiar datos a través de APIs.

> **model**: Modelo que vamos a utilizar (gpt-3.5-turbo).

Conceptos:


> **temperature**: Parámetro que se utiliza para controlar la aleatoriedad y la diversidad de las respuestas generadas por el modelo.



In [None]:
# Se puede añadir a mano
#client = OpenAI(
    # This is the default and can be omitted
    #api_key='...',)

In [None]:
get_completion("Cuanto es 2+1", client)

'2 + 1 es igual a 3.'

##Uso de LangChain

LangChain es un marco de trabajo de código abierto para crear aplicaciones basadas en modelos de lenguaje de gran tamaño (LLM).

In [None]:
!pip install --upgrade --quiet langchain langchain-openai

In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

In [None]:
chat = ChatOpenAI(temperature=0.0, model=llm_model)
chat

ChatOpenAI(client=<openai.resources.chat.completions.Completions object at 0x78e90a59a050>, async_client=<openai.resources.chat.completions.AsyncCompletions object at 0x78e90a59ba30>, temperature=0.0, openai_api_key=SecretStr('**********'), openai_proxy='')

### Prompts

In [None]:
template_string = """Traduce el texto \
delimitado por tres comillas \
al siguiente estilo {style}. \
texto: ```{text}```
"""

In [None]:
prompt_template = ChatPromptTemplate.from_template(template_string)

In [None]:
prompt_template.messages[0].prompt

PromptTemplate(input_variables=['style', 'text'], template='Traduce el texto delimitado por tres comillas al siguiente estilo {style}. texto: ```{text}```\n')

In [None]:
prompt_template.messages[0].prompt.input_variables

['style', 'text']

In [None]:
customer_style = """Español de españa \
en un tono calmado y respetuoso
"""

In [None]:
customer_email = """
Arrr, estoy que echo humo porque la tapa de mi batidora \
salió volando y salpicó las paredes de mi cocina \
¡con batido! Y para empeorar las cosas. \
la garantía no cubre el coste de \
limpiar mi cocina. Necesito tu ayuda \
¡ahora mismo, colega!
"""

In [None]:
customer_messages = prompt_template.format_messages(
                    style=customer_style,
                    text=customer_email)

In [None]:
print(customer_messages[0])

content='Traduce el texto delimitado por tres comillas al siguiente estilo Español de españa en un tono calmado y respetuoso\n. texto: ```\nArrr, estoy que echo humo porque la tapa de mi batidora salió volando y salpicó las paredes de mi cocina ¡con batido! Y para empeorar las cosas. la garantía no cubre el coste de limpiar mi cocina. Necesito tu ayuda ¡ahora mismo, colega!\n```\n'


In [None]:
# Llamada al LLM para 'traducir' el mensaje
customer_response = chat.invoke(customer_messages)

In [None]:
customer_response

AIMessage(content='"Vaya por Dios, estoy bastante molesto porque la tapa de mi batidora salió disparada y salpicó las paredes de mi cocina con batido. Y para colmo, la garantía no cubre los gastos de limpieza de mi cocina. Necesito tu ayuda en este preciso momento, amigo."')

### LLM Chain



 ✔ +control +depurable. Pasar un prompt muy largo suele dar problemas.

Hay dos tipos de cadenas secuenciales:

1.   **SimpleSequentialChain**: La forma más simple de cadenas secuenciales, donde cada paso tiene una entrada/salida singular, y la salida de un paso es la entrada del siguiente.

 **Cuándo usar:**

 * Tiene un proceso claro de pasos, cada uno con una única entrada y salida.
 * Cada paso se basa directamente en el resultado del paso anterior.
 * Útil para tuberías lineales simples con una entrada y salida por paso.
 * Cree cada paso como un archivo  LLMChain.
 * Pase la lista de  LLMChain a  SimpleSequentialChain.
 * Llamada  run() pasando la entrada inicial.


2. **SequentialChain**: Una forma más general de cadenas secuenciales permite múltiples entradas/salidas.

 **Cuándo usar:**

 * Tiene una secuencia de pasos pero con requisitos de entrada/salida más complejos.
 * Necesita realizar un seguimiento de múltiples variables en los pasos de la cadena.


### SimpleSequentialChain

In [None]:
from langchain.chains import SimpleSequentialChain
from langchain.chains import LLMChain

In [None]:
# prompt template 1
first_prompt = ChatPromptTemplate.from_template(
    "Cual es el mejor nombre para \
    una compañia que fabrica {product}?"
)

# Chain 1
chain_one = LLMChain(llm=chat, prompt=first_prompt)

In [None]:
# prompt template 2
second_prompt = ChatPromptTemplate.from_template(
    "Escriba una descripción de 20 palabras para \
    la compañia:{company_name}"
)
# chain 2
chain_two = LLMChain(llm=chat, prompt=second_prompt)

In [None]:
overall_simple_chain = SimpleSequentialChain(chains=[chain_one, chain_two],
                                             verbose=True
                                            )

In [None]:
product = "Cerveza artesana"
overall_simple_chain.run(product)

  warn_deprecated(




[1m> Entering new SimpleSequentialChain chain...[0m
[36;1m[1;3m"Artesana Brew Co."[0m
[33;1m[1;3m"Artesana Brew Co. es una cervecería artesanal que ofrece una amplia variedad de cervezas únicas y de alta calidad."[0m

[1m> Finished chain.[0m


'"Artesana Brew Co. es una cervecería artesanal que ofrece una amplia variedad de cervezas únicas y de alta calidad."'

### SequentialChain


In [None]:
from langchain.chains import SequentialChain

In [None]:
llm = ChatOpenAI(temperature=0.9, model=llm_model)

# prompt template 1
first_prompt = ChatPromptTemplate.from_template(
    "Traduzca la siguiente reseña al español:"
    "\n\n{Review}"
)
# chain 1: input= Review and output= Spanish_Review
chain_one = LLMChain(llm=llm, prompt=first_prompt,
                     output_key="Spanish_Review"
                    )

In [None]:
# prompt template 2
second_prompt = ChatPromptTemplate.from_template(
    "¿Puede resumir la siguiente reseña en 1 frase?:"
    "\n\n{Spanish_Review}"
)
# chain 2: input= Spanish_Review and output= summary
chain_two = LLMChain(llm=llm, prompt=second_prompt,
                     output_key="summary"
                    )


In [None]:
# prompt template 3
third_prompt = ChatPromptTemplate.from_template(
    "¿En qué idioma está redactada la siguiente reseña?:\n\n{Review}"
)
# chain 3: input= Review and output= language
chain_three = LLMChain(llm=llm, prompt=third_prompt,
                       output_key="language"
                      )

In [None]:
# prompt template 4
fourth_prompt = ChatPromptTemplate.from_template(
    "Escribe una respuesta para el siguiente"
    "resumen en el idioma especificado:"
    "\n\nSummary: {summary}\n\nLanguage: {language}"
)
# chain 4: input= summary, language and output= followup_message
chain_four = LLMChain(llm=llm, prompt=fourth_prompt,
                      output_key="followup_message"
                     )

In [None]:
# overall_chain: input= Review
# and output= Spanish_Review,summary, followup_message
overall_chain = SequentialChain(
    chains=[chain_one, chain_two, chain_three, chain_four],
    input_variables=["Review"],
    output_variables=["Spanish_Review", "summary","followup_message"],
    verbose=True
)

In [None]:
review = "Je trouve le goût médiocre. La mousse ne tient pas, c'est bizarre. J'achète les mêmes dans le commerce et le goût est bien meilleur...\nVieux lot ou contrefaçon !?"
overall_chain.invoke(review)



[1m> Entering new SequentialChain chain...[0m

[1m> Finished chain.[0m


{'Review': "Je trouve le goût médiocre. La mousse ne tient pas, c'est bizarre. J'achète les mêmes dans le commerce et le goût est bien meilleur...\nVieux lot ou contrefaçon !?",
 'Spanish_Review': 'Encuentro el sabor mediocre. La espuma no se sostiene, es extraño. Compro los mismos en el comercio y el sabor es mucho mejor... ¿Lote viejo o falsificación!?',
 'summary': 'El sabor es mediocre y la espuma no es consistente, lo que hace pensar si se trata de un lote viejo o una falsificación.',
 'followup_message': 'Réponse: Il est possible que le produit soit effectivement un vieux lot ou une contrefaçon, ce qui expliquerait le goût médiocre et la non-consistance de la mousse. Il serait préférable de vérifier auprès du fabricant pour clarification.'}

## Chatea con tus datos

Chatbot que trabaje con tus documentos

In [None]:
!pip install pypdf
!pip install -U docarray
!pip install chromadb==0.3.26
!pip install pydantic==1.10.8
!pip install langchain[docarray]

Collecting docarray
  Using cached docarray-0.40.0-py3-none-any.whl (270 kB)
Installing collected packages: docarray
  Attempting uninstall: docarray
    Found existing installation: docarray 0.32.1
    Uninstalling docarray-0.32.1:
      Successfully uninstalled docarray-0.32.1
Successfully installed docarray-0.40.0
Collecting docarray[hnswlib]<0.33.0,>=0.32.0 (from langchain[docarray])
  Using cached docarray-0.32.1-py3-none-any.whl (215 kB)
Installing collected packages: docarray
  Attempting uninstall: docarray
    Found existing installation: docarray 0.40.0
    Uninstalling docarray-0.40.0:
      Successfully uninstalled docarray-0.40.0
Successfully installed docarray-0.32.1


In [None]:
!pip install -U langchain-openai



In [None]:
#from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.text_splitter import CharacterTextSplitter, RecursiveCharacterTextSplitter
from langchain.vectorstores import DocArrayInMemorySearch
from langchain.document_loaders import TextLoader
from langchain.chains import RetrievalQA,  ConversationalRetrievalChain
from langchain.memory import ConversationBufferMemory
#from langchain.chat_models import ChatOpenAI
from langchain.document_loaders import TextLoader
from langchain.document_loaders import PyPDFLoader

# Anteriores estan deprecadas
from langchain_openai import OpenAIEmbeddings
from langchain_openai import ChatOpenAI


In [None]:
def load_db(file, chain_type, k):
    # load documents
    loader = PyPDFLoader(file)
    documents = loader.load()
    # split documents
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=150)
    docs = text_splitter.split_documents(documents)
    # define embedding
    embeddings = OpenAIEmbeddings()
    # create vector database from data
    db = DocArrayInMemorySearch.from_documents(docs, embeddings)
    # define retriever
    retriever = db.as_retriever(search_type="similarity", search_kwargs={"k": k})
    # create a chatbot chain. Memory is managed externally.
    qa = ConversationalRetrievalChain.from_llm(
        llm=ChatOpenAI(model_name=llm_model, temperature=0),
        chain_type=chain_type,
        retriever=retriever,
        return_source_documents=True,
        return_generated_question=True,
    )
    return qa

In [None]:
import panel as pn
import param
# https://github.com/holoviz/panel

class cbfs(param.Parameterized):
    chat_history = param.List([])
    answer = param.String("")
    db_query  = param.String("")
    db_response = param.List([])

    def __init__(self,  **params):
        super(cbfs, self).__init__( **params)
        self.panels = []
        self.loaded_file = "/content/drive/MyDrive/LLM/02.ElalmohadóndeplumasAutorHoracioQuiroga.pdf"
        self.qa = load_db(self.loaded_file,"stuff", 4)

    def call_load_db(self, count):
        if count == 0 or file_input.value is None:  # init or no file specified :
            return pn.pane.Markdown(f"Loaded File: {self.loaded_file}")
        else:
            file_input.save("temp.pdf")  # local copy
            self.loaded_file = file_input.filename
            button_load.button_style="outline"
            self.qa = load_db("temp.pdf", "stuff", 4)
            button_load.button_style="solid"
        self.clr_history()
        return pn.pane.Markdown(f"Loaded File: {self.loaded_file}")

    def convchain(self, query):
        if not query:
            return pn.WidgetBox(pn.Row('User:', pn.pane.Markdown("", width=600)), scroll=True)
        result = self.qa({"question": query, "chat_history": self.chat_history})
        self.chat_history.extend([(query, result["answer"])])
        self.db_query = result["generated_question"]
        self.db_response = result["source_documents"]
        self.answer = result['answer']
        self.panels.extend([
            pn.Row('User:', pn.pane.Markdown(query, width=600)),
            pn.Row('ChatBot:', pn.pane.Markdown(self.answer, width=600, style={'background-color': '#F6F6F6'}))
        ])
        inp.value = ''  #clears loading indicator when cleared
        return pn.WidgetBox(*self.panels,scroll=True)

    @param.depends('db_query ', )
    def get_lquest(self):
        if not self.db_query :
            return pn.Column(
                pn.Row(pn.pane.Markdown(f"Last question to DB:", styles={'background-color': '#F6F6F6'})),
                pn.Row(pn.pane.Str("no DB accesses so far"))
            )
        return pn.Column(
            pn.Row(pn.pane.Markdown(f"DB query:", styles={'background-color': '#F6F6F6'})),
            pn.pane.Str(self.db_query )
        )

    @param.depends('db_response', )
    def get_sources(self):
        if not self.db_response:
            return
        rlist=[pn.Row(pn.pane.Markdown(f"Result of DB lookup:", styles={'background-color': '#F6F6F6'}))]
        for doc in self.db_response:
            rlist.append(pn.Row(pn.pane.Str(doc)))
        return pn.WidgetBox(*rlist, width=600, scroll=True)

    @param.depends('convchain', 'clr_history')
    def get_chats(self):
        if not self.chat_history:
            return pn.WidgetBox(pn.Row(pn.pane.Str("No History Yet")), width=600, scroll=True)
        rlist=[pn.Row(pn.pane.Markdown(f"Current Chat History variable", styles={'background-color': '#F6F6F6'}))]
        for exchange in self.chat_history:
            rlist.append(pn.Row(pn.pane.Str(exchange)))
        return pn.WidgetBox(*rlist, width=600, scroll=True)

    def clr_history(self,count=0):
        self.chat_history = []
        return

In [None]:
import panel as pn

pn.extension()

cb = cbfs()

file_input = pn.widgets.FileInput(accept='.pdf')
button_load = pn.widgets.Button(name="Load DB", button_type='primary')
button_clearhistory = pn.widgets.Button(name="Clear History", button_type='warning')
button_clearhistory.on_click(cb.clr_history)
inp = pn.widgets.TextInput( placeholder='Enter text here…')

bound_button_load = pn.bind(cb.call_load_db, button_load.param.clicks)
conversation = pn.bind(cb.convchain, inp)

jpg_pane = pn.pane.Image( './img/convchain.jpg')

tab1 = pn.Column(
    pn.Row(inp),
    pn.layout.Divider(),
    pn.panel(conversation,  loading_indicator=True, height=300),
    pn.layout.Divider(),
)
tab2= pn.Column(
    pn.panel(cb.get_lquest),
    pn.layout.Divider(),
    pn.panel(cb.get_sources ),
)
tab3= pn.Column(
    pn.panel(cb.get_chats),
    pn.layout.Divider(),
)
tab4=pn.Column(
    pn.Row( file_input, button_load, bound_button_load),
    pn.Row( button_clearhistory, pn.pane.Markdown("Clears chat history. Can use to start a new topic" )),
    pn.layout.Divider(),
    pn.Row(jpg_pane.clone(width=400))
)
dashboard = pn.Column(
    pn.Row(pn.pane.Markdown('# ChatWithYourData_Bot')),
    pn.Tabs(('Conversation', tab1), ('Database', tab2), ('Chat History', tab3),('Configure', tab4))
)
dashboard