# Conceitos avançados de Models

### Prompt few-shot

In [None]:
from langchain_openai import ChatOpenAI

chat = ChatOpenAI()

In [None]:
from langchain_core.messages import HumanMessage, AIMessage

mensagens = [
    HumanMessage(content='Quanto é 1 + 1?'),
    AIMessage(content='2'),
    HumanMessage(content='Quanto é 10 * 5?'),
    AIMessage(content='50'),
    HumanMessage(content='Quanto é 10 + 3?'),
]

chat.invoke(mensagens)

Isto é similar a formação de mensagens da api da OpenAI, mas com uma sintaxe diferente:

```python
mensagens = [
    {'role': 'user', 'content': 'Quanto é 1 + 1'},
    {'role': 'assistant', 'content': '2'},
    {'role': 'user', 'content': 'Quanto é 10 * 5'},
    {'role': 'assistant', 'content': '50'},
    {'role': 'user', 'content': 'Quanto é 10 + 3'},
]
```

## Utilizando outros modelos

In [None]:
from langchain_huggingface.chat_models.huggingface import ChatHuggingFace  # Atualizando importação!
from langchain_huggingface.llms.huggingface_endpoint import HuggingFaceEndpoint # Atualizando importação!

In [None]:
modelo = 'mistralai/Mixtral-8x7B-Instruct-v0.1'

llm = HuggingFaceEndpoint(repo_id=modelo)
chat = ChatHuggingFace(llm=llm)

In [None]:
from langchain_core.messages import HumanMessage, AIMessage

mensagens = [
    HumanMessage(content='Quanto é 1 + 1?'),
    AIMessage(content='2'),
    HumanMessage(content='Quanto é 10 * 5?'),
    AIMessage(content='50'),
    HumanMessage(content='Quanto é 10 + 3?'),
]

chat.invoke(mensagens)

A estrutura de chat_model utiliza a estrutura de llm como backend

In [None]:
import langchain

langchain.debug = True
chat.invoke(mensagens)
langchain.debug = False

> Atenção, nas versões mais atuais de langchain é recomendado utilizar o método set_debug para ativar o modo de debug, da seguinte forma:

In [None]:
from langchain.globals import set_debug

set_debug(True)
chat.invoke(mensagens)
set_debug(False)

Outros modelos disponíveis:

https://python.langchain.com/docs/integrations/chat/

## Caching

### Cache em memória

In [None]:
from langchain_openai.chat_models import ChatOpenAI

chat = ChatOpenAI(model='gpt-3.5-turbo-0125')

In [None]:
from langchain_core.messages import HumanMessage, SystemMessage

mensagens = [
    SystemMessage(content='Você é um assistente engraçado.'),
    HumanMessage(content='Quanto é 1 + 1?')
]

In [None]:
from langchain.cache import InMemoryCache
from langchain.globals import set_llm_cache

set_llm_cache(InMemoryCache())

Rodandando a primeira vez

In [None]:
%%time

chat.invoke(mensagens)

Rodando novamente

In [None]:
%%time

chat.invoke(mensagens)

### Cache SQLite

In [None]:
from langchain.cache import SQLiteCache
from langchain.globals import set_llm_cache

set_llm_cache(SQLiteCache(database_path='arquivos/lancgchain_cache_db.sqlite'))

In [None]:
%%time

chat.invoke(mensagens)

In [None]:
%%time

chat.invoke(mensagens)

In [None]:
%%time

chat.invoke(mensagens)