# Projeto 02 - Chatbot customizado com memória e interface

> Nesse projeto você aprenderá como adicionar melhorias ao sistema de chat que criamos, onde será adicionado um sistema para que o bot seja capaz de lembrar  o histórico da conversa e com isso ter maior compreensão do contexto das mensagens, o que é possível através das interações passadas (Chatbots com essa capacidade são conhecidos como "Context-Aware Chatbot"). Além disso, veremos como facilmente criar uma interface amigável para sua aplicação usando uma biblioteca versátil chamada Streamlit.

Vamos aprender como fazer pelo Colab e também como reaproveitar nosso código para executar em seu ambiente local, o que pode ser mais interessante.

Com a ideia de tornar nossa aplicação mais flexível, deixaremos ela preparada para aceitar diferentes modelos e provedores de LLMs, tanto open source (com execução local ou via cloud) e proprietárias (via API).

Desse modo, caso esteja usando pelo Colab, essa aplicação vai funcionar inclusive se você selecionar CPU ao invés de GPU.

 * Falaremos mais sobre a vantagem de cada método mais tarde, enquanto estivermos desenvolvendo a integração.

## [ ! ] Como executar em ambiente local

* Para executar o código desse projeto em um ambiente local, siga as instruções para instalar as dependências necessárias usando os comandos abaixo. Você pode usar os mesmos comandos de instalação. Para mais detalhes, confira as aulas em vídeo referente à configuração local com o Streamlit.

* Você pode executar localmente desde já conforme é mostrado em aula - mas caso esteja com erros de configuração em seu ambiente local, recomendamos fazer pelo Colab antes, para não atrapalhar o fluxo de aprendizagem. Mas caso opte por fazer localmente já também é interessante, pois o Streamlit pede que trabalhemos com arquivo .py e aqui no Colab é .ipynb por causa do Jupyter Notebook, portanto devemos juntar tudo num só arquivo .py  

* Além disso, ao executar em ambiente local você pode ir visualizando as alterações mais rapidamente, pois após executar o comando que inicializa o streamlit (exemplo: `!streamlit run projeto2.py`) basta que edite o script .py e salve, e recarregue a página do streamlit, assim verá a mudança. Ou seja, não precisa reexecutar o comando `!streamlit...`)

* Antes de rodar seu código localmente, certifique-se de que todas as bibliotecas listadas no comando pip install estejam instaladas.  Caso ainda não as tenha, você pode instalá-las diretamente pelo terminal do VS Code (caso esteja usando essa IDE) ou o terminal/prompt normal.


## Instalação e Configuração

Precisamos instalar algumas bibliotecas que serão necessárias em nossa aplicação, como o LangChain e sstreamlit (para criação da interface), e mais alguns pacotes necessários e que usamos anteriormente

> Se estiver executando localmente: precisa instalar também o pytorch, caso já não tenha instalado (lembrando que no Colab já vem instalado por padrão, basta importar).
 * Para evitar problemas de compatibilidade, recomendamos esse comando: `pip install torch==2.3.1 torchvision torchaudio --index-url https://download.pytorch.org/whl/test/cu121`

In [None]:
!pip install -q streamlit langchain sentence-transformers
!pip install -q langchain_community langchain-huggingface langchain_ollama langchain_openai

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.4/50.4 kB[0m [31m934.1 kB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m8.7/8.7 MB[0m [31m45.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.0/1.0 MB[0m [31m25.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m227.1/227.1 kB[0m [31m11.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m207.3/207.3 kB[0m [31m15.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m396.4/396.4 kB[0m [31m18.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m288.4/288.4 kB[0m [31m17.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.9/6.9 MB[0m [31m57.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

> Instalação do Localtunnel

Caso esteja executando no Colab, você precisa também instalar o Localtunnel para conseguirmos nos conectar à aplicação gerada com o streamlit.

Isso será explicado na etapa em que é feita a inicialização da interface

In [None]:
!npm install localtunnel

### Carregando as variáveis de ambiente com o dotenv

Utilizaremos a biblioteca dotenv, que simplifica a gestão de variáveis de ambiente ao armazená-las em um arquivo .env.

In [None]:
!pip install python-dotenv

Collecting python-dotenv
  Downloading python_dotenv-1.0.1-py3-none-any.whl.metadata (23 kB)
Downloading python_dotenv-1.0.1-py3-none-any.whl (19 kB)
Installing collected packages: python-dotenv
Successfully installed python-dotenv-1.0.1


#### Criação do arquivo .env

O comando `%%writefile` permite que a célula do notebook seja salva como um arquivo externo, com o nome especificado

In [None]:
%%writefile .env
HUGGINGFACE_API_KEY==##########
HUGGINGFACEHUB_API_TOKEN==##########
OPENAI_API_KEY==##########
TAVILY_API_KEY=##########
SERPAPI_API_KEY=##########
LANGCHAIN_API_KEY=##########

Writing .env


## Inicialização da interface

Agora precisamos definir só algumas configurações do Streamlit e então reunir todo o código em um arquivo .py, desse modo conseguiremos rodar no Colab também   



In [None]:
%%writefile projeto2.py

import streamlit as st
from langchain_core.messages import AIMessage, HumanMessage
from langchain_core.prompts import MessagesPlaceholder

from langchain_ollama import ChatOllama
from langchain_openai import ChatOpenAI

from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate

import torch
from langchain_huggingface import ChatHuggingFace
from langchain_community.llms import HuggingFaceHub

from dotenv import load_dotenv

load_dotenv()

# Configurações do Streamlit
st.set_page_config(page_title="Seu assistente virtual 🤖", page_icon="🤖")
st.title("Seu assistente virtual 🤖")

model_class = "hf_hub" # @param ["hf_hub", "openai", "ollama"]

def model_hf_hub(model="meta-llama/Meta-Llama-3-8B-Instruct", temperature=0.1):
  llm = HuggingFaceHub(
      repo_id=model,
      model_kwargs={
          "temperature": temperature,
          "return_full_text": False,
          "max_new_tokens": 512,
          #"stop": ["<|eot_id|>"],
          # demais parâmetros que desejar
      }
  )
  return llm

def model_openai(model="gpt-4o-mini", temperature=0.1):
    llm = ChatOpenAI(
        model=model,
        temperature=temperature
        # demais parâmetros que desejar
    )
    return llm

def model_ollama(model="phi3", temperature=0.1):
    llm = ChatOllama(
        model=model,
        temperature=temperature,
    )
    return llm


def model_response(user_query, chat_history, model_class):

    ## Carregamento da LLM
    if model_class == "hf_hub":
        llm = model_hf_hub()
    elif model_class == "openai":
        llm = model_openai()
    elif model_class == "ollama":
        llm = model_ollama()

    ## Definição dos prompts
    system_prompt = """
    Você é um assistente prestativo e está respondendo perguntas gerais. Responda em {language}.
    """
    # corresponde à variável do idioma em nosso template
    language = "português"

    # Adequando à pipeline
    if model_class.startswith("hf"):
        user_prompt = "<|begin_of_text|><|start_header_id|>user<|end_header_id|>\n{input}<|eot_id|><|start_header_id|>assistant<|end_header_id|>"
    else:
        user_prompt = "{input}"

    prompt_template = ChatPromptTemplate.from_messages([
        ("system", system_prompt),
        MessagesPlaceholder(variable_name="chat_history"),
        ("user", user_prompt)
    ])

    ## Criação da Chain
    chain = prompt_template | llm | StrOutputParser()

    ## Retorno da resposta / Stream
    return chain.stream({
        "chat_history": chat_history,
        "input": user_query,
        "language": language
    })


if "chat_history" not in st.session_state:
    st.session_state.chat_history = [
        AIMessage(content="Olá, sou o seu assistente virtual! Como posso ajudar você?"),
    ]

for message in st.session_state.chat_history:
    if isinstance(message, AIMessage):
        with st.chat_message("AI"):
            st.write(message.content)
    elif isinstance(message, HumanMessage):
        with st.chat_message("Human"):
            st.write(message.content)

user_query = st.chat_input("Digite sua mensagem aqui...")
if user_query is not None and user_query != "":
    st.session_state.chat_history.append(HumanMessage(content=user_query))

    with st.chat_message("Human"):
        st.markdown(user_query)

    with st.chat_message("AI"):
        resp = st.write_stream(model_response(user_query, st.session_state.chat_history, model_class))
        print(st.session_state.chat_history)

    st.session_state.chat_history.append(AIMessage(content=resp))

Writing projeto2.py


### Execução do Streamlit

Tendo nosso script pronto, basta executar o comando abaixo para rodar a nossa aplicação pelo streamlit.
Isso fará com que a aplicação do Streamlit seja executada em segundo plano.

In [None]:
!streamlit run projeto2.py &>/content/logs.txt &



Observação:
* O `&` no final permite que o Colab continue executando outras células sem esperar que o aplicativo Streamlit termine.

* ao rodar localmente não é necessário o `&>/content/logs.txt &`

* aqui usamos pois o Colab não exibe no terminal a informação que precisamos, pois não podemos visualizá-lo pelo Colab (já que ele funciona de outro modo e não temos acesso ao terminal que é atualizado em tempo real - pelo menos na versão gratuita).


* O que esse trecho faz portanto é adicionar os logs do comando a um arquivo chamado `logs.txt`


>  Caso esteja acessando localmente agora basta acessar o link que irá aparecer no terminal (local URL ou Network URL, caso esteja em outro dispositivo na mesma rede).
 *  Para o Colab, precisa de mais um comando para abrir nossa aplicação (veja abaixo)

### Acesso com LocalTunnel

Antes de conectar com o localtunnel, você precisa obter o IP externo, que será usado como a senha ao fazer o launch da aplicação nessa próxima etapa.

Tem duas maneiras de fazer isso:

1) com o comando abaixo

In [None]:
!wget -q -O - ipv4.icanhazip.com

34.125.58.9


2) Ou, como alternativa, faça desse modo:

 * Abra o painel lateral do Colab
 * Clique sobre o arquivo logs.txt. Aqui mostra o que seria exibido no terminal
 * Selecione o número IP correspondente ao External URL. Somente o número IP com os pontos, sem o http:// ou a porta
  * Por exemplo: `35.184.1.10`

Pronto, agora basta executar o comando abaixo.

Esse comando usa npx localtunnel para "expor" o aplicativo Streamlit em execução local para a internet. O aplicativo é hospedado na porta 8501, e o localtunnel fornece uma URL pública por meio da qual o aplicativo pode ser acessado.

Então, entre no link que aparece na saída e informar o IP no campo Tunnel Password. Logo em seguida, clique no botão e aguarde o interface ser inicializada

In [None]:
!npx localtunnel --port 8501

your url is: https://four-eels-enjoy.loca.lt
^C


Observação:
 * Se der algum erro, recarregue a página e aguarde mais alguns instantes.
 * Caso esteja usando um método que não seja por API então é normal que na primeira execução leve um pouco mais de tempo.
  * Se velocidade for um fator muito determinante, recomendamos usar soluções onde o processamento é feito em um servidor externo e conecta-se via API como HF, Open AI ou Groq

---

## Criando seu próprio prompt
> **Dica de estrutura para criar seu próprio Prompt**

Você pode modificar à vontade o prompt para que atenda ao seu objetivo. Você pode usar esse formato:

* Introdução: Comece com uma breve introdução ao tema, definindo o conceito básico.
* Explicação: Forneça uma explicação detalhada, mas simples, sobre o conceito. Utilize exemplos práticos ou analogias quando necessário para facilitar a compreensão.
* Passos ou Componentes: Se o conceito tiver vários componentes ou etapas, liste e explique cada um de forma concisa.
* Aplicações: Dê exemplos de como esse conceito é aplicado na prática ou em contextos reais.
* Resumo: Conclua com um resumo das principais ideias apresentadas.
* Orientações Adicionais: Caso seja relevante, ofereça dicas ou orientações adicionais para aprofundamento no tema.

Palavras-chave relevantes para adicionar ao seu prompt e informar como deseja que seja sua resposta:
* Claro, Objetivo, Simples, Exemplo prático, Analogia, Explicação detalhada, Resumo

Outras ideias:
* explique [x] para alguém leigo; explique de modo fácil como se tivesse explicando para uma criança.

Indo além:
* você pode também procurar frameworks de prompt para fazer com que LLM desempenhe da melhor forma o papel desejado. Por exemplo, o framwork [COSTAR](https://medium.com/@frugalzentennial/unlocking-the-power-of-costar-prompt-engineering-a-guide-and-example-on-converting-goals-into-dc5751ce9875), método que garante que todos os aspectos-chave que influenciam a resposta de um LLM sejam considerados, resultando em respostas de saída mais personalizadas.
* Quando o objetivo é fazer com que o modelo desempenhe um papel específico ou atue de um determinado modo, é chamado de role-playing, e tem crescido muito as pesquisas em cima disso (como por exemplo [esse paper](https://arxiv.org/abs/2406.00627)).


## Alternativa ao Streamlit

Criando nossa própria aplicação com o streamlit nos garante uma certa liberdade, principalmente porque ao criar "do zero" podemos deixar do jeito que queremos. Mas existem outras formas mais prontas e com a interface já criada e disponível para uso, não exigindo lidar com código. Como nossa intenção aqui é também trabalhar com o código fonte e não depender unicamente de um programa/interface então não acabamos abordando, mas caso tenha interesse de usar uma alternativa assim então temos algumas recomendações:

* Open WebUI - https://github.com/open-webui/open-webui
* GPT4All - https://gpt4all.io/index.html
* AnythingLLM - https://anythingllm.com

Essas soluções possuem várias outras funcionalidades interessantes e integrações, portanto pode ser uma boa ideia checar caso tenha interesse em explorar mais LLMs.