# üß† Transformando o RAG em Produto: API, WhatsApp


## üîß Criando uma API com FastAPI para consumir o RAG

In [None]:
!pip install fastapi uvicorn

Set-ExecutionPolicy -ExecutionPolicy Bypass -Scope Process
pip install fastapi uvicorn langchain langchain-chroma langchain-huggingface langchain-community sentence-transformers


In [None]:
!pip install -U langchain langchain-community langchain-huggingface langchain-chroma

In [None]:
from fastapi import FastAPI # A MAIS F√ÅCIL DE TODAS
from pydantic import BaseModel
from langchain_chroma import Chroma  # Atualizado
from langchain_community.embeddings import HuggingFaceInferenceAPIEmbeddings
from langchain_huggingface import HuggingFaceEndpoint  # Atualizado
from langchain.chains import RetrievalQA
import os

app = FastAPI() # Classe que INSTANCIA o fast api

embedding = HuggingFaceInferenceAPIEmbeddings(
    api_key=os.getenv("HUGGINGFACEHUB_API_TOKEN"),
    model_name="sentence-transformers/all-MiniLM-L6-v2"
)

vectorstore = Chroma(
    persist_directory="./chroma_hf_db",
    embedding_function=embedding
)

llm = HuggingFaceEndpoint(
    repo_id="mistralai/Mixtral-8x7B-Instruct-v0.1",
    task="text-generation",  # <- ESSA LINHA √â ESSENCIAL
    huggingfacehub_api_token=os.getenv("HUGGINGFACEHUB_API_TOKEN"),
    temperature=0.3
)


qa = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=vectorstore.as_retriever()
)

class Consulta(BaseModel): # Herdar
    pergunta: str
    

@app.post("/chat/") # Decorador
def responder(consulta: Consulta):
    resposta = qa.run(consulta.pergunta)
    return {"resposta": resposta}




Executar:
```bash
uvicorn main:app --reload


## üì≤ WHATSAPP + IA: Como Integrar com Z-API e Twilio

### ‚úÖ Z-API: Integra√ß√£o com WhatsApp via API N√£o Oficial

#### O que √© Z-API?

Z-API √© uma API n√£o oficial do WhatsApp.

Ela funciona usando WhatsApp Web por tr√°s dos panos, simulando o comportamento de um usu√°rio real.

Ideal para projetos r√°pidos, testes e prot√≥tipos, com baixo custo.

#### Como funciona por tr√°s?

Voc√™ escanear um QR Code com o WhatsApp Web.

A Z-API cria uma sess√£o conectada ao seu WhatsApp pessoal ou corporativo.

Sua aplica√ß√£o ent√£o recebe e envia mensagens atrav√©s dessa conex√£o.


#### üõ†Ô∏è Etapas para usar a Z-API

1. Crie uma conta gratuita:

- Acesse: https://z-api.io

- Fa√ßa login com e-mail e senha.


2. Crie uma nova inst√¢ncia:

- Clique em "Nova inst√¢ncia"

- D√™ um nome, selecione um plano gratuito ou teste.


3. Escaneie o QR Code:

- Escaneie com seu celular na aba WhatsApp Web.

- Depois disso, sua inst√¢ncia ficar√° online e conectada ao seu n√∫mero.


4. Pegue os dados da inst√¢ncia:

- Voc√™ ver√° dois dados importantes:

    - Instance ID
    - Token



#### üì§ Enviando mensagens via Z-API

Para enviar mensagem de volta, voc√™ faz um POST HTTP para:

```bash
POST https://api.z-api.io/instances/{INSTANCE_ID}/token/{TOKEN}/send-text
```

Com o seguinte corpo:

```json 
{
  "phone": "5511999999999",
  "message": "Ol√°! Recebemos sua d√∫vida e responderemos em breve."
}



#### üì• Recebendo mensagens com Webhook

- Z-API envia um POST autom√°tico para sua API quando o usu√°rio responde.

- Exemplo de payload que sua API vai receber:

```json
{
  "message": "Ol√°, quero saber sobre reembolso",
  "phone": "5511999999999",
  "instanceId": "seu_instance",
  "timestamp": 1712271000
}
```



####  Integra√ß√£o com FastAPI:

In [None]:

from fastapi import FastAPI, Request
import requests

app = FastAPI()

INSTANCE_ID = "sua_instance"
TOKEN = "seu_token"

@app.post("/whatsapp/")
async def receber_mensagem(request: Request):
    dados = await request.json()
    pergunta = dados.get("message")
    numero = dados.get("phone")

    # Aqui entra seu RAG:
    resposta = qa.run(pergunta)

    # Enviar a resposta de volta
    requests.post(
        f"https://api.z-api.io/instances/{INSTANCE_ID}/token/{TOKEN}/send-text",
        json={
            "phone": numero,
            "message": resposta
        }
    )
    return {"ok": True}


#### üì¶ Pr√≥s e Contras do Z-API:
![prosecontras](images/prosecontras.png)

### Fluxo da mensagem:

#### üì° 1. Cliente envia mensagem no WhatsApp
Imagine que o cliente digita:

> "Gostaria de saber sobre reembolso." 

Essa mensagem √© enviada para o n√∫mero WhatsApp conectado via Z-API (o seu n√∫mero pessoal ou empresarial que foi escaneado no painel da Z-API).

#### üîÅ 2. Z-API envia um `POST` para o seu webhook FastAPI

No painel da Z-API, voc√™ configurou um webhook assim:

``https://seuservidor.com/whatsapp/``

Quando a mensagem chega no WhatsApp, a Z-API chama sua rota /whatsapp/, enviando um JSON com os seguintes dados:

```json
{
  "message": "Gostaria de saber sobre reembolso.",
  "phone": "5511999999999"
}
```

#### üß† 3. FastAPI recebe e processa no endpoint /whatsapp/

No seu c√≥digo:

```python
@app.post("/whatsapp/")
async def receber_mensagem(request: Request):
    dados = await request.json()
    pergunta = dados.get("message")
    numero = dados.get("phone")
```

Voc√™ est√° capturando:

- `pergunta` ‚Üí O conte√∫do da mensagem.
- `numero` ‚Üí O telefone de quem enviou.

#### ü§ñ 4. Essa pergunta √© passada para o seu RAG (LangChain + Chroma + Hugging Face | Ollama )

```python 
resposta = qa.run(pergunta)
```

Aqui, o pipeline acontece:

1. `pergunta` ‚Üí transformada em vetor.

2. Vetor ‚Üí busca no Chroma pelos documentos mais pr√≥ximos.

3. Os documentos recuperados ‚Üí passados para o LLM (Mixtral via Hugging Face).

4. O modelo gera a resposta final, j√° com base na sua base de conhecimento.


#### üì§ 5. A resposta √© enviada de volta ao usu√°rio no WhatsApp

Voc√™ faz uma chamada de `POST` para a Z-API:

```python
requests.post(
    f"https://api.z-api.io/instances/{INSTANCE_ID}/token/{TOKEN}/send-text",
    json={
        "phone": numero,
        "message": resposta
    }
)
```

‚úÖ E o cliente recebe a resposta diretamente no WhatsApp, como se fosse uma pessoa respondendo.

#### RESUMO DO FLUXO VISUAL:
```csharp
[WhatsApp do Cliente]
        ‚Üì
[Z-API Webhook]
        ‚Üì
[FastAPI /whatsapp/] ‚Üê captura mensagem
        ‚Üì
[RAG LangChain]
        ‚Üì
[Busca no ChromaDB + LLM]
        ‚Üì
[Resposta gerada]
        ‚Üì
[Z-API envia ao WhatsApp]
        ‚Üì
[Cliente recebe a resposta no WhatsApp]
```


### ‚úÖ Twilio: Integra√ß√£o Oficial com o WhatsApp Business

Twilio √© uma plataforma oficialmente aprovada pelo WhatsApp.

√â usada por grandes empresas como Nubank, iFood, Mercado Livre.

Voc√™ precisa de um n√∫mero WhatsApp Business verificado e aprovado.

#### üõ†Ô∏è Como funciona a integra√ß√£o via Twilio?

1. Criar conta no https://twilio.com/
Obtenha um SID da conta e um Token de autentica√ß√£o.

2. Obtenha um n√∫mero de WhatsApp Business sandbox
V√° para: Messaging > Try it out > WhatsApp sandbox

Siga as instru√ß√µes para conectar seu WhatsApp ao sandbox.

3. Configure seu webhook de recebimento
Twilio enviar√° mensagens recebidas para um endpoint HTTP (como FastAPI).

#### üì§ Enviando mensagem via Twilio (Python)



In [None]:
from twilio.rest import Client

account_sid = "SEU_SID"
auth_token = "SEU_TOKEN"
client = Client(account_sid, auth_token)

mensagem = client.messages.create(
    from_='whatsapp:+14155238886',
    body='Ol√°! Como posso ajudar?',
    to='whatsapp:+5511999999999'
)

print(mensagem.sid)


#### üì• Recebendo mensagem com webhook (FastAPI)



In [None]:
from fastapi import FastAPI, Form

app = FastAPI()

@app.post("/twilio/")
async def receber_mensagem(Body: str = Form(...), From: str = Form(...)):
    print(f"Mensagem de {From}: {Body}")
    resposta = qa.run(Body)

    # Aqui voc√™ pode usar Twilio para responder de volta
    # (igual ao c√≥digo acima)
    return "ok"


#### üì¶ Pr√≥s e Contras do Twilio:
![prosecontras2](images/prosecontras2.png)

# Agora vamos configurar uma forma solu√ß√£o controlada, local, escal√°vel e com liberdade total. 

Vamos integrar seu RAG Python com um bot em Node.js via uma API HTTP local

## ‚úÖ Passo a passo: rodando o llm + fastapi com python

### Criando ambiente virtual no python

```bash
python -m venv venv  
```
### Ativando o ambiente virtual

```bash
venv\Scripts\activate
```

### Bypass da excess√£o

Caso o erro abaixo apareca vc precisa pedir para que o Wondows ignore, apenas para aquele terminal, o bloqueio de execu√ß√£o de scripts.

![erro](erroo.png)

Execute o comando abaixo:
```bash
Set-ExecutionPolicy -ExecutionPolicy Bypass -Scope Process
```

Execute novamente o comando abaixo:
```bash
venv\Scripts\activate
```

Caso tenha conseguito seu terminal ter√° o nome da pasta do ambiente virtual como abaixo:

```bash
(venv) PS C:\Users\Eric\Desktop\aula> 
```

### Instale as depend√™ncias:

```bash
pip install -r requiremensts.txt
```

As dependencias do arquivo s√£o as seguintes:

```
fastapi
uvicorn
pydantic
python-dotenv
langchain
langchain-chroma
langchain-ollama
```

### Inicializar o FAST-API:

```bash
uvicorn rag_api:app --host 0.0.0.0 --port 3000 --reload
```

O comando anterior inicializa o 'motor' uvicorn que permanece 'ligado' o tempo todo aguardando novas requis√ß√µes.


## ‚úÖ Passo a passo: rodando o bot.js com whatsapp-web.js

### üß© 1. Instalar o Node.js

üëâ Acesse:
https://nodejs.org/

- Baixe a vers√£o LTS (recomendada)
- Instale com todas as op√ß√µes padr√£o
- Ap√≥s instalar, reinicie o terminal (ou VS Code)



### ‚úÖ 2. Verifique se o Node e NPM foram instalados

```bash
node -v
npm -v
```

Se aparecerem vers√µes como v18.x.x, 9.x.x, est√° tudo certo!


### üìÅ 3. Crie uma pasta para seu bot (caso ainda n√£o tenha)

```bash
mkdir whatsapp-rag-bot
cd whatsapp-rag-bot
```



### üì¶ 4. Crie o projeto Node

```bash
npm init -y
```


### üìö 5. Instale as depend√™ncias

```bash
npm install whatsapp-web.js axios qrcode-terminal
```


### üìù 6. Crie o arquivo bot.js


```js
const { Client, LocalAuth } = require("whatsapp-web.js");
const axios = require("axios");
const qrcode = require("qrcode-terminal");

const client = new Client({
    authStrategy: new LocalAuth()
});

client.on("qr", (qr) => {
    console.log("üì± Escaneie o QR Code para conectar seu bot ao WhatsApp:");
    qrcode.generate(qr, { small: true });
});

client.on("ready", () => {
    console.log("‚úÖ Bot do WhatsApp est√° pronto!");
});

client.on("message", async (message) => {
    if (message.isGroupMsg) return;
    if (!message.body) return;

    console.log(`üì© Mensagem recebida: ${message.body}`);

    try {
        const response = await axios.post("http://localhost:3000/chat", {
            prompt: message.body
        });

        const botResponse = response.data.response
            .replace(/<\/?[^>]+(>|$)/g, "")
            .replace(/\n/g, " ")
            .trim();

        await message.reply(botResponse);
        console.log(`ü§ñ Resposta enviada: ${botResponse}`);
    } catch (error) {
        console.error("‚ùå Erro ao processar a mensagem:", error.message);
        await message.reply("‚ö†Ô∏è Ocorreu um erro ao processar sua mensagem.");
    }
});

client.initialize();
```


### üöÄ 7. Rode o bot

```bash
node bot.js
```

üì± Ele mostrar√° um QR Code no terminal ‚Üí escaneie com seu WhatsApp Web.

### üß† 8. Certifique-se de que sua API FastAPI (/chat) esteja instalada e rodando

```bash
pip install fastapi uvicorn langchain langchain-community langchain-chroma sentence-transformers python-dotenv requests pydantic
```


```bash
uvicorn rag_api:app --host 0.0.0.0 --port 3000 --reload
```
