# Criando um Chatbot com IA (Parte 1)

## ü§ñ O que √© um Chatbot?

Um chatbot √© um programa de computador que simula uma conversa humana, podendo responder perguntas, fornecer informa√ß√µes e at√© realizar a√ß√µes automatizadas. Ele pode funcionar por texto (ChatGPT ou DeepSeek) ou voz (como a Alexa ou o Google Assistente).

## üìå Como um Chatbot Funciona?


Um chatbot pode funcionar de duas formas principais:

1Ô∏è‚É£ Chatbots Baseados em Regras (Simples):
Esses bots seguem um conjunto fixo de regras. Eles s√≥ entendem perguntas espec√≠ficas e respondem com respostas pr√©-definidas.

‚úÖ Exemplo:
- üë§ Usu√°rio: "Qual o hor√°rio de funcionamento?"
- ü§ñ Bot: "Nosso hor√°rio √© das 9h √†s 18h, de segunda a sexta."

üìå Como funciona?

Ele verifica se a pergunta corresponde a um padr√£o pr√©-programado.
Responde com uma resposta fixa.
Desvantagem: Se a pergunta for diferente do esperado, ele pode n√£o entender.

2Ô∏è‚É£ Chatbots com Intelig√™ncia Artificial (IA/NLP)
Esses bots usam Processamento de Linguagem Natural (NLP) e Machine Learning (ML) para entender frases de forma mais natural.

‚úÖ Exemplo:
- üë§ Usu√°rio: "Me fala sobre o hor√°rio de voc√™s?"
- ü§ñ Bot: "Nosso atendimento √© das 9h √†s 18h de segunda a sexta-feira."

üìå Como funciona?

Ele transforma o texto do usu√°rio em um formato compreens√≠vel.
Usa modelos de IA para interpretar o significado.
Gera uma resposta din√¢mica com base no contexto.
Aprende com intera√ß√µes anteriores para melhorar suas respostas.


## üìå Tecnologias Usadas em Chatbots
Chatbots podem ser constru√≠dos com v√°rias tecnologias, como:

- üîπ NLP (Processamento de Linguagem Natural) ‚Üí Para entender a linguagem humana (Ex: spaCy, NLTK, Hugging Face).
- üîπ Redes Neurais ‚Üí Para respostas mais inteligentes e aprendizado cont√≠nuo (Ex: ChatGPT).
- üîπ APIs de IA ‚Üí Como Dialogflow (Google), Watson Assistant (IBM), Microsoft Bot Framework.
- üîπ Frameworks para Chatbots ‚Üí Rasa, ChatterBot, BotPress.

![langchain](langchain.png)

## üìå O que √© LangChain e como ele melhora os Chatbots?

Vamos aprender a usar o LangChain para criar um sistema de Recupera√ß√£o Aumentada com Gera√ß√£o (RAG), onde um chatbot inteligente responde clientes com base em textos previamente armazenados e uma LLM gratuita.

Defini√ß√£o: LangChain √© um framework para construir aplica√ß√µes com Large Language Models (LLMs), como ChatGPT, LLaMA e Mistral.

üìå O que √© RAG (Retrieval-Augmented Generation)?

Aplica√ß√£o real: Empresas usam RAG para criar agentes de atendimento ao cliente, que interpretam documentos, bases de conhecimento e FAQs.

O ChatGPT pode responder com base em conhecimento geral.
Um RAG pode responder com base em documentos internos da empresa (exemplo: pol√≠ticas de reembolso).

## üìå Vis√£o geral das LLMs gratuitas para APIs e locais

APIs de LLMs gratuitas:

- OpenAI GPT-3.5/GPT-4 (com limites gratuitos).
- Mistral e Hugging Face API (modelos open-source).
- Together.ai (fornece acesso gratuito a v√°rias LLMs).
- Google AI Studio: Disponibiliza modelos de linguagem que podem ser utilizados gratuitamente para diversas aplica√ß√µes. 
- Hugging Face: Oferece uma ampla gama de modelos de linguagem que podem ser acessados gratuitamente atrav√©s de sua API.


![RAG](RAG.png)

![explan](explan.png)

## üìå Chamando uma API de LLM

In [None]:
!pip install -U langchain langchain-community openai


In [None]:
from langchain.chat_models import ChatOpenAI
from langchain.schema import HumanMessage
import os

api_key = os.environ.get("OPENAI_API_KEY")

# Configurando a API da OpenAI (use sua chave de API)
chat = ChatOpenAI(model="gpt-3.5-turbo", openai_api_key=api_key)

# Enviando uma pergunta para a LLM
resposta = chat([HumanMessage(content="Como funciona um chatbot de atendimento ao cliente?")])

print("Resposta da IA:", resposta.content)


In [None]:
!pip install langchain langchain-google-genai google-generativeai

In [None]:
from langchain_google_genai import GoogleGenerativeAI
from langchain.schema import HumanMessage
import os

# Configurar a API Key da Gemini (Google AI)
api_key = os.environ.get("GOOGLE_API_KEY")  

# Inicializando o modelo Gemini 1.5 Flash
chat = GoogleGenerativeAI(model="gemini-1.5-flash", google_api_key=api_key)

# Enviando uma pergunta para a LLM
resposta = chat.invoke("Como funciona um chatbot de atendimento ao cliente?")

# Exibir a resposta
print("Resposta da IA:", resposta)


AttributeError: 'str' object has no attribute 'content'

In [None]:
!pip install langchain langchain-community huggingface_hub


In [3]:
from langchain_community.llms import HuggingFaceHub
import os


# Configurar o modelo da Hugging Face
llm = HuggingFaceHub(
    repo_id="mistralai/Mistral-7B-Instruct-v0.2",  # Escolha o modelo
    model_kwargs={"temperature": 0.7, "max_length": 512},  # Configura√ß√µes
    huggingfacehub_api_token=os.getenv("HUGGINGFACEHUB_API_TOKEN")  # Usa a API Key
)

# Testando o modelo
resposta = llm.invoke("Explique o que √© uma IA generativa.")
print("Resposta:", resposta)




Resposta: Explique o que √© uma IA generativa.

A Intelig√™ncia Artificial Generativa (AI Generativa) √© uma subdisciplina da Intelig√™ncia Artificial que utiliza modelos de aprendizagem de m√°quina capazes de gerar informa√ß√µes novas e originais, sem serem direcionados por um humano. Essas informa√ß√µes podem ser texto, imagens, √°udio ou outros formatos de dados.

AI Generativas s√£o capazes de analisar e processar grande quantidades de dados existentes e criar novas informa√ß√µes baseadas nesses dados. Eles aprendem a gerar novas informa√ß√µes atrav√©s de algoritmos de aprendizagem profunda, como redes neurais convolucionais (CNNs) e redes recurrentes (RNNs), que podem descobrir padr√µes e estruturas nas informa√ß√µes existentes e usar essas descobertas para gerar novas informa√ß√µes semelhantes.

Uma aplica√ß√£o comum de AI Generativas √© a cria√ß√£o de conte√∫do multim√©dia, como imagens, v√≠deos ou textos. Por exemplo, um modelo de AI Generativa pode analisar milhares de imagens

## üìå Rodando Modelos LLM Locais com LLaMA e LangChain

- Para rodar LLMs no pr√≥prio computador sem depender de APIs.

- Instalando o Ollama (para rodar LLaMA localmente)

### Passo a passo para isntalar o ollama localmente:


- Acesse o site https://ollama.com
- Baixe o instalador de LLMs
- Instale na m√°quina
- Escolha a LLM que ir√° usar
- Instale a LLM no bash do Ollama

In [None]:
!pip install langchain langchain-community



'ollama' nÔøΩo ÔøΩ reconhecido como um comando interno
ou externo, um programa operÔøΩvel ou um arquivo em lotes.


#### üîπ Mistral 7B / Mixtral

- Pontos fortes: √ìtimo para conversa√ß√£o e respostas estruturadas.
- Onde encontrar: Dispon√≠vel no Ollama (ollama pull mistral).
- Ideal para: Chatbots empresariais e suporte t√©cnico.

Como usar no LangChain:

In [5]:
from langchain.llms import Ollama

# Inicializando a LLM local
llm = Ollama(model="mistral")
resposta = llm("Quem descobriu o Brasil?")
print(resposta)


 O Brasil foi descoberto pelos portugueses. Por volta do ano de 1500, a expedi√ß√£o liderada por Pedro √Ålvares Cabral, como parte da frota enviada pelo Rei D. Manuel I de Portugal, desembarcou no atual estado brasileiro de Esp√≠rito Santo, marcando o in√≠cio do processo de coloniza√ß√£o portuguesa do territ√≥rio brasileiro.


#### üîπ LLaMA 3 (Meta)

- Pontos fortes: √ìtima compreens√£o de contexto e menor consumo de mem√≥ria.
- Onde encontrar: Dispon√≠vel via Ollama (ollama pull llama3).

Como usar no LangChain:


In [None]:
from langchain.llms import Ollama

# Inicializando a LLM local
llm = Ollama(model="llama3")
resposta = llm("O que √© NLP?")
print(resposta)

## üìå Como Configurar um Chatbot Estruturado com RAG no LangChain

Agora, vamos configurar um pipeline de RAG para seu chatbot.

### Passo 1: Criando a Base de Conhecimento

Agora, vamos configurar um pipeline de RAG para seu chatbot.



In [None]:
!pip install faiss-cpu

In [None]:
!pip install tiktoken

In [13]:
from langchain_community.vectorstores import FAISS
from langchain_community.embeddings import OllamaEmbeddings
from langchain.schema import Document

# Criando documentos para o FAISS
documentos = [
    Document(page_content="Nosso suporte est√° dispon√≠vel de segunda a sexta, das 9h √†s 18h."),
    Document(page_content="O reembolso pode ser solicitado em at√© 7 dias ap√≥s a compra."),
    Document(page_content="Para falar com um atendente, envie um e-mail para suporte@empresa.com."),
]

# Usando embeddings locais com Ollama (modelo Mistral)
vectorstore = FAISS.from_documents(documentos, OllamaEmbeddings(model="mistral"))

print("Banco de vetores criado com sucesso usando Mistral!")


Banco de vetores criado com sucesso usando Mistral!


‚úÖ Isso cria um banco de vetores com informa√ß√µes do suporte ao cliente.

### Passo 2: Criando o Chatbot RAG

Agora, criamos um agente que busca respostas antes de responder:

In [14]:
from langchain.chains import RetrievalQA
from langchain_community.llms import Ollama  # Import correto para Ollama

llm = Ollama(model="mistral")

# Criando a cadeia de perguntas e respostas com recupera√ß√£o de contexto
qa = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=vectorstore.as_retriever()
)

# Fazendo uma pergunta ao chatbot
pergunta = "Qual o hor√°rio de atendimento?"
resposta = qa.run(pergunta)

print("Resposta do Chatbot:", resposta)


  resposta = qa.run(pergunta)


Resposta do Chatbot:  O hor√°rio de atendimento do nosso suporte √© de segunda a sexta, das 9h √†s 18h.


#### Conclus√£o

Qual LLM Escolher?

![taela_llm](taela_llm.png)

- ‚úÖ Se precisar de um chatbot local, v√° de Mistral 7B ou LLaMA 3.
- ‚úÖ Se precisar de alta precis√£o, use GPT-4 Turbo ou Cohere API.