<a href="https://colab.research.google.com/github/elianedp/ExpertSystem/blob/main/%5BONLINE%5D_Exemplo_1_Chatbot_baseado_em_regras.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Exemplo 1 - Chatbot de atendimento ao cliente baseado em regras
## Tecn√≥logo em Intelig√™ncia Artificial Aplicada - Agentes Conversacionais
Neste notebook iremos construir um chatbot utilizando-se das t√©cnicas mais simples de desenvolvimento.

### Chatbot baseado em regras

√â o tipo de chatbot mais simples que existe, que consiste em um dataset com respostas pr√©-definidas e uma s√©rie de regras que servem para encontrar estas respostas (ou inten√ß√µes) no dataset.

Apesar das limita√ß√µes, eles podem ser bastante eficientes e produtivos se tiverem regras bem definidas e um dataset substancial de respostas.


### Qual o contexto de nosso chatbot?

Iremos desenvolver um chatbot de intera√ß√£o com clientes de um restaurante. O objetivo √© que o chatbot auxilie o cliente a encontrar as informa√ß√µes desejadas sem que precise navegar por v√°rios links do site.

### Quais ferramentas e t√©cnicas iremos utilizar?

*   **NLTK** - O mais famoso toolkit de Processamento de Linguagem Natural em Python.
*   **Express√µes Regulares** - o pacote de regex do Python ser√° utilizado para otimizar a busca de padr√µes.
*   **WordNet** - o grande banco de dados l√©xico e sem√¢ntico, dispon√≠vel em diversos idiomas.



### Construindo o chatbot
Nosso chatbot vai operar da seguinte maneira:

1.   Recebe **entrada** do usu√°rio
2.   Procura **palavras-chave** na entrada do usu√°rio
3.   Define a **inten√ß√£o associada** √† entrada
4.   Obt√©m a **resposta baseada na inten√ß√£o** definida
5.   Mostra a **resposta** ao usu√°rio

Portanto, temos de ter uma **tabela que associe as palavras-chave desejadas, com as inten√ß√µes definidas** em nosso dataset. A seguir um exemplo:
![Exemplo de busca de inten√ß√£o e resposta](https://docs.google.com/uc?export=download&id=1LnOTZiahBSv9VGrCSExbylNbxHpclMKZ)

#### Importando as bibliotecas
Vamos importar o pacote de express√µes regulares do Python e tamb√©m o acesso ao WordNet dado pelo NLTK.

#### Construindo a lista de palavras-chave
Esta √© uma etapa que pode demandar bastante tempo, principalmente de voc√™ quiser definir as palavras manualmente. Por√©m, quanto mais palavras-chave voc√™ tiver, maior cobertura seu chatbot vai ter.

Por quest√µes did√°ticas, vamos a partir de um √∫nico termo, tentar automatizar esta busca, utilizando os sin√¥nimos encontrados no WordNet.

In [1]:
# Instala a biblioteca unidecode (s√≥ precisa rodar uma vez no ambiente)
!pip install unidecode

import re
import nltk
from nltk.corpus import wordnet
import unidecode  # para remover acentos

# Baixar pacotes necess√°rios
nltk.download('wordnet')
nltk.download('omw-1.4')

# Lista de palavras
palavras = ["ol√°", "hor√°rio", "card√°pio"]
lista_sinonimos = {}

for palavra in palavras:
    sinonimos = []
    for syn in wordnet.synsets(palavra, lang="por"):
        for nome in syn.lemma_names("por"):
            sinonimos.append(unidecode.unidecode(nome.lower()))
    lista_sinonimos[palavra] = set(sinonimos)

print("Lista de sin√¥nimos gerada:")
print(lista_sinonimos)



[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package omw-1.4 to /root/nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!


Lista de sin√¥nimos gerada:
{'ol√°': {'ola'}, 'hor√°rio': {'ordem_do_dia', 'horario', 'plano', 'programa', 'agenda', 'cronograma'}, 'card√°pio': {'cardapio', 'menu'}}


In [2]:
# Lista de palavras-chave (inten√ß√µes que o chatbot deve reconhecer)
# J√° inclu√≠ "ol√°", "hor√°rio" e adicionamos "card√°pio" como melhoria
palavras = ["ol√°", "hor√°rio", "card√°pio"]

# Dicion√°rio de sin√¥nimos
lista_sinonimos = {}

# Percorre a lista de palavras
for palavra in palavras:
    sinonimos = []
    # Busca sin√¥nimos da palavra no WordNet (em portugu√™s)
    for syn in wordnet.synsets(palavra, lang="por"):
        for lem in syn.lemma_names("por"):
            # Normaliza: min√∫sculas e sem acento
            sinonimos.append(unidecode.unidecode(lem.lower()))
    # Remove duplicatas e adiciona ao dicion√°rio
    lista_sinonimos[palavra] = set(sinonimos)

# Mostra os sin√¥nimos encontrados
print("Lista de sin√¥nimos gerada:")
print(lista_sinonimos)

Lista de sin√¥nimos gerada:
{'ol√°': {'ola'}, 'hor√°rio': {'ordem_do_dia', 'horario', 'plano', 'programa', 'agenda', 'cronograma'}, 'card√°pio': {'cardapio', 'menu'}}


#### Construindo dicion√°rio de inten√ß√µes
Vamos utilizar o dicion√°rio de sin√¥nimos constru√≠do e mape√°-los para as poss√≠veis inten√ß√µes. Al√©m disso, vamos formatar as palavras-chave de modo que sejam interpretadas pela ferramenta de busca de express√µes regulares.

In [3]:
# Construindo dicion√°rio de inten√ß√µes a partir dos sin√¥nimos
keywords = {}
keywords_dict = {}

# üîπ Inten√ß√£o: Sauda√ß√£o
keywords['saudacao'] = []
for sin in list(lista_sinonimos['ol√°']):
    keywords['saudacao'].append(r'.*\b' + sin + r'\b.*')

# üîπ Inten√ß√£o: Hor√°rio de atendimento
keywords['horario_atendimento'] = []
for sin in list(lista_sinonimos['hor√°rio']):
    keywords['horario_atendimento'].append(r'.*\b' + sin + r'\b.*')

# üîπ Inten√ß√£o: Card√°pio (melhoria que eu adicionei)
keywords['cardapio'] = []
for sin in list(lista_sinonimos['card√°pio']):
    keywords['cardapio'].append(r'.*\b' + sin + r'\b.*')

# üîπ Inten√ß√£o: Endere√ßo (adicionei manualmente)
keywords['endereco'] = [r'.*\bendereco\b.*', r'.*\bruab\b.*', r'.*\bloc\b.*']

# üîπ Inten√ß√£o: Delivery (adicionei manualmente)
keywords['delivery'] = [r'.*\bdelivery\b.*', r'.*\bentrega\b.*', r'.*\bpedido\b.*']

# üîπ Inten√ß√£o: Reserva de mesa (adicionei manualmente)
keywords['reserva'] = [r'.*\breserva\b.*', r'.*\bmesa\b.*', r'.*\breservar\b.*']

# Compila os padr√µes regex para cada inten√ß√£o
for intent, keys in keywords.items():
    keywords_dict[intent] = re.compile('|'.join(keys))

# Visualiza o dicion√°rio de inten√ß√µes
print("Dicion√°rio de inten√ß√µes (regex):")
print(keywords_dict)

Dicion√°rio de inten√ß√µes (regex):
{'saudacao': re.compile('.*\\bola\\b.*'), 'horario_atendimento': re.compile('.*\\bordem_do_dia\\b.*|.*\\bhorario\\b.*|.*\\bplano\\b.*|.*\\bprograma\\b.*|.*\\bagenda\\b.*|.*\\bcronograma\\b.*'), 'cardapio': re.compile('.*\\bcardapio\\b.*|.*\\bmenu\\b.*'), 'endereco': re.compile('.*\\bendereco\\b.*|.*\\bruab\\b.*|.*\\bloc\\b.*'), 'delivery': re.compile('.*\\bdelivery\\b.*|.*\\bentrega\\b.*|.*\\bpedido\\b.*'), 'reserva': re.compile('.*\\breserva\\b.*|.*\\bmesa\\b.*|.*\\breservar\\b.*')}


In [6]:
# Aqui eu estou criando as respostas que o meu chatbot vai usar.
# Tamb√©m deixei uma resposta padr√£o para quando ele n√£o entender a pergunta.
# Al√©m disso, adicionei novas inten√ß√µes: endere√ßo, delivery e reserva de mesa.

respostas = {
    'saudacao': 'Ol√°! Como posso ajud√°-lo?',
    'horario_atendimento': 'Abrimos para almo√ßo das 11h30 √†s 15h00 e para jantar das 18h30 √†s 23h00.',
    'cardapio': 'Nosso card√°pio inclui pratos variados, como massas, saladas e carnes.',  # melhoria que eu adicionei
    'endereco': 'Nosso restaurante fica na Rua das Flores, n¬∫ 123, no centro da cidade.',
    'delivery': 'Sim, fazemos delivery! Voc√™ pode pedir pelo nosso site ou pelo telefone (45) 1234-5678.',
    'reserva': 'Para reservar uma mesa, por favor me diga a data, o hor√°rio e o n√∫mero de pessoas.',
    'padrao': 'Me desculpe, mas n√£o entendi o que voc√™ disse. Voc√™ poderia reformular?'
}


> **NOTA**: Aqui poder√≠amos ainda criar mais de uma resposta para cada inten√ß√£o, evitando que a intera√ß√£o fique repetitivo.




#### Linkando as inten√ß√µes e gerando as repostas (front-end)
Aqui constru√≠remos de fato o algoritmo que far√° a intera√ß√£o com o usu√°rio (o gerenciador de di√°logo), onde receberemos uma entrada do mesmo, e utilizando regex, iremos buscar as palavras-chave no texto e associar com a inten√ß√£o desejada.

In [None]:
print("Bem-vindo ao restaurante McChat!")

# Dicion√°rio para salvar reservas feitas
reservas = []

# Roda indefinidamente, at√© que o usu√°rio pe√ßa para sair
while True:

    # Pega o input do usu√°rio e normaliza em letras min√∫sculas
    entrada = input("Voc√™: ").lower()

    # Define condi√ß√£o de sa√≠da
    if entrada == 'sair':
        print("Chatbot: Obrigado pela visita. Volte sempre!")
        break

    matched_intent = None

    # Verifica se alguma inten√ß√£o bate com a entrada
    for intent, pattern in keywords_dict.items():
        if re.search(pattern, entrada):
            matched_intent = intent
            break  # para na primeira correspond√™ncia encontrada

    # Caso especial: inten√ß√£o de reserva
    if matched_intent == 'reserva':
        # Tenta identificar quantidade de pessoas
        pessoas = re.findall(r'\d+', entrada)
        qtd = pessoas[0] if pessoas else "n√£o informado"

        # Salva a reserva em uma lista de dicion√°rios
        reservas.append({
            "pedido": entrada,
            "pessoas": qtd
        })

        print(f"Chatbot: Ok, anotei uma reserva para {qtd} pessoa(s).")
        continue  # volta para o pr√≥ximo input

    # Por padr√£o, usamos a inten√ß√£o 'padrao'
    key = 'padrao'
    if matched_intent in respostas:
        key = matched_intent

    # O chatbot imprime a resposta correspondente
    print("Chatbot:", respostas[key])

Bem-vindo ao restaurante McChat!
Voc√™: cardapio
Chatbot: Nosso card√°pio inclui pratos variados, como massas, saladas e carnes.


Assim, finalizamos o desenvolvimento de nosso modelo de chatbot.


### O que pode ser feito?
Como dito inicialmente, esta √© a abordagem e arquitetura mais simples de chatbot, que depende muito do tamanho e cobertura da base de dados para seu sucesso.
Ent√£o, o que poder√≠amos fazer para melhorar?


*   Inclua mais inten√ß√µes na base de dados relacionadas a dados necess√°rios para um restaurante (e.g., endere√ßo, card√°pio, delivery, reservas)
*   Tente fazer uma regra espec√≠fica para reserva de mesas no restaurante em que se salve as reservas em um dicion√°rio e utilize regex para obter os par√¢metros de data, hor√°rio e quantidade de pessoas em meio ao texto
*   Caso o restaurante abra para almo√ßo e jantar, como resolver a inten√ß√£o de hor√°rio de atendimento?



## Refer√™ncias e Material complementar

* [Criando meu ChatBot com Python](https://medium.com/@erikatiliorey/criando-um-chatbot-com-python-36f24b62df6c)
* [Introducing Conversational Chat bots using Rule Based Approach](https://chatbotslife.com/introducing-conversational-chat-bots-using-rule-based-approach-c8840aeaad07)
* [Building a Simple Chatbot from Scratch in Python (using NLTK)](https://medium.com/analytics-vidhya/building-a-simple-chatbot-in-python-using-nltk-7c8c8215ac6e)
* [How to write a smart Chatbot in 40 lines without ML](https://levelup.gitconnected.com/a-chatbot-without-machine-learning-b76ad00e30c1)
* [Building a Rule-based Chatbot in Python](https://blog.datasciencedojo.com/building-a-rule-based-chatbot-in-python/)
* [Basic FAQ chat bot](https://github.com/canonicalmg/FAQ-Chat-Bot)

Este notebook foi produzido por Prof. [Lucas Oliveira](http://lattes.cnpq.br/3611246009892500).