# Portfólio Processamento de Linguagem Natural - NLP

##### Criação do Chatbot

* Importação das biblotecas necessárias para o projeto

In [1]:
# Biblioteca NLTK
import nltk
# Importando a classe Chat e o objeto reflections
from nltk.chat.util import Chat, reflections
# Importando o método sleep
from time import sleep

* Realizando o download dos recursos para tokenização

In [2]:
# separar palavras e pontuações em um texto
nltk.download('punkt')
# Remoção de palavras comuns para precisão dos algoritmos de PNL
nltk.download('stopwords')

[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\leand\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package stopwords to
[nltk_data]     C:\Users\leand\AppData\Roaming\nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


True

* Definindo reflections

In [3]:
reflections = {
    "eu sou": "você é",
    "eu era": "você era",
    "eu": "você",
    "meu": "seu",
    "você é": "eu sou",
    "você era": "eu era",
    "seu": "meu",
    "sou": "é",
    "você": "eu"
}

* Criando os padrões de diálogo

In [17]:
conversa = [
    # Listas formatadas para reconhecem qualquer combinação de letras acentuadas, maiúsculas ou minúsculas.
    [r"(?i)\b[oóòôõö]l[aáàâãä]\b", ["Olá! Como vai?"]],
    [r"(?i).*bem", ["Que bom!😎"]],
    [r"(?i)\boi\b", ["Como vai?"]],
    [r"(?i)\b(ok|certo|positivo|entendido|compreendido|beleza|ótimo|otimo|não há de que|por nada|não por isso)\b", ["🤝"]],
    [r"\b(tudo bem|TUDO BEM|tudo bem!|TUDO BEM!)\b", ["Isso é bom!👍"]],
    [r"(como vai?|como você está?|como voce esta?|E você?|E voce?|bem e você?|bem e voce?)",
     ["Estou bem, Grato por perguntar!❤️"]],
    [r"(?i)me ajuda?", ["Claro, em que posso ser útil?"]],
    ["(?i)preciso de ajuda", ["Claro, em que posso ser útil?"]],
    ["(?i)pode ajudar?", ["Claro, em que posso ser útil?"]],
    [r"(?i).*pode me ajudar?", ["Claro, em que posso ser útil?"]],
    [r"(?i)\bajuda[r]?\b", ["Claro, em que posso ser útil?"]],
    [r"(?i).*brincando", ["Sem problemas, você tem bom humor 😂"]],
    [r"(?i).*um chatbot", ["Que legal, sugiro o estudo da biblioteca NLTK"]],
    [r"(?i).*indica um site?", ["Claro, o site oficial é: https://www.nltk.org/"]],
    [r"(?i).*indicar um site?", ["Claro, o site oficial é: https://www.nltk.org/"]],
    [r"(agradeço|grato|obrigado|muito grato|muito obrigado)",
     ["Não há de que! Você encontrará muitos tópicos úteis no site oficial da biblioteca."]],
    [r"(?i).*finalizar.*", ["OK, conte comigo sempre que precisar. Até mais!"]],
    [r"(?i)\bquem .*criou.* você\b", ["Foi um estudante de ciência de dados, O nome dele é Leandro."]],
    [r"(?i)\b(legal|que legal|bacana|que bacana|massa|que massa|irado|que irado|gostei|tai gostei|foda|que foda|top|que top|show|que show)\b", 
     ["Interessante, não é mesmo?! É o poder da biblioteca NLTK.😁"]],
    # Qualquer palavra/frase fora da lista, retona que o chat ainda não está preparado para a solicitação
    [".*", ["Ainda não sou capaz de reconhecer a frase/texto ou não possuo conhecimento nesse assunto."]]
]

* Criando o chat com padrões de pergunta e resposta

In [18]:
bot = Chat(conversa, reflections)

* Criando o loop do chat

In [19]:
# Definindo um input para o bot tratar o usuário pelo nome inserido
nome = input("Por gentileza, para começar digite o seu nome: \n\n")
# Loop para funcionamento do chat com bloco try/except
def dialogo(nome):
    try:
        print(f"\nRobô: Olá, {nome}! Meu nome é Jullees, e sou um chat virtual.\nVamos começar.")
        sleep(2)
        while True:
            pessoa = input("Digite aqui: ")
            sleep(1)
            # Criando uma condição para reconhecer a saída do chat
            if pessoa == "sair" or pessoa == "SAIR" or pessoa == 'Sair':
                print("\nChat finalizado. Até mais", nome)
                break
            else:
                chat = bot.respond(pessoa)
                sleep(1)
                print("Robô: ", chat, end="\n\n")
                sleep(1)
    # Tratativa e demonstração do erro, caso houver algum            
    except Exception as e:
        print("Ocorreu um erro: ", '\n', e)
# Chamando a função dialogo
dialogo(nome)

Por gentileza, para começar digite o seu nome: 

Leandro

Robô: Olá, Leandro! Meu nome é Jullees, e sou um chat virtual.
Vamos começar.
Digite aqui: Olá Jullees
Robô:  Olá! Como vai?

Digite aqui: estou bem
Robô:  Que bom!😎

Digite aqui: e você, como vai?
Robô:  Estou bem, Grato por perguntar!❤️

Digite aqui: por nada
Robô:  🤝

Digite aqui: pode me ajudar?
Robô:  Claro, em que posso ser útil?

Digite aqui: Quero ficar rico e ficar numa boa
Robô:  Ainda não sou capaz de reconhecer a frase/texto ou não possuo conhecimento nesse assunto.

Digite aqui: Estou brincando
Robô:  Sem problemas, você tem bom humor 😂

Digite aqui: agora é serio, estou desenvolvendo um chatbot
Robô:  Que legal, sugiro o estudo da biblioteca NLTK

Digite aqui: indica um site?
Robô:  Claro, o site oficial é: https://www.nltk.org/

Digite aqui: grato
Robô:  Não há de que! Você encontrará muitos tópicos úteis no site oficial da biblioteca.

Digite aqui: quem criou você?
Robô:  Foi um estudante de ciência de dados, O n

#### Criando o Processo de Tokenização

* Importando as bibliotecas para tokenização

In [20]:
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords

* Definido stopword em pt-br e criando a variável que contém o texto para tokenização

In [21]:
# Definindo o recurso stopwords para a lingua portuguesa
pt_br = stopwords.words('portuguese')
# Texto para tokenização
texto = '''Neste texto, será realizado o teste da funcionalidade
           do recurso para tokenização. Após os processos, será 
           possível identificar a eficácia da biblioteca NLTK e
           seus recursos.'''

* Criando o processo de tokenização

In [22]:
palavras = word_tokenize(texto, language='portuguese')
print("Texto tokenizado:", "\n\n", palavras)

Texto tokenizado: 

 ['Neste', 'texto', ',', 'será', 'realizado', 'o', 'teste', 'da', 'funcionalidade', 'do', 'recurso', 'para', 'tokenização', '.', 'Após', 'os', 'processos', ',', 'será', 'possível', 'identificar', 'a', 'eficácia', 'da', 'biblioteca', 'NLTK', 'e', 'seus', 'recursos', '.']


* Criando uma nova lista chamada sem_stopwords que contém todas as palavras 
  da lista palavras que não estão na lista de stopwords removendo as palavras 
  comuns que geralmente não contribuem para o significado de uma frase da lista de palavras reduzindo o ruído dos dados.

In [23]:
sem_stopwords = [palavra for palavra in palavras if palavra.lower() not in pt_br]
print(sem_stopwords)

['Neste', 'texto', ',', 'realizado', 'teste', 'funcionalidade', 'recurso', 'tokenização', '.', 'Após', 'processos', ',', 'possível', 'identificar', 'eficácia', 'biblioteca', 'NLTK', 'recursos', '.']


#### Criando o processo de análise de sentimentos

* Importando as biblotecas necessárias para o projeto de análise de sentimentos

In [31]:
# Importando TextBlob e NaiveBayesClassifier
from textblob import TextBlob
from textblob.classifiers import NaiveBayesClassifier
from time import sleep

* Criando a função para analisar os sentimentos

In [35]:
def analise(texto):
    # Exemplo de conjunto de treinamento
    treino = [
        ('Eu amo esse produto!', 'pos'), ('Estou muito feliz.', 'pos'), ('Isso é muito bom', 'pos'), ('Eu estou bem', 'pos'),
        ('Esse rapaz é legal', 'pos'), (' Esse creme é otimo', 'pos'), ('Estou descansado', 'pos'), ('Estou apaixonado', 'pos'),
        ('Gostei muito do show', 'pos'), ('Estou me sentindo mal', 'neg'), ('Estou me sentindo mau', 'neg'), 
        ('Estou muito cansado', 'neg'), ('Tenho medo de morrer', 'neg'), ('Estou doente', 'neg'),('Não gostei do sabor', 'neg'),
        ('Estou me sentindo infeliz', 'neg'), ('Esse processo não funciona', 'neg'), ('Isso é terrível.', 'neg'), 
        ('Isso é pessimo', 'neg'), ('Estou com muita raiva.', 'neg'), ('Estou com muita odio.', 'neg')
    ]
    
    # Treinamento do classificador
    cl = NaiveBayesClassifier(treino)
    # Definindo a classificação do texto para a variável 'entrada'
    entrada = TextBlob(texto, classifier=cl)
    #Criando 
    for i in entrada.sentences:
        print('\nA frase digitada foi:', i, end='\n')
        sleep(2)
        if i.classify() == 'neg':
            return '👎😢👎Isso me parece Negativo👎😢👎'
        elif i.classify() == 'pos':
            return '👍😁👍Isso me parece Positivo!👍😁👍'
        else:
            return '🤔🤔🤔Não consigo determinar o sentimento com exatidão.🤔🤔🤔'

# Utilizando a função 'analise'
entrada = input("Digite algo para análise de sentimento: ")
sentimento = analise(entrada)
print("\nAnálise de Sentimento: ", sentimento)

Digite algo para análise de sentimento: Fiquei insatisfeito com o produto adquirido

A frase digitada foi: Fiquei insatisfeito com o produto adquirido

Análise de Sentimento:  👎😢👎Isso me parece Negativo👎😢👎
