# Bibliotecas

In [60]:
import itertools
import nltk
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords
from nltk.corpus import mac_morpho
from nltk.tag import UnigramTagger
from nltk import pos_tag
from nltk.stem import RSLPStemmer

nltk.download('punkt')
nltk.download('punkt_tab')
nltk.download('rslp')
nltk.download('stopwords')
nltk.download('mac_morpho')

stemmer = RSLPStemmer()

[nltk_data] Downloading package punkt to C:\Users\Diego
[nltk_data]     Henrique\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package punkt_tab to C:\Users\Diego
[nltk_data]     Henrique\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt_tab is already up-to-date!
[nltk_data] Downloading package rslp to C:\Users\Diego
[nltk_data]     Henrique\AppData\Roaming\nltk_data...
[nltk_data]   Package rslp is already up-to-date!
[nltk_data] Downloading package stopwords to C:\Users\Diego
[nltk_data]     Henrique\AppData\Roaming\nltk_data...
[nltk_data]   Package stopwords is already up-to-date!
[nltk_data] Downloading package mac_morpho to C:\Users\Diego
[nltk_data]     Henrique\AppData\Roaming\nltk_data...
[nltk_data]   Package mac_morpho is already up-to-date!


# Arvore - Estrutura

In [61]:
class Node:
  def __init__(self, value):
    self.value = value
    self.children = []

In [62]:
class Tree:
  def __init__(self, value):
    self.root = Node(value)

  def add_child(self, parent_value, value, stem=False):
    if stem:
      value = stemmer.stem(value)

    parent_node = self.search(parent_value)
    if parent_node:
      parent_node.children.append(Node(value))
    else:
      print(f"Parent node with value {parent_value} not found.")

  def search(self, value, node=None):
    if node is None:
      node = self.root

    if node.value == value or node.value == stemmer.stem(value):
      return node

    for child in node.children:
      result = self.search(value, child)
      if result:
        return result
    return None

  def print(self, node=None, level=0):
    if node is None:
      node = self.root

    print("  " * level + str(node.value))
    for child in node.children:
      self.print(child, level+1)

  def find_answer(self, entity, intent):
    entity_stem = stemmer.stem(entity)
    intent_stem = stemmer.stem(intent)

    entity_node = self.search(entity_stem)
    if entity_node:
      for child in entity_node.children:
        if child.value == intent_stem:
          return child.children[0].value
    return None

  def search_in_level(self, value, level, current_level=0, node=None):
    if node is None:
        node = self.root

    # Se o nível atual for o nível desejado, faz a busca neste nível
    if current_level == level:
        if node.value == value or node.value == stemmer.stem(value):
            return node
        return None

    # Se não está no nível correto, percorre os filhos
    for child in node.children:
        result = self.search_in_level(value, level, current_level + 1, child)
        if result:
            return result

    return None

# Arvore - Dados do Chatbot

In [63]:
tree = Tree("personagens")

# Nós principais
tree.add_child("personagens", "Batman", True)
tree.add_child("personagens", "Flash", True)
tree.add_child("personagens", "Cassandra", True)
tree.add_child("personagens", "Deadpool", True)
tree.add_child("personagens", "Wolverine", True)

# Batman
tree.add_child("Batman", "nome", True)
tree.add_child("nome", "O nome verdadeiro do Batman é Bruce Wayne, um bilionário, filantropo e gênio.")

tree.add_child("Batman", "idade", True)
tree.add_child("idade", "Bruce Wayne tem aproximadamente 35 anos de idade nos quadrinhos, embora isso varie dependendo da adaptação.")

tree.add_child("Batman", "historia", True)
tree.add_child("historia", "Bruce Wayne perdeu seus pais, Thomas e Martha Wayne, aos 8 anos de idade em um assalto, evento que o motivou a se tornar o vigilante conhecido como Batman.")

#Flash
tree.add_child("Flash", "poderes", True)
tree.add_child("poderes", "O Flash possui o poder da supervelocidade, permitindo-lhe correr mais rápido que a luz, viajar no tempo e acessar a Força de Aceleração.")

tree.add_child("Flash", "inimigos", True)
tree.add_child("inimigos", "Os principais inimigos do Flash incluem Flash Reverso, Capitão Frio, Gorila Grodd e Mestre dos Espelhos.")

tree.add_child("Flash", "fraqueza", True)
tree.add_child("fraqueza", "A fraqueza do Flash está na sua dependência da Força de Aceleração. Se desconectado dela, ele perde seus poderes.")


# Cassandra
tree.add_child("Cassandra", "habilidades", True)
tree.add_child("habilidades", "Cassandra possui habilidades telepáticas avançadas, incluindo a capacidade de ler mentes, projetar pensamentos e influenciar as ações de outras pessoas.")
tree.add_child("Cassandra", "origem", True)
tree.add_child("origem", "A origem de Cassandra é envolta em mistério. Ela é frequentemente associada à família de mutantes liderada pelo Professor Xavier, mas detalhes sobre seu passado são escassos e pouco explorados.")
tree.add_child("Cassandra", "irmão", True)
tree.add_child("irmão", "O irmão de Cassandra é o Professor Charles Xavier, líder dos X-Men, com quem ela compartilha uma conexão telepática e um histórico conflituoso.")

# Deadpool
tree.add_child("Deadpool", "doença", True)
tree.add_child("doença", "A doença de Deadpool é um câncer terminal que foi tratado com um experimento, resultando em sua imortalidade e regeneração acelerada.")
tree.add_child("Deadpool", "capacidade", True)
tree.add_child("capacidade", "Deadpool possui uma capacidade de regeneração extremamente avançada, que o torna praticamente imortal e capaz de sobreviver a ferimentos fatais.")
tree.add_child("Deadpool", "amigos", True)
tree.add_child("amigos", "Deadpool tem Wolverine como um de seus principais aliados em algumas histórias, além de amizades ocasionais com Cable e Domino.")

# Wolverine
tree.add_child("Wolverine", "armas", True)
tree.add_child("armas", "O Wolverine utiliza suas garras revestidas de adamantium como arma principal, além de sua força sobre-humana e instintos aguçados.")
tree.add_child("Wolverine", "familia", True)
tree.add_child("familia", "O Wolverine teve uma infância conturbada, marcada por perdas e tragédias, incluindo a morte de seus pais biológicos e adotivos. Essas experiências moldaram sua personalidade solitária.")
tree.add_child("Wolverine", "anos", True)
tree.add_child("anos", "O Wolverine possui mais de 100 anos de vida, graças ao seu fator de cura que retarda significativamente seu envelhecimento.")

tree.print()

personagens
  batman
    nom
      O nome verdadeiro do Batman é Bruce Wayne, um bilionário, filantropo e gênio.
    idad
      Bruce Wayne tem aproximadamente 35 anos de idade nos quadrinhos, embora isso varie dependendo da adaptação.
    hist
      Bruce Wayne perdeu seus pais, Thomas e Martha Wayne, aos 8 anos de idade em um assalto, evento que o motivou a se tornar o vigilante conhecido como Batman.
  flash
    pod
      O Flash possui o poder da supervelocidade, permitindo-lhe correr mais rápido que a luz, viajar no tempo e acessar a Força de Aceleração.
    inimig
      Os principais inimigos do Flash incluem Flash Reverso, Capitão Frio, Gorila Grodd e Mestre dos Espelhos.
    fraqu
      A fraqueza do Flash está na sua dependência da Força de Aceleração. Se desconectado dela, ele perde seus poderes.
  cassandr
    habil
      Cassandra possui habilidades telepáticas avançadas, incluindo a capacidade de ler mentes, projetar pensamentos e influenciar as ações de outras pessoas.
  

# Dados para a consulta

In [64]:
import pandas as pd

df = pd.DataFrame({
    'Personagem': ['Batman', 'Flash', 'Cassandra', 'Deadpool', 'Wolverine'],
    'Poder': ['Sem poderes', 'Velocidade', 'Telepatia', 'Regeneração', 'Regeneração/Garras']
})

df


Unnamed: 0,Personagem,Poder
0,Batman,Sem poderes
1,Flash,Velocidade
2,Cassandra,Telepatia
3,Deadpool,Regeneração
4,Wolverine,Regeneração/Garras


# Chatbot

In [65]:
train_sents = mac_morpho.tagged_sents()
tagger = UnigramTagger(train_sents)

In [66]:
def extract_entities_and_intentions(question):
  stop_words = set(stopwords.words("portuguese"))
  tokens = word_tokenize(question.lower())
  tokens_clean = [ word for word in tokens if word not in stop_words and word.isalpha() ]

  tagged_tokens = tagger.tag(tokens_clean)

  entities = []
  intention = []

  for token, tag in tagged_tokens:
    if tree.search_in_level(stemmer.stem(token), 1):
      entities.append(stemmer.stem(token))
    elif tree.search_in_level(stemmer.stem(token), 2):
      intention.append(stemmer.stem(token))

  return entities, intention

In [67]:
def find_answer_in_tree(question):
  entities, intentions = extract_entities_and_intentions(question)
  print(f"Entities: {entities}, Intentions: {intentions}")

  entities_intentions = [[x, y] for x, y in itertools.product(entities, intentions)]
  for entity, intention in entities_intentions:
    answer = tree.find_answer(entity, intention)
    if answer:
      return answer
  return "Desculpe, não consegui entender sua pergunta."


In [68]:
def consult(df):
  quant = len(df)

  return f"Existem {quant} personagens"

In [69]:
def chatbot(question):
  print(f"Person: {question}")
  answer = find_answer_in_tree(question)

  if answer.startswith("f:"):
    print(f"Chat: {consult(df)}")
  else:
    print(f"Chat: {answer}")

In [72]:
questions = ["Quem é o irmão da Cassandra?"]
for question in questions:
  chatbot(question)

Person: Quem é o irmão da Cassandra?
Entities: ['cassandr'], Intentions: ['irm']
Chat: O irmão de Cassandra é o Professor Charles Xavier, líder dos X-Men, com quem ela compartilha uma conexão telepática e um histórico conflituoso.
