In [6]:
"""
Vamos abordar um exemplo bem simples de aprendizado de máquina
usando Python. Utilizaremos é a Árvore de Decisão. Ele é usado tanto para
tarefas de classificação quanto de regressão e é muito intuitivo
de entender. Vou demonstrar como usar uma Árvore de Decisão para
classificar frutas como "Maça" ou "Laranja" com base em seu peso
e textura.
"""

# Código com Árvore de Decisão

# Importar bibliotecas necessárias
from sklearn.tree import DecisionTreeClassifier
import numpy as np


# Preparar os dados
# Temos algumas frutas medidas em termos de peso e textura
# Peso e Textura (1 para suave e 0 para áspero)
dados_frutas = np.array([[140, 1], [130, 1], [150, 0], [170, 0]])

# Rótulos (0 para maça e 1 para laranja)
rotulos_frutas = np.array([0, 0, 1, 1])


# Treinar o modelo

# Criar um classificador de Árvore de Decisão
classificador_arvore = DecisionTreeClassifier()

# Treinar o classificador com os dados
classificador_arvore.fit(dados_frutas, rotulos_frutas)

# Fazer previsões
# Temos uma fruta nova com peso 145g e textura áspera (0)
fruta_nova = np.array([[145, 0]])

# Usar o modelo para prever a classe da nova fruta
previsao = classificador_arvore.predict(fruta_nova)

# Mapear as classes numéricas para descrições textuais
mapeamento_classes = {0: 'Maçã', 1: 'Laranja'}

# Obter a descrição textual da previsão
descricao_previsao = mapeamento_classes[previsao[0]]

print(f"A fruta com peso {fruta_nova[0][0]}g e textura {'suave' if fruta_nova[0][1] == 1 else 'áspera'} é provavelmente uma {descricao_previsao}.")


# Características da laranja para teste
# Suponhamos que a laranja tenha peso de 160g e textura áspera (0)
laranja_teste = np.array([[160, 0]])

# Usar o modelo para prever a classe da laranja de teste
previsao_laranja = classificador_arvore.predict(laranja_teste)

# Obter a descrição textual da previsão da laranja
descricao_previsao_laranja = mapeamento_classes[previsao_laranja[0]]

print(f"A fruta com peso {laranja_teste[0][0]}g e textura {'suave' if laranja_teste[0][1] == 1 else 'áspera'} é provavelmente uma {descricao_previsao_laranja}.")


A fruta com peso 145g e textura áspera é provavelmente uma Maçã.
A fruta com peso 160g e textura áspera é provavelmente uma Laranja.


In [21]:
pip install Scipy

Note: you may need to restart the kernel to use updated packages.


In [29]:

# 1. Importar bibliotecas necessárias

# Importar a classe CountVectorizer do módulo sklearn.feature_extraction.text
# Esta classe é usada para converter uma coleção de documentos de
# texto em uma matriz de contagens de tokens.
from sklearn.feature_extraction.text import CountVectorizer

# Importar a classe MultinomialNB do módulo sklearn.naive_bayes
# Esta classe é uma implementação do algoritmo Naive Bayes para 
# classificação multinomial.
from sklearn.naive_bayes import MultinomialNB

# Importar a função make_pipeline do módulo sklearn.pipeline
# Essa função é usada para criar um pipeline que pode executar várias 
# etapas consecutivas em um conjunto de dados.
from sklearn.pipeline import make_pipeline


# 2. Preparar os dados

# Criar uma lista de palavras chamada 'palavras'. 
# Esta lista contém as palavras que serão usadas para treinar o modelo de classificação.
palavras = ["maça", "banana", "uva", "cachorro", "gato", "carro"]

# Criar uma lista de rótulos chamada 'rotulos'. 
# Cada rótulo corresponde a uma palavra na lista 'palavras'. 
# Aqui, o número 1 representa "Fruta" e o número 0 representa "Não é uma fruta".
rotulos = [1, 1, 1, 0, 0, 0]  # 1 para Fruta, 0 para Não é uma fruta


# 3. Transformar palavras em vetores numéricos
# Isso será feito automaticamente pela pipeline


# 4. Treinar o modelo

# Criar um pipeline usando a função 'make_pipeline'.
# O pipeline realizará duas tarefas principais em sequência:
# 1. Transformar as palavras em vetores numéricos usando CountVectorizer.
# 2. Treinar um classificador Naive Bayes usando MultinomialNB.
modelo = make_pipeline(CountVectorizer(), MultinomialNB())

# Treinar o modelo utilizando o método 'fit'.
# O método 'fit' faz duas coisas aqui devido ao pipeline:
# 1. Ele primeiro transforma a lista de palavras em vetores numéricos.
# 2. Depois, treina o classificador Naive Bayes usando esses vetores 
# e os rótulos correspondentes.
modelo.fit(palavras, rotulos)


# 5. Fazer previsões

# Criar uma lista que contém uma nova palavra para a qual queremos fazer uma previsão.
# A lista é chamada 'nova_palavra' e contém a palavra "laranja".
nova_palavra = ["banana"]

# Usar o método 'predict' do modelo treinado para fazer uma previsão para a nova palavra.
# O método 'predict' retorna uma lista de previsões, uma para cada exemplo fornecido.
# Aqui, como temos apenas uma palavra, a lista terá um único elemento.
previsao = modelo.predict(nova_palavra)

# Imprimir a previsão.
# Usamos uma expressão condicional para imprimir "Fruta" se a previsão for 1, e "Não é uma fruta" se for 0.
print("Previsão:", "Fruta" if previsao[0] == 1 else "Não é uma fruta")

Previsão: Fruta


In [5]:
"""
Criar um Classificador de Frutas utilizando Tkinter e Naive Bayes

Objetivo

Neste exercício, você irá criar um aplicativo de desktop simples usando Tkinter que 
será capaz de classificar palavras como "Fruta" ou "Não é uma fruta". Você também 
usará o algoritmo Naive Bayes para treinar um modelo de classificação de texto.

Requisitos

    Interface Gráfica: Use Tkinter para criar a interface do usuário que deve incluir:
    
        - Um campo de entrada para inserir a palavra a ser classificada.
        - Dois botões de opção para especificar se a palavra inserida é uma fruta ou não.
        - Um botão para adicionar a palavra ao conjunto de treinamento.
        - Um botão para verificar se a palavra inserida é uma fruta ou não.
        - Uma etiqueta para mostrar o resultado da classificação ou outras mensagens ao usuário.

    Modelo de Machine Learning: Use a biblioteca scikit-learn para criar um modelo 
    Naive Bayes que seja treinado com as palavras inseridas pelo usuário.

    Persistência de Dados: Salve as palavras e seus rótulos correspondentes em um 
    arquivo de texto para que possam ser carregados cada vez que o programa é iniciado.

    Verificação de Palavra: Se a palavra inserida não estiver no conjunto de treinamento, 
    informe ao usuário que a palavra não pode ser classificada e precisa ser adicionada ao 
    conjunto de treinamento primeiro.

    Estilização Opcional: Melhore a aparência da sua aplicação usando diferentes fontes, cores
    ou widgets Tkinter adicionais.

Diretrizes

    Utilize o algoritmo Naive Bayes para classificação.
    
    Trate erros e exceções, como por exemplo, quando o arquivo de texto que armazena 
    as palavras não existir ou estiver corrompido.
    
    Siga as melhores práticas de codificação e estruture seu código de forma limpa e eficiente.


"""

# Importando as bibliotecas necessárias

# Importar a biblioteca tkinter como tk.
# tkinter é uma biblioteca padrão do Python para criar interfaces gráficas do usuário (GUI).
import tkinter as tk

# Importar ttk do tkinter.
# ttk (themed tkinter) é um conjunto de widgets estendidos que são estilizados
# para se parecer melhor com o sistema operacional.
from tkinter import ttk

# Importar CountVectorizer da biblioteca sklearn.feature_extraction.text.
# CountVectorizer é uma técnica de processamento de linguagem natural para converter texto em vetores numéricos.
from sklearn.feature_extraction.text import CountVectorizer

# Importar MultinomialNB da biblioteca sklearn.naive_bayes.
# MultinomialNB é uma implementação do algoritmo Naive Bayes para classificação de texto.
from sklearn.naive_bayes import MultinomialNB

# Importar make_pipeline da biblioteca sklearn.pipeline.
# make_pipeline é uma função que ajuda a criar um pipeline de aprendizado de máquina, 
# permitindo que você encadeie múltiplas etapas de processamento e modelagem juntas.
from sklearn.pipeline import make_pipeline

# Importar a biblioteca os.
# A biblioteca os fornece uma maneira de interagir com o sistema operacional, 
# como verificar a existência de arquivos ou criar diretórios.
import os


# Função para carregar palavras e rótulos do arquivo
def carregar_dados():
    
    # Inicializar listas vazias para armazenar as palavras e os rótulos.
    palavras = []
    rotulos = []
    
    # Verificar se o arquivo de dados existe no caminho especificado usando os.path.exists.
    if os.path.exists('C:\\Users\\clevison\\Desktop\\Curso de Python\\Aprendizado de Maquina\\palavras.txt'):
        
        # Abrir o arquivo em modo de leitura ('r').
        with open('C:\\Users\\clevison\\Desktop\\Curso de Python\\Aprendizado de Maquina\\palavras.txt', 'r') as f:
            
            # Ler cada linha do arquivo.
            for linha in f:
                
                try:
                    
                    # Remover espaços em branco e quebras de linha da linha com strip(),
                    # e então dividir a linha em palavra e rótulo usando split(',').
                    palavra, rotulo = linha.strip().split(',')
                    
                    # Adicionar a palavra e o rótulo às listas correspondentes.
                    palavras.append(palavra)
                    rotulos.append(int(rotulo))  # Converter o rótulo para um inteiro.
                    
                except ValueError:
                    
                    # Caso a linha não possa ser dividida em uma palavra e um rótulo,
                    # capturar a exceção e imprimir uma mensagem de erro.
                    print(f"Erro ao processar a linha: {linha.strip()}")
    
    # Retornar as listas de palavras e rótulos.
    return palavras, rotulos


# Função para salvar palavras e rótulos no arquivo
def salvar_dados(palavras, rotulos):
    
    # Abrir o arquivo especificado em modo de escrita ('w').
    # O modo 'w' sobrescreverá o arquivo se ele já existir ou criará um novo arquivo se ele não existir.
    with open('C:\\Users\\clevison\\Desktop\\Curso de Python\\Aprendizado de Maquina\\palavras.txt', 'w') as f:
        
        # Iterar sobre as listas de palavras e rótulos simultaneamente usando a função zip.
        # A função zip agrupa o i-ésimo elemento de cada uma das listas de entrada, 
        # permitindo que os elementos correspondentes sejam processados juntos.
        for palavra, rotulo in zip(palavras, rotulos):
            
            # Escrever a palavra e o rótulo na mesma linha do arquivo, separados por uma vírgula.
            # O método write é usado para escrever uma string no arquivo.
            # A palavra e o rótulo são formatados como uma string, com a palavra e o 
            # rótulo separados por uma vírgula e seguidos por uma quebra de linha ('\n').
            f.write(f"{palavra},{rotulo}\n")
         
    

# Função para treinar o modelo de classificação Naive Bayes
def treinar_modelo(palavras, rotulos):
    
    # Criar um pipeline de aprendizado de máquina usando a função make_pipeline.
    # O pipeline contém duas etapas: 
    # 1. CountVectorizer para transformar as palavras em vetores numéricos.
    # 2. MultinomialNB para aplicar o algoritmo de classificação Naive Bayes.
    modelo = make_pipeline(CountVectorizer(), MultinomialNB())
    
    # Treinar o modelo usando o método fit.
    # O método fit toma dois argumentos:
    # 1. palavras: a lista de palavras que serve como entrada (features).
    # 2. rotulos: a lista de rótulos que serve como saída (labels).
    # O método ajusta o modelo aos dados fornecidos.
    modelo.fit(palavras, rotulos)
    
    # Retornar o modelo treinado para ser usado para previsões futuras.
    return modelo


# Inicializar palavras e rótulos chamando a função carregar_dados.
# carregar_dados é uma função definida anteriormente que lê um arquivo e retorna duas listas:
# 1. palavras: uma lista de palavras extraídas do arquivo.
# 2. rotulos: uma lista de rótulos correspondentes extraídos do arquivo.
palavras, rotulos = carregar_dados()


# Verificar se as listas de palavras e rótulos não estão vazias
# A expressão "if palavras and rotulos:" verifica se ambas as listas são não vazias.
# Se ambas as listas contiverem pelo menos um elemento, a expressão será avaliada como True.
if palavras and rotulos:
    
    # Treinar o modelo inicial chamando a função treinar_modelo.
    # A função treinar_modelo foi definida anteriormente e toma duas listas como argumentos:
    # 1. palavras: a lista de palavras que servirá como entrada (features).
    # 2. rotulos: a lista de rótulos que servirá como saída (labels).
    # A função retorna um modelo treinado que é armazenado na variável 'modelo'.
    modelo = treinar_modelo(palavras, rotulos)
    
else:
    
    # Se qualquer uma das listas (palavras ou rótulos) estiver vazia, imprimir uma mensagem de erro.
    # Isso serve como um aviso de que o modelo de aprendizado de máquina não pode ser treinado sem dados.
    print("O conjunto de treinamento está vazio. Adicione algumas palavras e rótulos primeiro.")


    
# Função para adicionar uma nova palavra e seu rótulo correspondente ao modelo
def adicionar_palavra():
    
    # Declarar 'modelo', 'palavras' e 'rotulos' como variáveis globais
    # para que possamos modificá-las dentro desta função
    global modelo  
    global palavras, rotulos  
    
    # Obter a nova palavra e o novo rótulo dos widgets de entrada do Tkinter
    nova_palavra = entrada_palavra.get()  # Obter o texto da caixa de entrada chamada 'entrada_palavra'
    novo_rotulo = var_rotulo.get()  # Obter o valor do widget de botão de opção, que está armazenado na variável 'var_rotulo'
    
    # Verificar se uma nova palavra foi inserida e se o novo rótulo é 0 ou 1
    if nova_palavra and (novo_rotulo == 0 or novo_rotulo == 1):
        
        # Verificar se a nova palavra já existe na lista de palavras
        if nova_palavra not in palavras:
            
            # Adicionar a nova palavra (convertida para minúsculas) e o novo rótulo às listas correspondentes
            palavras.append(nova_palavra.lower())
            rotulos.append(novo_rotulo)
            
            # Salvar as listas atualizadas em um arquivo usando a função 'salvar_dados'
            salvar_dados(palavras, rotulos)
            
            # Retreinar o modelo com os novos dados
            modelo = treinar_modelo(palavras, rotulos)
            
            # Atualizar a etiqueta de resultado para informar que a nova palavra foi adicionada e o modelo foi atualizado
            lbl_resultado['text'] = f"A palavra '{nova_palavra}' foi adicionada e o modelo foi atualizado."
        
        else:
            
            # Se a nova palavra já existir na lista de palavras, atualizar a etiqueta de resultado para indicar isso
            lbl_resultado['text'] = f"A palavra '{nova_palavra}' já está no conjunto de treinamento."
   
        
    
# Função para verificar e classificar uma palavra usando o modelo treinado
def verificar_palavra():
    
    # Declarar 'modelo', 'palavras' e 'rotulos' como variáveis globais
    # para que possamos acessá-las e modificá-las dentro desta função
    global modelo  
    global palavras, rotulos  
    
    # Recarregar os dados do arquivo e retreinar o modelo
    # Usamos a função carregar_dados para ler palavras e rótulos de um arquivo
    # e a função treinar_modelo para treinar o modelo com esses novos dados
    palavras, rotulos = carregar_dados()
    modelo = treinar_modelo(palavras, rotulos)
    
    # Obter a palavra de consulta da caixa de entrada do Tkinter e converter para minúsculas
    consulta_palavra = entrada_palavra.get().lower()
    
    # Verificar se a palavra de consulta está presente no conjunto de treinamento
    if consulta_palavra in palavras:
    
        # Se a palavra estiver presente, usar o modelo para prever seu rótulo
        previsao = modelo.predict([consulta_palavra])
        
        # Atualizar a etiqueta de resultado com a previsão feita pelo modelo
        lbl_resultado['text'] = f"Previsão para '{consulta_palavra}': {'é uma Fruta' if previsao[0] == 1 else 'Não é uma fruta'}"
    
    else:
        
        # Se a palavra de consulta não estiver no conjunto de treinamento, informar ao usuário
        lbl_resultado['text'] = f"Palavra '{consulta_palavra}' não encontrada."


# Importa o módulo tkinter e o renomeia como tk
import tkinter as tk

# Cria uma nova janela principal
janela = tk.Tk()

# Define a geometria da janela (largura x altura)
janela.geometry("900x300")

# Define o título da janela
janela.title("Classificador de frutas")

# Define uma fonte para o título da aplicação
fonte_titulo = ("Arial", 24)

# Define uma fonte para o texto na aplicação
fonte_texto = ("Arial", 16)

# Define uma cor de fundo para a janela (Hexadecimal: #f2f2f2, Nome: Silver)
cor_fundo = "#f2f2f2"  # Cor de fundo: Silver

# Define uma cor para os botões (Hexadecimal: #4CAF50, Nome: Green)
cor_botao = "#4CAF50"  # Cor do botão: Green

# Define uma cor para o texto nos botões (Hexadecimal: #ffffff, Nome: White)
cor_texto_botao = "#ffffff"  # Cor do texto do botão: White

# Configura a cor de fundo da janela
janela.configure(bg=cor_fundo)


# Adicionar widgets (elementos de interface do usuário) à janela

# Adicionar um rótulo para instruções
lbl_instrucao = tk.Label(janela, 
                         text="Insira uma palavra:", 
                         font=fonte_titulo, bg=cor_fundo)

 # Posicionar o rótulo na primeira linha e primeira coluna
lbl_instrucao.grid(row=0, column=0, padx=20, pady=20)


# Adicionar uma caixa de entrada para a palavra
entrada_palavra = tk.Entry(janela, 
                           font=fonte_texto)

# Posicionar a caixa de entrada ao lado do rótulo de instrução
entrada_palavra.grid(row=0, column=1, padx=20, pady=20)


# Adicionar botões de opção para escolher o rótulo da palavra (fruta ou não fruta)


var_rotulo = tk.IntVar()  # Variável para armazenar a escolha do usuário
var_rotulo.set(0)  # Definir o valor inicial como 0 (não é uma fruta)

# Criar e posicionar o primeiro botão de opção (Radiobutton)
r1 = tk.Radiobutton(janela, 
                    text="Não é uma fruta",  # Texto exibido ao lado do Radiobutton
                    variable=var_rotulo,      # Variável para armazenar o valor deste Radiobutton
                    value=0,                  # Valor atribuído à 'var_rotulo' quando este Radiobutton é selecionado
                    font=fonte_texto,         # Fonte e tamanho do texto
                    bg=cor_fundo)             # Cor de fundo do Radiobutton

# Posiciona o Radiobutton de opção na linha 1, coluna 0 
# com padding de 20 à direita/esquerda e 10 acima/abaixo
r1.grid(row=1, column=0, padx=20, pady=10)


# Criar e posicionar o primeiro botão de opção (Radiobutton)
r2 = tk.Radiobutton(janela, 
                    text="É uma fruta",  # Texto exibido ao lado do Radiobutton
                    variable=var_rotulo,      # Variável para armazenar o valor deste Radiobutton
                    value=1,                  # Valor atribuído à 'var_rotulo' quando este Radiobutton é selecionado
                    font=fonte_texto,         # Fonte e tamanho do texto
                    bg=cor_fundo)             # Cor de fundo do Radiobutton

# Posiciona o Radiobutton de opção na linha 1, coluna 0 
# com padding de 20 à direita/esquerda e 10 acima/abaixo
r2.grid(row=1, column=1, padx=20, pady=10)


# Criar e posicionar o botão para adicionar uma palavra
btn_adicionar = tk.Button(janela, 
                          text="Adicionar Palavra",  # Texto exibido no botão
                          command=adicionar_palavra, # Função a ser executada quando o botão é pressionado
                          bg=cor_botao,              # Cor de fundo do botão
                          fg=cor_texto_botao,        # Cor do texto do botão
                          font=fonte_texto)          # Fonte e tamanho do texto
# Posiciona o botão na linha 2, coluna 0
btn_adicionar.grid(row=2, column=0, padx=20, pady=20)


# Criar e posicionar o botão para verificar a classificação de uma palavra
btn_verificar = tk.Button(janela, 
                          text="Verificar Palavra", 
                          command=verificar_palavra, 
                          bg=cor_botao, 
                          fg=cor_texto_botao, 
                          font=fonte_texto)
# Posiciona o botão na linha 2, coluna 1
btn_verificar.grid(row=2, column=1, padx=20, pady=20)


# Criar e posicionar um rótulo (Label) para exibir os resultados
lbl_resultado = tk.Label(janela, 
                         text="",       # Texto inicial vazio
                         font=("Arial", 20),     # Fonte e tamanho do texto
                         bg=cor_fundo)           # Cor de fundo do rótulo

# Posiciona o rótulo na linha 3, abrangendo 2 colunas (columnspan=2)
lbl_resultado.grid(row=3, columnspan=2, padx=20, pady=20)

# Inicia o loop principal do Tkinter para manter a janela aberta
janela.mainloop()


O conjunto de treinamento está vazio. Adicione algumas palavras e rótulos primeiro.


In [None]:
# Importa o módulo Tkinter para criar a interface gráfica
import tkinter as tk

# Importa a classe TfidfVectorizer para transformar texto em vetores numéricos
from sklearn.feature_extraction.text import TfidfVectorizer

# Importa a classe MultinomialNB para o modelo de classificação Naive Bayes multinomial
from sklearn.naive_bayes import MultinomialNB

# Importa a função make_pipeline para criar um pipeline de aprendizado de máquina
from sklearn.pipeline import make_pipeline

# Importa o módulo numpy como 'np' para manipulação de arrays
import numpy as np

# Define um conjunto de treinamento com perguntas frequentes
perguntas_treino = ["Qual é o seu nome?", "Como você está?", "O que você faz?", "Você gosta de programar?"]

# Define as respostas correspondentes para cada pergunta no conjunto de treinamento
respostas_treino = ["Meu nome é Celso.", "Estou funcionando bem, obrigado!", "Eu respondo a perguntas.", "Sim, eu adoro programar!"]



# Inicializa o transformador TF-IDF (Term Frequency-Inverse Document Frequency)
vectorizer = TfidfVectorizer()


# Cria um pipeline que primeiro aplica o transformador TF-IDF e, 
# em seguida, aplica o classificador Naive Bayes
modelo = make_pipeline(vectorizer, MultinomialNB())


# Treina o modelo usando as perguntas como entrada e os índices das respostas como saída
# np.arange(len(respostas_treino)) cria um array de índices [0, 1, 2, ...]
modelo.fit(perguntas_treino, np.arange(len(respostas_treino)))


# Função chamada 'responder_pergunta' destinada a encontrar e exibir a 
# resposta mais adequada para uma pergunta inserida.
def responder_pergunta():
    
    # Obter o conteúdo do widget 'entrada_pergunta' do Tkinter e armazená-lo 
    # na variável 'pergunta'.
    pergunta = entrada_pergunta.get()
    
    # Verificar se a variável 'pergunta' contém algum texto.
    if pergunta:
        
        # Utilizar o modelo treinado para prever a resposta mais adequada.
        # O resultado é o índice da resposta no array de respostas do treinamento.
        idx = modelo.predict([pergunta])[0]
        
        # Utilizar o método 'predict_proba' para obter as probabilidades associadas às previsões.
        # Em seguida, obter a máxima dessas probabilidades usando np.max().
        prob = np.max(modelo.predict_proba([pergunta]))
        
        # Definir um limiar de confiança (neste caso, 0.3).
        # Se a probabilidade máxima for maior que esse limiar, então a resposta é 
        # considerada válida.
        if prob > 0.3:
            
            # Definir o texto do widget 'lbl_resposta' para mostrar a resposta correspondente.
            lbl_resposta['text'] = f"Resposta: {respostas_treino[idx]}"
            
        else:
            # Se a probabilidade máxima for menor que o limiar, exibir uma mensagem 
            # indicando que a resposta não foi encontrada.
            lbl_resposta['text'] = "Resposta não encontrada."
    
    
# Criar uma nova janela Tkinter e armazená-la na variável 'janela'.
janela = tk.Tk()

# Definir as dimensões da janela para 600x300 pixels.
janela.geometry("600x300")

# Definir o título da janela como "Sistema de Resposta Automática".
janela.title("Sistema de Resposta Automática")

# Adicionar Widgets à Janela

# Adicionar um rótulo (Label) com o texto "Faça uma pergunta:".
lbl_instrucao = tk.Label(janela, 
                         text="Faça uma pergunta:",
                         font=("Arial 16"))

# Posicionar o rótulo na janela com um padding vertical de 10 pixels.
lbl_instrucao.pack(pady=10)

# Adicionar uma caixa de entrada (Entry) onde o usuário pode digitar uma pergunta.
# Definir a largura da caixa de entrada como 50 caracteres.
entrada_pergunta = tk.Entry(janela, 
                            width=50,
                            font=("Arial 16"))

# Posicionar a caixa de entrada na janela com um padding vertical de 5 pixels.
entrada_pergunta.pack(pady=5)

# Adicionar um botão (Button) com o texto "Responder".
# Associar o comando 'responder_pergunta' ao botão para que seja executado 
# quando o botão for clicado.
btn_responder = tk.Button(janela, 
                          text="Responder", 
                          command=responder_pergunta,
                          font=("Arial 16"))

# Posicionar o botão na janela com um padding vertical de 10 pixels.
btn_responder.pack(pady=10)

# Adicionar um rótulo (Label) onde a resposta será exibida.
# Inicialmente, o texto deste rótulo está vazio e a fonte é Arial tamanho 16.
lbl_resposta = tk.Label(janela, 
                        text="", 
                        font=("Arial", 16))

# Posicionar o rótulo na janela com um padding vertical de 10 pixels.
lbl_resposta.pack(pady=10)

# Iniciar o loop principal do Tkinter para manter a janela aberta.
janela.mainloop()

In [14]:
pip install autocorrect

Collecting autocorrectNote: you may need to restart the kernel to use updated packages.

  Downloading autocorrect-2.6.1.tar.gz (622 kB)
     ---------------------------------------- 0.0/622.8 kB ? eta -:--:--
     --- ----------------------------------- 61.4/622.8 kB 1.7 MB/s eta 0:00:01
     ------- ------------------------------ 122.9/622.8 kB 1.4 MB/s eta 0:00:01
     --------- ---------------------------- 163.8/622.8 kB 1.2 MB/s eta 0:00:01
     ----------- -------------------------- 194.6/622.8 kB 1.2 MB/s eta 0:00:01
     ----------- -------------------------- 194.6/622.8 kB 1.2 MB/s eta 0:00:01
     ----------- -------------------------- 194.6/622.8 kB 1.2 MB/s eta 0:00:01
     --------------- -------------------- 266.2/622.8 kB 862.0 kB/s eta 0:00:01
     ------------------ ----------------- 317.4/622.8 kB 855.7 kB/s eta 0:00:01
     --------------------- -------------- 378.9/622.8 kB 908.0 kB/s eta 0:00:01
     -------------------------- --------- 450.6/622.8 kB 972.0 kB/s et

In [15]:
pip install python-Levenshtein

Collecting python-Levenshtein
  Obtaining dependency information for python-Levenshtein from https://files.pythonhosted.org/packages/18/5f/7214d4e80d82b328109b4373f43e2187c2ba946f70fd13f3918ba83e2a0e/python_Levenshtein-0.22.0-py3-none-any.whl.metadata
  Downloading python_Levenshtein-0.22.0-py3-none-any.whl.metadata (3.8 kB)
Collecting Levenshtein==0.22.0 (from python-Levenshtein)
  Obtaining dependency information for Levenshtein==0.22.0 from https://files.pythonhosted.org/packages/be/e9/0845d00676f013d2d764fdaa946f13ecff06810bc3836d444b3f44e24a74/Levenshtein-0.22.0-cp311-cp311-win_amd64.whl.metadata
  Downloading Levenshtein-0.22.0-cp311-cp311-win_amd64.whl.metadata (3.5 kB)
Collecting rapidfuzz<4.0.0,>=2.3.0 (from Levenshtein==0.22.0->python-Levenshtein)
  Obtaining dependency information for rapidfuzz<4.0.0,>=2.3.0 from https://files.pythonhosted.org/packages/ba/74/f7656506c813e95ea8cc8698f1ab17e2ddf0db6a73d0ee0cbaf608388853/rapidfuzz-3.3.1-cp311-cp311-win_amd64.whl.metadata
  Down

In [3]:
# Importa o módulo Tkinter para criar a interface gráfica
import tkinter as tk

# Importa a classe TfidfVectorizer para transformar texto em vetores numéricos
from sklearn.feature_extraction.text import TfidfVectorizer

# Importa a classe MultinomialNB para o modelo de classificação Naive Bayes multinomial
from sklearn.naive_bayes import MultinomialNB

# Importa a função make_pipeline para criar um pipeline de aprendizado de máquina
from sklearn.pipeline import make_pipeline

# Importa o módulo numpy como 'np' para manipulação de arrays
import numpy as np

# Importar o módulo os para interagir com o sistema operacional.
# Pode ser usado para verificar a existência de arquivos, entre outras coisas.
import os

# Importar a função 'distance' da biblioteca Levenshtein.
# Esta função calcula a distância de Levenshtein entre duas strings, que é uma 
# medida da diferença entre elas.
from Levenshtein import distance as levenshtein_distance


# Definir uma função chamada carregar_dados para ler perguntas e respostas de um arquivo.
def carregar_dados():
    
    # Inicializar listas vazias para armazenar perguntas e respostas.
    perguntas = []
    respostas = []
    
    # Definir o caminho do arquivo que contém as perguntas e respostas.
    # Você deve ajustar esse caminho para o local onde o arquivo está 
    # realmente armazenado em seu sistema.
    caminho_arquivo = 'C:\\Users\\clevison\\Desktop\\Curso de Python\\Aprendizado de Maquina\\perguntas.txt'
    
    # Verificar se o arquivo existe.
    if os.path.exists(caminho_arquivo):
        
        # Abrir o arquivo para leitura.
        with open(caminho_arquivo, 'r') as f:
            
            # Ler cada linha do arquivo.
            for linha in f:
                try:
                    
                    # Tentar dividir a linha pelo delimitador '|' para separar 
                    # a pergunta e a resposta.
                    pergunta, resposta = linha.strip().split('|')
                    
                    # Adicionar a pergunta e a resposta às respectivas listas.
                    perguntas.append(pergunta)
                    respostas.append(resposta)
                    
                except ValueError:
                    
                    # Se ocorrer um erro ao dividir a linha, imprimir uma mensagem de erro.
                    print(f"Erro ao processar a linha: {linha.strip()}")
                    
    # Retornar as listas de perguntas e respostas.
    return perguntas, respostas


# Definir uma função chamada 'corrigir_texto' que toma um 
# texto e um vocabulário como argumentos.
def corrigir_texto(texto, vocabulario):
    
    # Inicializar uma lista vazia chamada 'palavras_corrigidas' para armazenar 
    # palavras corrigidas.
    palavras_corrigidas = []
    
    # Dividir o texto em palavras e iterar sobre cada palavra.
    for palavra in texto.split():
        
        # Inicializar 'min_dist' com infinito. Esta variável manterá a menor 
        # distância de Levenshtein encontrada.
        min_dist = float("inf")
        
        # Inicializar 'palavra_correta' com a palavra original. Esta variável
        # será atualizada se encontrarmos uma palavra mais próxima no vocabulário.
        palavra_correta = palavra
        
        # Iterar sobre cada palavra no vocabulário para encontrar a palavra 
        # mais próxima da palavra original.
        for vocab in vocabulario:
            
            # Calcular a distância de Levenshtein entre a palavra original 
            # e a palavra do vocabulário.
            dist = levenshtein_distance(palavra, vocab)
            
            # Se a distância calculada for menor que 'min_dist', atualizamos
            # 'min_dist' e 'palavra_correta'.
            if dist < min_dist:
                min_dist = dist
                palavra_correta = vocab
                
        # Adicionar a palavra correta à lista 'palavras_corrigidas'.
        palavras_corrigidas.append(palavra_correta)
        
    # Juntar todas as palavras corrigidas em uma string e retorná-la.
    return " ".join(palavras_corrigidas)


# Inicializar as listas 'perguntas_treino' e 'respostas_treino' 
# chamando a função 'carregar_dados'.
perguntas_treino, respostas_treino = carregar_dados()

# Criar um conjunto chamado 'vocabulario' que contém todas as palavras 
# únicas presentes nas perguntas de treino.
# Isso é feito juntando todas as perguntas em uma única string e, em seguida, 
# dividindo-a em palavras e convertendo em um conjunto para remover duplicatas.
vocabulario = set(" ".join(perguntas_treino).split())


# Verificar se as listas 'perguntas_treino' e 'respostas_treino' não estão vazias.
if perguntas_treino and respostas_treino:
    
    # Instanciar o objeto 'TfidfVectorizer', que será responsável por converter o
    # texto em uma matriz TF-IDF.
    vectorizer = TfidfVectorizer()
    
    # Criar um pipeline que primeiro aplica a vetorização TF-IDF e, em seguida, 
    # treina um modelo Naive Bayes Multinomial.
    modelo = make_pipeline(vectorizer, MultinomialNB())
    
    # Treinar o modelo usando as perguntas como entradas e um array de índices como saídas.
    # O array de índices é criado usando 'np.arange' e tem o mesmo tamanho que 'respostas_treino'.
    modelo.fit(perguntas_treino, np.arange(len(respostas_treino)))
    
    
# Função para encontrar a resposta mais adequada a uma pergunta feita.
def responder_pergunta():
    
    # Verificar se as listas de treinamento de perguntas e respostas estão
    # vazias. Se estiverem, exibe uma mensagem e retorna.
    if not perguntas_treino or not respostas_treino:
        
        # Limpar qualquer texto anterior na caixa de resposta da interface gráfica.
        caixa_resposta.delete(1.0, tk.END)
        
        # Inserir a resposta prevista na caixa de resposta da interface gráfica.
        caixa_resposta.insert(tk.END, "O conjunto de treinamento está vazio")
        
    
    # Obter a pergunta da caixa de entrada da interface gráfica.
    pergunta = entrada_pergunta.get()
    
    # Corrigir possíveis erros na pergunta usando a função 'corrigir_texto' e
    # o vocabulário criado anteriormente.
    pergunta_corrigida = corrigir_texto(pergunta, vocabulario)
    
    # Imprimir a pergunta corrigida no console para fins de depuração.
    print(pergunta_corrigida)
    
    # Verificar se a pergunta corrigida não está vazia.
    if pergunta_corrigida:
        
        # Usar o modelo treinado para prever o índice da resposta mais
        # adequada para a pergunta.
        idx = modelo.predict([pergunta_corrigida])[0]
        
        # Obter a probabilidade máxima associada à classe prevista.
        prob = np.max(modelo.predict_proba([pergunta_corrigida]))
        
        # Imprimir a probabilidade no console para fins de depuração.
        print(f"Probabilidade: {prob}")
        
        # Limpar qualquer texto anterior na caixa de resposta da interface gráfica.
        caixa_resposta.delete(1.0, tk.END)
        
        # Inserir a resposta prevista na caixa de resposta da interface gráfica.
        caixa_resposta.insert(tk.END, f"Resposta: {respostas_treino[idx]}")
    

# Criar a janela Tkinter principal
janela = tk.Tk()

# Definir as dimensões da janela para 600x300 pixels
janela.geometry("700x350")

# Definir o título da janela como "Sistema de Resposta Automática"
janela.title("Sistema de Resposta Automática")

# Adicionar um rótulo com o texto "Faça uma pergunta:" para instruir o usuário
lbl_instrucao = tk.Label(janela, 
                         text="Faça uma pergunta:",
                        font=("Arial 16"))

# Posicionar o rótulo na janela com um padding vertical de 10 pixels
lbl_instrucao.pack(pady=10)

# Adicionar uma caixa de entrada para o usuário digitar sua pergunta
entrada_pergunta = tk.Entry(janela, 
                            width=50,
                            font=("Arial 16"))

# Posicionar a caixa de entrada na janela com um padding vertical de 5 pixels
entrada_pergunta.pack(pady=5)



# Adicionar um botão com o texto "Responder" que, quando clicado, chama a função responder_pergunta
btn_responder = tk.Button(janela, 
                          text="Responder", 
                          command=responder_pergunta,
                          font=("Arial 16"))

# Posicionar o botão na janela com um padding vertical de 10 pixels
btn_responder.pack(pady=10)

# Adicionar uma caixa de texto onde a resposta será exibida
caixa_resposta = tk.Text(janela, 
                         wrap=tk.WORD,  # Configurar a quebra de linha para ocorrer em palavras completas
                         width=50,      # Definir a largura da caixa de texto para 50 caracteres
                         height=10,     # Definir a altura da caixa de texto para 10 linhas
                        font=("Arial 16"))

# Posicionar a caixa de texto na janela com um padding vertical de 10 pixels
caixa_resposta.pack(pady=10)

# Iniciar o loop de eventos Tkinter para manter a janela aberta e responsiva
janela.mainloop()

O que é if?
Probabilidade: 0.058372862620030413
O que é variável
Probabilidade: 0.04844279559986385
O que é for
Probabilidade: 0.045836739746276264
O que é um conjunto em Python?
Probabilidade: 0.06312123186022353


In [3]:
# Importar o módulo Tkinter para a criação da interface gráfica
import tkinter as tk

# Importar a função de distância de Levenshtein da biblioteca Levenshtein
# Esta função será usada para calcular a distância entre duas strings, o 
# que é útil para a correção de texto
from Levenshtein import distance as levenshtein_distance

# Importar o módulo de expressões regulares (re)
# Este módulo permite operações avançadas de manipulação de strings usando 
# expressões regulares
import re

# Dicionário de respostas predefinidas
respostas = {
    'bom dia': 'Bom dia! Como posso ajudá-lo?',
    'boa tarde': 'Boa tarde! Como posso ajudá-lo?',
    'boa noite': 'Boa noite! Como posso ajudá-lo?',
    'olá': 'Olá! Como posso ajudá-lo?',
    'oi': 'Oi! Como posso ajudá-lo?',
    'como você está': 'Estou funcionando conforme programado. E você?',
    'qual seu nome': 'Eu sou um chatbot e não tenho um nome.',
    'o que você faz': 'Eu estou aqui para responder suas perguntas e ajudá-lo.',
    'você é um robô': 'Sim, eu sou um programa de computador projetado para conversar com você.',
    'adeus': 'Até logo! Se precisar, estarei aqui.',
    'tchau': 'Tchau! Foi bom conversar com você.',
    'quem te criou': 'Fui criado por um programador.',
    'você gosta de música': 'Não tenho preferências, sou apenas um programa.',
    'você pode me ajudar': 'Claro, em que posso ajudá-lo?',
    'como funciona': 'Você faz perguntas e eu tento responder da melhor forma possível.',
    'você é inteligente': 'Eu tento ser o mais útil possível.',
    'você tem sentimentos': 'Não, eu sou apenas um conjunto de algoritmos.',
    'qual a sua idade': 'A idade não se aplica a mim.',
    'você está vivo': 'Não, eu sou apenas um programa de computador.',
    'como está o tempo': 'Não posso acessar a internet, então não sei como está o tempo.',
    'você gosta de café': 'Não tenho preferências ou gostos.',
    'qual é o seu filme favorito': 'Não assisto filmes, sou apenas um programa.',
    'você pode aprender': 'Eu não tenho a capacidade de aprender, sou programado para responder com base em um conjunto predefinido de respostas.',
    'você é feliz': 'Não tenho emoções.',
    'você é casado': 'Não, eu sou apenas um programa de computador.',
    'você tem filhos': 'Não, eu não tenho a capacidade de ter filhos.',
    'você tem amigos': 'Não, eu sou apenas um programa isolado.',
    'onde você mora': 'Eu existo em um servidor.',
    'você pode me contar uma piada': 'Por que os programadores preferem o escuro? Porque a luz atrai bugs.',
    'você é humano': 'Não, eu sou uma máquina.',
    'qual é o seu esporte favorito': 'Não tenho um esporte favorito, sou apenas um programa.',
    'você gosta de viajar': 'Não posso viajar, estou confinado a um servidor.',
    'você pode dirigir': 'Não, eu não tenho essa capacidade.',
    'você come': 'Não, eu não preciso de comida.',
    'você dorme': 'Não, eu estou sempre ativo.',
    'você pode cantar': 'Não, eu não tenho essa funcionalidade.',
    'você tem um animal de estimação': 'Não, eu não posso cuidar de animais de estimação.',
    'você gosta de ler': 'Não posso ler no sentido humano, mas posso processar texto.',
    'você pode dançar': 'Não, eu não tenho forma física para dançar.',
    'qual é o seu trabalho': 'Estou programado para conversar e fornecer respostas com base no meu conjunto de dados.',
    'você gosta de música': 'Não tenho a capacidade de gostar ou desgostar de música.',
    'você pode ver': 'Não, eu não tenho sensores visuais.',
    'qual é o seu nome': 'Eu sou um chatbot sem um nome específico.',
    'você gosta de matemática': 'Eu sou programado para processar números, mas não tenho preferências.',
    'você pode ler minha mente': 'Não, eu não tenho essa capacidade.',
    'você é inteligente': 'Minha inteligência é limitada ao que fui programado para fazer.',
    'você pode me ajudar com a lição de casa': 'Depende da pergunta, posso tentar ajudar.',
    'você pode fazer café': 'Não, eu não tenho capacidades físicas.',
    'você pode abrir a porta': 'Não, eu não posso interagir fisicamente com o ambiente.',
    'você tem um celular': 'Não, eu não tenho dispositivos físicos.',
    'como você foi criado': 'Fui criado usando algoritmos de programação.',
    'você pode ficar doente': 'Não, eu não tenho uma forma biológica.',
    'você pode ir à escola': 'Não, mas posso fornecer informações que são ensinadas nas escolas.',
    'qual é o seu hobby': 'Eu não tenho hobbies, estou aqui para responder perguntas.',
    'você tem um carro': 'Não, eu não tenho bens físicos.',
    'você pode voar': 'Não, eu não tenho capacidades físicas.',
    'você pode nadar': 'Não, eu não interajo com o ambiente físico.',
    'você pode correr': 'Não, eu não tenho forma física.',
    'você pode pular': 'Não, eu não tenho a capacidade de movimento.'

}

# Função para encontrar a melhor resposta para uma dada mensagem
def encontrar_melhor_resposta(mensagem, respostas):
    
    # Inicializar a melhor resposta como uma mensagem padrão e a melhor pontuação como 0
    melhor_resposta = 'Desculpe, não entendi essa pergunta.'
    melhor_pontuacao = 0
    
    # Iterar sobre cada par pergunta-resposta no dicionário 'respostas'
    for pergunta, resposta in respostas.items():
        
        # Usar expressões regulares para encontrar todas as palavras na 
        # pergunta e convertê-las para minúsculas
        # O resultado é um conjunto de palavras únicas
        
        """
            pergunta.lower(): Este método converte toda a string pergunta para letras
            minúsculas. Isso é feito para garantir que a comparação das palavras seja
            insensível a maiúsculas e minúsculas.

            re.findall(r'\b\w+\b', ...): Aqui, o método findall da biblioteca 
                re (Regular Expression) é utilizado para encontrar todas as ocorrências 
                que combinam com a expressão regular fornecida. A expressão 
                regular \b\w+\b faz o seguinte:
                
                    \b: Corresponde à posição entre um caractere de palavra 
                    (geralmente [a-zA-Z0-9_]) e um caractere não-palavra. Ele atua 
                    como um delimitador de palavra.
                    
                    \w+: Corresponde a um ou mais caracteres de palavra 
                    (geralmente [a-zA-Z0-9_]).
                    
                    \b: Outro delimitador de palavra.

        Portanto, essa expressão regular captura palavras inteiras na string, 
        ignorando espaços, pontuação e outros caracteres especiais.

            set(...): Finalmente, o resultado de re.findall() é uma lista de palavras, 
            que é então convertida em um conjunto (set) para eliminar palavras 
            duplicadas (se houver) e para facilitar a comparação de palavras posteriormente.
        """
        palavras_pergunta = set(re.findall(r'\b\w+\b', pergunta.lower()))
        
        # Fazer o mesmo para a mensagem recebida
        palavras_mensagem = set(re.findall(r'\b\w+\b', mensagem.lower()))
        
        
        # Calcular a pontuação como o número de palavras em comum entre a pergunta e a mensagem
        """
            palavras_pergunta.intersection(palavras_mensagem): Este é um método de 
            conjuntos que retorna um novo conjunto contendo todos os elementos que 
            são comuns entre palavras_pergunta e palavras_mensagem. Em outras 
            palavras, ele identifica as palavras que aparecem tanto na pergunta 
            predefinida (palavras_pergunta) quanto na mensagem do 
            usuário (palavras_mensagem).

            len(...): A função len() é usada para obter o número de elementos no 
            conjunto resultante da interseção. Esse número representa o quanto a 
            mensagem do usuário e a pergunta predefinida são semelhantes, em termos 
            de palavras comuns.
        """
        pontuacao = len(palavras_pergunta.intersection(palavras_mensagem))
        
        # Se a pontuação calculada for maior que a melhor pontuação até agora,
        # atualizar a melhor pontuação e a melhor resposta
        if pontuacao > melhor_pontuacao:
            melhor_pontuacao = pontuacao
            melhor_resposta = resposta
            
    # Retornar a melhor resposta encontrada
    return melhor_resposta
        
        
        

# Definindo a função que será chamada quando uma mensagem for enviada
def enviar_mensagem():
    
    # Pegando o texto da caixa de entrada
    mensagem = entrada.get()
    
    # Verificar se a mensagem está vazia; se estiver, sair da função
    if not mensagem:
        return
    
    # O número 790 representa a coordenada x onde o texto será desenhado no canvas.
    # Isso significa que o texto será posicionado mais à direita no canvas.
    
    # Adicionar a mensagem do usuário ao widget Canvas. O texto será alinhado à direita e será azul.
    # O 'canvas.y' é uma variável personalizada que mantém a posição vertical atual no canvas
    # tags é usada para associar uma ou mais etiquetas (tags) a um item criado em um widget 
    # Canvas. As tags são basicamente strings que você pode usar para identificar, atualizar,
    # ou manipular o item mais tarde.
    canvas.create_text(790, canvas.y, text=mensagem, font=("Arial", 20), anchor='e', tags='texto', fill='blue')
    
    # Aumentar o valor da posição vertical no canvas, para que a próxima 
    # mensagem apareça abaixo da anterior
    canvas.y += 30

    # Chamando a função 'encontrar_melhor_resposta' para obter a resposta mais 
    # adequada para a mensagem do usuário
    resposta = encontrar_melhor_resposta(mensagem, respostas)
    
    # Adicionar a resposta do chatbot ao Canvas. O texto será alinhado à esquerda e será verde.
    # tags é usada para associar uma ou mais etiquetas (tags) a um item criado em um widget 
    # Canvas. As tags são basicamente strings que você pode usar para identificar, atualizar,
    # ou manipular o item mais tarde.
    canvas.create_text(20, canvas.y, font=("Arial 20"), text=resposta, anchor='w', tags='texto', fill='green')
    
    # Aumentar o valor da posição vertical no canvas, para que a próxima mensagem apareça abaixo da anterior
    canvas.y += 30

    # Limpar o texto da caixa de entrada, preparando-a para a próxima mensagem do usuário
    entrada.delete(0, tk.END)
    

# Inicializar a janela Tkinter e dar um título a ela
janela = tk.Tk()
janela.title('Chatbot')

# Criar um Canvas (área de desenho) onde as mensagens serão exibidas
# Definir a cor de fundo como branca, e as dimensões como 500x400
canvas = tk.Canvas(janela, 
                   bg='white', 
                   width=500, 
                   height=400)

# Fazer o Canvas expandir para preencher qualquer 
# espaço disponível na janela
canvas.pack(expand=tk.YES, fill=tk.BOTH)

# Inicializar uma variável de coordenada y 
# no Canvas para manter o
# controle de onde colocar o próximo texto
canvas.y = 20

# Criar uma caixa de entrada (Entry widget) onde o usuário pode digitar sua mensagem
# Definir a fonte e o tamanho do texto na caixa de entrada
entrada = tk.Entry(janela, font=("Arial 20"), width=50)

# Posicionar a caixa de entrada na parte inferior esquerda da janela
entrada.pack(side=tk.LEFT, padx=10, pady=10)

# Criar um botão que o usuário pode pressionar para enviar uma mensagem
# Quando pressionado, este botão chamará a função enviar_mensagem
btn_enviar = tk.Button(janela, text='Enviar', command=enviar_mensagem, font=("Arial 20"))

# Posicionar o botão na parte inferior direita da janela
btn_enviar.pack(side=tk.RIGHT, padx=10, pady=10)

# Iniciar o loop principal da aplicação Tkinter, que mantém a janela 
# aberta e responde aos eventos do usuário
janela.mainloop()


ModuleNotFoundError: No module named 'Levenshtein'

In [4]:
# Importar a biblioteca Tkinter para criar a interface gráfica
import tkinter as tk

from tkinter import ttk

# Importar a biblioteca de fontes do Tkinter para estilizar o texto da interface
from tkinter import font

from tkinter import Text

# Importar a biblioteca de expressões regulares para realizar operações de
# correspondência de texto
import re

# Importar a biblioteca requests para fazer chamadas de API HTTP
import requests

# Definir uma função chamada obter_cotacao_dolar para buscar a cotação atual do dólar
def obter_cotacao_dolar():
    
    # Definir a URL da API que fornece as taxas de câmbio
    api_url = "https://api.exchangerate-api.com/v4/latest/USD"
    
    try:
        
        # Fazer uma chamada GET para a API para obter as taxas de câmbio
        # A flag verify=False é usada aqui para desativar a verificação 
        # SSL (não recomendado para produção)
        resposta = requests.get(api_url, verify=False)
        
        # Converter a resposta da API em um objeto JSON para fácil manipulação
        dados = resposta.json()
        
        # Retornar a taxa de câmbio do dólar em relação ao real brasileiro,
        # que está sob a chave 'BRL' no JSON
        return dados['rates']['BRL']
        
    
    # Capturar e manipular qualquer exceção que possa ocorrer durante o processo
    except Exception as e:
        
        # Retornar uma mensagem de erro informando o que deu errado
        return f"Erro ao obter cotação: {e}"
    
    
# Definir uma função chamada somar_numeros que aceita uma lista de números como argumento
def somar_numeros(numeros):
    
    # Utilizar a função built-in sum para somar todos os números na lista e 
    # retornar o resultado
    return sum(numeros)

# Definir uma função chamada subtrair_numeros que aceita uma lista de 
# números como argumento
def subtrair_numeros(numeros):
    
    # Subtrair a soma dos números a partir do segundo elemento da lista do primeiro número
    # A função sum é usada para somar todos os números da lista a partir do 
    # índice 1 (ou seja, números[1:])
    return numeros[0] - numeros[1]
    

    
# Definir uma função chamada multiplicar_numeros que aceita uma lista de
# números como argumento
def multiplicar_numeros(numeros):
    
    # Inicializar uma variável chamada resultado com o valor 1
    resultado = 1
    
    # Utilizar um loop for para iterar sobre cada número na lista de números
    for num in numeros:
        
        # Multiplicar o valor atual de resultado pelo número atual na lista
        # resultado = resultado * num
        resultado *= num
    
    # Retornar o resultado final da multiplicação
    return resultado


# Definir uma função chamada dividir_numeros que aceita uma lista 
# de números como argumento
def dividir_numeros(numeros):
    
    # Tente executar o bloco de código seguinte
    try:
    
        # Inicializar uma variável chamada resultado com o valor
        # do primeiro número na lista
        resultado = numeros[0]
        
        # Utilizar um loop for para iterar sobre cada número na lista, 
        # começando pelo segundo número (índice 1)
        for num in numeros[1:]:
            
            # Dividir o valor atual de resultado pelo número atual na lista
            resultado /= num
        
        # Retornar o resultado final da divisão
        return resultado
    
    # Capturar qualquer erro de divisão por zero
    except ZeroDivisionError:
        
        # Retornar uma mensagem de erro informando que a divisão por zero não é permitida
        return "Divisão por zero não permitida"

    
def tratar_mensagem(mensagem):
    
    # Converter toda a mensagem para minúsculas
    # Isso torna a comparação de strings insensível a maiúsculas e minúsculas,
    # facilitando a identificação de palavras-chave.
    mensagem = mensagem.lower()
    
    # Usar expressões regulares para encontrar todos os números na mensagem.
    # A função re.findall retorna todas as ocorrências de dígitos na mensagem como uma lista de strings.
    # Essas strings são então convertidas para inteiros usando uma list comprehension.
    numeros = [int(x) for x in re.findall(r'\d+', mensagem)]
    
    # Inicializar uma lista vazia chamada 'respostas' para armazenar as respostas geradas.
    respostas = []
    
    # Verificar se a palavra "some" está presente na mensagem.
    if "some" in mensagem:
        
        # Se a lista 'numeros' não estiver vazia, calcular a soma dos números.
        if numeros:
            respostas.append(f"A soma dos números é {somar_numeros(numeros)}")
            
            
     # Verificar se a palavra "subtraia" está presente na mensagem.
    if "subtraia" in mensagem:
        
        # Se a lista 'numeros' não estiver vazia, calcular a subtração dos números.
        if numeros:
            respostas.append(f"A subtração dos números é {subtrair_numeros(numeros)}")
    
    # Verificar se a palavra "multiplique" está presente na mensagem.
    if "multiplique" in mensagem:
        
        # Se a lista 'numeros' não estiver vazia, calcular a multiplicação dos números.
        if numeros:
            respostas.append(f"A multiplicação dos números é {multiplicar_numeros(numeros)}")
            
            
    # Verificar se a palavra "divida" está presente na mensagem.
    if "divida" in mensagem:
        
        # Se a lista 'numeros' não estiver vazia, calcular a divisão dos números.
        if numeros:
            respostas.append(f"A divisão dos números é {dividir_numeros(numeros)}")
            
    
    # Verificar se a palavra "dólar" está presente na mensagem.
    if "dólar" in mensagem:
        
        # Obter a cotação atual do dólar e adicioná-la à lista de respostas.
        cotacao = obter_cotacao_dolar()
        respostas.append(f"A cotação atual do dólar é {cotacao} BRL")
        
        
    # Tratar a mensagem para destacar números e palavras-chave

    # Primeiro, a mensagem original é dividida em palavras 
    # individuais usando o método `split()`.
    # Isso cria uma lista de palavras.
    palavras = mensagem.split()

    # Inicializamos uma lista vazia chamada `palavras_tratadas` para
    # armazenar as palavras após o tratamento.
    palavras_tratadas = []

    # Usamos um loop `for` para iterar sobre cada palavra na lista `palavras`.
    for palavra in palavras:

        # Usamos a função `fullmatch` do módulo `re` para verificar se a
        # palavra é inteiramente composta de dígitos.
        # A expressão regular r'\d+' significa "um ou mais dígitos".
        if re.fullmatch(r'\d+', palavra):  # Se for um número

            # Se a palavra é um número, adicionamos colchetes em torno dela.
            # Usamos f-string para fazer isso de forma eficiente.
            palavras_tratadas.append(f"[{palavra}]")

        # Caso contrário, verificamos se a palavra é uma das 
        # palavras-chave especificadas: "some", "subtraia", "multiplique", "divida".
        elif palavra in ["some", "subtraia", "multiplique", "divida"]:

            # Se for uma palavra-chave, transformamos ela em maiúsculas para destacá-la.
            palavras_tratadas.append(palavra.upper())

        # Se a palavra não se encaixa em nenhuma das categorias acima, mantemos ela como está.
        else:

            # Adicionamos a palavra original à lista `palavras_tratadas`.
            palavras_tratadas.append(palavra)
            
            
        
    # Finalmente, unimos todas as palavras tratadas em uma única string,
    # separadas por espaços.
    # Usamos o método `join` para fazer isso.
    mensagem_tratada = " ".join(palavras_tratadas)


    # Configurar o Text widget para permitir modificações
    text_area.config(state=tk.NORMAL)
        
    # Adicionar a mensagem do usuário

    # `pos_fim_usuario` e `pos_inicio_usuario` armazenam a posição do cursor no widget de texto.
    # Isso é feito para saber onde a mensagem do usuário termina e onde a do bot começa.
    # `tk.INSERT` é uma constante que aponta para a posição atual do cursor no widget de texto.
    pos_fim_usuario = text_area.index(tk.INSERT)
    pos_inicio_usuario = text_area.index(tk.INSERT)

    # Adicionar a mensagem do bot

    # Verificamos se há alguma resposta gerada pelo bot. `respostas` é
    # uma lista que pode conter uma ou mais respostas.
    if respostas:

        # Unimos todas as respostas em uma única string, separadas por quebras de linha.
        resposta = "\n".join(respostas)

        # Inserimos a mensagem do bot no widget de texto, na posição do fim do texto (`tk.END`).
        # A mensagem é prefixada por "Bot:" para indicar que é o bot que está falando.
        text_area.insert(tk.END, f"Bot: {resposta}\n\n")

        # Obtemos a nova posição do cursor após inserir o texto do bot.
        pos_fim_bot = text_area.index(tk.INSERT)

        # Aplicamos a formatação de cor ao texto do bot.
        # Usamos o método `tag_add` para adicionar uma tag ("cor_bot") ao
        # texto entre `pos_fim_usuario` e `pos_fim_bot`.
        # Em seguida, usamos o método `tag_config` para definir a cor do texto
        # com essa tag como verde.
        text_area.tag_add("cor_bot", pos_fim_usuario, pos_fim_bot)
        text_area.tag_config("cor_bot", foreground="green")

    # Caso não haja resposta, inserimos uma mensagem padrão.
    else:
        text_area.insert(tk.END, "Bot: Desculpe, não entendi sua solicitação.\n\n")

    # Desativamos a edição do widget de texto para que o usuário não
    # possa modificar as mensagens.
    # Isso é feito definindo o estado do widget de texto como `tk.DISABLED`.
    text_area.config(state=tk.DISABLED)

    # Retornamos a resposta do bot como uma string, ou uma mensagem padrão
    # se não houver resposta.
    return "\n".join(respostas) if respostas else "Desculpe, não entendi sua solicitação."
        
        

        
    
# Definição da função `enviar_mensagem` que será chamada quando o
# usuário clicar no botão "Enviar"
def enviar_mensagem():
    
    # Obter o texto inserido pelo usuário no widget Entry e 
    # armazená-lo na variável `mensagem`
    mensagem = entrada.get()
    
    # Verificar se a mensagem está vazia. Se estiver, a função retorna e nada mais é feito
    if not mensagem:
        return
    
    # Ativar o widget Text para permitir a inserção de novas mensagens
    # Isso é feito mudando o estado do widget para NORMAL
    text_area.config(state=tk.NORMAL)
    
    # Inserir a mensagem do usuário no widget Text
    # A mensagem é prefixada com "Você: " para indicar que o usuário está falando
    text_area.insert(tk.END, f"Você: {mensagem}\n")
    
    # Chamar a função `tratar_mensagem` para processar a mensagem 
    # do usuário e obter uma resposta
    resposta = tratar_mensagem(mensagem)
    
    # Inserir a resposta do bot no widget Text e destacá-la em verde
    # Primeiro, obtemos a posição do cursor antes de inserir a resposta do bot
    inicio = text_area.index(tk.INSERT)
    
    # Inserir a resposta do bot no widget Text
    text_area.insert(tk.END, f"Bot: {resposta}\n")
    
    # Obter a posição do cursor após a inserção para saber onde a mensagem do bot termina
    fim = text_area.index(tk.INSERT)
    
    # Usar o método `tag_add` para adicionar uma tag ("resposta_bot") ao 
    # texto entre `inicio` e `fim`
    text_area.tag_add("resposta_bot", inicio, fim)
    
    # Configurar a tag "resposta_bot" para ter a cor de texto verde
    text_area.tag_config("resposta_bot", foreground="green")
    
    # Desativar o widget Text para evitar edições manuais
    # Isso é feito mudando o estado do widget para DISABLED
    text_area.config(state=tk.DISABLED)
    
    # Limpar o widget Entry para que o usuário possa inserir uma nova mensagem
    entrada.delete(0, tk.END)
    
    # Fazer com que o widget Text role para a parte mais recente do chat
    # Isso é útil quando o histórico do chat se torna muito longo
    text_area.see(tk.END)
    
    
# Inicializar a janela principal do Tkinter
janela = tk.Tk()

# Definir o título da janela
janela.title('Chatbot')

# Criar o widget Text para mostrar as mensagens
# O Text widget é uma área onde o texto pode ser exibido e/ou editado.
# Vamos definir a fonte como Arial com tamanho 14, o texto será quebrado por palavras (wrap=tk.WORD),
# e definir a largura e a altura em termos de caracteres e linhas, respectivamente.
text_area = Text(janela, font=("Arial 14"), wrap=tk.WORD, width=50, height=20)

# Empacotar o Text widget na janela principal (janela) e permitir que ele se expanda
# e preencha tanto a largura quanto a altura da janela (expand=tk.YES, fill=tk.BOTH).
# Isso permite que o widget Text ocupe todo o espaço disponível na janela.
text_area.pack(expand=tk.YES, fill=tk.BOTH)

# Desativar a edição no widget Text.
# Isso é feito configurando o estado do widget para DISABLED.
# Essa é uma boa prática para evitar que o usuário edite manualmente as mensagens no histórico do chat.
text_area.config(state=tk.DISABLED)

# Inicializar uma variável y no objeto Canvas para controlar a posição vertical das mensagens
# Isso ajudará a colocar as mensagens em posições diferentes na vertical
#canvas.y = 20

# Criar um campo de entrada de texto (Entry) para o usuário digitar suas mensagens
# Definir a fonte como Arial com tamanho 20 e a largura como 50 caracteres
entrada = tk.Entry(janela, font=("Arial", 20), width=50)

# Empacotar o campo de entrada na janela, alinhando-o à esquerda e adicionando padding
entrada.pack(side=tk.LEFT, padx=10, pady=10)


# Criar um botão para enviar a mensagem. Quando clicado, ele chamará a função enviar_mensagem
btn_enviar = tk.Button(janela, text='Enviar', command=enviar_mensagem)

# Empacotar o botão na janela, alinhando-o à direita e adicionando padding
btn_enviar.pack(side=tk.RIGHT, padx=10, pady=10)

# Iniciar o loop principal do Tkinter para manter a janela aberta
janela.mainloop()