# Criação de Chatbot utilizando algoritmo KNN
------------------------------------------------
Projeto intergrante da disciplina Inteligencia Artificial lecionada pela professora Renata Rosa, desenvolvido pelos alunos Ayron Sanfra, Marcus Vinicius, Pedro Quintiliano e Thainara Rocha.

---------------------------------------------------------------------

## Introdução

#### **Chatbots**


<p align="justify">Chatbots são programas de computador que simulam conversas com humanos. Eles são capazes de manter uma conversa em tempo real, por texto ou por voz, e podem ser usados para uma variedade de propósitos, como atendimento ao cliente, educação, entretenimento e marketing.

<p align="justify">Os chatbots funcionam com base em inteligência artificial, que lhes permite entender e responder à linguagem humana. Eles são geralmente treinados em um grande conjunto de dados de texto e código, o que lhes permite aprender a responder a uma ampla gama de prompts e perguntas.

<p align="justify">Podem ser classificados em duas categorias principais: chatbots rule-based e chatbots baseados em aprendizado de máquina. Chatbots rule-based são programados com um conjunto de regras que determinam como eles devem responder a determinadas entradas. Chatbots baseados em aprendizado de máquina, por outro lado, aprendem a responder a partir de dados históricos.

<p align="justify">Os chatbots estão se tornando cada vez mais populares, à medida que a tecnologia de inteligência artificial continua a se desenvolver. Eles oferecem uma série de vantagens sobre o atendimento ao cliente tradicional, incluindo disponibilidade 24 horas por dia, 7 dias por semana, capacidade de responder a uma ampla gama de perguntas e personalização.

#### **Algoritmos de aprendizado não-supervisionados**

<p align="justify">O aprendizado não supervisionado é uma forma de aprendizado de máquina que não requer rótulos de dados. Em vez disso, o algoritmo aprende a identificar padrões ou estruturas nos dados sem saber o que significam.

 - **KNN**
    <p align="justify">Um exemplo de algoritmo de aprendizado não supervisionado é o KNN, ou k-nearest neighbors. O KNN funciona agrupando dados em clusters, ou grupos, com base em sua semelhança. Para isso, o algoritmo identifica os k pontos de dados mais próximos de um dado ponto de entrada. Os k pontos de dados mais próximos são então usados para determinar o cluster ao qual o dado ponto de entrada pertence. Ele pode ser utilizado em diversos casos como: Agrupamento de dados, reconhecimento de padrões e filtragem de dados

 - **K-Means**
 <p align="justify">O K-means funciona semelhante ao KNN a diferença é que ele identifica k pontos de dados centrais, chamados de centroides. Os dados são então atribuídos ao cluster ao qual seu centroide mais próximo pertence.

### **Integração com ChatGPT**

<p align="justify">Com o auxilio do ChatGPT será possível realizar uma integração que facilite o processamento do conjunto de dados e possibilite uma melhor interação destes com o algoritmo proposto, além disso é possível obter estruturas básicas de código e adaptá-las às necessidades do projeto, além de gerar resultados mais concisos, coerentes e funcionais.

## Criação do ambiente

Inicialmente para criação do ambiente deve-se importar as bibliotecas essenciais ao processamento de dados, aqui utilizaremos as bibliotecas: `scikit-learn`, `pandas` e `numpy`.

A biblioteca `numpy` é uma biblioteca de matemática e computação científica em Python. Ela fornece arrays multidimensionais, funções matemáticas e operações lineares.

`pandas` é uma biblioteca para análise de dados. Ela fornece estruturas de dados e funções para manipular dados numéricos, categóricos e textuais.

Por fim `sklearn` é uma biblioteca de aprendizado de máquina. Ela fornece uma ampla gama de algoritmos de aprendizado de máquina, incluindo classificação, regressão, clustering e redução de dimensionalidade.



In [None]:
import pandas as pd
from sklearn import datasets


## Conjunto de dados

<p align="justify">A base de dados utilizada é um arquivo CSV simples com duas colunas: perguntas e respostas, contendo algumas das perguntas e respostas mais comuns em uma conversa entre duas pessoas, segue a visualização do arquivo abaixo:

```
pergunta,resposta
Como vai você?,Tudo bem obrigado. E você?
Como está o tempo?,Está fazendo sol hoje.
O que você está fazendo?,Estou trabalhando no meu computador.
Você gosta de filmes?,Sim eu adoro.
Qual é o seu filme favorito?,O meu filme favorito é O Senhor dos Anéis.
Você gosta de música?,Sim eu adoro.
Qual é o seu cantor favorito?,O meu cantor favorito é Adele.
Você gosta de esportes?,Sim eu adoro.
Qual é o seu time favorito?,O meu time favorito é o Flamengo.
Onde você mora?,Eu moro em São Paulo.
Qual é o seu trabalho?,Eu sou programador.
Qual é a sua comida favorita?,Eu amo pizza.
Qual é o seu animal de estimação?,Eu tenho um cachorro chamado Rex.
Qual é a sua cor favorita?,A minha cor favorita é azul.
Qual é o seu número favorito?,O meu número favorito é 7.
Qual é o seu feriado favorito?,O meu feriado favorito é o Natal.
Qual é a sua viagem dos sonhos?,Eu sonho em viajar para a Europa.
O que você faz no seu tempo livre?,Gosto de ler assistir filmes e sair com amigos.
O que você gosta de fazer em férias?,Gosto de viajar conhecer novos lugares e experimentar novas culturas.
Qual é o seu objetivo na vida?,Quero ser feliz e fazer a diferença no mundo.
O que você mais gosta de fazer?,Gosto de aprender coisas novas e me desafiar.
Qual é a coisa mais importante para você?,A minha família e os meus amigos.
O que você mais valoriza?,A honestidade a integridade e a bondade.
O que você mais teme?,O fracasso e a solidão.
O que você mais ama?,A vida e as oportunidades que ela me oferece.

```



#Codigo

# Código inicial
<p align="justify">Este é um script Python que implementa um chatbot simples. A ideia é que o chatbot seja capaz de responder a perguntas com base em um conjunto de dados pré-definido.
Em resumo, este código é uma versão inicial de um chatbot que utiliza um modelo de aprendizado de máquina (KNN) treinado em um conjunto de dados de perguntas e respostas. Ele interage com os usuários, respondendo às suas perguntas com base no que foi aprendido durante o treinamento.

In [None]:
import numpy as np
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from google.colab import files
from sklearn.feature_extraction.text import TfidfVectorizer

uploaded_file = files.upload()

# Importar a base de dados
df = pd.read_csv('database.csv')

# Separar os dados em atributos e rótulos
X = df.iloc[:, :-1].values
y = df.iloc[:, -1].values

# Converter o array NumPy em uma lista de strings
X_str = X.tolist()

# Transformar a lista de listas em uma lista de strings
X_str_flat = [' '.join(sublist) for sublist in X_str]

# Iterar sobre a lista de listas e converter cada string para minúsculas
X_str_lower = [' '.join([str.lower() for str in sublist]) for sublist in X_str]

# Criar um vetorizador Tfidf
vectorizer = TfidfVectorizer()

# Transformar a lista de strings em vetores Tfidf
X_tfidf = vectorizer.fit_transform(X_str_lower)

# Transformar a lista de strings em vetores Tfidf
X_tfidf = vectorizer.fit_transform(X_str_lower)

# Treinar o modelo KNN
clf = KNeighborsClassifier(n_neighbors=3)
clf.fit(X_tfidf, y)

# Criar uma interface interativa
def chatbot():
    while True:
        # Solicitar uma pergunta ao usuário
        pergunta = input("Digite sua pergunta: ")

        # Transformar a pergunta em um vetor Tfidf
        pergunta_tfidf = vectorizer.transform([pergunta.lower()])

        # Predecir a resposta
        resposta = clf.predict(pergunta_tfidf)

        # Imprimir a resposta
        print("Resposta:", resposta[0])

# Iniciar o chatbot
chatbot()


## Integração ao chatGPT

O trecho a seguir faz a instalçao do pacote disponibilizado pela OpenAI para a utilização dos recursos do chatGPT.

In [None]:
#Integração com chat gpt

#Intalação do pacote
!pip install openai

## Código final

<p align="justify">Aqui temos o código final, neste ponto o, modelo é integrado ao chatGPT, funcionando da seguinte forma, ao ser digitada uma pergunta, o modelo utiliza-se de sua base para responde-la, é criado então uma única string contendo a pergunta do usuário e a resposta da maquina, a string então é enviada na forma de prompt para o chatGPT, este irá verificar se resposta do modelo faz sentido, e, em caso negativo, o próprio chatGPT, responde a pergunta.  Esta uma boa maneira de se obter respostas mais precisas enquanto o modelo ainda não é suficientemente treinado treinado.

In [None]:
import numpy as np
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from google.colab import files
from sklearn.feature_extraction.text import TfidfVectorizer
import openai

# Configure suas credenciais da OpenAI
api_key = "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"
openai.api_key = api_key

# Carregar o arquivo CSV
uploaded_file = files.upload()

# Importar a base de dados
df = pd.read_csv('database.csv')

# Separar os dados em atributos e rótulos
X = df.iloc[:, :-1].values
y = df.iloc[:, -1].values

# Converter o array NumPy em uma lista de strings
X_str = X.tolist()

# Transformar a lista de listas em uma lista de strings
X_str_flat = [' '.join(sublist) for sublist in X_str]

# Iterar sobre a lista de listas e converter cada string para minúsculas
X_str_lower = [' '.join([str.lower() for str in sublist]) for sublist in X_str]

# Criar um vetorizador Tfidf
vectorizer = TfidfVectorizer()

# Transformar a lista de strings em vetores Tfidf
X_tfidf = vectorizer.fit_transform(X_str_lower)

# Treinar o modelo KNN
clf = KNeighborsClassifier(n_neighbors=3)
clf.fit(X_tfidf, y)

# Função para obter resposta do ChatGPT
def get_chatgpt_response(question):
    conversation = []  # Iniciar uma nova conversa a cada chamada
    conversation.append({"role": "user", "content": question})
    response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=conversation
    )
    return response.choices[0].message['content']

# Função para gerar respostas usando o KNN
def gerar_resposta_knn(question):
    # Transformar a pergunta em um vetor Tfidf
    pergunta_tfidf = vectorizer.transform([question.lower()])

    # Prever a resposta com o KNN
    resposta_knn = clf.predict(pergunta_tfidf)[0]

    return resposta_knn

# Função para combinar respostas do KNN e do ChatGPT
def combinar_respostas(question):
    resposta_knn = gerar_resposta_knn(question)

    pergunta_mais_resposta_knn = question + resposta_knn

    resposta_chatgpt = get_chatgpt_response(pergunta_mais_resposta_knn+"verifique se esta resposta condiz com a realidade, caso não descosidere e responda a questão")


    return resposta_chatgpt

# Exemplo de uso
while True:
    pergunta = input("Você: ")
    resposta = get_chatgpt_response(pergunta)
    print("Chatbot:", resposta)

##Conclusão

<p align="justify">Apesar de bastante limitado, conseguimos construir um chatbot funcional utilizando um modelo de aprendizado de máquina, essa técnica, apesar de parecer muito simples, é o que um dia possibilitou a criação de diversas tecnologias mais modernas e sofisticadas, além disso, o projeto foi uma boa experiença de programação integrada, utilizando um ambiente de desenvolvimento colaborativo adaptado.