# Projeto 03 - Chatbot

## O que é um Chatbot?

Um chatbot é um programa de computador desenvolvido para simular conversas humanas. Ele é projetado para interagir com usuários em linguagem natural, geralmente através de interfaces de mensagens como websites, aplicativos de mensagens móveis ou plataformas de redes sociais.

Os chatbots são comumente usados para lidar com consultas de atendimento ao cliente, responder perguntas frequentes, realizar tarefas de agendamento ou fornecer informações detalhadas sobre um produto ou serviço. Eles são programados para responder de maneira a simular a conversação humana e são especialmente úteis para lidar com interações repetitivas, liberando tempo para que os humanos lidem com tarefas mais complexas.

Existem dois tipos principais de chatbots: 

- **Chatbots baseados em regras:** Esses chatbots respondem a consultas específicas e seguem um conjunto pré-definido de regras. Eles são limitados em termos de capacidade de compreensão e não conseguem lidar com perguntas fora das regras pré-definidas.

<br>

- **Chatbots baseados em Inteligência Artificial:** Esses chatbots utilizam técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (Machine Learning) para entender melhor a inteção do usuário e fornecer respostas mais naturais e contextualmente relevantes. Modelos de linguagem como GPT-3 e GPT-4 da OpenAI são exemplos de tecnologia usada para construir chatbots baseados em Inteligência Artificial. O ChatGPT é um chatbot baseado em IA. Esse é o tipo de chatbot que iremos construir agora no Projeto 03.

Esses bots são capazes de aprender com as interações passadas, melhorando assim a qualidade das respostas ao longo do tempo. Eles podem gerenciar uma variedade de perguntas e até mesmo participar de conversas mais complexas com os usuários.

## O que é um Modelo de Linguagem

Os modelos de linguagem são tipos de modelos de aprendizado de máquina (Machine Learning) que foram treinados para entender e gerar texto em linguagem humana. Eles são capazes de realizar várias tarefas relacionadas à linguagem, como tradução de texto, resposta a perguntas, resumo de texto, geração de texto criativo e muito mais.

Os modelos de linguagem são treinados em grandes quantidades de texto para aprender padrões na linguagem humana, incluindo gramática, sintaxe, estilo, tom e até mesmo alguns fatos sobre o mundo. Uma vez treinados, eles podem gerar texto que é frequentemente indistinguível do texto escrito por humanos.

Existem vários tipos de modelos de linguagem, mas os mais recentes e mais poderosos são baseados em uma técnica chamada Transformer. Esses modelos, como o GPT-4 da OpenAI, usam uma arquitetura de rede neural artificial conhecida como Transformer, que é especialmente eficaz para entender o contexto e a estrutura em sequências de texto. O Deep Learning Book traz vasto material gratuito sobre os Transformers.

https://www.deeplearningbook.com.br/transformadores-o-estado-da-arte-em-processamento-de-linguagem-natural/

Os modelos de linguagem são usados em assistentes de voz como a Siri e a Alexa, em chatbots, em ferramentas de escrita assistida por IA, em sistemas de tradução automática, e em muitos outros aplicativos onde a compreensão ou geração de texto é necessária.

## Generative Pre-Trained Transformer (GPT)

GPT significa Generative Pre-Trained Transformer, um modelo lançado pela OpenAI em 2018. É um modelo de linguagem desenvolvido para obter texto como se fosse gerado por humanos.

Baseia-se principalmente no conceito de transformadores, que forma a base de seu algoritmo. Transformer é um tipo de arquitetura de rede neural que usa uma camada de auto-atenção para identificar as relações entre diferentes partes da entrada, como palavras em uma frase. Aqui está o paper original da pesquisa sobre a camada de auto-atenção:

https://arxiv.org/abs/1706.03762

O GPT tem várias camadas de transformadores empilhados uns sobre os outros. Cada camada recebe a entrada da camada anterior, processa usando camadas de auto-atenção e feed-forward e, em seguida, passa sua saída para a próxima camada na arquitetura. A saída da camada final é usada para obter o texto previsto.

Com base nas palavras anteriores, o FPT usa esse conceito para prever a próxima palavra em uma frase. Isso permite que o modelo aprenda os padrões e relacionamentos nos dados de um idioma para que possa gerar um texto coerente e contextualmente apropriado. Assim, o GPT tem uma variedade de aplicações em classificação de texto, tradução automática e geração de texto.

Com o tempo, OpenAI lançou várias versões avançadas do GPT. Vejamos brevemente as características especiais de cada um deles:

- **GPT-2**: Modelo GPT disponível gratuitamente. A seguir estão suas características:
    - **a.** Ele foi treinado com um corpus de dados com quase 1,5 bilhão de parâmetros, permitindo que o modelo estude padrões mais complexos e gere textos mais semelhantes aos humanos.
    - **b.** Possui um recurso para limitar o número de previsões que o impede de gerar texto inapropriado ou enganoso.
    
<br>

- **GPT-3**: É mais robusto e avançado que o GPT 2. Alguns recursos interessantes são:
    - **a.** Ele é treinado em 175 bilhões de parâmetros, tornando-o muito maior que o GPT-2.
    - **b.** O OpenAI introduziu um novo recurso chamado "aprendizagem de poucos tiros" ("few-shot learning") e "aprendizado de tiros zero" ("zero-shot learning"), que permite que o modelo tenha um bom desempenho em tarefas nas quais não é treinaod. Isso é obtido por meio de pré-treinamento em conjuntos de dados muito diversos.
    - **c.** Outro recurso chamado "aprendizagem no contexto" permite que o modelo aprenda com as entradas simultaneamente e ajuste suas respostas de acordo.
    
<br>
    
- **GPT-3.5**: Esta é uma versão mais avançada do GPT-3. Ele executa todas as tarefas que o GPT-3 faz, mas com maior precisão. Está incorporado no ChatGPT em versão gratuita.

<br>

- **GPT-4**: Esta versão mais recenete é 10 vezes mais avançada que sua antecessora. Ele é treinado para resolver problemas mais complexos e entende dialetos que são extremamente difíceis para qualquer outro modelo de linguagem entender, pois os dialetos variam de lugar para lugar. Ele pode sintetizar histórias, poemas, redações, etc., e responder aos usuários com alguma emoção.

Outra característica impressionante do GPT-4 é que ele é capaz de analisar imagens. Ele pode ser usado para gerar legendas automáticas e responder a perguntas com base na imagem de entrada. No entanto, não pode sintetizar imagens por conta própria.

# Implementação do Projeto - ChatBot

## Passo 1

Acessr o site da OpenAI e crie sua conta: https://openai.com

Após efetuar o login, clique em Personal no canto superior direito e então clique em View API Keys. Clique no botão para criar sua chave.

**Importante:** Anote a sua chave, pois nãos erá possível visualizá-la novamente. A imagem abaixo mostra a tela para você. Como a tela pode mudar, sempre use como referência a documentação oficial.

https://platform.openai.com/docs/introduction/overview

A OpenAI oferece um crédito no período de teste e depois disso é necessário cadastrar o cartão de crédito para poder usar os modelos. O link abaixo traz as modalidades de preços:

https://openai.com/pricing#language-models

A subscrição do ChatGPT e o uso da API são cobrados separadamente. Sempre use a documentação oficial da OpenAI como referência, pois mudanças podem ocorrer.

## Passo 2

Abra o terminal ou prompt de comando e instale os pacotes com os comandos abaixo:

"pip install openai"
"pip install requests"

Os pacotes estão disponíveis para Windows, MacOS e Linux. Sempre digite com o máximo de atenção para não errar nos comandos.

Se a instalação ocorreu com sucesso, siga para o próximo passo. Claro que estamos considerando que você tem o Anaconda Python instalado, o que fizemos logo no início do curso.

Aqui está a documentação oficial do pacote openai: https://pypi.org/project/openai/

## Passo 3

Em um editor de código, acrescente o código abaixo:

In [None]:
# Import
import openai

# Chave
openai.api_key = "sua_chave_api"

Salve o arquivo com o nome "chatbot.py" em uma pasta no seu computador.

## Passo 4

Vamos seguir editando o arquivo criado e adicionar uma função python para carregar o modelo de linguagem. Adicione o código como mostrado a seguir. 

In [None]:
# Função para gerar texto a partir do modelo de linguagem
def gera_texto(texto):
    
    # Obtém a resposta do modelo de linguagem
    response = openai.Completion.create(
        
        # Modelo usado
        # Outros modelos estão disponíveis em https://platform.openai.com/account/rate-limits
        engine = "text-davinci-003",
        
        # Texto inicial da conversa com o chatbot
        prompt = texto,
        
        # Comprimento da resposta gerada pelo modelo
        max_tokens = 150,
        
        # Quantas conclusões gerar para cada prompt
        n = 5,
        
        # O texto retornado não conterá a sequência de parada
        stop = None,
        
        # Uma medida da aleatoriedade de um texto gerado pelo modelo. Seu valor está entre 0 e 1.
        # Valores próximos a 1 significam que a saída é mais aleatória, enquanto valores próximos a 0 significam
        # que a saída é muito identificável.
        temperature = 0.8,
    )
    
    return response.choices[0].text.strip()

Cada um dos parâmetros da função é customizável e você pode personalizar seu chatbot da forma que preferir. A documentação oficial oferece alguns exemplos: https://platform.openai.com/docs/api-reference/introduction

## Passo 5

Agora vamos implementar uma função que irá interagir com o usuário, coletar o texto inicial e então executar a função criada anteriormente.

In [None]:
# Função principal do programa em Python
def main():
    
    print("\nBem-vindo ao GPT-4 Chatbot do Projeto 3 do Curso da Data Science Academy.")
    print("\nwww.datascienceacademy.com.br")
    print("\nDigite 'sair' a qualquer momento para encerrar o chat.")
    
    # Loop
    while True:
        
        # coleta a pergunta digitada pelo usuário.
        user_message = input("\nVocê: ")
        
        # Se a mensagem for "sair" finaliza o programa
        if user_message.lower() == "sair":
            break
            
        # Coloca a mensagem digitada pelo usuário na variável Python chamada gpt4_prompt
        gpt4_prompt = f"\nUsuário: {user_message}\nChatbot:"
        
        # Obtém a resposta do modelo executando a função gera_texto()
        chatbot_response = gera_texto(gpt4_prompt)
        
        # Imprime a resposta do chatbot
        print(f"\nChatbot: {chatbot_response}")
        

# Execução do programa (bloco main) em Python
if __name__ == "__main__":
    main()

## Passo 6

Agora, basta navegarmos até o diretório onde está o nosso arquivo python e executá-lo 