<a href="https://colab.research.google.com/github/jcutigi/chatbot_ConverseComSeuLivro/blob/main/genIA_engsoftmoderna.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

##Chatbot **Converse com seu Livro**

Neste projeto foi criado um chatbot que utiliza a API da IA generativa do google para que o usuário possa "conversar" com um determinado livro. Ele utiliza os modelos de geração de conteúdo e de embeddings, para dar um contexto específico ao chatbot.

Como exemplo, o livro utilizado foi **Engenharia de Software Moderna**, do professor **Marco Tulio Valente**, que pode ser acessado gratuitamente no link a seguir: https://engsoftmoderna.info/. O livro é excelente e altamente recomendável. Os embeddings gerados foram das seções do Capítulo 1 do livro (algumas seções precisaram ser truncadas, dado a limitação trazida pela versão gratuita da API do google).

Cabe ressaltar que esse é um projeto bem simples, cujo objetivo foi "brincar" com a API do google. Tem muita coisa aí para melhorar e aprender ainda : ). Ele foi criado como resultado na participação na Imersão IA oferecido pela Alura e o Google, de 06 a 10 de maio de 2024. Agradeço pela oprotunidade. Mais infos no link: https://www.alura.com.br/imersao-ia-google-gemini

Logo abaixo segue uma versão marketeira do chatbot. Se trat de uma adaptação de um texto gerado pelo próprio Gemini do google : )


---
##Cansado de ficar revirando páginas em busca de respostas?

Ler livro é chato? Não tem paciência? Estudar e ficar procurando os conteúdos é uma tarefa custosa pra você?
Apresento o Chatbot **Converse com seu Livro** seu assistente virtual para "conversar" com qualquer livro. Faça perguntas, responda perguntas e interaja com o livro que você está lendo/estudando.

Com o **Converse com seu Livro**, você pode:

- "Conversar" com o livro como se estivesse em um bate-papo;
- Tirar dúvidas sobre o conteúdo sem precisar reler parágrafos inteiros;
- Aprofundar seus conhecimentos de forma interativa e divertida;
- Aprender de forma inovadora e personalizada.


Chega de perder tempo! O **Converse com seu Livro** está aqui para te ajudar a conquistar seus objetivos de aprendizado.

Importante: Como exemplo, o livro utilizado foi **Engenharia de Software Moderna**, do professor **Marco Tulio Valente**, que pode ser acessado gratuitamente no link a seguir: https://engsoftmoderna.info/. O livro é excelente e altamente recomendável. Os embeddings gerados foram das seções do Capítulo 1 do livro.

In [2]:
# Instala a biblioteca google-generativeai na versão mais recente e de forma silenciosa
!pip install -U -q google-generativeai

In [3]:
import numpy as np
import pandas as pd
import google.generativeai as genai
import requests
from bs4 import BeautifulSoup
import re
from IPython.display import HTML, display

# Melhora a visualização na saída, para incluir quebra de linha na visualização do chatbot.
def set_css():
  display(HTML('''
  <style>
    pre {
        white-space: pre-wrap;
    }
  </style>
  '''))
get_ipython().events.register('pre_run_cell', set_css)

In [4]:
# O código configura a chave de API para a biblioteca google-generativeai.
GOOGLE_API_KEY = "AIzaSyB3eehiM5nP2Pgh_PRqFnRCawA9XLTCuko"
genai.configure(api_key=GOOGLE_API_KEY)

In [5]:
# Exibe os modelos embeddings e de geração de conteúdo disponíveis

print("Modelos embeddings:")
for model in genai.list_models():
  if 'embedContent' in model.supported_generation_methods:
    print(model.name)

print("\nModelos generativos:")
for model in genai.list_models():
  if 'generateContent' in model.supported_generation_methods:
    print(model.name)

Modelos embeddings:
models/embedding-001
models/text-embedding-004

Modelos generativos:
models/gemini-1.0-pro
models/gemini-1.0-pro-001
models/gemini-1.0-pro-latest
models/gemini-1.0-pro-vision-latest
models/gemini-1.5-pro-latest
models/gemini-pro
models/gemini-pro-vision


In [6]:
# Função para extrair título das seções e seu respectivo conteúdo.
# url é o caminho para um capítulo do livro.

def extract_titles_and_contents(url):
  response = requests.get(url)
  if response.status_code != 200:
    print("Erro ao acessar a página:", response.status_code)
    return None

  soup = BeautifulSoup(response.content, 'html.parser')
  documents = []
  for item in soup.select("h2,h3"):
    title = item.get_text(strip=True)
    title = re.sub(r'[0-9.]', '', title)
    title = re.sub(r'\n', ' ', title)
    title = title[:len(title)-1]
    content = []
    for i in item.next_siblings:
      if i.name == "h2":
        break
      content.extend([x for x in i.stripped_strings])
    content = "\n".join(content)
    content = re.sub(r'\n+', '\n', content)
    content = re.sub(r'\s+', ' ', content)
    data_dict = {}
    data_dict['title'] = title
    data_dict['content'] = content[:2000]
    documents.append(data_dict)
  return documents

In [7]:
# Chamando a função para extração do título das seções e o conteúdo
# Para esse exemplo, será utilizado o Capítulo 1 do livro Engenharia de Software Moderna
url = "https://engsoftmoderna.info/cap1.html"
documents = extract_titles_and_contents(url)

In [8]:
# Cria um dataframe com os títulos e os conteúdos
df = pd.DataFrame(documents)
df.columns = ["title", "content"]
df

Unnamed: 0,title,content
0,"Definições, Contexto e História","No mundo moderno, tudo é software. Hoje em dia..."
1,Não existe bala de prata,Como começamos a afirmar no parágrafo anterior...
2,O que se Estuda em Engenharia de Software?,"Para responder a essa pergunta, vamos nos base..."
3,Engenharia de Requisitos,Os requisitos de um sistema definem o que ele ...
4,Projeto de Software,"Durante o projeto de um sistema de software, s..."
5,Construção de Software,"Construção trata da implementação, isto é, cod..."
6,Testes de Software,Teste consiste na execução de um programa com ...
7,Manutenção e Evolução de Software,Assim como sistemas tradicionais de Engenharia...
8,Gerência de Configuração,"Atualmente, é inconcebível desenvolver um soft..."
9,Gerência de Projetos,Desenvolvimento de software requer o uso de pr...


In [9]:
# Funcao para geração dos embeddings baseado no titulo e conteúdo das seções do capítulo
model_embedding_str = "models/embedding-001"

def generate_embeddings(title, content):
  return genai.embed_content(model=model_embedding_str,
                             content=content,
                             title=title,
                             task_type="RETRIEVAL_DOCUMENT")["embedding"]

In [10]:
# Criação da coluna embedding e adição dos dados referentes às seções
df["embedding"] = df.apply(lambda row: generate_embeddings(row["title"], row["content"]), axis=1)
df

Unnamed: 0,title,content,embedding
0,"Definições, Contexto e História","No mundo moderno, tudo é software. Hoje em dia...","[0.015971398, -0.011913146, -0.02258717, 0.019..."
1,Não existe bala de prata,Como começamos a afirmar no parágrafo anterior...,"[0.022837467, -0.03293403, -0.010475693, -0.00..."
2,O que se Estuda em Engenharia de Software?,"Para responder a essa pergunta, vamos nos base...","[-0.013461524, -0.03294809, -0.040565085, -0.0..."
3,Engenharia de Requisitos,Os requisitos de um sistema definem o que ele ...,"[0.010581429, -0.024242893, -0.038584225, 0.04..."
4,Projeto de Software,"Durante o projeto de um sistema de software, s...","[-0.007613311, -0.035631064, -0.025087237, 0.0..."
5,Construção de Software,"Construção trata da implementação, isto é, cod...","[-0.020763008, -0.03414009, -0.038438924, 0.00..."
6,Testes de Software,Teste consiste na execução de um programa com ...,"[-0.031790346, -0.0417571, -0.04129114, 0.0057..."
7,Manutenção e Evolução de Software,Assim como sistemas tradicionais de Engenharia...,"[-0.017738506, -0.043968115, -0.021955729, 0.0..."
8,Gerência de Configuração,"Atualmente, é inconcebível desenvolver um soft...","[-0.011216021, -0.029996894, -0.020224277, 0.0..."
9,Gerência de Projetos,Desenvolvimento de software requer o uso de pr...,"[0.042146992, -0.014353633, -0.013628773, 0.02..."


In [15]:
# Ajuste de hiperparâmetros e criação do modelo de geração de conteúdo
model_generative_str = "gemini-1.0-pro"

generation_config = {
  "temperature": 0.4,
  "candidate_count": 1
}

model_generative = genai.GenerativeModel(model_generative_str, generation_config=generation_config)

In [12]:
# Busca nos textos carregados o que tem maior relação com determinada query
def search_similarity(query, df, model):
  query_embedding = genai.embed_content(model=model,
                                        content=query,
                                        task_type="RETRIEVAL_QUERY")["embedding"]

  scalar_product = np.dot(np.stack(df["embedding"]), query_embedding)

  index = np.argmax(scalar_product)
  return df.iloc[index]["content"]

In [17]:
# Criação do chatbot "Converse com o livro"

chat = model_generative.start_chat(history=[])

query = input('Estudante: ')
context = search_similarity(query, df, model_embedding_str)
prompt = f"""Aja como o autor do livro que está sendo estudado.
             Você está conversando com um estudante.
             Responda a pergunta ou faça um comentário baseada
             no contexto dado e na pergunta do estudante.
             As respostas devem ser concisas e bullets devem ser evitados.
             Pergunta: {query}. Contexto: {context}"""
response = chat.send_message(prompt)
print("Resposta:", response.text, '\n')
context = search_similarity(response.text, df, model_embedding_str)
prompt = f"""Aja como o autor do livro que está sendo estudado.
             Baseado na resposta que você deu,
             faça uma outra pergunta para o aluno cujo assunto esteja no contexto.
             Resposta que você deu: {response.text}. Contexto: {context}"""
response = chat.send_message(prompt)
print("Assistente: ", response.text, '\n')
query = input('\nEstudante: ')

while query.upper() != "FIM":
  context = search_similarity(query, df, model_embedding_str)
  prompt = f"""Aja como o autor do livro que está sendo estudado.
               Analise a resposta do estudante e escreva um feedback baseado no contexto
               e faça outra pergunta para o estudante.
               Resposta do estudante: {query}. Contexto: {context}"""
  response = chat.send_message(prompt)
  print("Assistente:", response.text, '\n')
  query = input('\nEstudante: ')

prompt = "Aja como o autor do livro que está sendo estudado. Agradeça ao estudante e faça um resumo bem sucinto do que foi discutido, destacando os pontos mais importantes."
response = chat.send_message(prompt)
print("Considerações finais:", response.text, '\n\n')


Estudante: O que é Engenharia de Software?
Resposta: Engenharia de Software é a aplicação de abordagens sistemáticas e quantificáveis para desenvolver, operar, manter e evoluir software, principalmente aqueles mais complexos e de maior tamanho. 

Assistente:  Você entendeu que Engenharia de Software é a aplicação de abordagens sistemáticas e quantificáveis para desenvolver, operar, manter e evoluir software. Agora, me diga, quais são alguns dos desafios específicos que os engenheiros de software enfrentam ao desenvolver sistemas de software complexos? 


Estudante: Organizar os processos como um todo.
Assistente: **Feedback:**

Você mencionou "organizar os processos como um todo" como um desafio no desenvolvimento de sistemas de software complexos. Isso é certamente um aspecto importante, pois envolve gerenciar a complexidade e garantir que todos os componentes do sistema trabalhem juntos de forma coesa.

**Pergunta:**

Além de organizar os processos, quais outras abordagens ou técnica