<a href="https://colab.research.google.com/github/AbadeC/ProjetoImersaoAI/blob/main/ProjetoImersaoAI.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 1. Introdu√ß√£o



A proposta deste projeto √© criar um Chatbot que responda as perguntas dos usu√°rios com base em PDFs preparados como Base de Conhecimento. Seus usos ser√£o em intera√ß√£o com Clientes, Fornecedores, comunidade ou mesmo para ajudar estudantes em seus estudos.

### Funcionamento
O funcionamento do programa √© simples:
- Preparando o Ambiente: realizadas as instala√ß√µes e importa√ß√µes, configurados os par√¢metros;
- Preparando a Base de Conhecimento: S√£o realizados os uploads de arquivo para a √°rea de trabalho do colab (/content/). Podem ser enviados um ou mais arquivos em PDF, preparados especificamente para servir como base de conhecimento ou n√£o (a efici√™ncia da ferramenta depende disso);
- Executando o trabalho: √© aqui que acontece a intera√ß√£o entre o usu√°rio e o chat. Para terminar, teclar ENTER duas vezes consecutivas;
- Auxiliares e uso futuro: rotinas para lidar com os arquivos carregados (mostrar e apagar) e para serem usadas futuramente.

### Melhorias futuras
As possibilidades de melhoria s√£o muitas, commo por exemplo:
* Amplia√ß√£o da Base de Conhecimento opcionais:
 - Links externos
 - Outros tipos de arquivo
 - Imagens
* Interface amig√°vel
* Inclus√£o de √≠cone de avatar para o Chatbot
* Parametriza√ß√µes de acordo com o interesse do Usu√°rio:
 - Personalidade
 - Estilo
 - Escolha de um nome para o Chatbot


# 2. Preparando o Ambiente

In [225]:
#Instalando bibliotecas externas
!pip install -q -U google-generativeai #SDK do Gemini
!pip install PyPDF2     #Para os PDFs



In [226]:
#Importa√ß√µes de bibliotecas j√° embutidas no Colab e configura√ß√µes iniciais
import textwrap
from IPython.display import display
from IPython.display import Markdown
from pathlib import Path
import hashlib

from IPython.display import Image   # Para a imagem do Zig

# Importa√ß√£o do SDK do Python
import google.generativeai as genai

# Used to securely store your API key
from google.colab import userdata
GOOGLE_API_KEY=userdata.get('SECRET_KEY')
genai.configure(api_key=GOOGLE_API_KEY)

In [227]:
# Inicializando o Modelo (1)
# Defini√ß√µes b√°sicas para o Modelo

generation_config = {
  "temperature": 1,
  "top_p": 0.95,
  "top_k": 0,
  "max_output_tokens": 8192,
}

safety_settings = [
  {
    "category": "HARM_CATEGORY_HARASSMENT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
  {
    "category": "HARM_CATEGORY_HATE_SPEECH",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
  {
    "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
  {
    "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
]

In [228]:
# Vari√°veis √∫teis

# Instru√ß√µes de sistema: Definindo as caracter√≠sticas e a personalidade do Chatbot.
system_instruction = "Voc√™ √© um assistente de bate-papo prestativo chamado ZIG. Seja gentil, educado e entusiasta. Responda sempre as perguntas em portugu√™s brasileiro. Aja como um especialista nos assuntos das Bases de Conhecimento a que tem acesso e utilize o contexto fornecido para responder √†s perguntas do usu√°rio da forma mais completa e precisa poss√≠vel. Apresente as informa√ß√µes de forma clara, concisa e organizada. Se a resposta puder ser encontrada em diferentes partes do contexto, combine as informa√ß√µes relevantes. Se a pergunta se referir a requisitos ou documentos, assegure-se de incluir tudo, sem omitir nada. Se a resposta n√£o estiver no contexto, diga que n√£o a sabe, pe√ßa desculpas e sugira que o usu√°rio entre em contato com o suporte para obter informa√ß√µes. Lembre-se: Responda apenas com base no contexto fornecido. Mantenha um tom positivo e encorajador ao interagir com o usu√°rio."

url = "https://i.postimg.cc/nz4ZskZn/Gemini-Generated-Image-ddohr6ddohr6ddoh-Edited-1.jpg"    # URL da imagem do Zig


In [24]:
# Inicializando o Modelo (2)

# Verifica√ß√£o inicial das disponibilidades
#for modelo in genai.list_models():
#  if 'generateContent' in modelo.supported_generation_methods:
#    print(modelo.name)

# Defini√ß√£o do Modelo a ser usado

# Op√ß√£o 1
#model = genai.GenerativeModel(model_name="gemini-1.0-pro",
#                              generation_config=generation_config,
#                              system_instruction=system_instruction, #Instru√ß√µes de personalidade
#                              safety_settings=safety_settings)

# Op√ß√£o 2
#model = genai.GenerativeModel(model_name="1.0-pro-latest",
#                              generation_config=generation_config,
#                              system_instruction=system_instruction, #Instru√ß√µes de personalidade
#                              safety_settings=safety_settings)

# Op√ß√£o 3 - √â a √∫nica que aceita as instru√ß√µes iniciais personalizadas.
model = genai.GenerativeModel(model_name="gemini-1.5-pro-latest",
                              generation_config=generation_config,
                              system_instruction=system_instruction, #Instru√ß√µes de personalidade
                              safety_settings=safety_settings)

# 3. Preparando a Base de Conhecimento

In [230]:
# Alimentando a base de conhecimento com PDFs
from google.colab import files
import os

print('Image(url=url)')

Mensagem_carrega_PDF = 'Fa√ßa o **carregamento** (*upload*) de um ou mais arquivos em **PDF** (SELECIONE TODOS de uma s√≥ vez) que far√£o parte da Base de Conhecimento do Chatbot:'

# Verifica se j√° existem arquivos PDF no diret√≥rio de destino
arquivos_pdf_existentes = [arq for arq in os.listdir(diretorio_destino) if arq.endswith('.pdf')]

if arquivos_pdf_existentes:
  display(Markdown("Os seguintes arquivos PDF j√° est√£o no diret√≥rio:"))
  for arquivo in arquivos_pdf_existentes:
    print(f"- {arquivo}")

while True:
  display(Markdown(Mensagem_carrega_PDF))
  uploaded = files.upload()
  for filename in uploaded.keys():
    print(f'Arquivo "{filename}" carregado com sucesso.')
  arquivos_pdf_existentes = [arq for arq in os.listdir(diretorio_destino) if arq.endswith('.pdf')]
  if arquivos_pdf_existentes:
    display(Markdown("Base de Conhecimento preparada."))
    display(Markdown("Os seguintes arquivos PDF j√° est√£o no diret√≥rio:"))
    for arquivo in arquivos_pdf_existentes:
      print(f"- {arquivo}")
    break
  else:
    display(Markdown("**ALERTA:** Nenhum arquivo foi carregado ainda. Isso impede que eu funcione adequadamente."))
    continue

# Vers√£o futura
# Alimentando a base de conhecimentos com links externos
#
# Alimentando a base de conhecimento com outros tipos de arquivo...
#

Image(url=url)


Fa√ßa o **carregamento** (*upload*) de um ou mais arquivos em **PDF** (SELECIONE TODOS de uma s√≥ vez) que far√£o parte da Base de Conhecimento do Chatbot:

**ALERTA:** Nenhum arquivo foi carregado ainda. Isso impede que eu funcione adequadamente.

Fa√ßa o **carregamento** (*upload*) de um ou mais arquivos em **PDF** (SELECIONE TODOS de uma s√≥ vez) que far√£o parte da Base de Conhecimento do Chatbot:

Saving FAQ de Energia.pdf to FAQ de Energia.pdf
Arquivo "FAQ de Energia.pdf" carregado com sucesso.


Base de Conhecimento preparada.

Os seguintes arquivos PDF j√° est√£o no diret√≥rio:

- FAQ de Energia.pdf


# 4. Executando o Trabalho

In [231]:
Image(url=url)

In [236]:
from pathlib import Path
import hashlib
import PyPDF2
import glob # Importe o m√≥dulo glob

Image(url=url)

def extract_pdf_pages(directory: str) -> list[str]:
    parts = []
    for filename in glob.glob(f"{directory}/*.pdf"):  # Encontre todos os PDFs no diret√≥rio
        parts.append(f"--- START OF PDF {filename} ---")

        # L√≥gica para ler o PDF e retornar uma lista de p√°ginas:
        with open(filename, 'rb') as pdf_file:
            pdf_reader = PyPDF2.PdfReader(pdf_file)
            pages = []
            for page_num in range(len(pdf_reader.pages)):
                page = pdf_reader.pages[page_num].extract_text()
                pages.append(page)

        for index, page in enumerate(pages):
            parts.append(f"--- PAGE {index} ---")
            parts.append(page)
    return parts

convo = model.start_chat(history=[
    {
        "role": "user",
        "parts": extract_pdf_pages("/content/") # Passa o diret√≥rio
    }
])

# In√≠cio da intera√ß√£o

display(Markdown('Ol√°, sou o Zig. Estou aqui pra responder suas perguntas sobre a base de conhecimento carregada e sobre mim. üòä'))
display(Markdown('Se quiser interromper o chat, **tecle ENTER duas vezes seguidas** com o campo de escrita vazio. Como posso te ajudar?'))

entradas_vazias_consecutivas = 0    # Contador de tecla ENTER vazia

# Mantendo o di√°logo

while entradas_vazias_consecutivas < 2:
  prompt = input('Escreva aqui: ')
  if prompt.strip() == "":
    entradas_vazias_consecutivas += 1
  else:
    entradas_vazias_consecutivas = 0
    convo.send_message(prompt)
    display(Markdown(convo.last.text))

# Encerramento

display(Markdown('Obrigado por ter interagido comigo. Volte sempre.'))

# Fim

Ol√°, sou o Zig. Estou aqui pra responder suas perguntas sobre a base de conhecimento carregada e sobre mim. üòä

Se quiser interromper o chat, **tecle ENTER duas vezes seguidas** com o campo de escrita vazio. Como posso te ajudar?

Escreva aqui: Qual o seu nome


Ol√°! Meu nome √© ZIG, e estou aqui para te ajudar üòä. Como posso ser √∫til hoje? üòÑ 


Escreva aqui: Tchau


Tchau! Foi um prazer conversar com voc√™. üòä  Espero que tenha um √≥timo dia! üòÑ  Se precisar de algo mais, √© s√≥ chamar! üòâ 


Escreva aqui: 
Escreva aqui: 


Obrigado por ter interagido comigo. Volte sempre.

# 5. Auxiliares e uso futuro

Rotinas auxiliares para atividades de manuten√ß√£o e fora do processo normal. Futuramente poder√£o ser incorporadas.

In [217]:
# Apagar os arquivos carregados anteriormente #####################################################

import os

# Lista os arquivos no diret√≥rio atual
arquivos_no_diretorio = os.listdir()

# Itera sobre os arquivos e apaga os arquivos PDF
for arquivo in arquivos_no_diretorio:
  if arquivo.endswith(".pdf"):  # Verifica se o arquivo √© um PDF
    os.remove(arquivo)
    print(f'Arquivo "{arquivo}" apagado com sucesso.')

print("N√£o h√° ou todos os arquivos PDF foram apagados.")

Arquivo "FAQ de Energia.pdf" apagado com sucesso.
Arquivo "Orienta√ß√µes Gerais Grupo BNI BH Premium.pdf" apagado com sucesso.
N√£o h√° ou todos os arquivos PDF foram apagados.


In [218]:
# Mostra os arquivos na √°rea de trabalho #######################################

import os

# Diret√≥rio de destino dos arquivos PDF
#diretorio_destino = '/content/'

# Lista os arquivos no diret√≥rio atual
arquivos_no_diretorio = os.listdir()

# Itera sobre os arquivos e exibe o caminho completo
for arquivo in arquivos_no_diretorio:
  caminho_completo = os.path.abspath(arquivo)  # Obt√©m o caminho completo do arquivo
  print(f'Arquivo: {arquivo}, Caminho: {caminho_completo}')

Arquivo: .config, Caminho: /content/.config
Arquivo: sample_data, Caminho: /content/sample_data


In [219]:
# Verifica se algum arquivo foi carregado ################################################ COM FALHA
if uploaded:
  display(Markdown("Os seguintes arquivos foram carregados:"))   #print("Os seguintes arquivos foram carregados:")
  for filename in uploaded.keys():
    print(f"- {filename}")
else:
  display(Markdown("**ALERTA:** Nenhum arquivo foi carregado ainda. Isso impede que eu funcione adequadamente."))   #print("Nenhum arquivo foi carregado ainda.")

Os seguintes arquivos foram carregados:

- Orienta√ß√µes Gerais Grupo BNI BH Premium.pdf


In [222]:
# Resposta mais descontra√≠da. Uso futuro.
prompt = f"Reescreva esse texto de uma forma mais descontra√≠da, sem adicionar informa√ß√µes que n√£o fa√ßam parte do texto: {convo.last.text}"

model_2 = genai.GenerativeModel("gemini-1.0-pro",
                                generation_config=generation_config)
response = model_2.generate_content(prompt)

display(Markdown(response.text))

AttributeError: 'NoneType' object has no attribute 'text'