<a href="https://colab.research.google.com/github/armandossrecife/mysummary/blob/main/quick_process_text_summary.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Gemini API Python quickstart

Como ler o conteúdo de um arquivo pdf e fazer o resumo desse conteudo.

## Instale o SDK da API do Gemini

The Python SDK for the Gemini API is contained in the [`google-generativeai`](https://pypi.org/project/google-generativeai/) package.

Also, install [PyPDF2](https://pypdf2.readthedocs.io/en/3.x/)

Install the dependency using pip:

In [23]:
!pip install -q -U google-generativeai

In [24]:
!pip install PyPDF2



## Configure a sua chave da API do Gemini

To use the Gemini API, you'll need an API key. If you don't already have one, create a key in Google AI Studio.

<a class="button" href="https://aistudio.google.com/app/apikey" target="_blank" rel="noopener noreferrer">Get an API key</a>

In Colab, add the key to the secrets manager under the "🔑" in the left panel. Give it the name `GOOGLE_API_KEY`. Then pass the key to the SDK:

Obs: nunca publique sua chave no repositório

In [25]:
# Import the Python SDK
import google.generativeai as genai
# Used to securely store your API key
from google.colab import userdata

GOOGLE_API_KEY=userdata.get('GOOGLE_API_KEY')
genai.configure(api_key=GOOGLE_API_KEY)

## Inicialize o Modelo Generativo

Before you can make any API calls, you need to initialize the Generative Model.

In [26]:
model = genai.GenerativeModel('gemini-pro')

## Dado um documento, faz o resumo do conteúdo texto

O texto pode ser extraído de um arquivo .pdf

In [1]:
!wget https://raw.githubusercontent.com/armandossrecife/mysummary/refs/heads/main/pdfs/d1.pdf

--2024-10-19 13:41:51--  https://raw.githubusercontent.com/armandossrecife/mysummary/refs/heads/main/pdfs/d1.pdf
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.108.133, 185.199.109.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.108.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 1850029 (1.8M) [application/octet-stream]
Saving to: ‘d1.pdf’


2024-10-19 13:41:51 (26.2 MB/s) - ‘d1.pdf’ saved [1850029/1850029]



In [54]:
import PyPDF2
import os
from datetime import datetime

def extract_pdf_text(pdf_path):
    try:
        with open(pdf_path, 'rb') as pdf_file:
            pdf_reader = PyPDF2.PdfReader(pdf_file)

            pdf_text = {}
            for page_num in range(len(pdf_reader.pages)):
                page = pdf_reader.pages[page_num]
                text = page.extract_text()
                pdf_text[page_num + 1] = text
            return pdf_text
    except FileNotFoundError:
        print(f"Error: PDF file not found at {pdf_path}")
    except PermissionError:
        print(f"Error: Permission denied to access PDF file at {pdf_path}")
    except Exception as e:
        print(f"Error: An unexpected error occurred: {e}")

def get_summary_from_response(response_resumo_texto):
  try:
    if len(response_resumo_texto.candidates) > 0:
      summary_content = response_resumo_texto.candidates[0].content
      if len(summary_content.parts) > 0:
        summary_text = summary_content.parts[0].text
        return summary_text  # Return the extracted text
      else:
        print("No content parts found in the first candidate.")
    else:
      print("Nenhuma resposta disponível")
  except (AttributeError, IndexError):
    print("Error accessing response data. Please check the response structure.")

def request_to_gemini(prompt_text):
  print("Aguarde...")
  t1 = datetime.now()
  response_resumo_texto = model.generate_content(prompt_text)
  t2 = datetime.now()
  print(response_resumo_texto)
  tempo_resposta = t2 - t1
  print(f"Tempo de resposta: {tempo_resposta}")
  return response_resumo_texto

In [45]:
texto_documento = ""

meu_conteudo =  extract_pdf_text(pdf_path="d1.pdf")

In [46]:
print(f"Quantidade de páginas: {len(meu_conteudo.keys())}")

Quantidade de páginas: 25


In [47]:
for k,v in meu_conteudo.items():
  print(f"Página: {k}")
  print(f"Texto: {v}")
  texto_documento = texto_documento + v

Página: 1
Texto: AO CHEFE DO DEPARTAMENTO DE COMPUTAÇÃO  DA UNIVERSIDADE FEDERAL DO PIAUÍ  Caro Chefe de Departamento, Eu Armando Soares Sousa, Matrícula UFPI 1886865 lotado no Departamento de Computação do Centro de Ciência da Natureza da Universidade Federal do Piauí solicita sua concordância quanto minha PRORROGAÇÃO DE AFASTAMENTO a fim de dar continuidade ao curso de Pós-Graduação em Ciência da Computação em nível de Doutorado na (Área de Concentração: Ciência da Computação) na Universidade Federal do Ceará, por mais 6 (seis) meses, a partir de 23/02/2022, em conformidade com a Resolução No. 186/06-CEPEX. Além disso, gostaria que o senhor anexasse a meu pedido o documento referente ao plano de qualificação 2022 aprovado na Assembleia Departamental informando a deliberação favorável a meu pedido de afastamento em 2022 para poder concluir minhas atividades do doutorado. Fortaleza, 21, de Dezembro de 2021  __________________________________  (Assinatura) 
Solicitação ao Chefe para P

In [31]:
texto_documento

'AO CHEFE DO DEPARTAMENTO DE COMPUTAÇÃO  DA UNIVERSIDADE FEDERAL DO PIAUÍ  Caro Chefe de Departamento, Eu Armando Soares Sousa, Matrícula UFPI 1886865 lotado no Departamento de Computação do Centro de Ciência da Natureza da Universidade Federal do Piauí solicita sua concordância quanto minha PRORROGAÇÃO DE AFASTAMENTO a fim de dar continuidade ao curso de Pós-Graduação em Ciência da Computação em nível de Doutorado na (Área de Concentração: Ciência da Computação) na Universidade Federal do Ceará, por mais 6 (seis) meses, a partir de 23/02/2022, em conformidade com a Resolução No. 186/06-CEPEX. Além disso, gostaria que o senhor anexasse a meu pedido o documento referente ao plano de qualificação 2022 aprovado na Assembleia Departamental informando a deliberação favorável a meu pedido de afastamento em 2022 para poder concluir minhas atividades do doutorado. Fortaleza, 21, de Dezembro de 2021  __________________________________  (Assinatura) \nSolicitação ao Chefe para Prorrogac ̧ão d

### Envia o conteúdo para o Google Gemini analisar

In [55]:
pergunte_ao_gemini = "Você pode fazer um resumo do seguinte texto: "
prompt_text = f"{pergunte_ao_gemini}{texto_documento}"
response_resumo_texto = request_to_gemini(prompt_text)

Aguarde...
response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "O documento apresenta uma solicita\u00e7\u00e3o do Dr. Armando Soares Sousa, matriculado no Departamento de Computa\u00e7\u00e3o da Universidade Federal do Piau\u00ed (UFPI), para obter concord\u00e2ncia de sua prorroga\u00e7\u00e3o de afastamento a fim de prosseguir com seu curso de p\u00f3s-doutorado em Ci\u00eancia da Computa\u00e7\u00e3o na Universidade Federal do Cear\u00e1 (UFC) por mais 6 meses a partir de 23/02/2022.\n\nJunto ao documento, est\u00e3o anexados os seguintes documentos:\n\n1. Solicita\u00e7\u00e3o de renova\u00e7\u00e3o de afastamento para o Reitor\n2. Declara\u00e7\u00e3o de requisitos e carga hor\u00e1ria do Doutorado MDCC/UFC\n3. Concord\u00e2ncia do pedido de renova\u00e7\u00e3o do Coordenador do MDCC/UFC\n4. Concord\u00e

In [56]:
meu_resumo1 = get_summary_from_response(response_resumo_texto)
print(meu_resumo1)

O documento apresenta uma solicitação do Dr. Armando Soares Sousa, matriculado no Departamento de Computação da Universidade Federal do Piauí (UFPI), para obter concordância de sua prorrogação de afastamento a fim de prosseguir com seu curso de pós-doutorado em Ciência da Computação na Universidade Federal do Ceará (UFC) por mais 6 meses a partir de 23/02/2022.

Junto ao documento, estão anexados os seguintes documentos:

1. Solicitação de renovação de afastamento para o Reitor
2. Declaração de requisitos e carga horária do Doutorado MDCC/UFC
3. Concordância do pedido de renovação do Coordenador do MDCC/UFC
4. Concordância do pedido de renovação do Orientador
5. Atestado semestral de frequência 2021.1
6. Atestado semestral de frequência 2021.2
7. Avaliação semestral de desempenho 2021.1
8. Avaliação semestral de desempenho 2021.2
9. Termo de compromisso
10. Relatório semestral de atividade 2021.1
11. Relatório semestral de atividade 2021.2
12. Atestado de matrícula 2021.2
13. Declaraçã

In [57]:
response_resumo_texto2 = request_to_gemini(prompt_text)
meu_resumo2 = get_summary_from_response(response_resumo_texto2)
print(meu_resumo2)

Aguarde...
response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "O solicitante, Armando Soares Sousa, matriculado no Departamento de Computa\u00e7\u00e3o da Universidade Federal do Piau\u00ed, solicita a prorroga\u00e7\u00e3o de seu afastamento para continuar o curso de doutorado em Ci\u00eancia da Computa\u00e7\u00e3o na Universidade Federal do Cear\u00e1. A solicita\u00e7\u00e3o inclui:\n\n* Concord\u00e2ncia do chefe de departamento\n* Declara\u00e7\u00e3o da Universidade Federal do Cear\u00e1 sobre os requisitos e carga hor\u00e1ria do curso de doutorado\n* Concord\u00e2ncia do coordenador do programa de p\u00f3s-gradua\u00e7\u00e3o em Ci\u00eancia da Computa\u00e7\u00e3o da UFC\n* Concord\u00e2ncia do orientador\n* Atestados semestrais de frequ\u00eancia\n* Avalia\u00e7\u00f5es semestrais de desempenho\n* 

In [58]:
response_resumo_texto3 = request_to_gemini(prompt_text)
meu_resumo3 = get_summary_from_response(response_resumo_texto2)
print(meu_resumo3)

Aguarde...
response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "O Professor Armando Soares Sousa solicita ao Chefe do Departamento de Computa\u00e7\u00e3o da Universidade Federal do Piau\u00ed a concord\u00e2ncia para prorroga\u00e7\u00e3o do seu afastamento acad\u00eamico por mais 6 (seis) meses, a partir de 23/02/2022, para dar continuidade ao seu curso de P\u00f3s-Gradua\u00e7\u00e3o em Ci\u00eancia da Computa\u00e7\u00e3o (\u00e1rea de concentra\u00e7\u00e3o: Ci\u00eancia da Computa\u00e7\u00e3o) no n\u00edvel de Doutorado, na Universidade Federal do Cear\u00e1.\n\nAl\u00e9m disso, o professor solicita que o chefe do departamento anexe ao seu pedido o documento referente ao plano de qualifica\u00e7\u00e3o de 2022, aprovado na Assembleia Departamental, informando a delibera\u00e7\u00e3o favor\u00e1vel ao pe