# <h1 align="center"><font color="red">Get started with the Gemini API: Python</font></h1>

<font color="pink">Senior Data Scientist: Dr. Eddy Giusepe Chirinos Isidro</font>

Link de estudo:

* [Google AI for Developers](https://ai.google.dev/gemini-api/docs/get-started/tutorial?lang=python&hl=pt-br)

Este início rápido demonstra como usar o `Python SDK` para a `API Gemini`, que dá acesso aos modelos de linguagem grande `Gemini da Google`. Neste início rápido, você aprenderá como:

* Configure seu ambiente de desenvolvimento e acesso à API para usar o `Gemini`.
* Gere respostas de texto a partir de entradas de texto.
* Gere respostas de texto a partir de entradas multimodais (texto e imagens).
* Use o `Gemini` para conversas multi-turno (chat).
* Use `embeddings` para grandes modelos de linguagem.


Instalação:

```
pip install -q -U google-generativeai
```

ou 

```
uv add google-generativeai
```


# <font color="gree">Setup your API key</font>

In [1]:
import pathlib
import textwrap

import google.generativeai as genai

from IPython.display import display
from IPython.display import Markdown


def to_markdown(text):
    text = text.replace("•", "  *")
    return Markdown(textwrap.indent(text, "> ", predicate=lambda _: True))

In [2]:
import os
from dotenv import load_dotenv
load_dotenv()

GOOGLE_API_KEY = os.getenv("GOOGLE_AI_STUDIO_API_KEY")
if not GOOGLE_API_KEY:
    raise ValueError("Chave API não encontrada no arquivo .env")

genai.configure(api_key=GOOGLE_API_KEY)

# <font color="gree">List models</font>

Agora você está pronto para chamar a `API Gemini`. Use list_modelspara ver os modelos Gemini disponíveis:

* `gemini-1.5-flash`: otimizado para casos de uso `multimodais` onde velocidade e custo são importantes. Este deve ser seu modelo preferido.
* `gemini-1.5-pro`: otimizado para tarefas de `alta inteligência`, o modelo Gemini mais poderoso

In [3]:
for model in genai.list_models():
    if "generateContent" in model.supported_generation_methods:
        print(model.name)

models/gemini-1.0-pro-latest
models/gemini-1.0-pro
models/gemini-pro
models/gemini-1.0-pro-001
models/gemini-1.0-pro-vision-latest
models/gemini-pro-vision
models/gemini-1.5-pro-latest
models/gemini-1.5-pro-001
models/gemini-1.5-pro-002
models/gemini-1.5-pro
models/gemini-1.5-flash-latest
models/gemini-1.5-flash-001
models/gemini-1.5-flash-001-tuning
models/gemini-1.5-flash
models/gemini-1.5-flash-002
models/gemini-1.5-flash-8b
models/gemini-1.5-flash-8b-001
models/gemini-1.5-flash-8b-latest
models/gemini-1.5-flash-8b-exp-0827
models/gemini-1.5-flash-8b-exp-0924
models/gemini-2.0-flash-exp
models/gemini-2.0-flash
models/gemini-2.0-flash-001
models/gemini-2.0-flash-lite-preview
models/gemini-2.0-flash-lite-preview-02-05
models/gemini-2.0-pro-exp
models/gemini-2.0-pro-exp-02-05
models/gemini-exp-1206
models/gemini-2.0-flash-thinking-exp-01-21
models/gemini-2.0-flash-thinking-exp
models/gemini-2.0-flash-thinking-exp-1219
models/learnlm-1.5-pro-experimental


# <font color="yellow">Generate text from text inputs</font>

<font color="orange">Sempre comece com o modelo `'gemini-1.5-flash'`. Ele deve ser suficiente para a maioria das suas tarefas:</font>

In [4]:
model = genai.GenerativeModel("gemini-1.5-flash")

model

genai.GenerativeModel(
    model_name='models/gemini-1.5-flash',
    generation_config={},
    safety_settings={},
    tools=None,
    system_instruction=None,
    cached_content=None
)

<font color="orange">No caso mais simples, você pode passar uma string de prompt para o método [GenerativeModel.generate_content](https://ai.google.dev/api/generate-content?hl=pt-br#v1beta.models.generateContent):</font>

In [9]:
import time

# Início da medição do tempo:
start_time = time.time()

response = model.generate_content("Qual é o significado da vida?")
response
# Fim da medição e cálculo do tempo decorrido
end_time = time.time()


tempo_execucao = end_time - start_time
print(f"\nTempo de execução: {tempo_execucao:.2f} segundos")



Tempo de execução: 2.86 segundos


In [10]:
print(response)

response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "N\u00e3o existe uma \u00fanica resposta universalmente aceita para a pergunta \"Qual \u00e9 o significado da vida?\".  A resposta \u00e9 profundamente pessoal e varia de pessoa para pessoa, dependendo de suas cren\u00e7as, valores, experi\u00eancias e perspectivas.\n\nAlgumas pessoas encontram significado na:\n\n* **Religi\u00e3o ou espiritualidade:**  A f\u00e9 em um poder superior e a busca pela ilumina\u00e7\u00e3o espiritual podem dar sentido \u00e0 vida para muitos.\n* **Relacionamentos:** O amor, a fam\u00edlia e as amizades fornecem conex\u00e3o e prop\u00f3sito.\n* **Contribui\u00e7\u00e3o \u00e0 sociedade:**  Trabalhar para melhorar o mundo, seja atrav\u00e9s de caridade, ativismo ou simplesmente ajudando os outros, pode ser uma fonte de significado

In [11]:
to_markdown(response.text)

> Não existe uma única resposta universalmente aceita para a pergunta "Qual é o significado da vida?".  A resposta é profundamente pessoal e varia de pessoa para pessoa, dependendo de suas crenças, valores, experiências e perspectivas.
> 
> Algumas pessoas encontram significado na:
> 
> * **Religião ou espiritualidade:**  A fé em um poder superior e a busca pela iluminação espiritual podem dar sentido à vida para muitos.
> * **Relacionamentos:** O amor, a família e as amizades fornecem conexão e propósito.
> * **Contribuição à sociedade:**  Trabalhar para melhorar o mundo, seja através de caridade, ativismo ou simplesmente ajudando os outros, pode ser uma fonte de significado.
> * **Criatividade e auto-expressão:**  Expressar-se através da arte, da música, da escrita ou de outras formas criativas pode ser profundamente gratificante.
> * **Desenvolvimento pessoal:**  A busca pelo conhecimento, o crescimento pessoal e a superação de desafios podem dar propósito à vida.
> * **Experiências:** Explorar o mundo, viajar e viver novas experiências podem proporcionar uma sensação de significado e propósito.
> 
> Em resumo, o significado da vida não é algo a ser descoberto, mas sim algo a ser **criado**. É uma jornada individual de autodescoberta e construção de um propósito que resulte em uma vida significativa e gratificante para você.  A busca por esse significado, talvez mais do que o próprio significado em si, é o que muitas vezes confere propósito à vida.


Se a API não retornar um resultado, use `GenerateContentResponse.prompt_feedback`para verificar se ela foi bloqueada devido a problemas de segurança relacionados ao `prompt`.

In [22]:
response.candidates

[content {
  parts {
    text: "Não existe uma única resposta universalmente aceita para a pergunta \"Qual é o significado da vida?\".  A resposta é profundamente pessoal e varia de pessoa para pessoa, dependendo de suas crenças, valores, experiências e perspectivas.\n\nAlgumas pessoas encontram significado na:\n\n* **Religião ou espiritualidade:**  A fé em um poder superior e a busca pela iluminação espiritual podem dar sentido à vida para muitos.\n* **Relacionamentos:** O amor, a família e as amizades fornecem conexão e propósito.\n* **Contribuição à sociedade:**  Trabalhar para melhorar o mundo, seja através de caridade, ativismo ou simplesmente ajudando os outros, pode ser uma fonte de significado.\n* **Criatividade e auto-expressão:**  Expressar-se através da arte, da música, da escrita ou de outras formas criativas pode ser profundamente gratificante.\n* **Desenvolvimento pessoal:**  A busca pelo conhecimento, o crescimento pessoal e a superação de desafios podem dar propósito à 

<font color="orange">Por padrão, o modelo retorna uma resposta após concluir todo o processo de geração. Você também pode transmitir a resposta conforme ela é gerada, e o modelo retornará pedaços da resposta assim que forem gerados.

Para transmitir respostas, use `GenerativeModel.generate_content(..., stream=True)`.</font>

In [24]:
response = model.generate_content("Qual é o significado da vida?", stream=True)

for chunk in response:
    print(chunk.text)



Não
 existe uma única resposta para a pergunta "Qual é o significado da vida?".  
A resposta é profundamente pessoal e varia de indivíduo para indivíduo, dependendo de seus
 valores, crenças, experiências e perspectivas.

Algumas pessoas encontram significado na:

* **Religião e espiritualidade:**  Para muitos, o
 significado da vida está em servir a um poder superior, seguir os ensinamentos de uma fé e encontrar a salvação ou iluminação.
* **Relacionamentos:**
 O amor, a família e as conexões com outras pessoas são fontes importantes de significado para muitas pessoas.
* **Contribuição para a sociedade:**  Contribuir para algo maior do que si mesmo, seja através do trabalho voluntário,
 da caridade ou da criação de algo valioso, pode dar sentido à vida.
* **Autodescoberta e crescimento pessoal:**  A jornada de autoconhecimento, o desenvolvimento pessoal e a busca por crescimento e aprendizado contínuo
 podem ser fontes de significado.
* **Criatividade e expressão artística:**  Express

# <font color="yellow">Generate text from image and text inputs</font>

A `GenerativeModel.generate_content` API foi projetada para lidar com `prompts multimodais` e retorna uma saída de texto.

Vamos incluir uma imagem:

In [26]:
# Criamos uma pasta "images":
!mkdir -p images

!curl -o images/image.jpg https://t0.gstatic.com/licensed-image?q=tbn:ANd9GcQ_Kevbk21QBRy-PgB4kQpS79brbmmEG7m3VOTShAn4PecDU5H5UxrJxE3Dw1JiaG17V88QIol19-3TM2wCHw



  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  405k  100  405k    0     0   934k      0 --:--:-- --:--:-- --:--:--  935k


In [28]:
import PIL.Image

img = PIL.Image.open("images/image.jpg")

# img # Para ver a imagem


<font color="orange">Para fornecer `texto` e `imagens em um prompt`, passe uma lista contendo as strings e imagens:</font>

In [37]:
model = genai.GenerativeModel("gemini-1.5-flash")


response = model.generate_content(
    [
        """Escreva um post curto, envolvente baseado nesta imagem. Ele deve incluir 
           uma descrição do prato da foto e falar sobre minha jornada de preparação
           de refeições. Seja conciso, factual e não forneça explicações adicionais.
        """,
        img,
    ],
    stream=True,
)

response.resolve()  # Espera a resposta completa

In [38]:
print(response.text)


Claro, aqui está uma legenda curta e envolvente para a foto com base na sua descrição:

**Legenda:**

Frango teriyaki com brócolis e arroz integral. Mais duas refeições preparadas! Minha jornada para preparar as refeições aumentou minha produtividade e minha saúde.  #preparacaoderecações #vidasaudavel #receitasfacil


In [39]:
to_markdown(response.text)

> Claro, aqui está uma legenda curta e envolvente para a foto com base na sua descrição:
> 
> **Legenda:**
> 
> Frango teriyaki com brócolis e arroz integral. Mais duas refeições preparadas! Minha jornada para preparar as refeições aumentou minha produtividade e minha saúde.  #preparacaoderecações #vidasaudavel #receitasfacil

# <font color="yellow">Chat conversations</font>

`Gemini` permite que você tenha conversas de forma livre em vários turnos. A classe `ChatSession` simplifica o processo gerenciando o estado da conversa, então, diferentemente de `generate_content`, você não precisa armazenar o histórico da conversa como uma lista.

Inicializar o chat:

In [40]:
model = genai.GenerativeModel("gemini-1.5-flash")
chat = model.start_chat(history=[])

chat

ChatSession(
    model=genai.GenerativeModel(
        model_name='models/gemini-1.5-flash',
        generation_config={},
        safety_settings={},
        tools=None,
        system_instruction=None,
        cached_content=None
    ),
    history=[]
)

O método `ChatSession.send_message` retorna o mesmo `GenerateContentResponse` tipo como `GenerativeModel.generate_content`. Ele também anexa sua mensagem e a resposta ao histórico de bate-papo:

In [41]:
response = chat.send_message(
    "Em uma frase, explique como um computador funciona para uma criança jovem."
)

response.text


'Um computador é como um cérebro super rápido que segue instruções (programas) para fazer coisas, como exibir fotos, tocar música e jogar jogos.\n'

In [42]:
to_markdown(response.text)

> Um computador é como um cérebro super rápido que segue instruções (programas) para fazer coisas, como exibir fotos, tocar música e jogar jogos.


In [43]:
chat.history

[parts {
   text: "Em uma frase, explique como um computador funciona para uma criança jovem."
 }
 role: "user",
 parts {
   text: "Um computador é como um cérebro super rápido que segue instruções (programas) para fazer coisas, como exibir fotos, tocar música e jogar jogos.\n"
 }
 role: "model"]

Você pode continuar enviando mensagens para continuar a conversa. Use o argumento `stream=True` para transmitir o chat:

In [45]:
response = chat.send_message(
    "Certo, que tal uma explicação mais detalhada para um estudante do ensino médio?", stream=True
)

for chunk in response:
    print(chunk.text)

Um
 computador é uma máquina que processa informações seguindo instruções codificadas em programas de
 software.  Ele funciona manipulando dados digitais representados em binário (zeros
 e uns).  A unidade central de processamento (CPU) é o "cérebro" do computador, executando essas instruções passo a passo em um ciclo
 de busca-decodificação-execução.  A memória de acesso aleatório (RAM) armazena temporariamente os dados e as instruções que a CPU
 está usando ativamente, permitindo acesso rápido.  A memória de armazenamento secundário, como o disco rígido (HDD) ou unidade de estado sólido (SSD), armazena dados permanentemente, mesmo quando o computador está desligado.  
A placa-mãe conecta e coordena todos os componentes do hardware, incluindo a CPU, RAM, armazenamento, placa de vídeo (GPU) e periféricos.  A GPU processa informações gráficas, acelerando jogos e aplicações
 visuais.

Os dispositivos de entrada, como teclado, mouse e microfone, permitem que o usuário forneça informações 

In [46]:
for message in chat.history:
    display(to_markdown(f"**{message.role}**: {message.parts[0].text}"))

> **user**: Em uma frase, explique como um computador funciona para uma criança jovem.

> **model**: Um computador é como um cérebro super rápido que segue instruções (programas) para fazer coisas, como exibir fotos, tocar música e jogar jogos.


> **user**: Certo, que tal uma explicação mais detalhada para um estudante do ensino médio?

> **model**: Um computador é uma máquina que processa informações seguindo instruções codificadas em programas de software.  Ele funciona através da manipulação de dados binários (zeros e uns) que representam tudo, desde texto e imagens até instruções complexas. A  Unidade Central de Processamento (CPU) é o "cérebro" do computador, executando essas instruções passo a passo.  A memória RAM (memória de acesso aleatório) armazena os dados e as instruções em uso, permitindo acesso rápido pela CPU.  O disco rígido (ou SSD) armazena dados de forma permanente, mesmo quando o computador está desligado.  Os dispositivos de entrada (teclado, mouse) permitem que o usuário forneça informações ao computador, e os dispositivos de saída (monitor, impressora) mostram os resultados do processamento.  Todo esse hardware interage através de uma placa-mãe que conecta e coordena todos os componentes.  O sistema operacional (como Windows, macOS ou Linux) gerencia o hardware e fornece uma interface para os programas de software rodarem.


> **user**: Certo, que tal uma explicação mais detalhada para um estudante do ensino médio?

> **model**: Um computador é uma máquina que processa informações seguindo instruções codificadas em programas de software.  Ele funciona manipulando dados digitais representados em binário (zeros e uns).  A unidade central de processamento (CPU) é o "cérebro" do computador, executando essas instruções passo a passo em um ciclo de busca-decodificação-execução.  A memória de acesso aleatório (RAM) armazena temporariamente os dados e as instruções que a CPU está usando ativamente, permitindo acesso rápido.  A memória de armazenamento secundário, como o disco rígido (HDD) ou unidade de estado sólido (SSD), armazena dados permanentemente, mesmo quando o computador está desligado.  A placa-mãe conecta e coordena todos os componentes do hardware, incluindo a CPU, RAM, armazenamento, placa de vídeo (GPU) e periféricos.  A GPU processa informações gráficas, acelerando jogos e aplicações visuais.
> 
> Os dispositivos de entrada, como teclado, mouse e microfone, permitem que o usuário forneça informações ao computador.  Os dispositivos de saída, como monitor, impressora e alto-falantes, exibem os resultados do processamento.  O sistema operacional (SO), como Windows, macOS ou Linux, gerencia o hardware e os recursos do computador, fornecendo uma interface para os programas de software.  Software de aplicativos, como processadores de texto, navegadores da web e jogos, executam tarefas específicas definidas pelo usuário.  A interação complexa entre hardware e software permite que os computadores realizem uma ampla gama de tarefas, desde cálculos simples até processamento de imagens e simulações avançadas.  Redes de computadores permitem que múltiplos computadores se comuniquem e compartilhem informações.
