## **Exercício 9: Cálculo de Tokens em Texto Longo com API Gemini**

*Implemente um notebook que use a API Gemini para calcular a quantidade de tokens necessários para processar um texto de 5.000 palavras.* 

*Baseie-se no modelo de tokenização utilizado por Gemini e explique como a quantidade de tokens influencia o custo e o desempenho da interação com LLMs em textos longos.*

In [1]:
import google.generativeai as genai
from dotenv import load_dotenv
import os
import requests

load_dotenv('../.env')

genai.configure(api_key=os.environ['GEMINI_KEY'])

modelo = genai.GenerativeModel('gemini-1.5-flash')

In [2]:
resp_principe = requests.get('https://mais-diferencas.s3.us-east-2.amazonaws.com/books/O+Pequeno+Pr%C3%ADncipe/original.txt')

texto = resp_principe.text.split()[:5000]
texto = ' '.join(texto)

In [3]:
import tiktoken

codificador = tiktoken.get_encoding('cl100k_base')

tokens = codificador.encode(texto)

In [4]:
len(tokens)

8701

In [5]:
tokens[:3]

[46, 5250, 447]

Utilizamos um trecho de 5.000 palavras do livro "O Pequeno Príncipe" e foram necessários **8.701 tokens para processá-lo**.

Os *tokens* são as divisões usadas pelos LLMs para processar textos em representações numéricas. Podem ser palavras inteiras, radicais, pontuações, etc.

Portanto, um vocabulário extenso resulta em um maior número de *tokens*, o que provavelmente necessitará de um tempo de processamento maior, possibilidade de se perder o contexto — tanto pelo número de palavras em si quanto caso haja a necessidade de separar o texto em pedaços menores — e uma tarefa mais custosa no geral, já que a maioria desses modelos cobra pelo número de *tokens*.

---