# API da Gmail

## O que √© uma API

**API** √© a sigla para Application Programming Interface (Interface de Programa√ß√£o de Aplica√ß√µes). Em termos simples, √© um conjunto de regras e ferramentas que permite que diferentes softwares se comuniquem entre si.

A API:

- Recebe seu pedido

- Verifica se voc√™ tem permiss√£o (autentica√ß√£o)

- Busca os dados no servidor do Gmail

- Retorna a resposta em um formato padronizado (geralmente JSON)

Com o uso de APIs todas as intera√ß√µes seguem regras claras, o banco de de dados nunca √© acessado direto do servidor e isso garante seguran√ßa dos usu√°rios, voc√™ recebe somente as informa√ß√µes que pediu e n√£o precisa saber como o Gmail √© implementado por dentro.

Os principais componente de uma API s√£o:

- Endpoint: √© uma URL especifica para cada recurso, por exemplo, "https://gmail.googleapis.com/gmail/v1/users/me/messages".

- [M√©todo](https://developers.google.com/workspace/gmail/api/reference/rest/v1/users.messages/get?hl=pt-br): A√ß√£o que voc√™ quer executar, por exemplo, GET (listar), POST (criar) ou DELETE (remover).

- Par√¢metros: S√£o as informa√ß√µes adicionais da requisi√ß√£o, por exemplo, maxResults=32.

- Autentica√ß√£o: Prova quem voc√™ √©, por exemplo, Token OAuth 2.0.

- Resposta: Dados retornados pela API, geralmente em formato JSON.

O fluxo b√°sico envolve :

1. Criar um projeto no Google Cloud Console

2. Ativar a Gmail API

3. Configurar a tela de consentimento OAuth

4. Criar credenciais (cliente OAuth 2.0)

5. Implementar o fluxo de autentica√ß√£o no seu app

Nesse texto ser√° mostrado todas essas componentes e mostrado como se trabalha com a API do Gmail.


## [Prepara√ß√£o do Ambiente](https://developers.google.com/workspace/gmail/api/quickstart/python?hl=pt-br)


Para iniciar o fluxo de autentica√ß√£o e de autoriza√ß√£o √© necess√°rio:

- Python 3.10.7 ou mais recente
- A ferramenta de gerenciamento de pacotes pip
- Uma Conta do Google com o Gmail ativado.
- Um projeto do Google Cloud.

### 1. Como criar um projeto no google cloud

Esse projeto organizar√° as APIs que voc√™ usa, as credenciais de acesso e o faturamento.


1. Com seu gmail logado, acesse [Google Cloud](https://console.cloud.google.com/)

2. No topo da p√°gina, ao lado direito do logotipo do Google Cloud, clique no seletor de projetos (que pode estar escrito "Selecione um projeto" ou mostrando o nome de um projeto atual) . No menu que abrir, clique em "Novo Projeto".

3. Configure os Detalhes do Projeto:

- Uma tela chamada "Novo Projeto" ser√° exibida. Preencha os campos :

  - Nome do projeto: Escolha um nome descritivo (ex: "Meu Projeto Gmail API"). √â com esse nome que voc√™ o identificar√° no console.

  - Local (Organiza√ß√£o): Se sua conta estiver associada a uma organiza√ß√£o, voc√™ poder√° escolher uma pasta. Para uso pessoal, a op√ß√£o "Sem organiza√ß√£o" √© a mais comum.

O ID do Projeto ser√° gerado automaticamente a partir do nome, mas voc√™ pode clicar em "Editar" para personaliz√°-lo. Aten√ß√£o: este ID √© √∫nico e n√£o poder√° ser alterado depois .

4. Clique no bot√£o "Criar". 

5. Selecione o Novo Projeto: Ap√≥s a cria√ß√£o, uma notifica√ß√£o aparecer√°. Clique em "Selecionar projeto" para ser redirecionado para o painel do seu novo projeto . Verifique se o nome do seu projeto est√° vis√≠vel no seletor de projetos no topo da p√°gina (Ao lado direito do logotipo do google cloud).

### 2. Ativa√ß√£o da API

√â necess√°rio ativar a API para que o script Python consiga se conectar com o Gmail.



Dentro do seu [projeto](https://console.cloud.google.com/apis/enableflow?apiid=gmail.googleapis.com&hl=pt-br), v√° em ** "APIs e Servi√ßos" > "Biblioteca"**

Procure por "Gmail API" e clique em "Ativar"

### 3. Consentimento OAuth

√â necess√°rio ativar a tela de consentimento OAuth para que a API do Gmail de identifique quando necess√°rio.

Na barra lateral esquerda do Google Cloud Platform clique em  *"APIs e Servi√ßos" > "Tela de consentimento OAuth"*.

Escolha "Interno" e preencha as informa√ß√µes b√°sicas como o nome do app, e-mail de suporte,

### 4. Cria√ß√£o das Credenciais

As credenciais identificam seu script para o Google, permitindo que ele solicite autoriza√ß√£o do usu√°rio para acessar os dados do Gmail. Sem ele, o fluxo de autentica√ß√£o OAuth 2.0 n√£o pode ser iniciado, pois o Google n√£o sabe qual aplicativo est√° pedindo acesso. 

Com credentials.json seu script consegue pedir autoriza√ß√£o, gerar o token.json e finalmente acessar a API. √â como um documento de identidade do seu aplicativo.

Na mesma tela, "APIs e Servi√ßos", v√° em:

**"Credenciais" e clique em "+ Criar Credenciais" > "ID do cliente OAuth"**

Escolha "Aplicativo da Web" e adicione um nome.

Ap√≥s criar, baixe o arquivo JSON. 

Renomeie esse arquivo para credentials.json e coloque-o na raiz do seu projeto. 

√â este arquivo que seu c√≥digo l√™ quando chama 

```bash 
InstalledAppFlow.from_client_secrets_file()
```

## 5 .Cria√ß√£o do script Python 

[Fonte](https://developers.google.com/workspace/gmail/api/quickstart/python?hl=pt-br)

Inicie instalando a biblioteca de cliente do Google para o Python.

Digite em seu terminal:

```bash
python3 -m pip install --upgrade google-api-python-client google-auth-httplib2 google-auth-oauthlib
```

### Script de fluxo de autentica√ß√£o e autoriza√ß√£o

In [None]:
import os.path
from pathlib import Path
from google.auth.transport.requests import Request
from google.oauth2.credentials import Credentials
from google_auth_oauthlib.flow import InstalledAppFlow
from googleapiclient.discovery import build
from googleapiclient.errors import HttpError
import base64



In [None]:
# O escopo concede ao seu aplicativo acesso somente leitura a todos os recursos da caixa de correio do usu√°rio. 
# Com ele, seu script pode listar e-mails e seus IDs, baixar mensagens e seus metadados, 
# mas n√£o pode enviar ou excluir mensagens.
# Obs: Se modificar os escopos, exclua o arquivo token.json.
SCOPES = ["https://www.googleapis.com/auth/gmail.readonly"] # Acesso somente leitura √† caixa de correio do usu√°rio

"""Mostra o uso b√°sico da API do Gmail."""
  

creds = None

# O arquivo token.json armazena as credenciais de acesso do usu√°rio. 
# Ele √© criado automaticamente quando o fluxo de autoriza√ß√£o √© conclu√≠do pela primeira vez.
if os.path.exists("token.json"):
    creds = Credentials.from_authorized_user_file("token.json", SCOPES)

# Se as credenciais forem inv√°lidas ou expiradas, solicita login do usu√°rio.
if not creds or not creds.valid:
    if creds and creds.expired and creds.refresh_token:
        creds.refresh(Request())
    else:
        flow = InstalledAppFlow.from_client_secrets_file(
        "credentials.json", SCOPES
        )
        creds = flow.run_local_server(port=0)

# Salva as credenciais para a pr√≥xima execu√ß√£o
    with open("token.json", "w") as token:
        token.write(creds.to_json())

try:
# Chama a API do Gmail
    service = build("gmail", "v1", credentials=creds)

except HttpError as error:
    print(f"An error occurred: {error}")

#### Automatiza√ß√£o da autentica√ß√£o

O script de autentica√ß√£o e autoriza√ß√£o pode ser automatizado da seguinte forma:

In [None]:

# Escopos de acesso/ExtractEmais.py
SCOPES = ["https://www.googleapis.com/auth/gmail.readonly"]

# Defini√ß√£o dos caminhos (ajuste se necess√°rio)

TOKEN = "token.json"
CREDENTIAL = "credential.json"
DIRETORIO_RAIZ = Path.cwd()
PROCESSED_IDS_PATH = DIRETORIO_RAIZ / "data"
PROCESSED_ATTACHMENTS_PATH = PROCESSED_IDS_PATH / "attachments"
PROCESSED_IDS_FILE="processed_ids.json"

def get_gmail_service():
    """Autentica e retorna o servi√ßo da Gmail API."""
    creds = None

    # Carrega token existente, se houver
    if os.path.exists(TOKEN):
        creds = Credentials.from_authorized_user_file(TOKEN, SCOPES)

    # Se n√£o h√° credenciais v√°lidas, faz login
    if not creds or not creds.valid:
        if creds and creds.expired and creds.refresh_token:
            creds.refresh(Request())
        else:
            flow = InstalledAppFlow.from_client_secrets_file(
            "credentials.json", SCOPES
            )
            creds = flow.run_local_server(port=0)

        # Salva o token para a pr√≥xima execu√ß√£o
        with open(TOKEN, "w") as token:
            token.write(creds.to_json())

    try:
        # Testa a autentica√ß√£o listando as labels
        service = build("gmail", "v1", credentials=creds)
        service.users().labels().list(userId="me").execute()
        print("Autentica√ß√£o bem-sucedida!")
        return service
    except HttpError as error:
        print(f"Falha ao autenticar o servi√ßo do Gmail: {error}")
        return None

A partir de agora, para autenticar o servi√ßo, basta todar o comando abaixo.

In [None]:
get_gmail_service()

### [Listar Mensagens](https://developers.google.com/workspace/gmail/api/guides/list-messages?hl=pt-br)

O m√©todo list tem como principal objetivo retornar uma lista de IDs de mensagens que est√£o na caixa de correio do usu√°rio.

**users.messages.list** √© compat√≠vel com v√°rios par√¢metros de consulta para filtrar as mensagens:

- **maxResults**: n√∫mero m√°ximo de mensagens a serem retornadas (o padr√£o √© 100, e o m√°ximo √© 500).
- **pageToken**: token para recuperar uma p√°gina espec√≠fica de resultados.
- **q**: string de consulta para filtrar mensagens, como from:someuser@example.com is:unread".
- **labelIds**: retorna apenas mensagens com r√≥tulos que correspondem a todos os IDs de r√≥tulo especificados.
- **includeSpamTrash**: inclua mensagens de SPAM e TRASH nos resultados.

Quando voc√™ lista os emails de uma caixa de entrada, usando o m√©todo list, voc√™ recebe apenas metadados b√°sicos e os IDs. Para obter o conte√∫do completo de um email (assunto, corpo, anexos, etc...), voc√™ precisa chamar o m√©todo get para cada ID de interesse. 

Saiba mais sobre:

* O m√©todo get [aqui](https://developers.google.com/workspace/gmail/api/reference/rest/v1/users.messages/list?hl=pt-br)

* Como pesquisar mensagens [aqui](https://developers.google.com/workspace/gmail/api/guides/filtering?hl=pt-br)

* Como criar filtro de e-mails [aqui](https://support.google.com/mail/answer/7190?hl=pt-br)

* O m√©todo list [aqui](https://developers.google.com/workspace/gmail/api/reference/rest/v1/users.messages/get?hl=pt-br)

In [None]:
 # Lista os r√≥tulos da caixa de correio do usu√°rio.    
results_labels = service.users().labels().list(userId="me").execute()

print(f'Resultados: {results_labels}')

# Obt√©m a lista de r√≥tulos. Se n√£o houver r√≥tulos, a lista ser√° vazia.
labels = results_labels.get("labels", [])
if labels:
    print("Labels:")

    for label in labels:
        print(label["name"])
else:
    print("No labels found.")    

In [None]:
results_messages = service.users().messages().list(userId="me").execute()
mensagens = results_messages.get("messages", [])

# print('Resultados')
# if results_messages:
#     for message in mensagens:
#         print(message["id"])
# else:
#     print("No messages found.")

```bash
results_messages = service.users().messages().list(userId="me").execute()
mensagens = results_messages.get("messages", [])

print('Resultados')
if results_messages:
    for message in mensagens:
        print(message["id"])
else:
    print("No messages found.")
```

Output:

Resultados
19c8a6ed637e6bcf
19c8a50e83be0949
19c8a6b336e6331d
19c8925a2630ab71
19c882c8f6c09c78
19c87e51cf29d446
19c87cc42c9a343f


* *page_token = results.get('nextPageToken')*

page_token √© o id da p√°gina de e-mail.
A vari√°vel page_token controla o loop. Ela come√ßa como None e √© atualizada a cada itera√ß√£o com o nextPageToken vindo da API

In [None]:
page_token = None
results=service.users().messages().list(
                userId='me',
                pageToken=page_token #token para controle de pagina√ß√£o
            ).execute()

page_token = results.get('nextPageToken')
print(f'Pr√≥xima p√°gina: {page_token}')

O script abaixo mostra o token das primeiras 10 p√°ginas do e-mail.

In [None]:
page_token = None
contador = 0
maxResults = 10 # Defina o n√∫mero m√°ximo de p√°ginas que deseja percorrer
while contador<maxResults:  
    results=service.users().messages().list(
                    userId='me',
                    maxResults=maxResults,
                    pageToken=page_token #token para controle de pagina√ß√£o
                ).execute()
    print(f'Pr√≥xima p√°gina: {page_token}')
    page_token = results.get('nextPageToken')
    contador+=1


#### Automatiza√ß√£o da sele√ß√£o dos Ids dos de e-mails filtrados

In [None]:
def fetch_email_ids(service, days_back=None, max_results=None, has_attachments=None, from_email=None):
    """
    Busca IDs de e-mails da caixa de entrada com filtros opcionais.
    
    Args:
        service: Servi√ßo autenticado da Gmail API.
        days_back: N√∫mero de dias para tr√°s (se None, busca todos).
        max_results: N√∫mero m√°ximo de IDs a retornar (se None, busca todos via pagina√ß√£o).
        has_attachments: Se True, filtra apenas e-mails com anexos.
    
    Returns:
        Lista de IDs (strings).
    """
    
    # Pinta os filtros aplicados
    print(f'''
          Filtros aplicados: 
          - days_back={days_back} dias, 
          - max_results={max_results}, 
          - has_attachments={has_attachments}, 
          - from_email={from_email}
          ------------------------''')
    
    # Verifica se o servi√ßo foi autenticado corretamente
    if service is None:
        print("Servi√ßo n√£o dispon√≠vel.")
        return []

    all_ids = [] # Lista para armazenar os IDs coletados
    page_token = None # Token para controle de pagina√ß√£o, inicia como None para a primeira p√°gina
    query_parts = ["in:inbox"] # Come√ßa a query buscando apenas na caixa de entrada

    # Aplica os filtros √† query
    # Se os comandos abaixo forem fornecidos, adiciona o respectivo filtro em query_parts
    if days_back is not None:
        query_parts.append(f"newer_than:{days_back}d")

    if has_attachments=='True':
        query_parts.append("has:attachment")

    if has_attachments=='False':
        query_parts.append("-has:attachment")
    
    if from_email is not None:
        query_parts.append(f"from:{from_email}")

    # Une os filtros em uma √∫nica string de consulta
    query = " ".join(query_parts)

    # Define o tamanho da p√°gina (m√°x 500, ou o limite solicitado se menor)
    page_size = 500
    if max_results is not None and max_results < page_size:
        page_size = max_results

    # Loop para buscar p√°ginas de resultados at√© atingir o m√°ximo desejado ou n√£o haver mais p√°ginas
    while True:
        try:
            # Faz a chamada √† API para listar mensagens com os filtros e pagina√ß√£o
            results = service.users().messages().list(
                userId='me',
                q=query if query else None,
                maxResults=page_size,
                pageToken=page_token #token para controle de pagina√ß√£o
            ).execute()
        
        # Se ocorrer um erro na chamada da API, imprime o erro e interrompe o loop    
        except HttpError as error:
            print(f"Erro na chamada da API: {error}")
            break
        
        messages = results.get('messages', [])
        if messages: # Se houver mensagens nesta p√°gina, extrai os IDs e adiciona √† lista total
            page_ids = [msg['id'] for msg in messages]
            all_ids.extend(page_ids)

        # Se j√° atingimos o m√°ximo desejado, p√°ra
        if max_results is not None and len(all_ids) >= max_results:
            all_ids = all_ids[:max_results]
            break
        
        if len(all_ids)==0:
            print("Nenhum e-mail encontrado com os filtros aplicados.")
            break

        # Verifica se h√° mais p√°ginas
        page_token = results.get('nextPageToken')
        if not page_token:
            break

        # Ajusta o page_size para n√£o exceder o restante necess√°rio
        if max_results is not None:
            remaining = max_results - len(all_ids)
            page_size = min(500, remaining)
    return all_ids

In [None]:
# ID dos primeiros 5 e-mails da caixa de entrada    
fetch_email_ids(service, max_results=5)

In [None]:
#  ID dos primeiros 10 e-mails com anexos                                                                                               
fetch_email_ids(service, max_results=2000, has_attachments='True')                                                        

In [None]:
# ID dos primeiros 10 e-mails com anexos nos √∫ltimos 3 dias. 
# Observe que n√£o h√° 10 e-mails com anexos nos √∫ltimos 3 dias, ent√£o o resultado ser√° menor que 10.
fetch_email_ids(service, max_results=10, has_attachments='True', days_back=3) 

In [None]:
# Mostra os IDs dos primeiros 2 e-mails com anexos do remetente contadigital@mhnet.com.br
fetch_email_ids(service, max_results=2, has_attachments='True', from_email='contadigital@mhnet.com.br')

In [None]:
# Mostra os IDs dos primeiros 2 e-mails com anexos do remetente blabla@email.com.br
fetch_email_ids(service, max_results=2, has_attachments='True', from_email='blabla@email.com.br')

A pr√≥xima etapa consiste em automatizar o salvamento dos ids processados

In [None]:
def save_processed_ids(processed_ids):
    """Salva o conjunto de IDs processados no arquivo JSON."""
    
    # Garante que o diret√≥rio existe
    PROCESSED_IDS_PATH.mkdir(parents=True, exist_ok=True)
    
    with open(os.path.join(PROCESSED_IDS_PATH, PROCESSED_IDS_FILE), 'w') as f:
        json.dump(list(processed_ids), f, indent=2)
    
    print(f"IDs salvos em {PROCESSED_IDS_PATH / PROCESSED_IDS_FILE}")


#### Downloads dos anexos

In [None]:
message_id = '19b93601d5b274f6'  # Substitua pelo ID do e-mail que deseja baixar
# gera um dict em que as chaves s√£o: 'id', 'threadId', 'labelIds', 'snippet', 'historyId', 'internalDate', 'payload', 'sizeEstimate', 'raw' (nem todas as mensagens ter√£o a chave 'raw')
message = service.users().messages().get(
            userId='me',
            id=message_id,
            format='full'
        ).execute()
message.keys()

In [None]:
# Recebe o conte√∫do da mensagem em formato de dict em que as chaves s√£o: 
# 'partId', 'mimeType', 'filename', 'headers', 'body', 'parts' (nem todas as mensagens ter√£o a chave 'parts')
message.get('payload', {}).keys()

In [None]:
# Recebe a lista de partes da mensagem (se houver). 
# Cada parte √© um dict com as chaves mencionadas acima.
message.get('payload', {}).get('parts', [])

In [None]:
# Para cada parte do Id, verifica se h√° um anexo e, se houver, 
# baixa o anexo usando o ID da mensagem e o ID do anexo.
attachment=service.users().messages().attachments().get(
                    userId='me',
                    messageId=message_id,
                    id='ANGjdJ-aSQjOp7FaOdEPfVbPiHuuX_Y7VDYrc3eCiKDi7ZIFJtG3_UywVOdoz8v0Y-niCHHkHWisVBoF5o6XwHWwxndI2EIXgCzY4SAWo2jhT2C-Y0-ZH1nmQu_cEG-v7ph2GxyLKSCpDXTZUXgef0VagpPsqjnfxucijfibyIrDFXIvI0zd639Dx2SpUi9g8BQugtQodEJK1q_MIUjQC7p5bRLTgY7xLSarwabdEXb1KyniJeio6L-UxpSG4DpKsW91_mR9PS8cGr_M5HVIMn1b8VEIQezLEL622hsRiLD7jiAmNxLg_v9aoQ8nXPLom2LbH0U8q05k_ZB6DntV5P2Fib0OYzicinofkH_B6zsAi5D9ybjLOig_OloPJZf6AiH92i82zkIaMkwXUGoJooztu4QM-qEEMcetA'
                ).execute()

In [None]:
# O conte√∫do do anexo √© codificado em base64, 
# ent√£o precisamos decodific√°-lo para obter os bytes originais do arquivo.
base64.urlsafe_b64decode(attachment['data'])

In [None]:
downloaded_files = []
parts = message.get('payload', {}).get('parts', [])

In [None]:
for part in parts:

    # Verifica se h√° um um anexo
    if 'filename' in part and part['filename']: 
        filename = part['filename']
        
        # Constr√≥i caminho seguro para o arquivo, 
        # trocando caracteres inv√°lidos por sublinhados
        safe_filename = filename.replace('/', '_').replace('\\', '_')
        filepath = os.path.join(PROCESSED_ATTACHMENTS_PATH, safe_filename)
        print(f"Arquivo seguro: {filepath}")
        
        # Evita sobrescrever arquivos com nomes iguais
        if os.path.exists(filepath):
            base, ext = os.path.splitext(safe_filename) # Separa o nome do arquivo e a extens√£o
            counter = 1
            while os.path.exists(filepath):
                new_filename = f"{base}_{counter}{ext}"
                filepath = os.path.join(PROCESSED_ATTACHMENTS_PATH, new_filename)
                counter += 1
                
        # Obt√©m o attachmentId
        if 'body' in part and 'attachmentId' in part['body']:
            # Pega o ID do anexo para baixar o arquivo posteriormente
            attachment_id = part['body']['attachmentId']
            
            try:
                # 4. Baixa o anexo usando attachments().get()
                attachment = service.users().messages().attachments().get(
                    userId='me',
                    messageId=message_id,
                    id=attachment_id
                ).execute()
                
                # 5. Decodifica os dados baixados do anexo(base64url) 
                file_data = base64.urlsafe_b64decode(attachment['data'])
                
                # 6. Salva o arquivo
                with open(filepath, 'wb') as f:
                    f.write(file_data)
                
                print(f"Anexo salvo: {filepath}")
                downloaded_files.append(filepath)
            except HttpError as e:
                print(f"  Erro ao baixar anexo {filename}: {e}")
            except Exception as e:
                print(f"  Erro inesperado ao baixar {filename}: {e}")

In [None]:
# Caminho para salvar os IDs filtrados, cria a pasta "filtered_ids" se n√£o existir.
caminho = PROCESSED_IDS_PATH / "filtered_ids"
print("Criando em:", caminho)
caminho.mkdir(parents=True, exist_ok=True)

In [None]:
def process_parts(parts, parent_path=""):

    if not parts:
        return

    for part in parts:
        # Verifica se esta parte tem filename (√© um anexo)
        if 'filename' in part and part['filename']:
            filename = part['filename']
            
            # Constr√≥i caminho seguro para o arquivo
            safe_filename = filename.replace('/', '_').replace('\\', '_')
            filepath = os.path.join(download_dir, safe_filename)
            
            # Evita sobrescrever arquivos com nomes iguais
            if os.path.exists(filepath):
                base, ext = os.path.splitext(safe_filename)
                counter = 1
                while os.path.exists(filepath):
                    new_filename = f"{base}_{counter}{ext}"
                    filepath = os.path.join(download_dir, new_filename)
                    counter += 1
            
            # Obt√©m o attachmentId
            if 'body' in part and 'attachmentId' in part['body']:
                attachment_id = part['body']['attachmentId']
                
                try:
                    # 4. Baixa o anexo usando attachments().get()
                    attachment = service.users().messages().attachments().get(
                        userId='me',
                        messageId=message_id,
                        id=attachment_id
                    ).execute()
                    
                    # 5. Decodifica os dados (base64url) 
                    file_data = base64.urlsafe_b64decode(attachment['data'])
                    
                    # 6. Salva o arquivo
                    with open(filepath, 'wb') as f:
                        f.write(file_data)
                    
                    print(f"  ‚úÖ Anexo salvo: {filepath}")
                    downloaded_files.append(filepath)
                    
                except HttpError as e:
                    print(f"  Erro ao baixar anexo {filename}: {e}")
                except Exception as e:
                    print(f"  Erro inesperado ao baixar {filename}: {e}")
        
        # Processa recursivamente subpartes (mensagens com partes aninhadas)
        if 'parts' in part:
            process_parts(part['parts'], parent_path)

In [None]:
message = service.users().messages().get(
            userId='me',
            id=message_id,
            format='full'
        ).execute()


A fun√ß√£o que ser√° definida a seguir download_attachment, baixa todos os anexos de uma mensagem espec√≠fica do Gmail e salva no diret√≥rio *attachments*

In [None]:
def download_attachments(service, message_id, download_dir="attachments"):
    """
    Baixa todos os anexos de uma mensagem espec√≠fica do Gmail.
    
    Args:
        service: Servi√ßo autenticado da Gmail API.
        message_id: ID da mensagem (string).
        download_dir: Diret√≥rio onde salvar os anexos (padr√£o: "attachments").
    
    Returns:
        Lista de caminhos dos arquivos baixados (strings).
    """
    downloaded_files = []
    
    try:
        # 1. Obt√©m a mensagem completa com formato 'full' para ter acesso aos parts
        message = service.users().messages().get(
            userId='me',
            id=message_id,
            format='full'
        ).execute()
        
        # 2. Cria o diret√≥rio de download se n√£o existir
        Path(download_dir).mkdir(parents=True, exist_ok=True)

        # 3. Processa as partes da mensagem para encontrar anexos
        process_parts(parts, parent_path="")  

        # Inicia o processamento a partir do payload principal
        # payload √© a parte da mensagem que cont√©m todo o conte√∫do √∫til do e-mail
        if 'payload' in message:
            payload = message['payload']
            
            # Se o payload principal j√° for um anexo
            if 'filename' in payload and payload['filename']:
                process_parts([payload])
            # Se tiver partes, processa-as
            elif 'parts' in payload:
                process_parts(payload['parts'])
        
        return downloaded_files
    
    except HttpError as error:
        print(f"Erro na API ao processar mensagem {message_id}: {error}")
        return []
    except Exception as error:
        print(f"Erro inesperado: {error}")
        return []
        

In [None]:
def download_attachments(service, message_id, download_dir="attachments"):
    """
    Baixa todos os anexos de uma mensagem espec√≠fica do Gmail.
    
    Args:
        service: Servi√ßo autenticado da Gmail API.
        message_id: ID da mensagem (string).
        download_dir: Diret√≥rio onde salvar os anexos (padr√£o: "attachments").
    
    Returns:
        Lista de caminhos dos arquivos baixados (strings).
    """
    downloaded_files = []
    
    try:
        # 1. Obt√©m a mensagem completa com formato 'full' para ter acesso aos parts
        message = service.users().messages().get(
            userId='me',
            id=message_id,
            format='full'
        ).execute()
        
        # 2. Cria o diret√≥rio de download se n√£o existir
        Path(download_dir).mkdir(parents=True, exist_ok=True)
        
        # 3. Fun√ß√£o recursiva para percorrer as partes da mensagem
        def process_parts(parts, parent_path=""): # parts inicialmente √© message.get('payload', {}).get('parts', [])
            nonlocal downloaded_files
            
            if not parts:
                return
            
            for part in parts:
                # Verifica se esta parte tem filename (√© um anexo)
                if 'filename' in part and part['filename']:
                    filename = part['filename']
                    
                    # Constr√≥i caminho seguro para o arquivo
                    safe_filename = filename.replace('/', '_').replace('\\', '_')
                    filepath = os.path.join(download_dir, safe_filename)
                    
                    # Evita sobrescrever arquivos com nomes iguais
                    if os.path.exists(filepath):
                        base, ext = os.path.splitext(safe_filename)
                        counter = 1
                        while os.path.exists(filepath):
                            new_filename = f"{base}_{counter}{ext}"
                            filepath = os.path.join(download_dir, new_filename)
                            counter += 1
                    
                    # Obt√©m o attachmentId
                    if 'body' in part and 'attachmentId' in part['body']:
                        attachment_id = part['body']['attachmentId']
                        
                        try:
                            # 4. Baixa o anexo usando attachments().get()
                            attachment = service.users().messages().attachments().get(
                                userId='me',
                                messageId=message_id,
                                id=attachment_id
                            ).execute()
                            
                            # 5. Decodifica os dados (base64url) 
                            file_data = base64.urlsafe_b64decode(attachment['data'])
                            
                            # 6. Salva o arquivo
                            with open(filepath, 'wb') as f:
                                f.write(file_data)
                            
                            print(f"  ‚úÖ Anexo salvo: {filepath}")
                            downloaded_files.append(filepath)
                            
                        except HttpError as e:
                            print(f"  Erro ao baixar anexo {filename}: {e}")
                        except Exception as e:
                            print(f"  Erro inesperado ao baixar {filename}: {e}")
                
                # Processa recursivamente subpartes (mensagens com partes aninhadas)
                if 'parts' in part:
                    process_parts(part['parts'], parent_path)
        
        # Inicia o processamento a partir do payload principal
        if 'payload' in message:
            payload = message['payload']
            
            # Se o payload principal j√° for um anexo
            if 'filename' in payload and payload['filename']:
                process_parts([payload])
            # Se tiver partes, processa-as
            elif 'parts' in payload:
                process_parts(payload['parts'])
        
        return downloaded_files
        
    except HttpError as error:
        print(f"Erro na API ao processar mensagem {message_id}: {error}")
        return []
    except Exception as error:
        print(f"Erro inesperado: {error}")
        return []

In [None]:
from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
import json

In [None]:
def main():
   
    parser = ArgumentParser(
        description='Extrai e-mails da caixa de entrada do Gmail e os salva em um arquivo JSON.',
        formatter_class=ArgumentDefaultsHelpFormatter
    )

    parser.add_argument(
        '--max_results',
        type=int,
        default=None,
        help='N√∫mero m√°ximo de e-mails a processar (padr√£o: todos)'
    )

    parser.add_argument(
        '--days_back',
        type=int,
        default=1,
        help='N√∫mero de dias para tr√°s a partir da data atual para buscar e-mails (padr√£o: todos)'
    )

    parser.add_argument(
        '--has_attachments',
        choices=['True', 'False'],
        default=True,
        help='True: apenas com anexos. False: apenas sem anexos. Omitido sem filtro (padr√£o: nenhum filtro)'
    )

    parser.add_argument(
        '--download_dir',
        type=str,
        default="attachments",
        help='Diret√≥rio onde os anexos ser√£o salvos (padr√£o: diret√≥rio atual)'
    )

    parser.add_argument(
        '--from_email',
        type=str,
        default=None,
        help='E-mail do remetente (padr√£o: nenhum filtro)'
    )

    args = parser.parse_args()
    print(f"Argumentos recebidos: {args}")
    # Obt√©m servi√ßo autenticado
    service = get_gmail_service()
    print(f"Servi√ßo do Gmail obtido: {'Sim' if service else 'N√£o'}")
    if service is None:
        print("N√£o foi poss√≠vel autenticar o servi√ßo do Gmail. Verifique as credenciais e tente novamente.")
        return  # encerra se n√£o conseguiu autenticar

    # Busca os IDs com os filtros
    print("\nüîç Buscando IDs de e-mails com os filtros aplicados...")
    print(f"args.has_attachments = {args.has_attachments}")
    ids = fetch_email_ids(
        service,
        days_back=args.days_back,
        max_results=args.max_results,
        has_attachments=args.has_attachments,
        from_email=args.from_email  
    )

    print(f"args.has_attachments = {args.has_attachments}")

    print(f"\n Total de IDs encontrados: {len(ids)}")

    if ids:
        # Exemplo: salva os IDs processados
        save_processed_ids(ids)
        # Voc√™ pode adicionar aqui o processamento desejado
    else:
        print("Nenhum ID encontrado com os filtros atuais.")

    if ids and args.download_dir is not None:
        print("\nüì• Baixando anexos...")
        all_downloaded = []
        
        for i, msg_id in enumerate(ids, 1):
            print(f"\nProcessando e-mail {i}/{len(ids)} (ID: {msg_id})")
            downloaded = download_attachments(
                service, 
                msg_id, 
                download_dir=args.download_dir
            )
            all_downloaded.extend(downloaded)
            
            # Pequena pausa para n√£o sobrecarregar a API
            if i < len(ids):
                time.sleep(0.5)
        
        print(f"\n Total de anexos baixados: {len(all_downloaded)}")
    
    # Salva os IDs processados (opcional)
    save_processed_ids(ids)

In [None]:
main()

#