**Modelo de projeto final**

Abaixo segue um modelo de projeto final. A ideia é ter uma seção inicial que explica o seu projeto e células de markdown, precedentes a cada célula, que explicam o código que se segue.

Um usuário deve ser capaz de rodar todas as células (`Kernel > Restart Kernel and Run All Cells`) e obter uma saída no final (as células não devem ser executadas fora de ordem e não devem gerar erros).

**Dicas**
- Destrinche o seu projeto em partes menores: se você tem um relatório de 100 páginas, tente automatizar uma página de início.
- Escolha suas batalhas: use a IA para obter respostas, mas escolha uma ou duas coisas as quais você vai se aprofundar e aprender mais.
- Salve versões: antes de fazer uma grande alteração em algo que já está funcionando, faça uma cópia de segurança do seu notebook (projeto_v1.ipynb, projeto_v2.ipynb). Ter um "ponto de restauração" seguro te dará a confiança para experimentar e testar novas abordagens sem o medo de perder seu progresso.

# Projeto Final: Geração Automatizada do Boletim de Câmbio

## Objetivo do Projeto
Este notebook é um projeto completo que demonstra um pipeline de automação de relatórios. Nosso objetivo é criar um boletim diário sobre a cotação do Dólar PTAX (venda) de forma 100% automatizada.

O pipeline seguirá 4 etapas, integrando todo o conhecimento do curso:

- Coleta (API): Conectar-nos à API de Séries Temporais do Banco Central (BCB) para buscar os dados de câmbio mais recentes.

- Análise (Pandas): Carregar os dados em um DataFrame do Pandas para limpar, tratar e calcular indicadores-chave (máximo, mínimo, média, valor recente).

- Visualização (Seaborn/IO): Gerar um gráfico da evolução da taxa de câmbio com o Seaborn e salvá-lo diretamente na memória (usando io.BytesIO), sem criar arquivos temporários.

- Relatório (docxtpl): Carregar um template .docx e preenchê-lo dinamicamente com os indicadores, textos e o gráfico gerado, criando um relatório final pronto para distribuição.

## Passo 0: Configuração do Ambiente

In [3]:
# Célula para instalação de bibliotecas, se necessário
!pip install docxtpl docx requests pandas seaborn matplotlib -q
print("Bibliotecas prontas.")

Bibliotecas prontas.


In [4]:
# --- Importação das Bibliotecas ---

# Para requisições de API
import requests

# Para manipulação e análise de dados
import pandas as pd

# Para visualização de dados
import seaborn as sns
import matplotlib.pyplot as plt

# Para salvar imagens em memória
import io 

# Para lidar com datas e períodos de tempo
from datetime import datetime, timedelta

# Para automação do Word (docxtpl)
from docxtpl import DocxTemplate, InlineImage
from docx.shared import Mm # Para definir o tamanho da imagem em milímetros

print("Todas as ferramentas foram importadas com sucesso.")

Todas as ferramentas foram importadas com sucesso.


## Passo 1: Coleta de Dados (API do BCB)
Nossa primeira tarefa é buscar os dados atualizados. Vamos definir um período (últimos 90 dias) e construir a URL correta para consultar a API de Séries Temporais do Banco Central.

Usamos um bloco try...except para garantir que nosso script lide de forma robusta com possíveis falhas de conexão ou erros da API.

In [6]:
# --- Parte I: Coleta e Tratamento de Dados (BCB API + Pandas) ---

print("Iniciando pipeline...")
try:
    # Passo 1.1: Definir o período e buscar os dados da API
    print("Buscando dados da API do Banco Central do Brasil...")
    data_final_dt = datetime.now()
    data_inicial_dt = data_final_dt - timedelta(days=90) # Analisaremos os últimos 90 dias

    # Formatando as datas para o padrão que a API espera (MM-dd-yyyy ou dd/MM/yyyy)
    # Vamos usar o formato dd/MM/YYYY, que é mais comum no BCB
    data_inicial_str = data_inicial_dt.strftime('%d/%m/%Y')
    data_final_str = data_final_dt.strftime('%d/%m/%Y')

    # O código '1' corresponde à série "Dólar americano (venda) - PTAX"
    codigo_serie_bcb = '1'
    url = (
        f'https://api.bcb.gov.br/dados/serie/bcdata.sgs.{codigo_serie_bcb}/dados?'
        f'formato=json&dataInicial={data_inicial_str}&dataFinal={data_final_str}'
    )
    
    print(f"URL da API consultada: {url}")
    
    response = requests.get(url)
    response.raise_for_status()  # Gera um erro se a requisição falhar (ex: erro 404 ou 500)
    
    dados_api = response.json() # Convertemos a resposta JSON em uma lista de dicionários
    
    print(f"Sucesso! {len(dados_api)} registros de câmbio recebidos.")

except requests.exceptions.RequestException as e:
    print(f"Erro Crítico: Falha ao acessar a API do BCB: {e}")
    # Em um projeto real, poderíamos parar o script aqui ou enviar um e-mail de alerta

Iniciando pipeline...
Buscando dados da API do Banco Central do Brasil...
URL da API consultada: https://api.bcb.gov.br/dados/serie/bcdata.sgs.1/dados?formato=json&dataInicial=18/06/2025&dataFinal=16/09/2025
Sucesso! 64 registros de câmbio recebidos.


## Passo 2: Tratamento e Análise (Pandas)
Os dados da API vêm como uma lista de dicionários (JSON). Usaremos o Pandas para converter essa lista em uma tabela (DataFrame), o que facilita enormemente a limpeza e a análise dos dados.

Vamos converter as colunas para os tipos corretos (números e datas) e calcular nossos indicadores-chave.

In [8]:
if dados_api: # Só continuamos se a API tiver retornado dados
    print("Iniciando tratamento dos dados com Pandas...")
    
    # Passo 2.1: Carregar dados no DataFrame
    df = pd.DataFrame(dados_api)

    # Passo 2.2: Limpeza e conversão de tipos
    # Os valores da API vêm como string; convertemos para numérico (float)
    df['valor'] = pd.to_numeric(df['valor'])
    # As datas vêm como string dd/MM/yyyy; convertemos para o tipo datetime
    df['data'] = pd.to_datetime(df['data'], format='%d/%m/%Y')
    
    # Renomeando colunas para clareza
    df = df.rename(columns={'valor': 'taxa_ptax_venda'})

    # Passo 2.3: Cálculos dos indicadores para o relatório
    cotacao_maxima = df['taxa_ptax_venda'].max()
    cotacao_minima = df['taxa_ptax_venda'].min()
    cotacao_media = df['taxa_ptax_venda'].mean()
    cotacao_recente = df['taxa_ptax_venda'].iloc[-1] # Pega o último valor da série

    print("Dados tratados e indicadores calculados:")
    print(df.tail()) # Mostra os últimos 5 registros
    print(f"Máx: {cotacao_maxima} | Mín: {cotacao_minima} | Recente: {cotacao_recente}")

Iniciando tratamento dos dados com Pandas...
Dados tratados e indicadores calculados:
         data  taxa_ptax_venda
59 2025-09-10           5.4123
60 2025-09-11           5.3858
61 2025-09-12           5.3677
62 2025-09-15           5.3208
63 2025-09-16           5.3096
Máx: 5.6034 | Mín: 5.3096 | Recente: 5.3096


## Passo 3: Geração de Conteúdo Dinâmico (Texto e Gráfico)
Com nossos indicadores calculados, agora podemos gerar os "ingredientes" finais para o relatório: um parágrafo de resumo (usando f-string) e um gráfico (usando Seaborn).

Para evitar salvar um arquivo .png temporário no disco, salvaremos o gráfico diretamente em um "arquivo virtual" na memória RAM usando a biblioteca io.

In [10]:
if dados_api:
    # Passo 3.1: Gerar o texto dinâmico para o resumo
    print("Gerando texto de resumo dinâmico...")
    resumo_texto = (
        f"Nos últimos 90 dias (de {data_inicial_str} a {data_final_str}), a cotação do Dólar (PTAX Venda) apresentou volatilidade. "
        f"A taxa atingiu um valor máximo de R$ {cotacao_maxima:.4f} e um mínimo de R$ {cotacao_minima:.4f}. "
        f"A média para o período foi de R$ {cotacao_media:.4f}. "
        f"A cotação mais recente registrada foi de R$ {cotacao_recente:.4f}."
    )
    print(resumo_texto)

    # Passo 3.2: Gerar a imagem do gráfico com Seaborn (em memória)
    print("\nGerando gráfico de linha com Seaborn...")
    plt.figure(figsize=(10, 5)) # Define o tamanho da imagem
    sns.lineplot(x='data', y='taxa_ptax_venda', data=df, marker='o', color='navy')
    plt.title('Evolução da Cotação do Dólar (PTAX Venda) - Últimos 90 Dias')
    plt.xlabel('Data')
    plt.ylabel('Taxa de Câmbio (R$)')
    plt.xticks(rotation=30) # Rotaciona as datas no eixo X
    plt.grid(True, linestyle='--', alpha=0.6)
    plt.tight_layout() # Ajusta o gráfico para caber na figura
    
    # --- Mágica do IO ---
    # 1. Criamos um "arquivo virtual" na memória RAM
    image_stream = io.BytesIO()
    
    # 2. Pedimos ao matplotlib para salvar o gráfico nesse arquivo, no formato PNG
    plt.savefig(image_stream, format='png', dpi=150)
    plt.close() # Fechamos a figura para liberar memória
    
    # 3. Rebobinamos o "cursor" do arquivo virtual para o início (para que o docxtpl possa lê-lo)
    image_stream.seek(0)
    print("Gráfico gerado e armazenado com sucesso na memória.")

Gerando texto de resumo dinâmico...
Nos últimos 90 dias (de 18/06/2025 a 16/09/2025), a cotação do Dólar (PTAX Venda) apresentou volatilidade. A taxa atingiu um valor máximo de R$ 5.6034 e um mínimo de R$ 5.3096. A média para o período foi de R$ 5.4749. A cotação mais recente registrada foi de R$ 5.3096.

Gerando gráfico de linha com Seaborn...
Gráfico gerado e armazenado com sucesso na memória.


## Passo 4: Montagem e Renderização do Relatório (docxtpl)
Esta é a etapa final. Carregamos nosso template (ex: template_api.docx) e criamos o dicionário de contexto. Este dicionário é o "de-para" que diz ao docxtpl qual variável do Python corresponde a qual marcador {{ chave }} no Word.

Também preparamos o gráfico em memória para ser inserido usando a função InlineImage.

In [24]:
if dados_api:
    try:
        print("Montando o relatório final no Word...")
        doc = DocxTemplate("template_projeto_final.docx")
        
        # O contexto usa as chaves exatas que estão no template
        context = {
            'data_inicial': data_inicial_str,
            'data_final': data_final_str,
            'resumo_dolar': resumo_texto,
            'grafico_dolar': InlineImage(doc, image_stream, width=Mm(150)),
            'data_emissao': datetime.now().strftime('%d/%m/%Y %H:%M:%S')
        }
        
        # Renderiza e salva o arquivo final
        doc.render(context)
        nome_arquivo_final = 'relatorio_dolar_ptax.docx'
        doc.save(nome_arquivo_final)

        print("-" * 50)
        print(f"Sucesso! Pipeline concluído.")
        print(f"Boletim salvo como '{nome_arquivo_final}'.")
        print("-" * 50)
        
    except Exception as e:
        print(f"ERRO AO GERAR O WORD: {e}")
        print("Verifique se o nome do template ('template_api.docx') está correto e se o arquivo não está aberto.")

Montando o relatório final no Word...
--------------------------------------------------
Sucesso! Pipeline concluído.
Boletim salvo como 'relatorio_dolar_ptax.docx'.
--------------------------------------------------
