In [1]:
import os
from dotenv import load_dotenv
import requests
import pandas as pd

# === Carregar variáveis do .env ===
load_dotenv()
API_URL = os.getenv("API_URL")
API_KEY = os.getenv("API_KEY")
HEADERS = { "Api-Token": API_KEY }

# === Função de paginação ===
def paginar(endpoint):
    results = []
    offset = 0
    limit = 100
    while True:
        url = f"{API_URL}/{endpoint}?limit={limit}&offset={offset}"
        r = requests.get(url, headers=HEADERS)
        r.raise_for_status()
        data = r.json()
        chave = endpoint.split('?')[0].split('/')[0] + 's'
        items = data.get(chave) or []
        if not items:
            break
        results.extend(items)
        offset += limit
    return results

# === Buscar dados ===
contatos = paginar("contacts")
fields = paginar("fields")
field_values = paginar("fieldValues")
tags = paginar("tags")
contact_tags = paginar("contactTags")

# === Mapear ID da tag "LEAD L3-25" ===
tag_id = next((t["id"] for t in tags if t["tag"] == "LEAD L3-25"), None)
if not tag_id:
    raise ValueError("Tag 'LEAD L3-25' não encontrada!")

# === Coletar IDs dos contatos com essa tag ===
contatos_filtrados = { ct["contact"] for ct in contact_tags if ct["tag"] == tag_id }

# === Mapear UTMs por contato ===
utm_fields = {}
for f in fields:
    if f["title"].lower() in ["utm_source", "utm_medium", "utm_campaign"]:
        utm_fields[f["id"]] = f["title"].lower()

utm_por_contato = {}
for item in field_values:
    cid = item["contact"]
    fid = item["field"]
    if fid in utm_fields:
        if cid not in utm_por_contato:
            utm_por_contato[cid] = {}
        utm_por_contato[cid][utm_fields[fid]] = item["value"]

# === Montar DataFrame com leads da tag específica ===
dados = []
for c in contatos:
    cid = c["id"]
    if cid not in contatos_filtrados:
        continue
    row = {
        "email": c["email"],
        "data_inscricao": c["created_timestamp"],
        "utm_source": utm_por_contato.get(cid, {}).get("utm_source", ""),
        "utm_medium": utm_por_contato.get(cid, {}).get("utm_medium", ""),
        "utm_campaign": utm_por_contato.get(cid, {}).get("utm_campaign", "")
    }
    dados.append(row)

df = pd.DataFrame(dados)
df["data_inscricao"] = pd.to_datetime(df["data_inscricao"])
df = df.sort_values("data_inscricao", ascending=False)

# Visualizar
df.head()

ValueError: Tag 'LEAD L3-25' não encontrada!

In [None]:
print(f"Quantidade de tags encontradas: {len(tags)}")
print(tags[:5])  # mostra as 5 primeiras (se houver)

In [None]:
# Filtrar por data (apenas leads inscritos após 01/04/2024)
df["data_inscricao"] = pd.to_datetime(df["data_inscricao"])
df_lancamento = df[df["data_inscricao"] >= "2024-04-01"]