In [1]:
import sys
import os
import pandas as pd
from pathlib import Path

# --- 1. Configurar Caminhos (Para achar a pasta 'etl') ---
# Pega o diretório atual do notebook
notebook_dir = Path(os.getcwd())

# Se estivermos na pasta 'notebooks', a raiz é o pai dela
if notebook_dir.name == 'notebooks':
    project_root = notebook_dir.parent
    if str(project_root) not in sys.path:
        sys.path.append(str(project_root))
        print(f"Raiz do projeto adicionada ao Path: {project_root}")

# --- 2. Importar Nossas Funções Novas ---
from etl.connection import load_raw_data
from etl.processor import process_data

# --- 3. Executar o Pipeline (Passo a Passo) ---

print("\n>>> ETAPA 1: Baixando Dados Brutos (Lista de Meses)...")
raw_list = load_raw_data()

if raw_list:
    print(f"✓ Sucesso! Você baixou {len(raw_list)} dataframes (meses).")
    print(f"  - Exemplo Mês 1 (Jan): {raw_list[0].shape} linhas/colunas")
    
    print("\n>>> ETAPA 2: Processando e Unificando...")
    df_final = process_data(raw_list)
    
    print(f"✓ Sucesso! Dataframe Final criado.")
    print(f"  - Shape Final: {df_final.shape} (Linhas, Colunas)")
    
    # --- 4. A Prova dos 9 (Verificar se sumiram as duplicatas) ---
    print("\n>>> ETAPA 3: Verificação de Qualidade (Ghost Rows)")
    print("Verificando se existem linhas duplicadas ou vazias...")
    
    # Verifica nulos na coluna score
    nulos = df_final['score'].isna().sum()
    print(f"  - Total de Scores Nulos (Descanso/Folga): {nulos}")
    
    # Verifica duplicidade: Não deve haver duas linhas para o mesmo habito na mesma data
    duplicatas = df_final.duplicated(subset=['date', 'habit'], keep=False).sum()
    if duplicatas == 0:
        print("  - ZERO Duplicatas encontradas! (Problema resolvido)")
    else:
        print(f"  - ALERTA: {duplicatas} duplicatas encontradas.")

else:
    print("ERRO: A lista de dados veio vazia. Verifique a conexão.")

Raiz do projeto adicionada ao Path: c:\Users\pedro\Documents\GitHub\portfolio\habit-tracker

>>> ETAPA 1: Baixando Dados Brutos (Lista de Meses)...
--- Connecting to Google Sheets: habits-2025 ---
✓ Baixado: jan (21 linhas)
✓ Baixado: feb (21 linhas)
✓ Baixado: mar (21 linhas)
✓ Baixado: apr (21 linhas)
✓ Baixado: may (21 linhas)
✓ Baixado: jun (21 linhas)
✓ Baixado: jul (21 linhas)
✓ Baixado: ago (21 linhas)
✓ Baixado: set (21 linhas)
✓ Baixado: out (21 linhas)
✓ Baixado: nov (21 linhas)
✓ Baixado: dez (21 linhas)
✓ Sucesso! Você baixou 12 dataframes (meses).
  - Exemplo Mês 1 (Jan): (21, 33) linhas/colunas

>>> ETAPA 2: Processando e Unificando...
✓ Sucesso! Dataframe Final criado.
  - Shape Final: (7589, 7) (Linhas, Colunas)

>>> ETAPA 3: Verificação de Qualidade (Ghost Rows)
Verificando se existem linhas duplicadas ou vazias...
  - Total de Scores Nulos (Descanso/Folga): 1824
  - ZERO Duplicatas encontradas! (Problema resolvido)


In [None]:
# Mostrar as primeiras linhas (Janeiro) e as últimas (Julho)
# Isso confirma que o concat funcionou do começo ao fim
display(df_final)

Unnamed: 0,date,type,habit,status,score,month_name,day_of_week
15,2025-01-01,Alimentação,Alimentação Diversificada,0,0.0,January,Wednesday
16,2025-01-01,Alimentação,Alimentação Limpa,0,0.0,January,Wednesday
17,2025-01-01,Alimentação,Meta de Proteinas,1,1.0,January,Wednesday
13,2025-01-01,Desenvolvimento,Dicção/Voz,0,0.0,January,Wednesday
14,2025-01-01,Desenvolvimento,Leitura/Música,-,,January,Wednesday
...,...,...,...,...,...,...,...
7585,2025-12-28,Profissional,Acompanhar Mercado,1,1.0,December,Sunday
7584,2025-12-28,Profissional,Produzir,1,1.0,December,Sunday
7583,2025-12-28,Sono,Acordar cedo,-,,December,Sunday
7581,2025-12-28,Sono,Dormir ao menos 7h,1,1.0,December,Sunday



Histórico do hábito: Acordar cedo


Unnamed: 0,date,type,habit,status,score,month_name,day_of_week
2,2025-01-01,Sono,Acordar cedo,-,,January,Wednesday
23,2025-01-02,Sono,Acordar cedo,1,1.0,January,Thursday
44,2025-01-03,Sono,Acordar cedo,0,0.0,January,Friday
65,2025-01-04,Sono,Acordar cedo,0,0.0,January,Saturday
86,2025-01-05,Sono,Acordar cedo,0,0.0,January,Sunday
107,2025-01-06,Sono,Acordar cedo,1,1.0,January,Monday
128,2025-01-07,Sono,Acordar cedo,1,1.0,January,Tuesday
149,2025-01-08,Sono,Acordar cedo,1,1.0,January,Wednesday
170,2025-01-09,Sono,Acordar cedo,1,1.0,January,Thursday
191,2025-01-10,Sono,Acordar cedo,1,1.0,January,Friday
