#**Licença de Uso**

This repository uses a **dual-license model** to distinguish between source code and creative/documental content.

**Code** (Python scripts, modules, utilities):
Licensed under the MIT License.

→ You may freely use, modify, and redistribute the code, including for commercial purposes, provided that you preserve the copyright notice.

**Content** (Jupyter notebooks, documentation, reports, datasets, and generated outputs):
Licensed under the Creative Commons Attribution–NonCommercial 4.0 International License.

→ You may share and adapt the content for non-commercial purposes, provided that proper credit is given to the original author.


**© 2025 Leandro Bernardo Rodrigues**

In [None]:
# @title
# parágrafo git: inicialização do repositório no drive e push inicial para o github

# imports
from pathlib import Path
import subprocess, os, sys, getpass, textwrap

# util de shell
def sh(cmd, cwd=None, check=True):
    r = subprocess.run(cmd, cwd=cwd, text=True, capture_output=True)
    if check and r.returncode != 0:
        print(r.stdout, r.stderr)
        raise RuntimeError(f"falha: {' '.join(cmd)} (rc={r.returncode})")
    return r.stdout.strip()

# garantir que o diretório do projeto exista
repo_dir.mkdir(parents=True, exist_ok=True)

# montar drive no colab se necessário
try:
    from google.colab import drive as _colab_drive  # type: ignore
    if not os.path.ismount("/content/drive"):
        print("montando google drive…")
        _colab_drive.mount("/content/drive")
except Exception:
    pass

# configurar safe.directory para evitar avisos do git com caminhos de rede
try:
    sh(["git", "config", "--global", "--add", "safe.directory", str(repo_dir)])
except Exception:
    pass

# inicializar repositório se ainda não existir
if not (repo_dir / ".git").exists():
    print("inicializando repositório git…")
    sh(["git", "init"], cwd=repo_dir)
    # garantir branch principal como main (compatível com versões antigas)
    try:
        sh(["git", "checkout", "-B", default_branch], cwd=repo_dir)
    except Exception:
        sh(["git", "branch", "-M", default_branch], cwd=repo_dir)
else:
    print(".git já existe; seguindo")

# configurar identidade local
sh(["git", "config", "user.name", author_name], cwd=repo_dir)
sh(["git", "config", "user.email", author_email], cwd=repo_dir)

# criar .gitignore básico e readme se estiverem ausentes
gitignore_path = repo_dir / ".gitignore"
if not gitignore_path.exists():
    gitignore_path.write_text(textwrap.dedent("""
      # python
      __pycache__/
      *.py[cod]
      *.egg-info/
      .venv*/
      venv/

      # segredos
      .env
      *.key
      *.pem
      *.tok

      # jupyter/colab
      .ipynb_checkpoints/

      # artefatos e dados locais (não versionar)
      data/
      input/                 # inclui input.csv sensível
      output/
      runs/
      logs/
      figures/
      *.log
      *.tmp
      *.bak
      *.png
      *.jpg
      *.pdf
      *.html

      # allowlist para a pasta de referências
      !references/
      !references/**
    """).strip() + "\n", encoding="utf-8")
    print("criado .gitignore")

readme_path = repo_dir / "README.md"
if not readme_path.exists():
    readme_path.write_text(f"# {repo_name}\n\nprojeto de autoencoder tabular para journal entries.\n", encoding="utf-8")
    print("criado README.md")

# preparar commit inicial se não houver nenhum
needs_commit = False
try:
    sh(["git", "rev-parse", "HEAD"], cwd=repo_dir, check=True)
    print("repositório já possui commits")
except Exception:
    needs_commit = True

if needs_commit:
    sh(["git", "add", "."], cwd=repo_dir)
    sh(["git", "commit", "-m", "chore: bootstrap do repositório"], cwd=repo_dir)
    print("commit inicial criado")

# configurar remoto origin
remote_base = f"https://github.com/{owner}/{repo_name}.git"
existing_remotes = sh(["git", "remote"], cwd=repo_dir)
if "origin" not in existing_remotes.split():
    sh(["git", "remote", "add", "origin", remote_base], cwd=repo_dir)
    print(f"remoto origin adicionado: {remote_base}")
else:
    # se já existe, garantir que aponta para o repo correto
    current_url = sh(["git", "remote", "get-url", "origin"], cwd=repo_dir)
    if current_url != remote_base:
        sh(["git", "remote", "set-url", "origin", remote_base], cwd=repo_dir)
        print(f"remoto origin atualizado para: {remote_base}")
    else:
        print("remoto origin já configurado corretamente")

# push para o github usando token sem salvá-lo no remoto
print("\npara fazer o push para o github, informe um token pessoal (pat) com escopo 'repo'.")
print("o token não será salvo; será usado apenas nesta chamada.")
pat = getpass.getpass("cole seu github personal access token (entrada oculta): ").strip()
assert pat, "token não informado"

# construir url de push com token apenas para esta chamada
push_url = f"https://{pat}:x-oauth-basic@github.com/{owner}/{repo_name}.git"

# criar a branch remota se necessário e ajustar upstream
try:
    sh(["git", "push", "-u", push_url, default_branch], cwd=repo_dir, check=True)
    print(f"push concluído para {owner}/{repo_name} na branch {default_branch}")
except Exception as e:
    print("falha no push. verifique se o repositório existe e se o token tem escopo 'repo'.")
    raise

#**Utilitário:** verificação da formatação de código

Black [88] + Isort, desconsiderando células mágicas

In [None]:
# @title
#ID0001
#pré-visualizar/aplicar (pula magics) — isort(profile=black)+black(88) { display-mode: "form" }
import sys, subprocess, os, re, difflib, textwrap, time
from typing import List, Tuple

# ===== CONFIG =====
NOTEBOOK = "/content/drive/MyDrive/Notebooks/data-analysis/notebooks/AETabular_main.ipynb"  # <- ajuste
LINE_LENGTH = 88
# ==================

# 1) Instalar libs no MESMO Python do kernel
subprocess.check_call([sys.executable, "-m", "pip", "install", "-q", "black", "isort", "nbformat"])

import nbformat
import black
import isort

BLACK_MODE = black.Mode(line_length=LINE_LENGTH)
ISORT_CFG  = isort.Config(profile="black", line_length=LINE_LENGTH)

# 2) Regras para pular células com magics/shell
#   - linhas começando com %, %%, !
#   - chamadas a get_ipython(
MAGIC_LINE = re.compile(r"^\s*(%{1,2}|!)", re.M)
GET_IPY    = re.compile(r"get_ipython\s*\(")

def has_magics(code: str) -> bool:
    return bool(MAGIC_LINE.search(code) or GET_IPY.search(code))

def format_code(code: str) -> str:
    # isort primeiro, depois black
    sorted_code = isort.api.sort_code_string(code, config=ISORT_CFG)
    return black.format_str(sorted_code, mode=BLACK_MODE)

def summarize_diff(diff_lines: List[str]) -> Tuple[int, int]:
    added = removed = 0
    for ln in diff_lines:
        # ignorar cabeçalhos do diff
        if ln.startswith(("---", "+++", "@@")):
            continue
        if ln.startswith("+"):
            added += 1
        elif ln.startswith("-"):
            removed += 1
    return added, removed

def header(title: str):
    print("\n" + "=" * 100)
    print(title)
    print("=" * 100)

if not os.path.exists(NOTEBOOK):
    raise FileNotFoundError(f"Notebook não encontrado:\n{NOTEBOOK}")

# 3) Leitura do .ipynb
with open(NOTEBOOK, "r", encoding="utf-8") as f:
    nb = nbformat.read(f, as_version=4)

changed_cells = []  # (idx, added, removed, diff_text, preview_snippet, new_code)

# 4) Pré-visualização célula a célula
header("Pré-visualização (NÃO grava) — somente células com mudanças")
for i, cell in enumerate(nb.cells):
    if cell.get("cell_type") != "code":
        continue

    original = cell.get("source", "")
    if not original.strip():
        continue

    # Pular células com magics/shell
    if has_magics(original):
        continue

    try:
        formatted = format_code(original)
    except Exception as e:
        print(f"[Aviso] célula {i}: erro no formatador — pulando ({e})")
        continue

    if original.strip() != formatted.strip():
        # Gerar diff unificado legível
        diff = list(difflib.unified_diff(
            original.splitlines(), formatted.splitlines(),
            fromfile=f"cell_{i}:before", tofile=f"cell_{i}:after", lineterm=""
        ))
        add, rem = summarize_diff(diff)
        snippet = original.strip().splitlines()[0][:120] if original.strip().splitlines() else "<célula vazia>"
        changed_cells.append((i, add, rem, "\n".join(diff), snippet, formatted))

# 5) Exibição dos diffs por célula (se houver)
if not changed_cells:
    print("✔ Nada a alterar: todas as células (não mágicas) já estão conforme isort/black.")
else:
    total_add = total_rem = 0
    for (idx, add, rem, diff_text, snippet, _new) in changed_cells:
        total_add += add
        total_rem += rem
        header(f"Diff — Célula #{idx}  (+{add}/-{rem})")
        print(f"Primeira linha da célula: {snippet!r}\n")
        print(diff_text)

    header("Resumo")
    print(f"Células com mudanças: {len(changed_cells)}")
    print(f"Linhas adicionadas:   {total_add}")
    print(f"Linhas removidas:     {total_rem}")

# 6) Perguntar se aplica
if changed_cells:
    print("\nDigite 'p' para **Proceder** e gravar as mudanças nessas células, ou 'c' para **Cancelar**.")
    try:
        choice = input("Proceder (p) / Cancelar (c): ").strip().lower()
    except Exception:
        choice = "c"

    if choice == "p":
        # Backup antes de escrever
        backup = NOTEBOOK + ".bak"
        if not os.path.exists(backup):
            with open(backup, "w", encoding="utf-8") as bf:
                nbformat.write(nb, bf)

        # Aplicar somente nas células com mudanças
        idx_to_new = {idx: new for (idx, _a, _r, _d, _s, new) in changed_cells}
        for i, cell in enumerate(nb.cells):
            if i in idx_to_new and cell.get("cell_type") == "code":
                cell["source"] = idx_to_new[i]

        # Escrever no .ipynb
        with open(NOTEBOOK, "w", encoding="utf-8") as f:
            nbformat.write(nb, f)

        # Sync delay (Drive)
        time.sleep(1.0)

        header("Concluído")
        print(f"✔ Mudanças aplicadas em {len(changed_cells)} célula(s).")
        print(f"Backup criado em: {backup}")
        print("Dica: recarregue o notebook no Colab para ver a formatação atualizada.")
    else:
        print("\nOperação cancelada. Nada foi gravado.")

#**Sincronizar alterações no código do projeto**
Comandos para sincronizar código (Google Drive, Git, GitHub) e realizar versionamento

---
Google Drive é considerado o ponto de verdade

In [None]:
# @title
#ID0002
#push do Drive -> GitHub (Drive é a fonte da verdade)
#respeita .gitignore do Drive
#sempre em 'main', sem pull, commit + push imediato
#mensagem de commit padronizada com timestamp SP
#bump de versão (M/m/n) + tag anotada
#force push (branch e tags), silencioso; só 1 print final
#PAT lido de segredo do Colab: GITHUB_PAT_DA (fallback: env; último caso: prompt)

from pathlib import Path
import subprocess, os, re, shutil, sys, getpass
from urllib.parse import quote as urlquote
from datetime import datetime, timezone, timedelta

#utilitários silenciosos
def sh(cmd, cwd=None, check=True):
    """
    Executa comando silencioso. Em erro, levanta RuntimeError com rc e UM rascunho de causa,
    mascarando URLs com credenciais (ex.: https://***:***@github.com/...).
    """
    safe_cmd = []
    for x in cmd:
        if isinstance(x, str) and "github.com" in x and "@" in x:
            #mascara credenciais: https://user:token@ -> https://***:***@
            x = re.sub(r"https://[^:/]+:[^@]+@", "https://***:***@", x)
        safe_cmd.append(x)

    r = subprocess.run(cmd, cwd=cwd, text=True, capture_output=True)
    if check and r.returncode != 0:
        #heurística curtinha p/ tornar rc=128 mais informativo sem vazar nada
        stderr = (r.stderr or "").strip().lower()
        if "authentication failed" in stderr or "permission" in stderr or "not found" in stderr:
            hint = "auth/permissões/URL"
        elif "not a git repository" in stderr:
            hint = "repo local inválido"
        else:
            hint = "git falhou"
        cmd_hint = " ".join(safe_cmd[:3])
        raise RuntimeError(f"rc={r.returncode}; {hint}; cmd={cmd_hint}")
    return r.stdout

def git(*args, cwd=None, check=True):
    return sh(["git", *args], cwd=cwd, check=check)

#configurações do projeto
author_name    = "Leandro Bernardo Rodrigues"
owner          = "LeoBR84p"         # dono do repositório no GitHub
repo_name      = "ae-tabular"    # nome do repositório
default_branch = "main"
repo_dir       = Path("/content/drive/MyDrive/Notebooks/ae-tabular")
remote_base    = f"https://github.com/{owner}/{repo_name}.git"
author_email   = f"bernardo.leandro@gmail.com"  # evita erro de identidade

#nbstripout: "install" para limpar outputs; "disable" para versionar outputs
nbstripout_mode = "install"
import shutil
exe = shutil.which("nbstripout")
git("config", "--local", "filter.nbstripout.clean", exe if exe else "nbstripout", cwd=repo_dir)

#ambiente: Colab + Drive
def ensure_drive():
    try:
        from google.colab import drive  # type: ignore
        base = Path("/content/drive/MyDrive")
        if not base.exists():
            drive.mount("/content/drive")
        if not base.exists():
            raise RuntimeError("Google Drive não montado.")
    except Exception as e:
        raise RuntimeError(f"Falha ao montar o Drive: {e}")

#repo local no Drive
def is_empty_dir(p: Path) -> bool:
    try:
        return p.exists() and not any(p.iterdir())
    except Exception:
        return True

def init_or_recover_repo():
    repo_dir.mkdir(parents=True, exist_ok=True)
    git_dir = repo_dir / ".git"

    def _fresh_init():
        if git_dir.exists():
            shutil.rmtree(git_dir, ignore_errors=True)
        git("init", cwd=repo_dir)

    #caso .git no Colab ausente ou vazia -> init limpo
    if not git_dir.exists() or is_empty_dir(git_dir):
        _fresh_init()
    else:
        #valida se é um work-tree git funcional no Colab; se falhar -> init limpo
        try:
            git("rev-parse", "--is-inside-work-tree", cwd=repo_dir)
        except Exception:
            _fresh_init()

    #aborta operações pendentes (não apaga histórico)
    for args in (("rebase", "--abort"), ("merge", "--abort"), ("cherry-pick", "--abort")):
        try:
            git(*args, cwd=repo_dir, check=False)
        except Exception:
            pass

    #força branch main
    try:
        sh(["git", "switch", "-C", default_branch], cwd=repo_dir)
    except Exception:
        sh(["git", "checkout", "-B", default_branch], cwd=repo_dir)

    #configura identidade local
    try:
        git("config", "user.name", author_name, cwd=repo_dir)
        git("config", "user.email", author_email, cwd=repo_dir)
    except Exception:
        pass

    #marca o diretório como safe
    try:
        sh(["git","config","--global","--add","safe.directory", str(repo_dir)])
    except Exception:
        pass

    #sanity check final (falha cedo se algo ainda estiver errado)
    git("status", "--porcelain", cwd=repo_dir)


#nbstripout (opcional)
def setup_nbstripout():
    if nbstripout_mode == "disable":
        #remove configs do filtro
        sh(["git","config","--local","--unset-all","filter.nbstripout.clean"], cwd=repo_dir, check=False)
        sh(["git","config","--local","--unset-all","filter.nbstripout.smudge"], cwd=repo_dir, check=False)
        sh(["git","config","--local","--unset-all","filter.nbstripout.required"], cwd=repo_dir, check=False)
        gat = repo_dir / ".gitattributes"
        if gat.exists():
            lines = gat.read_text(encoding="utf-8", errors="ignore").splitlines()
            new_lines = [ln for ln in lines if "filter=nbstripout" not in ln]
            gat.write_text("\n".join(new_lines) + ("\n" if new_lines else ""), encoding="utf-8")
        return

    #instala nbstripout (se necessário)
    try:
        import nbstripout  #noqa: F401
    except Exception:
        sh([sys.executable, "-m", "pip", "install", "--quiet", "nbstripout"])

    py = sys.executable
    #configurar filtro sem aspas extras
    git("config", "--local", "filter.nbstripout.clean", "nbstripout", cwd=repo_dir)
    git("config", "--local", "filter.nbstripout.smudge", "cat", cwd=repo_dir)
    git("config", "--local", "filter.nbstripout.required", "true", cwd=repo_dir)
    gat = repo_dir / ".gitattributes"
    line = "*.ipynb filter=nbstripout"
    if gat.exists():
        txt = gat.read_text(encoding="utf-8", errors="ignore")
        if line not in txt:
            gat.write_text((txt.rstrip() + "\n" + line + "\n"), encoding="utf-8")
    else:
        gat.write_text(line + "\n", encoding="utf-8")

#.gitignore normalização
def normalize_tracked_ignored():
    """
    Se houver arquivos já rastreados que hoje são ignorados pelo .gitignore,
    limpa o índice e re-adiciona respeitando o .gitignore.
    Retorna True se normalizou algo; False caso contrário.
    """
    #remove lock de índice, se houver
    lock = repo_dir / ".git/index.lock"
    try:
        if lock.exists():
            lock.unlink()
    except Exception:
        pass

    #garante que o índice existe (ou se recupera)
    idx = repo_dir / ".git/index"
    if not idx.exists():
        try:
            sh(["git", "reset", "--mixed"], cwd=repo_dir)
        except Exception:
            try:
                sh(["git", "init"], cwd=repo_dir)
            except Exception:
                pass

    #detecta arquivos ignorados que estão rastreados e normaliza
    normalized = False
    try:
        out = git("ls-files", "-z", "--ignored", "--exclude-standard", "--cached", cwd=repo_dir)
        tracked_ignored = [p for p in out.split("\x00") if p]
        if tracked_ignored:
            git("rm", "-r", "--cached", ".", cwd=repo_dir)
            git("add", "-A", cwd=repo_dir)
            normalized = True
    except Exception:
        #falhou a detecção? segue o fluxo sem travar
        pass

    return normalized

#semVer e bump de versão
_semver = re.compile(r"^(\d+)\.(\d+)\.(\d+)$")

def parse_semver(s):
    m = _semver.match((s or "").strip())
    return tuple(map(int, m.groups())) if m else None

def current_version():
    try:
        tags = [t for t in git("tag", "--list", cwd=repo_dir).splitlines() if parse_semver(t)]
        if tags:
            return sorted(tags, key=lambda x: parse_semver(x))[-1]
    except Exception:
        pass
    vf = repo_dir / "VERSION"
    if vf.exists():
        v = vf.read_text(encoding="utf-8").strip()
        if parse_semver(v):
            return v
    return "1.0.0"

def bump(v, kind):
    M, m, p = parse_semver(v) or (1, 0, 0)
    k = (kind or "").strip()
    if k == "m":
        return f"{M}.{m+1}.0"
    if k == "n":
        return f"{M}.{m}.{p+1}"
    return f"{M+1}.0.0"  #default major

#timestamp SP
def now_sp():
    #tenta usar zoneinfo; fallback fixo -03:00 (Brasil sem DST atualmente)
    try:
        from zoneinfo import ZoneInfo  # Py3.9+
        tz = ZoneInfo("America/Sao_Paulo")
        dt = datetime.now(tz)
    except Exception:
        dt = datetime.now(timezone(timedelta(hours=-3)))
    #formato legível + offset
    return dt.strftime("%Y-%m-%d %H:%M:%S%z")  # ex.: 2025-10-08 02:34:00-0300

#autenticação (PAT)
def get_pat():
    #Colab Secrets
    token = None
    try:
        from google.colab import userdata  #type: ignore
        token = userdata.get('GITHUB_PAT_AETABULAR')  #nome do segredo criado no Colab
    except Exception:
        token = None
    #fallback1 - variável de ambiente
    if not token:
        token = os.environ.get("GITHUB_PAT_AETABULAR") or os.environ.get("GITHUB_PAT")
    #fallback2 - interativo
    if not token:
        token = getpass.getpass("Informe seu GitHub PAT: ").strip()
    if not token:
        raise RuntimeError("PAT ausente.")
    return token

#listas de força
FORCE_UNTRACK = ["input/", "output/", "data/", "runs/", "logs/", "figures/"]
FORCE_TRACK   = ["references/"]  #versionar tudo dentro (PDFs inclusive)

def force_index_rules():
    #garante que pastas sensíveis NUNCA fiquem rastreadas
    for p in FORCE_UNTRACK:
        try:
            git("rm", "-r", "--cached", "--", p, cwd=repo_dir)
        except Exception:
            pass
    #garante que references/ SEMPRE entre (útil se ainda há *.pdf globais)
    for p in FORCE_TRACK:
        try:
            git("add", "-f", "--", p, cwd=repo_dir)
        except Exception:
            pass

#fluxo principal
def main():
    try:
        ensure_drive()
        init_or_recover_repo()
        setup_nbstripout()

        #pergunta apenas o tipo de versão (M/m/n)
        kind = input("Informe o tipo de mudança: Maior (M), menor (m) ou pontual (n): ").strip()
        if kind not in ("M", "m", "n"):
            kind = "n"

        #versão
        cur = current_version()
        new = bump(cur, kind)
        (repo_dir / "VERSION").write_text(new + "\n", encoding="utf-8")

        #normaliza itens ignorados que estejam rastreados (uma única vez, se necessário)
        normalize_tracked_ignored()

        #aplica regras de força
        force_index_rules()

        #stage de tudo (Drive é a verdade; remoções entram aqui)
        git("add", "-A", cwd=repo_dir)

        #mensagem padronizada de commit
        ts = now_sp()
        commit_msg = f"upload pelo {author_name} em {ts}"
        try:
            git("commit", "-m", commit_msg, cwd=repo_dir)
        except Exception:
            #se nada a commitar, seguimos (pode ocorrer se só a tag mudar, mas aqui VERSION muda)
            status = git("status", "--porcelain", cwd=repo_dir)
            if status.strip():
                raise

        #Tag anotada (substitui se já existir)
        try:
            git("tag", "-a", new, "-m", f"release {new} — {commit_msg}", cwd=repo_dir)
        except Exception:
            sh(["git", "tag", "-d", new], cwd=repo_dir, check=False)
            git("tag", "-a", new, "-m", f"release {new} — {commit_msg}", cwd=repo_dir)

        #push com PAT (Drive é a verdade): validação + push forçado
        token = get_pat()
        user_for_url = owner  # você é o owner; não perguntamos
        auth_url = f"https://{urlquote(user_for_url, safe='')}:{urlquote(token, safe='')}@github.com/{owner}/{repo_name}.git"

        #valida credenciais/URL de forma silenciosa (sem vazar token)
        #tenta checar a branch main; se não existir (repo vazio), faz um probe genérico
        try:
            sh(["git", "ls-remote", auth_url, f"refs/heads/{default_branch}"], cwd=repo_dir)
        except RuntimeError:
            #repositório pode estar vazio (sem refs); probe sem ref deve funcionar
            sh(["git", "ls-remote", auth_url], cwd=repo_dir)

        #push forçado de branch e tags
        sh(["git", "push", "-u", "--force", auth_url, default_branch], cwd=repo_dir)
        sh(["git", "push", "--force", auth_url, "--tags"], cwd=repo_dir)

        print(f"[ok]   Registro no GitHub com sucesso. Versão atual {new}")
    except Exception as e:
        #mensagem única, curta, sem detalhes sensíveis
        msg = str(e) or "falha inesperada"
        print(f"[erro] {msg}")

#executa
if __name__ == "__main__":
    main()

## **Etapa 1:** Ativação do ambiente virtual
---
Monta o Google Drive, define a BASE e REPO do projeto Git, cria/ativa o ambiente virtual.

---

In [None]:
# @title
#ID0003
#inicialização robusta: Drive + venv fora do Drive + Git checks (com patch de venv/ensurepip) { display-mode: "form" }
#força clear do kernel/variáveis desta sessão
%reset -f

#imports básicos -----
from google.colab import drive
from IPython.display import display, HTML
import json, os, sys, time, shutil, pathlib, subprocess

#helper de subprocess -----
def run(cmd, check=True, cwd=None):
    r = subprocess.run(cmd, text=True, capture_output=True, cwd=cwd)
    if check and r.returncode != 0:
        print(r.stdout + r.stderr)
        raise RuntimeError(f"falha: {' '.join(cmd)} (rc={r.returncode})")
    return r.stdout.strip()

#funções utilitárias de Drive/FS -----
def _is_mount_active(mountpoint: str = "/content/drive"):
    """verifica em /proc/mounts se o mountpoint está realmente montado"""
    try:
        with open("/proc/mounts", "r") as f:
            for line in f:
                parts = line.split()
                if len(parts) > 1 and parts[1] == mountpoint:
                    return True
    except Exception:
        pass
    return False

def _cleanup_local_mountpoint(mountpoint: str = "/content/drive"):
    """limpa conteúdo local do mountpoint quando NÃO está montado"""
    if os.path.isdir(mountpoint) and os.listdir(mountpoint):
        print(f"[info] mountpoint '{mountpoint}' contém arquivos locais. limpando...")
        for name in os.listdir(mountpoint):
            p = os.path.join(mountpoint, name)
            try:
                if os.path.isfile(p) or os.path.islink(p):
                    os.remove(p)
                else:
                    shutil.rmtree(p)
            except Exception as e:
                print(f"[aviso] não foi possível remover {p}: {e}")
        print("[ok] limpeza concluída.")

def safe_mount_google_drive(preferred_mountpoint: str = "/content/drive", readonly: bool = False, timeout_ms: int = 120000):
    """desmonta se preciso, limpa o mountpoint local e monta o drive"""
    try:
        if _is_mount_active(preferred_mountpoint):
          # print("[info] drive montado. tentando desmontar...")
          drive.flush_and_unmount()
          for _ in range(50):
              if not _is_mount_active(preferred_mountpoint):
                  break
              time.sleep(0.2)
    except Exception:
        pass

    if not _is_mount_active(preferred_mountpoint):
        _cleanup_local_mountpoint(preferred_mountpoint)

    os.makedirs(preferred_mountpoint, exist_ok=True)
    if os.listdir(preferred_mountpoint):
        alt = "/mnt/drive"
        print(f"[aviso] '{preferred_mountpoint}' ainda não está vazio. usando alternativo '{alt}'.")
        os.makedirs(alt, exist_ok=True)
        mountpoint = alt
    else:
        mountpoint = preferred_mountpoint

    print(f"[info] montando o google drive em '{mountpoint}'...")
    drive.mount(mountpoint, force_remount=True, timeout_ms=timeout_ms, readonly=readonly)
    print("[ok]   drive montado com sucesso.")
    return mountpoint

def safe_chdir(path):
    """usa os.chdir com validações, evitando %cd"""
    if not os.path.exists(path):
        raise FileNotFoundError(f"caminho não existe: {path}")
    os.chdir(path)
    print("[ok]   diretório atual:", os.getcwd())

#parâmetros do projeto -----
GITHUB_OWNER = "LeoBR84p"
GITHUB_REPO  = "ae-tabular"
CLEAN_URL    = f"https://github.com/{GITHUB_OWNER}/{GITHUB_REPO}.git"

#montar/remontar o google drive (robusto)
MOUNTPOINT = safe_mount_google_drive("/content/drive")
BASE = f"{MOUNTPOINT}/MyDrive/Notebooks"  #ajuste se quiser
REPO = "ae-tabular"
PROJ = f"{BASE}/{REPO}"
os.makedirs(BASE, exist_ok=True)

#venv fora do drive (mais rápido e evita sync)
VENV_PATH = "/content/.venv_data"
VENV_BIN  = f"{VENV_PATH}/bin"
VENV_PY   = f"{VENV_BIN}/python"
VENV_PIP  = f"{VENV_BIN}/pip"   #pode não existir ainda se o venv foi criado sem pip

#criação do venv com fallback para 'virtualenv'
def create_or_repair_venv(venv_path: str, venv_python: str):
    if not os.path.exists(VENV_BIN):
        #print(f"[info] criando venv (stdlib) em {venv_path} --without-pip ...")
        try:
            run([sys.executable, "-m", "venv", "--without-pip", venv_path], check=True)
            print("[ok]   venv criado (sem pip).")
        except Exception as e:
            print(f"[aviso] venv(stdlib) falhou: {e}")
            #print("[info] instalando 'virtualenv' e criando venv alternativo com pip embutido...")
            run([sys.executable, "-m", "pip", "install", "-q", "--upgrade", "virtualenv"], check=True)
            run([sys.executable, "-m", "virtualenv", "--python", sys.executable, venv_path], check=True)
            print("[ok]   venv criado via virtualenv.")
    else:
        print(f"[ok]   venv já existe em {venv_path}")

create_or_repair_venv(VENV_PATH, VENV_PY)

#ajusta PATH antes de qualquer instalação
os.environ["PATH"] = f"{VENV_BIN}{os.pathsep}{os.environ['PATH']}"
os.environ["VIRTUAL_ENV"] = VENV_PATH
print("[ok]   venv adicionado ao PATH")

#garante pip dentro do venv (ensurepip -> fallback virtualenv)
def _ensure_pip_in_venv(vpy: str):
    try:
        run([vpy, "-m", "pip", "--version"], check=True)
        return True
    except Exception:
        #print("[info] pip ausente no venv. tentando ensurepip dentro do venv...")
        try:
            run([vpy, "-m", "ensurepip", "--upgrade", "--default-pip"], check=True)
            run([vpy, "-m", "pip", "install", "-q", "--upgrade", "pip", "setuptools", "wheel"], check=True)
            return True
        except Exception as e:
            #print(f"[aviso] ensurepip no venv falhou: {e}")
            #print("[info] fallback: usando virtualenv para semear o pip dentro do venv existente...")
            run([sys.executable, "-m", "pip", "install", "-q", "--upgrade", "virtualenv"], check=True)
            run([sys.executable, "-m", "virtualenv", "--python", vpy, VENV_PATH], check=True)
            run([vpy, "-m", "pip", "install", "-q", "--upgrade", "pip", "setuptools", "wheel"], check=True)
            return True

if not _ensure_pip_in_venv(VENV_PY):
    raise RuntimeError("não foi possível provisionar o pip dentro do venv")

# garante que os pacotes instalados no venv sejam visíveis para este kernel
_ver = subprocess.check_output([VENV_PY, "-c", "import sys; print(f'{sys.version_info.major}.{sys.version_info.minor}')"], text=True).strip()
_site_dir = f"{VENV_PATH}/lib/python{_ver}/site-packages"
if _site_dir not in sys.path:
    sys.path.insert(0, _site_dir)
print("[ok]   site-packages do venv adicionado ao sys.path:", _site_dir)

#instala dependências de sessão DENTRO do venv
print("[info] instalando pacotes no venv...")
run([VENV_PY, "-m", "pip", "install", "-q", "jupytext", "nbdime", "nbstripout"])

#habilita integração do nbdime com git (global)
print("[info] habilitando nbdime em git config --global ...")
run([VENV_PY, "-m", "nbdime", "config-git", "--enable", "--global"])

#checks do repositório git + navegação até a pasta do projeto
if not os.path.exists(PROJ):
    print(f"[aviso] pasta do projeto não encontrada em {PROJ}.")
else:
    print("[ok]   pasta do projeto encontrada.")
    safe_chdir(PROJ)
    if not os.path.isdir(".git"):
        print("[aviso] esta pasta não parece ser um repositório Git (.git ausente).")
    else:
        print("[ok]   repositório Git detectado.")

# resumo do ambiente (confirmação objetiva e detalhada)
kernel_py = sys.executable
venv_py = VENV_PY
site_dir = _site_dir

# verifica se o site-packages do venv está no sys.path
site_ok = site_dir in sys.path

# obtém versões e caminhos
try:
    py_ver = subprocess.check_output([venv_py, "-V"], text=True).strip()
    pip_ver = subprocess.check_output([venv_py, "-m", "pip", "--version"], text=True).strip()
    pip_path = subprocess.check_output(
        [venv_py, "-m", "pip", "show", "pip"], text=True, stderr=subprocess.DEVNULL
    )
    pip_path_line = next((l for l in pip_path.splitlines() if l.startswith("Location:")), "")
except subprocess.CalledProcessError:
    py_ver, pip_ver, pip_path_line = "erro", "erro", ""

# imprime status linha a linha
print(f"[ok]   venv habilitado" if venv_py else "[erro] venv não encontrado")
print(f"[info] python em uso: {kernel_py}")
print(f"[info] versão do python: {py_ver}")
print(f"[ok]   pip do venv ativo" if "pip" in pip_ver.lower() else "[erro] pip do venv não detectado")
print(f"[info] caminho do pip: {venv_py.replace('python','pip')}")
print(f"[ok]   site-packages no sys.path: {site_dir}" if site_ok else f"[erro] site-packages ausente no sys.path: {site_dir}")
print(f"[info] versão do pip: {pip_ver}")

#all BS below
#mensagem com humor (skynet)
from IPython.display import display, HTML
display(HTML('<div style="margin:12px 0;padding:8px 12px;border:1px dashed #999;">'
             '<b>🤖 Skynet</b>: T-800 ativado. Diagnóstico do ambiente concluído. '
             '🎯 Alvo principal: organização do notebook e venv fora do drive.'
             '</div>'))

In [None]:
#ID003
# imports principais
from pathlib import Path
from datetime import datetime
from zoneinfo import ZoneInfo
import json, os, getpass, platform, subprocess, sys

# configurações do projeto (já fornecidas)
author_name    = "Leandro Bernardo Rodrigues"
owner          = "LeoBR84p"         # dono do repositório no GitHub
repo_name      = "ae-tabular"       # nome do repositório
default_branch = "main"
repo_dir       = Path("/content/drive/MyDrive/Notebooks/ae-tabular")
remote_base    = f"https://github.com/{owner}/{repo_name}.git"
author_email   = f"bernardo.leandro@gmail.com"  # evita erro de identidade

# zona de tempo brasilia
TZ_BR = ZoneInfo("America/Sao_Paulo")

def skynet(msg: str):
    """log simples padronizado"""
    ts = datetime.now(TZ_BR).strftime("%Y-%m-%d %H:%M:%S")
    print(f"[skynet {ts}] {msg}")

# 1) montar o google drive se necessário
try:
    from google.colab import drive as _colab_drive  # type: ignore
    if not os.path.ismount("/content/drive"):
        skynet("montando google drive…")
        _colab_drive.mount("/content/drive")
    else:
        skynet("google drive já montado")
except Exception:
    skynet("ambiente não é colab ou google drive indisponível, prosseguindo assim mesmo")

# 2) criar estrutura de pastas do projeto
INPUT_DIR  = repo_dir / "input"
OUTPUT_DIR = repo_dir / "output"

os.makedirs(INPUT_DIR, exist_ok=True)
os.makedirs(OUTPUT_DIR, exist_ok=True)

# 3) criar subpasta de execução em output com carimbo de data e hora de brasília
run_stamp = datetime.now(TZ_BR).strftime("%Y-%m-%d_%H-%M-%S")
RUN_DIR = OUTPUT_DIR / run_stamp
os.makedirs(RUN_DIR, exist_ok=True)

# 4) opcional: escrever metadados mínimos da execução
run_meta = {
    "author_name": author_name,
    "author_email": author_email,
    "project": repo_name,
    "run_stamp_br": run_stamp,
    "timezone": "America/Sao_Paulo",
    "python_version": sys.version.split()[0],
    "platform": platform.platform(),
    "uid": getpass.getuser(),
}
with open(RUN_DIR / "run.json", "w", encoding="utf-8") as f:
    json.dump(run_meta, f, ensure_ascii=False, indent=2)

# 5) git opcional: configurar identidade local se este for um repositório git
def _git(cmd, cwd=None):
    return subprocess.run(["git", *cmd], cwd=cwd, text=True, capture_output=True)

if (repo_dir / ".git").exists():
    _git(["config", "user.name", author_name], cwd=repo_dir)
    _git(["config", "user.email", author_email], cwd=repo_dir)
    skynet("git detectado e identidade configurada no repositório")
else:
    skynet("repositório git não detectado em repo_dir, etapa git será ignorada por enquanto")

# 6) impressão de caminhos úteis
skynet("ambiente preparado com sucesso")
print("repo_dir:   ", repo_dir)
print("input_dir:  ", INPUT_DIR)
print("output_dir: ", OUTPUT_DIR)
print("run_dir:    ", RUN_DIR)
