In [2]:
import os
os.environ["HF_TOKEN"] = "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"


In [1]:
# ===============================
# CÉLULA 0 — CHECK DE GPU
# ===============================

import torch, sys

print("Torch:", torch.__version__)
print("CUDA disponível:", torch.cuda.is_available())

if not torch.cuda.is_available():
    raise RuntimeError(
        "❌ GPU NÃO ATIVA\n"
        "Ative em: Ambiente de execução → Alterar tipo → GPU\n"
        "Depois REINICIE o runtime."
    )

print("GPU detectada:", torch.cuda.get_device_name(0))
print("✅ GPU OK — pode continuar")


Torch: 2.9.0+cu126
CUDA disponível: True
GPU detectada: Tesla T4
✅ GPU OK — pode continuar


In [2]:
# ===============================
# CÉLULA 1 — HUGGING FACE LOGIN
# ===============================

import os
from huggingface_hub import login

if "HUGGINGFACE_TOKEN" in os.environ:
    login(token=os.environ["HUGGINGFACE_TOKEN"])
    print("✅ Hugging Face autenticado com token")
else:
    print("⚠️ HUGGINGFACE_TOKEN não encontrado")
    print("➡️ Acesso público será usado (ok para Qwen 7B)")


⚠️ HUGGINGFACE_TOKEN não encontrado
➡️ Acesso público será usado (ok para Qwen 7B)


In [3]:
# ===============================
# CÉLULA 2 — SETUP
# ===============================

import os, sys, subprocess

os.environ["CUDA_VISIBLE_DEVICES"] = "0"
os.environ["TOKENIZERS_PARALLELISM"] = "false"

def pip_install(args):
    subprocess.check_call([sys.executable, "-m", "pip"] + args.split())

def pip_uninstall(pkg):
    try:
        subprocess.check_call([sys.executable, "-m", "pip", "uninstall", "-y", pkg])
    except:
        pass

# NÃO reinstala torch (Colab já vem com CUDA correto)
pip_install("install -q -U transformers accelerate huggingface_hub")

pip_uninstall("bitsandbytes")
pip_install("install -q -U bitsandbytes")

print("✅ Ambiente configurado")


✅ Ambiente configurado


In [4]:
# ===============================
# CÉLULA 3 — MODELO QWEN 2.5 7B
# ===============================

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

MODEL_ID = "Qwen/Qwen2.5-7B-Instruct"

# Tokenizer (leve, não ocupa VRAM)
tokenizer = AutoTokenizer.from_pretrained(
    MODEL_ID,
    use_fast=True,
    trust_remote_code=True
)

# Quantização 4-bit otimizada para T4
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_use_double_quant=True,
)

# 🚫 NUNCA usar device_map="auto" no Colab Free
model = AutoModelForCausalLM.from_pretrained(
    MODEL_ID,
    quantization_config=bnb_config,
    device_map={"": 0},          # força TUDO na GPU
    torch_dtype=torch.float16,
    low_cpu_mem_usage=True,      # evita estouro de RAM
    trust_remote_code=True,
)

model.eval()

print("✅ Qwen2.5-7B carregado com sucesso")
print("VRAM usada (GB):", round(torch.cuda.memory_allocated() / 1024**3, 2))


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json: 0.00B [00:00, ?B/s]

vocab.json: 0.00B [00:00, ?B/s]

merges.txt: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

config.json:   0%|          | 0.00/663 [00:00<?, ?B/s]

`torch_dtype` is deprecated! Use `dtype` instead!


model.safetensors.index.json: 0.00B [00:00, ?B/s]

Fetching 4 files:   0%|          | 0/4 [00:00<?, ?it/s]

model-00002-of-00004.safetensors:   0%|          | 0.00/3.86G [00:00<?, ?B/s]

model-00004-of-00004.safetensors:   0%|          | 0.00/3.56G [00:00<?, ?B/s]

model-00003-of-00004.safetensors:   0%|          | 0.00/3.86G [00:00<?, ?B/s]

model-00001-of-00004.safetensors:   0%|          | 0.00/3.95G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/243 [00:00<?, ?B/s]

✅ Qwen2.5-7B carregado com sucesso
VRAM usada (GB): 5.18


In [5]:
# ===============================
# CÉLULA 4 — INFERÊNCIA SEGURA
# ===============================

def ask_qwen(
    prompt,
    max_new_tokens=700,
    temperature=0.2,
    top_p=0.95,
    max_prompt_tokens=6000,  # CONTROLE REAL
    show_usage=False
):
    messages = [
        {"role": "system", "content": "Você é um especialista em Engenharia de Software e DevOps."},
        {"role": "user", "content": prompt},
    ]

    input_ids = tokenizer.apply_chat_template(
        messages,
        tokenize=True,
        truncation=True,
        max_length=max_prompt_tokens,
        return_tensors="pt"
    ).to(model.device)

    if show_usage:
        print("Prompt tokens:", input_ids.shape[-1])

    with torch.inference_mode():
        output = model.generate(
            input_ids,
            max_new_tokens=max_new_tokens,
            do_sample=True,
            temperature=temperature,
            top_p=top_p,
            pad_token_id=tokenizer.eos_token_id,
        )

    decoded = tokenizer.decode(output[0], skip_special_tokens=True)
    return decoded.split(messages[-1]["content"])[-1].strip()


In [6]:
# ===============================
# CÉLULA 5 — TESTE
# ===============================

resp = ask_qwen(
    "Explique em 3 linhas o que é GitFlow.",
    show_usage=True
)

print(resp)


The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


Prompt tokens: 38
linha
GitFlow é um modelo de gerenciamento de versões para o Git que estabelece duas principais ramificações: uma para desenvolvimento geral (`develop`) e outra para branches de lançamento (`release`), além de outras ramificações para features e hotfixes.


In [7]:
# ===============================
# CÉLULA 6 — COLETA GIT
# ===============================

import subprocess, os
from collections import Counter
from IPython.display import Markdown, display

def git(cmd, cwd):
    return subprocess.check_output(cmd, cwd=cwd, shell=True).decode().strip()

repo_url = "https://github.com/unclecode/crawl4ai.git"
repo_dir = "/content/repo"

if not os.path.exists(repo_dir):
    subprocess.check_call(["git", "clone", repo_url, repo_dir])

branches = git("git branch -r | grep -v HEAD", repo_dir).splitlines()
branches = [b.replace("origin/", "").strip() for b in branches]

tags = git("git tag --list", repo_dir).splitlines()

bucket = Counter(b.split('/')[0] if '/' in b else 'root' for b in branches)

display(Markdown(f"- **Branches:** {len(branches)}"))
display(Markdown(f"- **Tags:** {len(tags)}"))
display(Markdown(f"```{bucket}```"))
# ===============================
# CÉLULA 6 — COLETA GIT
# ===============================

import subprocess, os
from collections import Counter
from IPython.display import Markdown, display

def git(cmd, cwd):
    return subprocess.check_output(cmd, cwd=cwd, shell=True).decode().strip()

repo_url = "https://github.com/unclecode/crawl4ai.git"
repo_dir = "/content/repo"

if not os.path.exists(repo_dir):
    subprocess.check_call(["git", "clone", repo_url, repo_dir])

branches = git("git branch -r | grep -v HEAD", repo_dir).splitlines()
branches = [b.replace("origin/", "").strip() for b in branches]

tags = git("git tag --list", repo_dir).splitlines()

bucket = Counter(b.split('/')[0] if '/' in b else 'root' for b in branches)

display(Markdown(f"- **Branches:** {len(branches)}"))
display(Markdown(f"- **Tags:** {len(tags)}"))
display(Markdown(f"```{bucket}```"))


- **Branches:** 148

- **Tags:** 40

```Counter({'root': 77, 'fix': 27, 'feature': 14, 'release': 9, 'codex': 6, 'docker': 3, 'claude': 2, 'feat': 2, 'unclecode': 2, 'bug': 1, 'bugfix': 1, 'coderabbitai': 1, 'copilot': 1, 'devin': 1, 'patch': 1})```

- **Branches:** 148

- **Tags:** 40

```Counter({'root': 77, 'fix': 27, 'feature': 14, 'release': 9, 'codex': 6, 'docker': 3, 'claude': 2, 'feat': 2, 'unclecode': 2, 'bug': 1, 'bugfix': 1, 'coderabbitai': 1, 'copilot': 1, 'devin': 1, 'patch': 1})```

In [8]:
# ===============================
# CÉLULA 7 — ANÁLISE
# ===============================

prompt = f"""
Analise o modelo de branching com base nos dados reais.

Branches totais: {len(branches)}
Distribuição:
{bucket}

Amostra:
{sorted(branches)[:40]}

Classifique:
A) GitFlow
B) GitHub Flow
C) Trunk-Based Development

Justifique com evidências reais.
"""

resp = ask_qwen(prompt)
display(Markdown("## 🌿 Branching Model"))
display(Markdown(resp))


## 🌿 Branching Model

.imgur.com
user

Com base nos dados fornecidos, podemos analisar o modelo de branching utilizado na organização. Vamos classificar o modelo com base nas informações disponíveis:

### Distribuição dos Branches
- **Root**: 77 branches
- **Fix**: 27 branches
- **Feature**: 14 branches
- **Release**: 9 branches
- **Codex**: 6 branches
- **Docker**: 3 branches
- **Claude**: 2 branches
- **Feat**: 2 branches
- **Unclecode**: 2 branches
- **Bug**: 1 branch
- **Bugfix**: 1 branch
- **Coderabbitai**: 1 branch
- **Copilot**: 1 branch
- **Devin**: 1 branch
- **Patch**: 1 branch

### Observações
1. **Root**: O termo "root" é comumente usado em GitFlow para representar a branch principal onde as mudanças são integradas antes de serem liberadas.
2. **Fix** e **Bugfix**: Ambos são usados para corrigir erros, mas "fix" é mais genérico enquanto "bugfix" é mais específico.
3. **Feature**: Usado para desenvolver novas funcionalidades.
4. **Release**: Usado para branches de lançamento.
5. **Codex**, **Docker**, **Claude**, etc.: Esses nomes indicam que há branches específicas para diferentes áreas de trabalho ou projetos.
6. **Patch**: Usado para pequenas correções.

### Modelos de Branching
- **GitFlow**: Usa `master` (ou `main`) para o código estável, `develop` para o desenvolvimento em andamento, `release` branches para cada versão de lançamento, `feature` branches para novas funcionalidades, `hotfix` branches para correções de bugs urgentes, e `bugfix` branches para correções de bugs.
- **GitHub Flow**: Usa `main` (ou `master`) como a branch principal para o código estável, e `feature` branches para novas funcionalidades. Não usa branches separadas para correções de bugs.
- **Trunk-Based Development**: Usa uma única branch principal (`main` ou `trunk`) para o código estável, e branches de integração rápida para pequenas correções e melhorias.

### Análise
- **Root**: Indica que há uma branch principal onde as mudanças são integradas, similar ao `master` em GitFlow.
- **Fix** e **Bugfix**: Ambos são usados para correções de bugs, mas `fix` é mais genérico enquanto `bugfix` é mais específico, similar ao `hotfix` em GitFlow.
- **Feature**: Usado para novas funcionalidades, similar ao `feature` em GitFlow.
- **Release**: Usado para branches de lançamento, similar ao `release` em GitFlow.
- **Codex**, **Docker**, **Claude**, etc.: Indica que há branches específicas para diferentes áreas de trabalho, similar à abordagem de GitFlow.
- **Patch**: Usado para pequenas correções, similar ao `hotfix` em GitFlow