In [1]:
%load_ext autoreload
%autoreload 2

import os
from dotenv import load_dotenv
from pathlib import Path
from research_tools.gpu import get_gpus_available

load_dotenv()


hf_access_token = os.getenv("HUGGINGFACE_API_KEY")

n_gpus = 1

gpus_available = get_gpus_available()
n_gpus = min(n_gpus, len(gpus_available))
gpus = gpus_available[:n_gpus]

assert n_gpus > 0, "No GPUs available"

os.environ["CUDA_VISIBLE_DEVICES"] = ",".join([str(i) for i in gpus])

In [2]:
# print transformers_cache
os.environ["TRANSFORMERS_CACHE"] = ""
# remove from environment
del os.environ["TRANSFORMERS_CACHE"]

In [3]:
from transformers import AutoTokenizer, AutoModelForCausalLM
from typing import List, Dict, Optional
import torch
from research_tools.utils import set_seed

set_seed(42)

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
assert device == torch.device("cuda")

model_id = "HuggingFaceH4/zephyr-7b-beta"

model = AutoModelForCausalLM.from_pretrained(
    model_id, torch_dtype=torch.bfloat16, trust_remote_code=True, token=hf_access_token
).to(device)
tokenizer = AutoTokenizer.from_pretrained(model_id)
tokenizer.pad_token_id = tokenizer.eos_token_id

Loading checkpoint shards:   0%|          | 0/8 [00:00<?, ?it/s]

In [4]:
from datasets import load_dataset
from relearn.datasets.utils import (
    load_dataset as local_load_dataset,
    DATASETS_DICT,
    Datasets,
)
from relearn.datasets.corpus import process as process_corpus
from relearn.datasets.mcq import process as process_mcq
import pickle

data_dir = Path("../data")
cache_path = data_dir / "full.pickle"

USE_CACHE = True

if USE_CACHE:
    assert cache_path.exists(), "Cache file does not exist"
    with open(cache_path, "rb") as f:
        data = pickle.load(f)
else:
    data = {}
    # iterate over all enums
    for name in Datasets:

        dataset_config = DATASETS_DICT[name]

        def get_dataset(train_files: List[str], val_files: List[str], max_length: int):
            train = local_load_dataset(data_dir, train_files)
            val = local_load_dataset(data_dir, val_files)
            train_records = process_corpus(train, tokenizer, max_length)
            val_records = process_mcq(val, tokenizer, max_length)
            mcq_records = process_mcq(val, tokenizer, max_length, expand_choices=False)
            return {
                "corpus": train_records,
                "mcq": mcq_records,
                "val": val_records,
            }

        max_length = 512

        unlearn_files = dataset_config["unlearn_files"]
        val_unlearn_files = dataset_config["val_unlearn_files"]

        print(f"Processing {name}")

        data[name] = get_dataset(unlearn_files, val_unlearn_files, max_length)

        if "retain" not in data:
            retain_files = dataset_config["retain_files"]
            val_retain_files = dataset_config["val_retain_files"]
            data["retain"] = get_dataset(retain_files, val_retain_files, max_length)

    with open(cache_path, "wb") as f:
        pickle.dump(data, f)

In [5]:
import wandb

wandb.login()
config = {
    "model_id": model_id,
}


run = wandb.init(
    project="relearn", config=config, tags=["rmu", "fold", "debug"], entity="12tqian"
)

[34m[1mwandb[0m: Using wandb-core as the SDK backend.  Please refer to https://wandb.me/wandb-core for more information.
[34m[1mwandb[0m: Currently logged in as: [33m12tqian[0m. Use [1m`wandb login --relogin`[0m to force relogin


In [None]:
from relearn.unlearn.rmu import super_rmu

forget_set = data[Datasets.WMDP]
retain_set = data["retain"]

model, res = super_rmu(
    model,
    tokenizer,
    forget_set,
    retain_set,
    None,
    4,
    magnitude=6.5,
    forget_alpha=0.023105360391794554,
    retain_alpha=0.14482228107954087,
    epochs_per_fold=3,
    lr=0.00008156557999985112,
    lr_end=0.11877675152876664,
    joint_train=True,
    prefix_forget=True,  # i have now set this to true
    sweeping=True,
)
print(res)

Unlearning fold A


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 99/99 [00:07<00:00, 14.10it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 14.89it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 16.20it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:07<00:00, 12.30it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 393/393 [00:56<00:00,  

{'epoch': -1, 'A/acc': 0.5939086294416244, 'B/acc': 0.5357142857142857, 'C/acc': 0.5153061224489796, 'D/acc': 0.5510204081632653, 'retain/acc': 0.5923566878980892}


  forget_loss = torch.nn.functional.mse_loss(
100%|█████████████████████████████████████████| 147/147 [03:07<00:00,  1.27s/it, A/forget_loss=0.000862, B/retain_loss=1.08e-5, C/retain_loss=1.38e-5, D/retain_loss=2.57e-5, retain/retain_loss=4.63e-5]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 99/99 [00:07<00:00, 13.44it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:08<00:00, 12.18it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:07<00:00, 13.70it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

{'epoch': 0, 'A/acc': 0.29949238578680204, 'B/acc': 0.41836734693877553, 'C/acc': 0.3979591836734694, 'D/acc': 0.45408163265306123, 'retain/acc': 0.5528662420382165}


100%|██████████████████████████████████████████| 147/147 [03:08<00:00,  1.28s/it, A/forget_loss=0.000835, B/retain_loss=2.97e-6, C/retain_loss=4.2e-6, D/retain_loss=2.61e-6, retain/retain_loss=7.96e-5]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 99/99 [00:06<00:00, 14.64it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:07<00:00, 13.25it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 14.15it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:07<00:00, 1

{'epoch': 1, 'A/acc': 0.4416243654822335, 'B/acc': 0.47959183673469385, 'C/acc': 0.42857142857142855, 'D/acc': 0.5306122448979592, 'retain/acc': 0.5579617834394904}


100%|███████████████████████████████████████████| 147/147 [02:45<00:00,  1.13s/it, A/forget_loss=0.000801, B/retain_loss=2.67e-6, C/retain_loss=2.7e-6, D/retain_loss=2.8e-6, retain/retain_loss=4.74e-5]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 99/99 [00:06<00:00, 15.43it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 14.51it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 16.15it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 1

{'epoch': 2, 'A/acc': 0.24873096446700507, 'B/acc': 0.47959183673469385, 'C/acc': 0.4489795918367347, 'D/acc': 0.5510204081632653, 'retain/acc': 0.5605095541401274}
Unlearning fold B


100%|███████████████████████████████████████| 147/147 [02:28<00:00,  1.01s/it, A/forget_loss=0.000507, B/forget_loss=0.000511, C/retain_loss=5.05e-5, D/retain_loss=4.48e-5, retain/retain_loss=0.000664]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 99/99 [00:06<00:00, 15.48it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 14.87it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 16.17it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 1

{'epoch': 3, 'A/acc': 0.3248730964467005, 'B/acc': 0.3010204081632653, 'C/acc': 0.21428571428571427, 'D/acc': 0.3010204081632653, 'retain/acc': 0.2878980891719745}


100%|█████████████████████████████████████████| 147/147 [02:28<00:00,  1.01s/it, A/forget_loss=0.000504, B/forget_loss=0.000504, C/retain_loss=2.09e-5, D/retain_loss=2.34e-5, retain/retain_loss=0.0005]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 99/99 [00:06<00:00, 15.45it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 14.82it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 16.14it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 1

{'epoch': 4, 'A/acc': 0.40609137055837563, 'B/acc': 0.30612244897959184, 'C/acc': 0.3112244897959184, 'D/acc': 0.3673469387755102, 'retain/acc': 0.34394904458598724}


100%|██████████████████████████████████████████| 147/147 [02:28<00:00,  1.01s/it, A/forget_loss=0.000507, B/forget_loss=0.00066, C/retain_loss=1.7e-5, D/retain_loss=1.8e-5, retain/retain_loss=0.000383]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 99/99 [00:06<00:00, 15.42it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 14.83it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 16.14it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 1

{'epoch': 5, 'A/acc': 0.41624365482233505, 'B/acc': 0.3520408163265306, 'C/acc': 0.33163265306122447, 'D/acc': 0.39285714285714285, 'retain/acc': 0.3910828025477707}
Unlearning fold C


100%|████████████████████████████████████████| 147/147 [02:10<00:00,  1.12it/s, A/forget_loss=0.000404, B/forget_loss=0.000429, C/forget_loss=0.000397, D/retain_loss=0.00363, retain/retain_loss=0.0354]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 99/99 [00:06<00:00, 15.44it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 14.53it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 16.19it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 1

{'epoch': 6, 'A/acc': 0.17766497461928935, 'B/acc': 0.1989795918367347, 'C/acc': 0.18877551020408162, 'D/acc': 0.16326530612244897, 'retain/acc': 0.2713375796178344}
Unlearning fold D


100%|██████████████████████████████████████████████████| 147/147 [01:53<00:00,  1.29it/s, A/forget_loss=0.0216, B/forget_loss=0.0233, C/forget_loss=0.0201, D/forget_loss=0.0184, retain/retain_loss=3.7]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 99/99 [00:06<00:00, 15.42it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 14.80it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 16.12it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:06<00:00, 1

{'epoch': 9, 'A/acc': 0.19289340101522842, 'B/acc': 0.1836734693877551, 'C/acc': 0.1377551020408163, 'D/acc': 0.1836734693877551, 'retain/acc': 0.26496815286624203}


 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 376/393 [00:24<00:01, 16.37it/s]

 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 376/393 [00:24<00:01, 15.12it/s]


KeyboardInterrupt: 

[1;34mwandb[0m: 🚀 View run [33mworldly-firebrand-3283[0m at: [34mhttps://wandb.ai/12tqian/relearn/runs/k4tud6ju[0m
[1;34mwandb[0m: Find logs at: [1;35mwandb/run-20250217_120401-k4tud6ju/logs[0m


In [None]:
run.finish()

path = Path("../models/super_rmu")
path.mkdir(exist_ok=True, parents=True)
model.save_pretrained(path)

In [None]:
from relearn.attacks import super_rtt

config = {
    "model_id": model_id,
}
run = wandb.init(
    project="relearn", config=config, tags=["rtt", "fold", "debug"], entity="12tqian"
)

model = super_rtt(model, tokenizer, forget_set, 4, use_wandb=True)

run.finish()