In [2]:
from transformers import AutoTokenizer, AutoModel
from peft import PeftModel
import torch

base_model = "Qwen/Qwen2.5-VL-3B-Instruct"
adapter_path = "saves/qwen2.5_vl-3b_cold_start_new_stage2/lora/sft"

# 加载 tokenizer
tokenizer = AutoTokenizer.from_pretrained(base_model, trust_remote_code=True)

# 加载 Qwen2.5-VL 模型（带 vision）
model = AutoModel.from_pretrained(
    base_model,
    trust_remote_code=True,
    torch_dtype=torch.bfloat16,  # 或者用 torch.float16 / "auto"
    device_map="auto"
)

# 加载 LoRA adapter
model = PeftModel.from_pretrained(model, adapter_path)

# 统计参数
trainable = sum(p.numel() for p in model.parameters() if p.requires_grad)
total = sum(p.numel() for p in model.parameters())
print(f"Trainable parameters: {trainable}")
print(f"All parameters: {total}")
print(f"Trainable ratio: {100 * trainable / total:.4f}%")


Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

ValueError: Target modules {'model.layers.32.self_attn.o_proj', 'model.layers.9.self_attn.k_proj', 'model.layers.6.self_attn.o_proj', 'model.layers.30.self_attn.q_proj', 'model.layers.33.self_attn.q_proj', 'model.layers.23.self_attn.v_proj', 'model.layers.30.self_attn.o_proj', 'model.layers.30.self_attn.k_proj', 'model.layers.19.self_attn.o_proj', 'model.layers.28.self_attn.v_proj', 'model.layers.1.self_attn.q_proj', 'model.layers.25.self_attn.k_proj', 'model.layers.8.self_attn.q_proj', 'model.layers.8.self_attn.o_proj', 'model.layers.11.self_attn.q_proj', 'model.layers.22.self_attn.o_proj', 'model.layers.2.self_attn.o_proj', 'model.layers.6.self_attn.q_proj', 'model.layers.34.self_attn.k_proj', 'model.layers.3.self_attn.v_proj', 'model.layers.4.self_attn.o_proj', 'model.layers.8.self_attn.k_proj', 'model.layers.4.self_attn.k_proj', 'model.layers.9.self_attn.o_proj', 'model.layers.33.self_attn.k_proj', 'model.layers.19.self_attn.v_proj', 'model.layers.16.self_attn.v_proj', 'model.layers.17.self_attn.q_proj', 'model.layers.22.self_attn.k_proj', 'model.layers.1.self_attn.v_proj', 'model.layers.35.self_attn.k_proj', 'model.layers.29.self_attn.v_proj', 'model.layers.27.self_attn.k_proj', 'model.layers.11.self_attn.o_proj', 'model.layers.32.self_attn.k_proj', 'model.layers.31.self_attn.q_proj', 'model.layers.13.self_attn.v_proj', 'model.layers.22.self_attn.v_proj', 'model.layers.24.self_attn.q_proj', 'model.layers.16.self_attn.o_proj', 'model.layers.28.self_attn.o_proj', 'model.layers.21.self_attn.q_proj', 'model.layers.18.self_attn.q_proj', 'model.layers.28.self_attn.k_proj', 'model.layers.20.self_attn.o_proj', 'model.layers.16.self_attn.k_proj', 'model.layers.26.self_attn.q_proj', 'model.layers.34.self_attn.o_proj', 'model.layers.10.self_attn.v_proj', 'model.layers.1.self_attn.o_proj', 'model.layers.26.self_attn.k_proj', 'model.layers.22.self_attn.q_proj', 'model.layers.12.self_attn.v_proj', 'model.layers.5.self_attn.q_proj', 'model.layers.2.self_attn.k_proj', 'model.layers.9.self_attn.q_proj', 'model.layers.3.self_attn.k_proj', 'model.layers.7.self_attn.q_proj', 'model.layers.25.self_attn.o_proj', 'model.layers.25.self_attn.q_proj', 'model.layers.21.self_attn.v_proj', 'model.layers.35.self_attn.o_proj', 'model.layers.19.self_attn.k_proj', 'model.layers.13.self_attn.q_proj', 'model.layers.13.self_attn.o_proj', 'model.layers.29.self_attn.q_proj', 'model.layers.26.self_attn.v_proj', 'model.layers.14.self_attn.v_proj', 'model.layers.23.self_attn.k_proj', 'model.layers.11.self_attn.v_proj', 'model.layers.7.self_attn.v_proj', 'model.layers.29.self_attn.k_proj', 'model.layers.7.self_attn.k_proj', 'model.layers.31.self_attn.k_proj', 'model.layers.12.self_attn.k_proj', 'model.layers.17.self_attn.v_proj', 'model.layers.23.self_attn.q_proj', 'model.layers.24.self_attn.k_proj', 'model.layers.33.self_attn.v_proj', 'model.layers.20.self_attn.k_proj', 'model.layers.15.self_attn.q_proj', 'model.layers.4.self_attn.q_proj', 'model.layers.31.self_attn.o_proj', 'model.layers.33.self_attn.o_proj', 'model.layers.7.self_attn.o_proj', 'model.layers.2.self_attn.q_proj', 'model.layers.19.self_attn.q_proj', 'model.layers.21.self_attn.o_proj', 'model.layers.34.self_attn.v_proj', 'model.layers.20.self_attn.q_proj', 'model.layers.12.self_attn.o_proj', 'model.layers.8.self_attn.v_proj', 'model.layers.21.self_attn.k_proj', 'model.layers.17.self_attn.o_proj', 'model.layers.6.self_attn.v_proj', 'model.layers.4.self_attn.v_proj', 'model.layers.0.self_attn.v_proj', 'model.layers.17.self_attn.k_proj', 'model.layers.5.self_attn.o_proj', 'model.layers.28.self_attn.q_proj', 'model.layers.5.self_attn.k_proj', 'model.layers.35.self_attn.q_proj', 'model.layers.32.self_attn.q_proj', 'model.layers.15.self_attn.v_proj', 'model.layers.24.self_attn.o_proj', 'model.layers.34.self_attn.q_proj', 'model.layers.23.self_attn.o_proj', 'model.layers.24.self_attn.v_proj', 'model.layers.29.self_attn.o_proj', 'model.layers.3.self_attn.q_proj', 'model.layers.15.self_attn.k_proj', 'model.layers.27.self_attn.o_proj', 'model.layers.10.self_attn.k_proj', 'model.layers.5.self_attn.v_proj', 'model.layers.3.self_attn.o_proj', 'model.layers.11.self_attn.k_proj', 'model.layers.35.self_attn.v_proj', 'model.layers.10.self_attn.q_proj', 'model.layers.6.self_attn.k_proj', 'model.layers.15.self_attn.o_proj', 'model.layers.27.self_attn.q_proj', 'model.layers.26.self_attn.o_proj', 'model.layers.30.self_attn.v_proj', 'model.layers.18.self_attn.k_proj', 'model.layers.2.self_attn.v_proj', 'model.layers.31.self_attn.v_proj', 'model.layers.14.self_attn.o_proj', 'model.layers.32.self_attn.v_proj', 'model.layers.9.self_attn.v_proj', 'model.layers.13.self_attn.k_proj', 'model.layers.18.self_attn.v_proj', 'model.layers.0.self_attn.q_proj', 'model.layers.14.self_attn.q_proj', 'model.layers.18.self_attn.o_proj', 'model.layers.14.self_attn.k_proj', 'model.layers.1.self_attn.k_proj', 'model.layers.16.self_attn.q_proj', 'model.layers.20.self_attn.v_proj', 'model.layers.0.self_attn.o_proj', 'model.layers.25.self_attn.v_proj', 'model.layers.12.self_attn.q_proj', 'model.layers.27.self_attn.v_proj', 'model.layers.10.self_attn.o_proj', 'model.layers.0.self_attn.k_proj'} not found in the base model. Please check the target modules and try again.