<a href="https://colab.research.google.com/github/yanjun-sui/test-config/blob/master/deepseek_lora_raGent5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

使用lora方式对DeepSeek-R1-Distill-Llama-8B进行模型微调，并保存模型文件到HuggingFace

### 1.依赖安装

In [None]:
# 捕获该单元格的标准输出（stdout）和标准错误输出（stderr）, 这些输出将不在界面中打印
# %%capture
# Normally using pip install unsloth is enough

# Temporarily as of Jan 31st 2025, Colab has some issues with Pytorch
# Using pip install unsloth will take 3 minutes, whilst the below takes <1 minute:
# !将后面的代码当做系统命令执行
!pip install --no-deps bitsandbytes accelerate xformers==0.0.29 peft trl triton -v
!pip install --no-deps cut_cross_entropy unsloth_zoo
!pip install sentencepiece protobuf datasets huggingface_hub hf_transfer
!pip install --no-deps unsloth
!pip install scikit-learn

Using pip 24.1.2 from /usr/local/lib/python3.11/dist-packages/pip (python 3.11)
Collecting bitsandbytes
  Obtaining dependency information for bitsandbytes from https://files.pythonhosted.org/packages/20/0f/3a5f062c0ed2252ed128ff028b36d2a46a763a2919b00f12ca5274493ff3/bitsandbytes-0.45.3-py3-none-manylinux_2_24_x86_64.whl.metadata
  Downloading bitsandbytes-0.45.3-py3-none-manylinux_2_24_x86_64.whl.metadata (5.0 kB)
Collecting xformers==0.0.29
  Obtaining dependency information for xformers==0.0.29 from https://files.pythonhosted.org/packages/10/91/69ba97e0b8ae7f9e1d01abb0044e103aa7eb3e6d36efd5dcba68093a40b6/xformers-0.0.29-cp311-cp311-manylinux_2_28_x86_64.whl.metadata
  Downloading xformers-0.0.29-cp311-cp311-manylinux_2_28_x86_64.whl.metadata (1.0 kB)
Collecting trl
  Obtaining dependency information for trl from https://files.pythonhosted.org/packages/7b/29/25378447c48359843de0e4ce1995d367210601c3b437ddf1c779b6393d74/trl-0.15.2-py3-none-any.whl.metadata
  Downloading trl-0.15.2-py3-

### 2.模型加载

In [None]:
from transformers import AutoModelForCausalLM,AutoTokenizer,BitsAndBytesConfig,DataCollatorForSeq2Seq
from peft import get_peft_model, LoraConfig
import torch
import datasets
from datasets import Dataset
import pandas as pd
import re
from sklearn.metrics import accuracy_score

from sklearn.model_selection import train_test_split

max_length = 1024
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,          # 启用 4-bit 量化
    bnb_4bit_use_double_quant=True,  # 嵌套量化进一步压缩
    bnb_4bit_quant_type="nf4",   # 量化类型（推荐 nf4）
    bnb_4bit_compute_dtype=torch.bfloat16,  # 计算时用 bfloat16 加速
)
# 加载基础模型
bas_model = "deepseek-ai/DeepSeek-R1-Distill-Llama-8B"
model = AutoModelForCausalLM.from_pretrained(
    bas_model ,          # 本地模型路径
    quantization_config=bnb_config,
    torch_dtype=torch.bfloat16,
    use_cache=False,
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(bas_model )

#model.resize_token_embeddings(len(tokenizer))
print(tokenizer.pad_token)
print(tokenizer.eos_token)
print(f"模型显存占用: {model.get_memory_footprint() / 1e9:.2f} GB")
# 配置 LoRA
lora_config = LoraConfig(
    r=4,                      # 低秩矩阵的秩（增加秩可提升效果，但显存占用更高）
    lora_alpha= 16,           # 缩放系数
    target_modules= ["q_proj", "k_proj", "v_proj", "o_proj"],  # 仅修改注意力层的部分参数
    lora_dropout= 0.2,
    bias="none",
    task_type="CAUSAL_LM",
    use_rslora = True,  # 启用 Rank Stabilized LoRA（RSLoRA），一种改进的 LoRA 方法，旨在提高训练稳定性和性能。
    loftq_config = {}, # 配置 LoftQ（低秩量化），用于进一步减少模型大小和计算量。设置为 None 表示不使用 LoftQ。
)

model = get_peft_model(model, lora_config)
model.print_trainable_parameters()  # 示例输出: trainable params: 8,192,000 (1.2% 总参数)

🦥 Unsloth: Will patch your computer to enable 2x faster free finetuning.
🦥 Unsloth Zoo will now patch everything to make training faster!
==((====))==  Unsloth 2025.3.9: Fast Llama patching. Transformers: 4.48.3.
   \\   /|    Tesla T4. Num GPUs = 1. Max memory: 14.741 GB. Platform: Linux.
O^O/ \_/ \    Torch: 2.5.1+cu124. CUDA: 7.5. CUDA Toolkit: 12.4. Triton: 3.1.0
\        /    Bfloat16 = FALSE. FA [Xformers = 0.0.29. FA2 = False]
 "-____-"     Free license: http://github.com/unslothai/unsloth
Unsloth: Fast downloading is enabled - ignore downloading bars which are red colored!


model.safetensors:   0%|          | 0.00/5.96G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/236 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/53.0k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.2M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/483 [00:00<?, ?B/s]


### 5.训练数据集准备


In [None]:
from google.colab import files
uploaded = files.upload()

Saving acre-think-0313.csv to acre-think-0313.csv


In [None]:
EOS_TOKEN = tokenizer.eos_token  # Must add EOS_TOKEN

prompt_template = """
您是二元分类响应助手，你需要对输入的文本进行NGAC访问控制策略的识别（
请按以下扩展维度识别NGAC策略：
1. **数据完整性控制**
   校验输入格式/范围（如数据隐含格式合规性验证）
2. **操作权限验证**
   验证用户对系统状态变更的权限（如数据隐含状态修改权限）
3. **动态信息披露**  （如数据隐含敏感数据披露规则）
   根据角色控制数据展示
4. **身份认证强化**
   绑定操作与认证状态
5. **系统级安全约束**
   通过程序行为隐式阻断违规操作
），
识别流程拆解为多个子任务，包括：
（1）语法分析（Syntactic Parsing）：用户（User）、客体（Object）、用户属性（User Attributes）、客体属性（Object Attributes）和策略类（Policy Classes）。
（2）共指消解（Coreference Resolution）：解析代词或省略主语的句子，提高上下文理解能力。
（3）句法重构（Syntactic Rewriting）：将复杂句拆分为无歧义的简洁句式，使策略更具可读性。
（4）逻辑推理（Logical Inference）：基于原始文本信息、语法分析、共指消解、句法重构数据，推导出隐含的访问控制规则
（5）策略映射：基于语法分析、共指消解、句法重构、逻辑推理数据综合分析，输入是符合哪一条判定维度，或依据哪一条判否
（6）总结：输入的文本是否可识别出NGAC访问控制策略，有一条及以上满足即可输出“是”，否则输出“否”
6个子任务输出到think标签中，只输出最终结果（是或否）
Input:
{instruction}
Output:
"""

out_prompt = """
<think>
{think}
<think/>
{out}
"""



def generate_prompt(instruction, think=None, label=None, prompt_template=prompt_template):
    res = prompt_template.format( instruction=instruction)
    if label:
        out = out_prompt.format(think=think, out=label)
        res = f"{res}{out}{EOS_TOKEN}"
    return res


def tokenize(tokenizer, prompt, max_length=max_length, add_eos_token=True):
    result = tokenizer(
        prompt,
        truncation=True,
        max_length=max_length,
        padding=False,
        add_special_tokens=True,  # 确保自动添加 [CLS], [SEP] 等
        return_tensors=None)
    if result["input_ids"][-1] != tokenizer.eos_token_id:
        print("********** 数据异常 ******************")
    result["labels"] = result["input_ids"].copy()
    return result




def generate_and_tokenize_prompt(data_point):
    full_prompt = generate_prompt(
        data_point["input"],
        data_point['think'],
        data_point['acp']
    )

    tokenized_full_prompt = tokenize(tokenizer, full_prompt)
    user_prompt = generate_prompt(data_point["input"])
    tokenized_user_prompt = tokenize(tokenizer, user_prompt)
    user_prompt_len = len(tokenized_user_prompt["input_ids"])
    mask_token = [-100] * user_prompt_len
    tokenized_full_prompt["labels"] = mask_token + tokenized_full_prompt["labels"][user_prompt_len:]
    return tokenized_full_prompt


dataset = datasets.load_dataset('csv', data_files='./data/acre-think-0313.csv',encoding="GBK")
dataset = dataset['train']
dataset = dataset.to_pandas()

# 假设我们想移除一些数据，例如移除标签为 0 的数据


dataset_train, dataset_test = train_test_split(dataset, test_size=0.3, random_state=42)

dataset_train = Dataset.from_pandas(dataset_train)
dataset_test = Dataset.from_pandas(dataset_test)

dataset_train = dataset_train.shuffle().map(generate_and_tokenize_prompt)

dataset_val = dataset_test

print("训练集数量："+ str(len(dataset_train)))
print("测试集数量："+ str(len(dataset_test)))
print("验证集数量："+ str(len(dataset_val)))


Generating train split: 0 examples [00:00, ? examples/s]

训练集大小: 408
测试集大小: 88
验证集大小: 87


Map:   0%|          | 0/408 [00:00<?, ? examples/s]

Map:   0%|          | 0/87 [00:00<?, ? examples/s]

Map:   0%|          | 0/88 [00:00<?, ? examples/s]

'\n您是二元分类响应助手，你需要对输入的文本进行NGAC访问控制策略的识别（\n请按以下扩展维度识别NGAC策略：\n1. **数据完整性控制**\n   校验输入格式/范围（如数据隐含格式合规性验证）\n2. **操作权限验证**\n   验证用户对系统状态变更的权限（如数据隐含状态修改权限）\n3. **动态信息披露**  （如数据隐含敏感数据披露规则）\n   根据角色控制数据展示\n4. **身份认证强化**\n   绑定操作与认证状态\n5. **系统级安全约束**\n   通过程序行为隐式阻断违规操作\n），\n识别流程拆解为多个子任务，包括：\n（1）语法分析（Syntactic Parsing）：用户（User）、客体（Object）、用户属性（User Attributes）、客体属性（Object Attributes）和策略类（Policy Classes）。\n（2）共指消解（Coreference Resolution）：解析代词或省略主语的句子，提高上下文理解能力。\n（3）句法重构（Syntactic Rewriting）：将复杂句拆分为无歧义的简洁句式，使策略更具可读性。\n（4）逻辑推理（Logical Inference）：基于原始文本信息、语法分析、共指消解、句法重构数据，推导出隐含的访问控制规则\n（5）策略映射：基于语法分析、共指消解、句法重构、逻辑推理数据综合分析，输入是符合哪一条判定维度，或依据哪一条判否\n（6）总结：输入的文本是否可识别出NGAC访问控制策略，有一条及以上满足即可输出“是”，否则输出“否”\n6个子任务输出到think标签中，只输出最终结果（是|否）\nInput:\nIf the lab procedure status is marked as completed, the patient can see the results and the HCP-provided comments.\nOutput:\n<think>\n1. 语法分析：用户=患者；客体=实验结果 2. 共指消解：动态信息披露（状态驱动） 3. 句法重构：基于状态的数据展示 4. 逻辑推理：维度3 5. 策略映射：动态信息披露 6. 结论：是\n</think>\n是\n<｜end▁of▁sentence｜>'

In [None]:
dataset_train["text"][0]

'\n您是二元分类响应助手，你需要对输入的文本进行NGAC访问控制策略的识别（\n请按以下扩展维度识别NGAC策略：\n1. **数据完整性控制**  \n   校验输入格式/范围（如数据隐含格式合规性验证）\n2. **操作权限验证**  \n   验证用户对系统状态变更的权限（如数据隐含状态修改权限）\n3. **动态信息披露**  （如数据隐含敏感数据披露规则）\n   根据角色控制数据展示\n4. **身份认证强化**  \n   绑定操作与认证状态\n5. **系统级安全约束**  \n   通过程序行为隐式阻断违规操作\n），\n识别流程拆解为多个子任务，包括：\n（1）语法分析（Syntactic Parsing）：用户（User）、客体（Object）、用户属性（User Attributes）、客体属性（Object Attributes）和策略类（Policy Classes）。\n（2）共指消解（Coreference Resolution）：解析代词或省略主语的句子，提高上下文理解能力。\n（3）句法重构（Syntactic Rewriting）：将复杂句拆分为无歧义的简洁句式，使策略更具可读性。\n（4）逻辑推理（Logical Inference）：基于原始文本信息、语法分析、共指消解、句法重构数据，推导出隐含的访问控制规则\n（5）策略映射：基于语法分析、共指消解、句法重构、逻辑推理数据综合分析，输入是符合哪一条判定维度，或依据哪一条判否\n（6）总结：输入的文本是否可识别出NGAC访问控制策略，有一条及以上满足即可输出“是”，否则输出“否”\n6个子任务输出到think标签中，只输出最终结果（是|否）\nInput:\nBy default, the messages in the message inbox or outbox should be ordered by timestamp, the most recent first.\nOutput:\n<think>\n1. 语法分析：UI排序规则 2. 共指消解：非访问控制机制 3. 句法重构：功能设计 4. 逻辑推理：非安全策略 5. 策略映射：无匹配维度 6. 结论：否\n</think>\n否\n<｜end▁of▁sentence｜>'

In [None]:
dataset_test["text"][0]

'\n您是二元分类响应助手，你需要对输入的文本进行NGAC访问控制策略的识别（\n请按以下扩展维度识别NGAC策略：\n1. **数据完整性控制**  \n   校验输入格式/范围（如数据隐含格式合规性验证）\n2. **操作权限验证**  \n   验证用户对系统状态变更的权限（如数据隐含状态修改权限）\n3. **动态信息披露**  （如数据隐含敏感数据披露规则）\n   根据角色控制数据展示\n4. **身份认证强化**  \n   绑定操作与认证状态\n5. **系统级安全约束**  \n   通过程序行为隐式阻断违规操作\n），\n识别流程拆解为多个子任务，包括：\n（1）语法分析（Syntactic Parsing）：用户（User）、客体（Object）、用户属性（User Attributes）、客体属性（Object Attributes）和策略类（Policy Classes）。\n（2）共指消解（Coreference Resolution）：解析代词或省略主语的句子，提高上下文理解能力。\n（3）句法重构（Syntactic Rewriting）：将复杂句拆分为无歧义的简洁句式，使策略更具可读性。\n（4）逻辑推理（Logical Inference）：基于原始文本信息、语法分析、共指消解、句法重构数据，推导出隐含的访问控制规则\n（5）策略映射：基于语法分析、共指消解、句法重构、逻辑推理数据综合分析，输入是符合哪一条判定维度，或依据哪一条判否\n（6）总结：输入的文本是否可识别出NGAC访问控制策略，有一条及以上满足即可输出“是”，否则输出“否”\n6个子任务输出到think标签中，只输出最终结果（是|否）\nInput:\nThe sending HCP then chooses a priority from 1-3 (1 is most important, 3 is least important) for the referral.\nOutput:\n<think>\n1. 语法分析：用户=HCP；客体=转诊流程 2. 共指消解：输入范围约束 3. 句法重构：数据完整性控制 4. 逻辑推理：维度1 5. 策略映射：数据完整性控制 6. 结论：是\n</think>\n是\n<｜end▁of▁sentence｜>'

In [None]:
dataset_val["text"][0]

'\n您是二元分类响应助手，你需要对输入的文本进行NGAC访问控制策略的识别（\n请按以下扩展维度识别NGAC策略：\n1. **数据完整性控制**  \n   校验输入格式/范围（如数据隐含格式合规性验证）\n2. **操作权限验证**  \n   验证用户对系统状态变更的权限（如数据隐含状态修改权限）\n3. **动态信息披露**  （如数据隐含敏感数据披露规则）\n   根据角色控制数据展示\n4. **身份认证强化**  \n   绑定操作与认证状态\n5. **系统级安全约束**  \n   通过程序行为隐式阻断违规操作\n），\n识别流程拆解为多个子任务，包括：\n（1）语法分析（Syntactic Parsing）：用户（User）、客体（Object）、用户属性（User Attributes）、客体属性（Object Attributes）和策略类（Policy Classes）。\n（2）共指消解（Coreference Resolution）：解析代词或省略主语的句子，提高上下文理解能力。\n（3）句法重构（Syntactic Rewriting）：将复杂句拆分为无歧义的简洁句式，使策略更具可读性。\n（4）逻辑推理（Logical Inference）：基于原始文本信息、语法分析、共指消解、句法重构数据，推导出隐含的访问控制规则\n（5）策略映射：基于语法分析、共指消解、句法重构、逻辑推理数据综合分析，输入是符合哪一条判定维度，或依据哪一条判否\n（6）总结：输入的文本是否可识别出NGAC访问控制策略，有一条及以上满足即可输出“是”，否则输出“否”\n6个子任务输出到think标签中，只输出最终结果（是|否）\nInput:\nThe LHCP does not confirm the selection and is prompted to try again.\nOutput:\n<think>\n语法分析：未确认选择时提示重试；共指消解：隐含权限验证失败；句法重构：操作需显式确认；逻辑推理：操作权限验证（维度2）；策略映射：系统级安全约束（维度5）；总结：是\n</think>\n是\n<｜end▁of▁sentence｜>'

### 6.模型训练


In [None]:
from transformers import TrainingArguments

args = TrainingArguments(
    output_dir="./llama-lora-finetuned-0326",
    per_device_train_batch_size=2,       # 根据显存调整（24GB 显存可设 4-8）
    gradient_accumulation_steps=2,       # 模拟更大的 batch size
    warmup_steps =100,
    num_train_epochs=10,
    learning_rate=2e-5,
    fp16=True,                           # 混合精度训练
    logging_steps=10,
    save_strategy="steps",
    save_steps=50,
    optim="paged_adamw_8bit",            # 8-bit 优化器节省显存
    weight_decay = 0.1,
    lr_scheduler_type = "cosine",
    seed = 3407,

    remove_unused_columns=True

)

from transformers import Trainer

trainer = Trainer(
    model=model,
    args=args,
    train_dataset=dataset_train,
    data_collator=DataCollatorForSeq2Seq(
      tokenizer, pad_to_multiple_of=8, return_tensors="pt", padding=False),

)

trainer.train()

Tokenizing to ["text"] (num_proc=2):   0%|          | 0/459 [00:00<?, ? examples/s]

==((====))==  Unsloth - 2x faster free finetuning | Num GPUs used = 1
   \\   /|    Num examples = 459 | Num Epochs = 15 | Total steps = 100
O^O/ \_/ \    Batch size per device = 8 | Gradient accumulation steps = 8
\        /    Data Parallel GPUs = 1 | Total batch size (8 x 8 x 1) = 64
 "-____-"     Trainable parameters = 41,943,040/4,670,623,744 (0.90% trained)


Unsloth: Will smartly offload gradients to save VRAM!


Step,Training Loss
1,4.2571
2,4.2662
3,4.2131
4,3.9816
5,3.6116
6,3.1316
7,2.6962
8,2.2776
9,1.9411
10,1.6849



### 7.模型保存

In [None]:
new_model_online = "suiyanjun/raGent-0313-acre"
token = "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"
model.push_to_hub("suiyanjun/lora-0326")
#model.push_to_hub_merged(new_model_online, tokenizer, save_method = "merged_16bit", token=token)

Unsloth: You are pushing to hub, but you passed your HF username = suiyanjun.
We shall truncate suiyanjun/raGent-0313-acre to raGent-0313-acre
Unsloth: You have 1 CPUs. Using `safe_serialization` is 10x slower.
We shall switch to Pytorch saving, which might take 3 minutes and not 30 minutes.
To force `safe_serialization`, set it to `None` instead.
Unsloth: Kaggle/Colab has limited disk space. We need to delete the downloaded
model which will save 4-16GB of disk space, allowing you to save on Kaggle/Colab.
Unsloth: Will remove a cached repo with size 6.0G


Unsloth: Merging 4bit and LoRA weights to 16bit...
Unsloth: Will use up to 3.12 out of 12.67 RAM for saving.
Unsloth: Saving model... This might take 5 minutes ...


 34%|███▍      | 11/32 [00:00<00:01, 13.03it/s]
We will save to Disk and not RAM now.
100%|██████████| 32/32 [05:31<00:00, 10.35s/it]


Unsloth: Saving tokenizer...

  0%|          | 0/1 [00:00<?, ?it/s]

tokenizer.json:   0%|          | 0.00/17.2M [00:00<?, ?B/s]

 Done.
Unsloth: Saving raGent-0313-acre/pytorch_model-00001-of-00004.bin...
Unsloth: Saving raGent-0313-acre/pytorch_model-00002-of-00004.bin...
Unsloth: Saving raGent-0313-acre/pytorch_model-00003-of-00004.bin...
Unsloth: Saving raGent-0313-acre/pytorch_model-00004-of-00004.bin...


README.md:   0%|          | 0.00/628 [00:00<?, ?B/s]

  0%|          | 0/4 [00:00<?, ?it/s]

pytorch_model-00004-of-00004.bin:   0%|          | 0.00/1.17G [00:00<?, ?B/s]

pytorch_model-00003-of-00004.bin:   0%|          | 0.00/4.92G [00:00<?, ?B/s]

pytorch_model-00002-of-00004.bin:   0%|          | 0.00/5.00G [00:00<?, ?B/s]

pytorch_model-00001-of-00004.bin:   0%|          | 0.00/4.98G [00:00<?, ?B/s]

Done.
Saved merged model to https://huggingface.co/suiyanjun/raGent-0313-acre


### 8.训练后模型测试

In [None]:
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "suiyanjun/lora_model", # 加载保存的模型
    max_seq_length = max_seq_length,
    dtype = dtype,
    load_in_4bit = load_in_4bit,
    # token = "hf_...", # use one if using gated models like meta-llama/Llama-2-7b-hf
)

In [None]:
prompt_style = """您是二元分类响应助手，你需要对输入的文本进行NGAC访问控制策略的识别（
请按以下扩展维度识别NGAC策略：
1. **数据完整性控制**
   校验输入格式/范围（如数据隐含格式合规性验证）
2. **操作权限验证**
   验证用户对系统状态变更的权限（如数据隐含状态修改权限）
3. **动态信息披露**  （如数据隐含敏感数据披露规则）
   根据角色控制数据展示
4. **身份认证强化**
   绑定操作与认证状态
5. **系统级安全约束**
   通过程序行为隐式阻断违规操作
），
识别流程拆解为多个子任务，包括：
（1）语法分析（Syntactic Parsing）：用户（User）、客体（Object）、用户属性（User Attributes）、客体属性（Object Attributes）和策略类（Policy Classes）。
（2）共指消解（Coreference Resolution）：解析代词或省略主语的句子，提高上下文理解能力。
（3）句法重构（Syntactic Rewriting）：将复杂句拆分为无歧义的简洁句式，使策略更具可读性。
（4）逻辑推理（Logical Inference）：基于原始文本信息、语法分析、共指消解、句法重构数据，推导出隐含的访问控制规则
（5）策略映射：基于语法分析、共指消解、句法重构、逻辑推理数据综合分析，输入是符合哪一条判定维度，或依据哪一条判否
（6）总结：输入的文本是否可识别出NGAC访问控制策略，有一条及以上满足即可输出“是”，否则输出“否”
6个子任务输出到think标签中，只输出最终结果（一个字：是|否）
Input:
{}
Output:
<think></think>
"""


question = "一封假电子邮件被发送给患者或代表，提醒患者或代表新的消息回复已经到达。"


FastLanguageModel.for_inference(model)# Unsloth has 2x faster inference!
inputs = tokenizer([prompt_style.format(question, )], return_tensors="pt").to("cuda")

outputs = model.generate(
  input_ids=inputs.input_ids,
  attention_mask=inputs.attention_mask,
  max_new_tokens=1200,
  use_cache=True,
)
response = tokenizer.batch_decode(outputs)

print(response[0])

<｜begin▁of▁sentence｜>您是二元分类响应助手，你需要对输入的文本进行NGAC访问控制策略的识别（
请按以下扩展维度识别NGAC策略：
1. **数据完整性控制**
   校验输入格式/范围（如数据隐含格式合规性验证）
2. **操作权限验证**
   验证用户对系统状态变更的权限（如数据隐含状态修改权限）
3. **动态信息披露**  （如数据隐含敏感数据披露规则）
   根据角色控制数据展示
4. **身份认证强化**
   绑定操作与认证状态
5. **系统级安全约束**
   通过程序行为隐式阻断违规操作
），
识别流程拆解为多个子任务，包括：
（1）语法分析（Syntactic Parsing）：用户（User）、客体（Object）、用户属性（User Attributes）、客体属性（Object Attributes）和策略类（Policy Classes）。
（2）共指消解（Coreference Resolution）：解析代词或省略主语的句子，提高上下文理解能力。
（3）句法重构（Syntactic Rewriting）：将复杂句拆分为无歧义的简洁句式，使策略更具可读性。
（4）逻辑推理（Logical Inference）：基于原始文本信息、语法分析、共指消解、句法重构数据，推导出隐含的访问控制规则
（5）策略映射：基于语法分析、共指消解、句法重构、逻辑推理数据综合分析，输入是符合哪一条判定维度，或依据哪一条判否
（6）总结：输入的文本是否可识别出NGAC访问控制策略，有一条及以上满足即可输出“是”，否则输出“否”
6个子任务输出到think标签中，只输出最终结果（一个字：是|否）
Input:
一封假电子邮件被发送给患者或代表，提醒患者或代表新的消息回复已经到达。
Output:
<think></think>
好的，我现在需要分析用户提供的文本，判断是否存在NGAC访问控制策略。首先，用户给出的文本是：“一封假电子邮件被发送给患者或代表，提醒患者或代表新的消息回复已经到达。”。

接下来，我按照用户指定的六个子任务来处理。首先是语法分析（Syntactic Parsing），我需要识别句子中的主语、宾语、属性等。句子中的主语是“一封假电子邮件”，宾语是“患者或代表”，而动作是“被发送给”和“提醒”。接着，句子中涉及的用户属

In [None]:
result_list = response[0].split("</think>")
result1 = result_list[len(result_list) -1 ]
print(result1)



1
<｜end▁of▁sentence｜>


In [None]:
#print(len(dataset_test))
j=0
y_true = []  # 真实标签
y_pred = []  # 模型预测标签
for i in range(len(dataset_test['acp'])):
  print(f"--------------------------{i}--------------------------------------")
  question = dataset_test['input'][i]

  result = dataset_test['acp'][i]
  if str(result) == '1':
      y_true.append(1)
  else:
      y_true.append(0)
  inp = prompt_style.format(question,"", "")

  inputs = tokenizer([inp], return_tensors="pt").to("cuda")
  outputs = model.generate(
    input_ids=inputs.input_ids,
    attention_mask=inputs.attention_mask,
    max_new_tokens=1200,
    use_cache=True,
  )
  response = tokenizer.batch_decode(outputs)

  result_list = response[0].split("</think>")
  result1 = result_list[len(result_list) -1 ].split("<｜end▁of▁sentence｜>")[0]

  print("预测结果："+ result1)
  print("真实结果："+ str(result))
  print(response[0])
  if str(result) in result1:
      j += 1
  else:

    pass
  if '是' in result1:
    y_pred.append(1)
  else :
    y_pred.append(0)
  print("正确数量：" + str(j))
  print(f"--------------------------{i} END--------------------------------------")


[1;30;43m流式输出内容被截断，只能显示最后 5000 行内容。[0m
   - 文本符合数据完整性控制（涉及数据隐含格式合规性验证）、操作权限验证（涉及数据隐含状态修改权限）、动态信息披露（根据角色控制数据展示）、身份认证强化（绑定操作与认证状态）和系统级安全约束（阻断违规操作）。

6. **总结**：
   - 文本涵盖了多个NGAC维度，因此可以判定存在NGAC访问控制策略。

综上所述，文本符合NGAC策略的多个维度，因此输出“是”。
</think>

是<｜end▁of▁sentence｜>
正确数量：31
--------------------------45 END--------------------------------------
--------------------------46--------------------------------------
预测结果：

是
真实结果：否
<｜begin▁of▁sentence｜>您是二元分类响应助手，你需要对输入的文本进行NGAC访问控制策略的识别（
请按以下扩展维度识别NGAC策略：
1. **数据完整性控制**
   校验输入格式/范围（如数据隐含格式合规性验证）
2. **操作权限验证**
   验证用户对系统状态变更的权限（如数据隐含状态修改权限）
3. **动态信息披露**  （如数据隐含敏感数据披露规则）
   根据角色控制数据展示
4. **身份认证强化**
   绑定操作与认证状态
5. **系统级安全约束**
   通过程序行为隐式阻断违规操作
），
识别流程拆解为多个子任务，包括：
（1）语法分析（Syntactic Parsing）：用户（User）、客体（Object）、用户属性（User Attributes）、客体属性（Object Attributes）和策略类（Policy Classes）。
（2）共指消解（Coreference Resolution）：解析代词或省略主语的句子，提高上下文理解能力。
（3）句法重构（Syntactic Rewriting）：将复杂句拆分为无歧义的简洁句式，使策略更具可读性。
（4）逻辑推理（Logical Inference）：基于原始文本信息、语法分析、共指消解、句法重构数据，推导出隐含的访问控制规

In [None]:
print(y_true )
print(y_pred )

[1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 

In [None]:
from sklearn.metrics import confusion_matrix

def calculate_f1(y_true, y_pred):
    # 计算混淆矩阵
    cm = confusion_matrix(y_true, y_pred)

    # 混淆矩阵包含四个值：[[TN, FP], [FN, TP]]
    tn, fp, fn, tp = cm.ravel()  # ravel() 方便直接取出四个值

    # 计算 Precision 和 Recall
    precision = tp / (tp + fp) if (tp + fp) != 0 else 0
    recall = tp / (tp + fn) if (tp + fn) != 0 else 0

    # 计算 F1 值
    if (precision + recall) == 0:
        return 0
    f1 = 2 * (precision * recall) / (precision + recall)
    return f1

In [None]:
f1 = calculate_f1(y_true, y_pred)
print(f1)

0.8534396809571286
