In [1]:
import json
import pandas as pd
import numpy as np
from tqdm import tqdm
from sklearn.metrics import precision_score, recall_score, f1_score, accuracy_score
from transformers import AutoModelForCausalLM, AutoTokenizer

# 加载模型和 tokenizer
model_path = "./Qwen2.5-0.5B-Instruct-jinm"
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(model_path)

def get_bio_tags(text):
    """
    调用大模型进行 BIO 标签预测
    """
    sys_prompt = """
    你是一个医疗命名实体专家！请根据当前对话文本内容，识别出每一句话中的BIO实体标签
    """
    messages = [
        {"role": "system", "content": sys_prompt},
        {"role": "user", "content": text}
    ]

    text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
    model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
    generated_ids = model.generate(**model_inputs, max_new_tokens=512)
    generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]
    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
    return response

def calculate_f1(y_true, y_pred):
    """
    计算 F1 分数
    """
    true_labels = [label.split() for label in y_true]
    pred_labels = [label.split() for label in y_pred]

    true_labels_flat = [item for sublist in true_labels for item in sublist]
    print("true_labels_flat:", true_labels_flat)
    pred_labels_flat = [item for sublist in pred_labels for item in sublist]
    print("pred_labels_flat", pred_labels_flat)

    precision = precision_score(true_labels_flat, pred_labels_flat, average='micro')
    recall = recall_score(true_labels_flat, pred_labels_flat, average='micro')
    f1 = f1_score(true_labels_flat, pred_labels_flat, average='micro')
    accuracy = accuracy_score(true_labels_flat, pred_labels_flat)
    return precision, recall, f1

# 读取 TSV 文件
data = pd.read_csv("dev.tsv", sep='\t', encoding='utf8')

# 随机抽取100条数据
sampled_data = data.sample(n=100, random_state=42)

results = []
predicted_labels = []
true_labels = list(sampled_data["output"])

# 创建列表来存储预测内容
predictions = []
problematic = 0

for idx, row in tqdm(sampled_data.iterrows(), total=len(sampled_data)):
    instruction = row["instruction"]
    actual_output = row["output"]

    # 获取预测输出
    predicted_output = get_bio_tags(instruction).strip()  # 去掉首尾空白字符

    # 检查预测输出和实际输出的位置和标签是否一致，仅需对比
    actual_tags = actual_output.split()
    print("actual_tags",actual_tags)
    predicted_tags = predicted_output.split()
    print("predicted_tags",predicted_tags)

    if len(predicted_tags) != len(actual_tags) or predicted_tags != actual_tags:
        print(f"预测格式错误: index={idx}, instruction={instruction}, predicted_output={predicted_output}")
        # predicted_output = "O " * len(actual_tags)  # 使用默认值避免程序中断
        predicted_output = "X " * len(actual_tags)  # 使用默认值避免程序中断
        predicted_output = predicted_output.strip()  # 去掉最后的多余空格
        problematic += 1

    # 将 predicted_output 添加到 predicted_labels 列表中
    predicted_labels.append(predicted_output)
    predictions.append([instruction, actual_output, predicted_output])
    results.append(predicted_output == actual_output)

print(f"输出格式问题的条目个数： {problematic}")

  1%|          | 1/100 [00:06<10:49,  6.56s/it]

actual_tags ['O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug']
predicted_tags ['O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug']


  2%|▏         | 2/100 [00:10<08:14,  5.04s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


  3%|▎         | 3/100 [00:17<09:44,  6.03s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom']


  4%|▍         | 4/100 [00:33<16:01, 10.02s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Operation', 'I-Operation', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Operation', 'I-Operation', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom']
预测格式错误: index=8958, instruction=注意孩子拉的很多的话，注意适当补液，如果拉的水不多，可以继续光母乳，预防脱水, predicted_output=O O O O O O O O O O O O O O O B-Operation I-Operation O O O B-Symptom I-Symptom I-Symptom O O O O O O O O O O O O O B-Symptom I-Symptom


  5%|▌         | 5/100 [00:37<12:00,  7.59s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


  6%|▌         | 6/100 [00:40<09:38,  6.16s/it]

actual_tags ['B-Symptom', 'I-Symptom']
predicted_tags ['B-Symptom', 'I-Symptom']


  7%|▋         | 7/100 [00:49<11:08,  7.19s/it]

actual_tags ['O', 'O', 'O', 'O', 'B-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'B-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'O']


  8%|▊         | 8/100 [01:04<14:38,  9.55s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'O', 'O', 'O', 'O']


  9%|▉         | 9/100 [01:07<11:34,  7.63s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 10%|█         | 10/100 [01:09<08:50,  5.89s/it]

actual_tags ['O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O']


 11%|█         | 11/100 [01:20<10:44,  7.24s/it]

actual_tags ['B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug']
predicted_tags ['B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug']


 12%|█▏        | 12/100 [01:27<10:27,  7.13s/it]

actual_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O']


 13%|█▎        | 13/100 [01:34<10:40,  7.37s/it]

actual_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O']
predicted_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O']


 14%|█▍        | 14/100 [01:39<09:08,  6.38s/it]

actual_tags ['B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'O', 'O']
predicted_tags ['B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'O', 'O']


 15%|█▌        | 15/100 [01:41<07:22,  5.21s/it]

actual_tags ['O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'B-Operation', 'I-Operation']
预测格式错误: index=17998, instruction=那怎么照射, predicted_output=O O O B-Operation I-Operation


 16%|█▌        | 16/100 [01:47<07:32,  5.39s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Operation', 'I-Operation']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Operation', 'I-Operation']


 17%|█▋        | 17/100 [01:48<05:32,  4.01s/it]

actual_tags ['O']
predicted_tags ['O']


 18%|█▊        | 18/100 [01:56<07:12,  5.27s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
预测格式错误: index=14816, instruction=另外孩子如果吃母乳，孩子妈妈忌辛辣刺激，生冷食品, predicted_output=O O O O O O O O O O O O O O O O O O O O O O O O O


 19%|█▉        | 19/100 [02:01<06:57,  5.16s/it]

actual_tags ['B-Symptom', 'I-Symptom', 'O', 'B-Symptom', 'O']
predicted_tags ['B-Symptom', 'I-Symptom', 'O', 'B-Symptom', 'O']


 20%|██        | 20/100 [02:02<05:10,  3.88s/it]

actual_tags ['O', 'O']
predicted_tags ['O', 'O']


 21%|██        | 21/100 [02:05<04:57,  3.76s/it]

actual_tags ['O', 'O', 'B-Symptom', 'I-Symptom']
predicted_tags ['O', 'O', 'B-Symptom', 'I-Symptom']


 22%|██▏       | 22/100 [02:20<09:19,  7.17s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug']


 23%|██▎       | 23/100 [02:36<12:36,  9.82s/it]

actual_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'B-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom']
predicted_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'B-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom']
预测格式错误: index=1143, instruction=昨晚烧38.8吃了退热药，最高39, predicted_output=O O B-Symptom I-Symptom I-Symptom I-Symptom I-Symptom O O B-Drug_Category I-Drug_Category I-Drug_Category O B-Symptom I-Symptom I-Symptom I-Symptom


 24%|██▍       | 24/100 [02:45<11:53,  9.39s/it]

actual_tags ['B-Drug', 'I-Drug', 'I-Drug', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['B-Drug', 'I-Drug', 'I-Drug', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 25%|██▌       | 25/100 [02:48<09:29,  7.60s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 26%|██▌       | 26/100 [02:49<06:53,  5.59s/it]

actual_tags ['O', 'O']
predicted_tags ['O', 'O']


 27%|██▋       | 27/100 [02:50<04:58,  4.09s/it]

actual_tags ['O']
predicted_tags ['O']


 28%|██▊       | 28/100 [03:05<09:03,  7.54s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'B-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'B-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O']


 29%|██▉       | 29/100 [03:06<06:38,  5.61s/it]

actual_tags ['O', 'O', 'O']
predicted_tags ['O', 'O', 'O']


 30%|███       | 30/100 [03:17<08:10,  7.01s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 31%|███       | 31/100 [03:17<05:57,  5.18s/it]

actual_tags ['O', 'O']
predicted_tags ['O', 'O']


 32%|███▏      | 32/100 [03:32<09:00,  7.95s/it]

actual_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination']
predicted_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination']


 33%|███▎      | 33/100 [03:40<08:49,  7.90s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug']


 34%|███▍      | 34/100 [03:46<08:13,  7.48s/it]

actual_tags ['B-Symptom', 'I-Symptom', 'I-Symptom', 'B-Symptom', 'I-Symptom', 'I-Symptom']
predicted_tags ['B-Symptom', 'I-Symptom', 'I-Symptom', 'B-Symptom', 'I-Symptom', 'I-Symptom']


 35%|███▌      | 35/100 [03:52<07:25,  6.86s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'O']


 36%|███▌      | 36/100 [03:56<06:29,  6.09s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 37%|███▋      | 37/100 [03:59<05:27,  5.19s/it]

actual_tags ['O', 'O', 'O', 'O', 'O']
predicted_tags ['B-Symptom', 'O', 'O', 'B-Symptom', 'O']
预测格式错误: index=31588, instruction=憋的脸红，, predicted_output=B-Symptom O O B-Symptom O


 38%|███▊      | 38/100 [04:02<04:45,  4.60s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 39%|███▉      | 39/100 [04:07<04:51,  4.78s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 40%|████      | 40/100 [04:10<04:11,  4.18s/it]

actual_tags ['B-Symptom', 'I-Symptom', 'O', 'O']
predicted_tags ['B-Symptom', 'I-Symptom', 'O', 'O']


 41%|████      | 41/100 [04:15<04:13,  4.30s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 42%|████▏     | 42/100 [04:16<03:09,  3.26s/it]

actual_tags ['O', 'O', 'O']
predicted_tags ['O', 'O', 'O']


 43%|████▎     | 43/100 [04:16<02:23,  2.52s/it]

actual_tags ['O']
predicted_tags ['O']


 44%|████▍     | 44/100 [04:18<02:12,  2.36s/it]

actual_tags ['O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O']


 45%|████▌     | 45/100 [04:28<04:17,  4.68s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'O', 'B-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'B-Operation', 'I-Operation', 'I-Operation', 'I-Operation', 'I-Operation', 'O', 'B-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'O', 'O']
预测格式错误: index=17836, instruction=别着急，可以打抗过敏药和消炎药观察, predicted_output=O O O O O O B-Operation I-Operation I-Operation I-Operation I-Operation O B-Drug_Category I-Drug_Category I-Drug_Category O O


 46%|████▌     | 46/100 [04:32<03:47,  4.21s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 47%|████▋     | 47/100 [04:34<03:22,  3.81s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 48%|████▊     | 48/100 [04:35<02:31,  2.92s/it]

actual_tags ['O', 'O']
predicted_tags ['O', 'O']


 49%|████▉     | 49/100 [04:41<03:11,  3.75s/it]

actual_tags ['O', 'O', 'B-Operation', 'I-Operation', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'B-Operation', 'I-Operation', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 50%|█████     | 50/100 [04:47<03:47,  4.55s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O']


 51%|█████     | 51/100 [04:51<03:24,  4.17s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 52%|█████▏    | 52/100 [05:04<05:37,  7.03s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Operation', 'I-Operation', 'I-Operation', 'I-Operation', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Operation', 'I-Operation', 'I-Operation', 'I-Operation', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 53%|█████▎    | 53/100 [05:21<07:46,  9.93s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'B-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'B-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'O']
预测格式错误: index=2867, instruction=要注意体温情况，如果出现高热体温39度，就要吃美林退热药。, predicted_output=O O O O O O O O O O O O B-Symptom I-Symptom B-Symptom I-Symptom I-Symptom I-Symptom I-Symptom O O O O B-Drug I-Drug B-Drug_Category I-Drug_Category I-Drug_Category O


 54%|█████▍    | 54/100 [05:28<07:00,  9.15s/it]

actual_tags ['O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'O', 'B-Drug', 'I-Drug', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'O', 'B-Drug', 'I-Drug', 'O', 'O', 'O', 'O']


 55%|█████▌    | 55/100 [05:30<05:16,  7.03s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 56%|█████▌    | 56/100 [05:31<03:48,  5.19s/it]

actual_tags ['O', 'O', 'O']
predicted_tags ['O', 'O', 'O']


 57%|█████▋    | 57/100 [05:46<05:45,  8.04s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'B-Symptom', 'I-Symptom', 'O']
预测格式错误: index=23534, instruction=大便在肠腔内停留时间过长会有酸臭味道的，药物不吃的话，孩子就容易便秘脱肛。, predicted_output=O O O O O O O O O O O O O O B-Symptom I-Symptom I-Symptom I-Symptom O O O O O O O O O O O O O O B-Symptom I-Symptom B-Symptom I-Symptom O


 58%|█████▊    | 58/100 [05:58<06:31,  9.32s/it]

actual_tags ['O', 'O', 'O', 'O', 'B-Symptom', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'B-Symptom', 'I-Symptom', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'B-Symptom', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'B-Symptom', 'I-Symptom', 'O']


 59%|█████▉    | 59/100 [06:03<05:19,  7.78s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 60%|██████    | 60/100 [06:05<04:06,  6.17s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 61%|██████    | 61/100 [06:06<03:00,  4.62s/it]

actual_tags ['O', 'O']
predicted_tags ['O', 'O']


 62%|██████▏   | 62/100 [06:11<02:59,  4.74s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 63%|██████▎   | 63/100 [06:18<03:24,  5.53s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 64%|██████▍   | 64/100 [06:25<03:36,  6.01s/it]

actual_tags ['O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 65%|██████▌   | 65/100 [06:32<03:35,  6.15s/it]

actual_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom']
predicted_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom']


 66%|██████▌   | 66/100 [06:34<02:42,  4.78s/it]

actual_tags ['O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O']


 67%|██████▋   | 67/100 [06:35<02:03,  3.74s/it]

actual_tags ['O', 'O', 'O']
predicted_tags ['O', 'O', 'O']


 68%|██████▊   | 68/100 [06:38<01:58,  3.70s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 69%|██████▉   | 69/100 [06:40<01:37,  3.16s/it]

actual_tags ['O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O']


 70%|███████   | 70/100 [06:42<01:24,  2.81s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O']


 71%|███████   | 71/100 [06:53<02:30,  5.21s/it]

actual_tags ['B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['B-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
预测格式错误: index=19767, instruction=病理性黄疸值听说升得很快的, predicted_output=B-Medical_Examination I-Medical_Examination I-Medical_Examination I-Medical_Examination I-Medical_Examination I-Medical_Examination O O O O O O O


 72%|███████▏  | 72/100 [06:57<02:10,  4.67s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 73%|███████▎  | 73/100 [06:57<01:35,  3.53s/it]

actual_tags ['O', 'O']
predicted_tags ['O', 'O']


 74%|███████▍  | 74/100 [07:08<02:30,  5.78s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O']
预测格式错误: index=21355, instruction=可是他刚才也大便了一次，软的，还是有血哦, predicted_output=O O O O O O O O O O O O B-Symptom I-Symptom I-Symptom I-Symptom I-Symptom I-Symptom I-Symptom O


 75%|███████▌  | 75/100 [07:11<01:59,  4.76s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 76%|███████▌  | 76/100 [07:12<01:28,  3.70s/it]

actual_tags ['O', 'O', 'O']
predicted_tags ['O', 'O', 'O']


 77%|███████▋  | 77/100 [07:14<01:12,  3.16s/it]

actual_tags ['O', 'O', 'B-Symptom']
predicted_tags ['O', 'O', 'B-Symptom']


 78%|███████▊  | 78/100 [07:22<01:40,  4.55s/it]

actual_tags ['O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 79%|███████▉  | 79/100 [07:23<01:13,  3.51s/it]

actual_tags ['O', 'O', 'O']
predicted_tags ['O', 'O', 'O']


 80%|████████  | 80/100 [07:40<02:34,  7.71s/it]

actual_tags ['B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
预测格式错误: index=8157, instruction=咳嗽是一个过程，宝贝上痰后咳嗽症状比较厉害，并不代表宝贝病情加重了，痰液刺激的！不用担心，多给宝贝后背, predicted_output=B-Symptom I-Symptom O O O O O O O O O B-Symptom O B-Symptom I-Symptom O O O O O O O O O O O O O O O O O O O B-Symptom O O O O O O O O O O O O O O O O


 81%|████████  | 81/100 [07:42<01:49,  5.79s/it]

actual_tags ['O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O']


 82%|████████▏ | 82/100 [07:47<01:39,  5.52s/it]

actual_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'B-Symptom', 'O', 'O']
predicted_tags ['O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'B-Symptom', 'O', 'O']


 83%|████████▎ | 83/100 [08:24<04:16, 15.08s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'B-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'O', 'O', 'O', 'O', 'O', 'B-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'O', 'O', 'O', 'O', 'B-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'I-Medical_Examination', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
预测格式错误: index=32941, instruction=这个基因检测，主要是查先天性疾病的，和亲子鉴定的基因诊断，是完全不同的，一般不会牵扯到亲子关系的

 84%|████████▍ | 84/100 [08:29<03:11, 11.97s/it]

actual_tags ['O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O']


 85%|████████▌ | 85/100 [08:38<02:48, 11.20s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O']


 86%|████████▌ | 86/100 [08:43<02:10,  9.31s/it]

actual_tags ['B-Operation', 'I-Operation', 'I-Operation', 'O', 'O', 'O']
predicted_tags ['B-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O']
预测格式错误: index=27161, instruction=肛门塞可以吗, predicted_output=B-Symptom I-Symptom I-Symptom O O O


 87%|████████▋ | 87/100 [08:51<01:55,  8.85s/it]

actual_tags ['B-Drug', 'I-Drug', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'O']
predicted_tags ['B-Drug', 'I-Drug', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'O']


 88%|████████▊ | 88/100 [08:51<01:16,  6.38s/it]

actual_tags ['O']
predicted_tags ['O']


 89%|████████▉ | 89/100 [08:53<00:54,  4.95s/it]

actual_tags ['O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O']


 90%|█████████ | 90/100 [08:58<00:49,  4.99s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 91%|█████████ | 91/100 [09:00<00:36,  4.10s/it]

actual_tags ['O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O']


 92%|█████████▏| 92/100 [09:02<00:27,  3.41s/it]

actual_tags ['O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O']


 93%|█████████▎| 93/100 [09:04<00:20,  2.98s/it]

actual_tags ['O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O']


 94%|█████████▍| 94/100 [09:05<00:14,  2.39s/it]

actual_tags ['O', 'O']
predicted_tags ['O', 'O']


 95%|█████████▌| 95/100 [09:07<00:11,  2.39s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O']


 96%|█████████▌| 96/100 [09:14<00:14,  3.68s/it]

actual_tags ['O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 97%|█████████▋| 97/100 [09:28<00:19,  6.66s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O']
预测格式错误: index=31758, instruction=可能的原因，一慢性的支气管炎，二，过敏性咳嗽的可能。, predicted_output=O O O O O O O O O O B-Symptom I-Symptom I-Symptom I-Symptom O O O B-Symptom I-Symptom I-Symptom I-Symptom I-Symptom O O O O


 98%|█████████▊| 98/100 [09:30<00:10,  5.44s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


 99%|█████████▉| 99/100 [09:34<00:04,  4.92s/it]

actual_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


100%|██████████| 100/100 [09:35<00:00,  5.76s/it]

actual_tags ['O', 'O', 'O', 'O', 'O']
predicted_tags ['O', 'O', 'O', 'O', 'O']
输出格式问题的条目个数： 14





In [2]:
# 计算 F1 分数
precision, recall, f1 = calculate_f1(true_labels, predicted_labels)

print(f"精确率(Precision): {precision}")
print(f"召回率(Recall): {recall}")
print(f"F1 分数(F1 Score): {f1}")


# 打印预测内容
print(predictions)

# 将预测内容保存为新的 TSV 文件
output_df = pd.DataFrame(predictions, columns=['instruction', 'output', 'pred_output'])
output_df.to_csv("predictions_sampled.tsv", sep='\t', index=False)

print("随机抽样预测结果已保存到 predictions_sampled1.tsv 文件中")

true_labels_flat: ['O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Operation', 'I-Operation', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Symptom', 'I-Symptom', 'O', 'O', 'O', 'O', 'B-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'I-Drug_Category', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'B-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug', 'I-Drug',