# CRF+LSTM

keras 2.2.4

tensorflow 1.13

pip install git+https://www.github.com/keras-team/keras-contrib.git

In [108]:
import re
import os
import pandas as pd

In [109]:
char_vocab_path = "CRF/data/char_vocabs.txt" # 字典文件
#train_data_path = 'data/train_data/train_data_000' # 训练数据
#train_data_path = './data/train_data' # 训练数据
#test_data_path = 'data/train_data/train_data_000' # 测试数据

special_words = ['<PAD>', '<UNK>'] # 特殊词表示

# "BIO"标记的标签
#label2idx = {"O": 0,
#             "B-PER": 1, "I-PER": 2,
#             "B-LOC": 3, "I-LOC": 4,
#             "B-ORG": 5, "I-ORG": 6
#            }
label2idx = {'O': 0,
             'B-DISEASE': 1, 'B-DISEASE_GROUP': 2,
             'B-DRUG_DOSAGE': 3, 'B-DRUG_EFFICACY': 4,
             'B-DRUG_INGREDIENT': 5, 'B-DRUG_TASTE': 6,
             'B-FOOD_GROUP':7, 'B-PERSON_GROUP':8,
             'B-SYMPTOM':9, 'B-SYNDROME':10,
             'I-DISEASE': 11, 'I-DISEASE_GROUP': 12,
             'I-DRUG_DOSAGE': 13, 'I-DRUG_EFFICACY': 14,
             'I-DRUG_INGREDIENT': 15, 'I-DRUG_TASTE': 16,
             'I-FOOD_GROUP':17, 'I-PERSON_GROUP':18,
             'I-SYMPTOM':19, 'I-SYNDROME':20
            }

# 索引和BIO标签对应
idx2label = {idx: label for label, idx in label2idx.items()}

# 读取字符词典文件
with open(char_vocab_path, "r", encoding="utf8") as fo:
    char_vocabs = [line.strip() for line in fo]
char_vocabs = special_words + char_vocabs

# 字符和索引编号对应
idx2vocab = {idx: char for idx, char in enumerate(char_vocabs)}
vocab2idx = {char: idx for idx, char in idx2vocab.items()}

In [110]:
# 读取训练语料
def read_corpus(corpus_path, vocab2idx, label2idx):
    with open(corpus_path, encoding='utf-8') as fr:
        lines = fr.readlines()

    sent_, tag_ = [], []
    for letter in lines:
        [char,label,_] = re.split('\t|\n',letter)
        char = re.sub(' |\*|<|>','_',char)
        sent_.append(char)
        tag_.append(label)

    sent_ids = [vocab2idx[char] if char in vocab2idx else vocab2idx['<UNK>'] for char in sent_]
    tag_ids = [label2idx[label] if label in label2idx else 0 for label in tag_]
    return sent_ids, tag_ids

# 加载训练集
#train_datas, train_labels = read_corpus(train_data_path, vocab2idx, label2idx)
# 加载测试集
#test_datas, test_labels = read_corpus(test_data_path, vocab2idx, label2idx)


In [111]:
train_datas = []
train_labels = []
files = os.listdir('data/train_data')
for file in files:
    train_data_path_i = 'data/train_data/'+file
    train_datas_i, train_labels_i = read_corpus(train_data_path_i, vocab2idx, label2idx)
    train_datas.append(train_datas_i)
    train_labels.append(train_labels_i)
    #if i%10==0:
    #    print(i)

In [112]:
valid_datas = []
valid_labels = []
files = os.listdir('data/valid_data')
for file in files:
    valid_data_path_i = 'data/valid_data/'+file
    valid_datas_i, valid_labels_i = read_corpus(valid_data_path_i, vocab2idx, label2idx)
    valid_datas.append(valid_datas_i)
    valid_labels.append(valid_labels_i)

In [113]:
print(train_datas[50])
print([idx2vocab[idx] for idx in train_datas[50]])
print(train_labels[50])
print([idx2label[idx] for idx in train_labels[50]])

[58, 61, 77, 1, 58, 17, 181, 3093, 3817, 2654, 6214, 1959, 2177, 286, 6802, 5965, 519, 1408, 2644, 2102, 2732, 1842, 889, 2545, 3093, 3817]
['_', 'b', 'r', '<UNK>', '_', '3', '、', '治', '疗', '期', '间', '忌', '房', '事', '，', '配', '偶', '如', '有', '感', '染', '应', '同', '时', '治', '疗']
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


In [None]:
import numpy as np
import keras
from keras.models import Sequential
from keras.models import Model
from keras.layers import Masking, Embedding, Bidirectional, LSTM, Dense, Input, TimeDistributed, Activation
from keras.preprocessing import sequence
from keras_contrib.layers import CRF
from keras_contrib.losses import crf_loss
from keras_contrib.metrics import crf_viterbi_accuracy
from keras import backend as K
K.clear_session()

EPOCHS = 30
BATCH_SIZE = 64
EMBED_DIM = 48
HIDDEN_SIZE = 12
MAX_LEN = 100
VOCAB_SIZE = len(vocab2idx)
CLASS_NUMS = len(label2idx)
print(VOCAB_SIZE, CLASS_NUMS)

print('padding sequences')
train_datas = sequence.pad_sequences(train_datas, maxlen=MAX_LEN)
train_labels = sequence.pad_sequences(train_labels, maxlen=MAX_LEN)
valid_datas = sequence.pad_sequences(valid_datas, maxlen=MAX_LEN)
valid_labels = sequence.pad_sequences(valid_labels, maxlen=MAX_LEN)
print('x_train shape:', train_datas.shape)
print('x_test shape:', valid_datas.shape)

train_labels = keras.utils.to_categorical(train_labels, CLASS_NUMS)
valid_labels = keras.utils.to_categorical(valid_labels, CLASS_NUMS)
print('trainlabels shape:', train_labels.shape)
print('testlabels shape:', valid_labels.shape)

## BiLSTM+CRF模型构建
inputs = Input(shape=(MAX_LEN,), dtype='int32')
x = Masking(mask_value=0)(inputs)
x = Embedding(VOCAB_SIZE, EMBED_DIM, mask_zero=True)(x)
x = Bidirectional(LSTM(HIDDEN_SIZE, return_sequences=True))(x)
x = TimeDistributed(Dense(CLASS_NUMS))(x)#TimeDistributed层的作用就是把Dense层应用到这10个具体的向量上，对每一个向量进行了一个Dense操作
outputs = CRF(CLASS_NUMS)(x)
model = Model(inputs=inputs, outputs=outputs)
model.summary()

model.compile(loss=crf_loss, optimizer='adam', metrics=[crf_viterbi_accuracy])
model.fit(train_datas, train_labels, epochs=EPOCHS, verbose=1, validation_split=0.1)

score = model.evaluate(valid_datas, valid_labels, batch_size=BATCH_SIZE)
print(model.metrics_names)
print(score)

6874 21
padding sequences
x_train shape: (6899, 100)
x_test shape: (3974, 100)
trainlabels shape: (6899, 100, 21)
testlabels shape: (3974, 100, 21)
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         (None, 100)               0         
_________________________________________________________________
masking_1 (Masking)          (None, 100)               0         
_________________________________________________________________
embedding_1 (Embedding)      (None, 100, 48)           329952    
_________________________________________________________________
bidirectional_1 (Bidirection (None, 100, 24)           5856      
_________________________________________________________________
time_distributed_1 (TimeDist (None, 100, 21)           525       
_________________________________________________________________
crf_1 (CRF)                  (None, 100, 21)           945  

In [90]:
# save model
model.save("model/ch_ner_model.h5")

In [91]:
def get_valid_nertag(input_data, result_tags):
    result_words = []
    start, end =0, 1 # 实体开始结束位置标识
    tag_label = "O" # 实体类型标识
    number = 0
    for i, tag in enumerate(result_tags):
        if tag.startswith("B"):
            number += 1
            if tag_label != "O": # 当前实体tag之前有其他实体     
                result_words.append(('T'+str(number), tag_label, start, end,input_data[start: end]))
                #result_words.append(('T'+str(number), tag_label+' '+str(start)+' '+str(end),input_data[start: end])) # 获取实体
            tag_label = tag.split("-")[1] # 获取当前实体类型
            start, end = i, i+1 # 开始和结束位置变更
        elif tag.startswith("I"):
            temp_label = tag.split("-")[1]
            if temp_label == tag_label: # 当前实体tag是之前实体的一部分
                end += 1 # 结束位置end扩展
        elif tag == "O":
            if tag_label != "O": # 当前位置非实体 但是之前有实体
                #result_words.append(('T'+str(number), tag_label+' '+str(start)+' '+str(end),input_data[start: end])) # 获取实体
                result_words.append(('T'+str(number), tag_label, start, end,input_data[start: end]))
                tag_label = "O"  # 实体类型置"O"
            start, end = i, i+1 # 开始和结束位置变更
    if tag_label != "O": # 最后结尾还有实体
        number += 1
        result_words.append(('T'+str(number), tag_label, start, end,input_data[start: end]))
        #result_words.append(('T'+str(number),tag_label+' '+str(start)+' '+str(end),input_data[start: end])) # 获取结尾的实体
    return result_words

In [103]:
# 线下验证数据集
maxlen = 100
valid_result = {}
valid_data_path = 'data/valid/text/'
#test_data_path = 'data/valid/'
for i in range(len(os.listdir(valid_data_path))):
#for i in range(7):
    valid_file = valid_data_path+str(i+800)+'.txt'
    with open(valid_file, "r", encoding="utf8") as valid:
        sentence = valid.read()
    sentences = sentence.split('。')
    y_ner = []

    for sent in sentences:
        sent = sent.replace(' ','_')
        sent_chars = list(sent+'。')
        sent2id = [vocab2idx[word] if word in vocab2idx else vocab2idx['<UNK>'] for word in sent_chars]

        sent2id_new = np.array([[0] * (maxlen-len(sent2id)) + sent2id[:maxlen]])
        y_pred = model.predict(sent2id_new)
        y_label = np.argmax(y_pred, axis=2)
        y_label = y_label.reshape(1, -1)[0]
        y_ner_ = [idx2label[i] for i in y_label][-len(sent_chars):]
        y_ner.extend(y_ner_)
    result_words = get_valid_nertag(sentence, y_ner)
    ans = []
    for res in result_words:
        number = res[0]
        tag = res[1]
        start = res[2]
        end = res[3]
        word = re.sub(' |，|：|；|、|;','_',res[4])
        if '_' not in word:
            ans.append('{}\t{} {} {}\t{}'.format('T'+str(len(ans)+1), tag,start, end, word))
            #ans.append(, tag, start,end, "".join(word))
            print('{}\t{} {} {}\t{}'.format('T'+str(len(ans)), tag,start, end, word))
    #print('='*100)
    
    valid_result[i+800] = ans

T1	DRUG_DOSAGE 4 8	薄膜衣片
T2	DRUG_TASTE 19 21	味涩
T3	DRUG_TASTE 22 24	微苦
T4	DISEASE 44 47	糖尿病
T5	SYMPTOM 105 109	脾胃虚寒
T6	SYMPTOM 113 117	月经量多
T7	SYMPTOM 127 129	尿频
T8	SYMPTOM 130 132	尿急
T9	SYMPTOM 133 135	尿痛
T10	PERSON_GROUP 226 229	过敏者
T11	PERSON_GROUP 266 268	儿童
T12	SYMPTOM 279 281	头昏
T13	SYMPTOM 282 284	头晕
T14	SYMPTOM 285 287	恶心
T15	DRUG_DOSAGE 319 322	薄膜衣
T1	DRUG_DOSAGE 15 18	胶囊剂
T2	DRUG_DOSAGE 30 32	粉未
T3	DRUG_TASTE 33 35	气香
T4	DRUG_TASTE 36 39	味微苦
T5	DRUG_EFFICACY 42 46	活血化瘀
T6	DRUG_EFFICACY 47 51	软坚散结
T7	DISEASE 54 58	子宫肌瘤
T8	DISEASE 59 66	盆腔炎生冷粉未
T9	DRUG_EFFICACY 154 158	所致的家
T10	DRUG_EFFICACY 159 163	血液粘滞
T11	DISEASE 166 170	制正常大
T12	DISEASE 171 175	离体子宫
T13	SYMPTOM 175 177	平滑
T14	SYMPTOM 178 182	收缩频率
T1	FOOD_GROUP 84 86	辛辣
T2	DRUG_EFFICACY 124 128	清热解毒
T3	DISEASE 161 164	阴道炎
T4	DISEASE 170 173	宫颈炎
T5	SYMPTOM 174 178	宫颈糜烂
T6	SYMPTOM 190 192	味臭
T7	SYMPTOM 193 196	小腹痛
T8	SYMPTOM 197 201	腰骶痛栓
T9	DRUG_INGREDIENT 244 246	制作
T10	DRUG_INGREDIENT 251 254	滴虫作
T11	DRUG_INGREDIENT 257 260	连

T1	DRUG_DOSAGE 31 34	胶囊剂
T2	DRUG_DOSAGE 42 44	颗粒
T3	DRUG_TASTE 45 48	气微香
T4	DRUG_TASTE 49 52	味微苦
T5	DRUG_TASTE 100 103	气微香
T6	DRUG_TASTE 104 107	味微苦
T7	DRUG_EFFICACY 156 160	益气养血
T8	SYNDROME 174 176	血瘀
T9	SYMPTOM 186 192	月经周期错后
T10	SYMPTOM 193 197	行经量少
T11	SYMPTOM 198 202	淋沥不净
T12	SYMPTOM 208 212	肢体乏力
T13	SYMPTOM 263 267	月经不调
T1	DRUG_EFFICACY 122 126	活血破瘀
T2	DRUG_EFFICACY 127 131	通经消痞
T3	SYMPTOM 139 143	腹部肿块
T4	SYMPTOM 144 148	肌肤甲错
T5	SYMPTOM 149 153	目眶黯黑
T6	SYMPTOM 154 158	潮热羸瘦
T7	SYMPTOM 159 167	经闭不行腹部肿块
T8	SYMPTOM 168 172	肌肤甲错
T1	DRUG_DOSAGE 11 14	小蜜丸
T2	DRUG_DOSAGE 19 22	大蜜丸
T3	SYNDROME 38 40	气滞
T4	PERSON_GROUP 60 65	小蜜丸妇女
T5	SYNDROME 65 67	血亏
T6	DRUG_EFFICACY 68 72	消化不良
T7	SYMPTOM 73 81	月经不调赤白带下
T8	SYMPTOM 82 86	小腹冷痛
T9	SYMPTOM 86 90	赤白带下
T10	SYMPTOM 119 127	月经不调赤白带下
T11	SYMPTOM 128 132	小腹冷痛
T12	SYNDROME 133 137	气血衰弱
T13	DRUG_DOSAGE 171 174	的小蜜
T14	PERSON_GROUP 245 247	于妇
T15	SYNDROME 247 249	女血
T16	SYNDROME 280 282	郁气
T1	SYMPTOM 22 24	腹胀
T2	SYMPTOM 25 27	胃痛
T3	DRUG_EFFICACY 201 2

T1	SYMPTOM 30 34	清热解毒
T2	DRUG_EFFICACY 35 39	活血止痛
T3	DRUG_EFFICACY 40 44	杀虫止痒
T4	DISEASE 47 53	霉菌性阴道炎
T5	DISEASE 54 60	滴虫性阴道炎
T6	DISEASE 61 67	细菌性阴道病
T7	SYMPTOM 72 76	皮肤瘙痒
T8	DRUG_DOSAGE 245 247	液体
T9	DISEASE 324 327	外阴炎
T1	DRUG_EFFICACY 1 5	补气养血
T2	DRUG_EFFICACY 6 10	调经止带
T3	SYNDROME 13 17	气血两虚
T4	SYMPTOM 18 22	身体瘦弱
T5	SYMPTOM 23 27	腰膝酸软
T6	SYMPTOM 28 32	月经量少
T7	SYMPTOM 33 35	后错
T8	SYMPTOM 36 42	带下腰膝酸软
T9	DRUG_DOSAGE 120 123	大蜜丸
T10	DRUG_EFFICACY 137 141	促进造血
T11	DRUG_EFFICACY 142 144	止血
T12	DRUG_EFFICACY 252 254	保肝
T13	DRUG_EFFICACY 486 490	补气养血
T14	SYMPTOM 498 502	月经不调
T15	SYMPTOM 503 507	经期腹痛
T16	DRUG_DOSAGE 509 512	大蜜丸
T17	PERSON_GROUP 533 535	孕妇
T1	DRUG_EFFICACY 32 36	祛瘀生新
T2	SYMPTOM 39 43	月经量少
T3	DRUG_EFFICACY 92 96	活血调经
T4	SYNDROME 99 101	血瘀
T5	SYMPTOM 104 108	月经不调
T6	SYMPTOM 111 115	经水量少
T1	DRUG_DOSAGE 76 80	薄膜衣片
T2	DRUG_TASTE 102 104	微苦
T3	SYNDROME 107 111	肾阳不足
T4	SYNDROME 112 116	气滞血瘀
T5	DRUG_EFFICACY 158 160	益肾
T6	DRUG_EFFICACY 161 163	活血
T7	DRUG_EFFICACY 164 168	软坚散结
T8	SY

T1	DRUG_DOSAGE 60 63	水蜜丸
T2	DRUG_TASTE 68 70	味甜
T3	DRUG_TASTE 71 73	微苦
T4	FOOD_GROUP 79 81	辛辣
T5	DISEASE 89 91	感冒
T6	SYMPTOM 91 93	发热
T7	DISEASE 103 106	高血压
T8	DISEASE_GROUP 107 110	心脏病
T9	DISEASE_GROUP 111 113	肝病
T10	DISEASE 114 117	糖尿病
T11	DISEASE_GROUP 118 120	肾病
T12	DISEASE_GROUP 121 124	慢性病
T13	PERSON_GROUP 139 141	孕妇
T14	PERSON_GROUP 144 149	青春期少女
T15	PERSON_GROUP 150 155	更年期妇女
T16	SYMPTOM 178 182	月经过少
T17	SYMPTOM 184 188	经期错后
T18	SYMPTOM 190 197	阴道不规则出血
T19	SYMPTOM 207 211	月经量多
T20	DRUG_EFFICACY 362 366	调经养血
T21	SYNDROME 379 387	气滞血瘀营血不足
T22	SYMPTOM 395 399	月经不调
T23	SYMPTOM 400 402	痛经
T24	SYMPTOM 403 407	小腹胀痛
T25	SYMPTOM 408 412	腰腿酸痛
T1	DRUG_EFFICACY 75 79	散结消肿
T2	DRUG_EFFICACY 80 84	化瘀止痛
T3	SYMPTOM 99 103	肿硬作痛
T4	SYMPTOM 104 109	多发性脓肿
T1	DRUG_DOSAGE 63 66	硬胶囊
T2	DRUG_TASTE 85 87	气腥
T3	SYMPTOM 100 104	痰瘀凝聚
T4	SYMPTOM 107 111	乳腺增生
T5	SYMPTOM 112 116	乳房胀痛
T6	DRUG_EFFICACY 153 157	疏肝解郁
T7	DRUG_EFFICACY 163 167	活血止痛
T8	SYNDROME 170 174	肝郁气滞
T9	SYMPTOM 175 179	痰瘀凝聚
T1	DRUG_EFFICACY 4

T1	SYMPTOM 292 298	物药业有限公
T2	SYMPTOM 304 306	例可
T3	SYMPTOM 372 374	品过
T4	SYMPTOM 375 377	者禁
T5	SYMPTOM 418 420	月。
T6	SYMPTOM 443 445	及泌
T7	SYMPTOM 445 449	尿道感染
T8	SYMPTOM 455 457	眼结
T1	DRUG_DOSAGE 11 13	颗粒
T2	DRUG_TASTE 14 16	气香
T3	DRUG_TASTE 17 19	味甜
T4	SYMPTOM 86 90	月经过少
T5	SYMPTOM 92 96	经期错后
T6	PERSON_GROUP 238 240	儿童
T7	DRUG_EFFICACY 310 312	止痛
T8	SYMPTOM 315 319	月经量少
T9	DRUG_EFFICACY 335 337	止痛
T10	SYMPTOM 340 344	月经量少
T11	DRUG_EFFICACY 360 362	止痛
T12	SYMPTOM 365 369	月经量少
T13	SYMPTOM 373 377	经期腹痛
T14	PERSON_GROUP 377 384	过敏体质过敏者
T15	SYMPTOM 384 389	痛经不减轻
T16	SYMPTOM 391 395	重度痛经
T17	PERSON_GROUP 410 414	糖尿病者
T1	DRUG_DOSAGE 1 3	丸剂
T2	DRUG_DOSAGE 4 7	水蜜丸
T3	SYMPTOM 12 14	内热
T4	SYMPTOM 15 18	舌质红
T5	DRUG_EFFICACY 37 41	提高免疫
T6	DRUG_EFFICACY 478 482	补肾健脾
T7	SYNDROME 490 494	脾肾虚弱
T8	SYMPTOM 497 501	面黄肌瘦
T9	SYMPTOM 502 506	体倦乏力
T10	SYMPTOM 519 528	化疗后全血细胞减少
T11	DISEASE_GROUP 584 586	口干
T12	DRUG_DOSAGE 614 617	水蜜丸
T13	DRUG_TASTE 618 621	味微苦
T1	DRUG_EFFICACY 72 76	养血调经
T2	DRUG_EFFICACY 82 

T1	SYMPTOM 88 91	瘕积聚
T2	SYMPTOM 92 96	痛经闭经
T3	SYMPTOM 97 101	赤白带下
T4	DISEASE 102 107	慢性盆腔炎
T5	DRUG_DOSAGE 111 115	薄膜衣片
T6	DRUG_TASTE 130 133	气微香
T7	DRUG_TASTE 134 136	味苦
T8	DRUG_TASTE 137 139	微咸
T9	DRUG_DOSAGE 187 190	薄膜衣
T10	DRUG_EFFICACY 218 222	抗炎镇痛
T11	DRUG_EFFICACY 228 237	促进生殖系统微循环
T12	DRUG_EFFICACY 238 244	化解体内肿块
T13	DRUG_EFFICACY 247 252	增强免疫力
T14	SYMPTOM 332 335	瘕积聚
T15	SYMPTOM 336 340	痛经闭经
T16	SYMPTOM 341 345	赤白带下
T17	SYMPTOM 346 351	慢性盆腔炎
T1	DRUG_DOSAGE 36 38	液体
T2	DRUG_TASTE 44 47	气芳香
T3	SYMPTOM 66 70	外阴瘙痒
T4	SYMPTOM 71 77	男子阴囊湿疹
T5	SYMPTOM 121 124	肛干洒
T6	DRUG_EFFICACY 128 134	清热燥湿止痒
T7	SYMPTOM 139 143	外阴瘙痒
T8	PERSON_GROUP 143 148	绝经后患者
T9	PERSON_GROUP 148 152	孕期妇女
T10	SYMPTOM 328 330	尿频
T11	SYMPTOM 331 333	尿急
T12	SYMPTOM 334 336	尿痛
T13	DISEASE 336 339	糖尿病
T14	SYMPTOM 353 355	尿频
T15	SYMPTOM 356 358	尿急
T16	SYMPTOM 359 361	尿痛
T17	PERSON_GROUP 394 397	过敏者
T18	PERSON_GROUP 434 436	儿童
T19	PERSON_GROUP 436 441	过敏体质者
T1	DRUG_DOSAGE 47 49	颗粒
T2	DRUG_TASTE 50 53	气微香
T3	DRUG_TASTE 54

T1	SYNDROME 99 103	瘀血肿痛
T2	SYMPTOM 194 198	痔疮出血
T3	SYMPTOM 199 204	肺结核咯血
T4	SYMPTOM 208 212	子宫出血
T5	PERSON_GROUP 213 215	妇女
T6	SYMPTOM 215 219	月经不调
T7	SYMPTOM 220 222	经痛
T8	SYMPTOM 223 227	月经过多
T9	DRUG_EFFICACY 231 235	止血镇痛
T10	SYMPTOM 263 267	瘀血肿痛
T11	SYMPTOM 284 288	扩张出血
T12	SYMPTOM 320 327	功能性子宫出血
T13	SYMPTOM 328 330	外伤
T14	SYMPTOM 331 335	痔疮出血
T15	SYMPTOM 338 341	月经不
T16	DRUG_DOSAGE 349 354	月经血量过
T17	DRUG_EFFICACY 431 435	子为朱红
T1	DRUG_EFFICACY 1 5	补肾壮腰
T2	DRUG_EFFICACY 6 10	固精止遗
T3	DRUG_EFFICACY 11 13	调经
T4	SYNDROME 16 20	肾阳不足
T5	SYMPTOM 28 32	神疲不振
T6	SYMPTOM 33 37	阳痿不举
T7	SYMPTOM 41 45	腰膝软弱
T8	SYMPTOM 64 70	闭经遗精滑泄
T9	SYMPTOM 70 74	阳痿不举
T10	DRUG_DOSAGE 106 108	液体
T11	DRUG_TASTE 109 112	气微香
T12	DRUG_TASTE 113 115	味甜
T13	SYMPTOM 145 149	阳痿不举
T14	SYMPTOM 153 157	腰膝软弱
T15	SYMPTOM 171 175	月经不调
T1	DRUG_DOSAGE 16 18	液体
T2	DRUG_DOSAGE 19 21	静置
T3	FOOD_GROUP 145 147	辛辣
T4	SYMPTOM 192 196	带下量多
T5	SYMPTOM 197 199	气臭
T6	SYMPTOM 243 247	带下量多
T7	SYMPTOM 249 251	尿频
T8	SYMPTOM 252 254	尿急
T9	SYMPTO

T1	SYMPTOM 14 18	经期延长
T2	SYMPTOM 19 23	经量过多
T3	SYMPTOM 24 30	经色紫黯有块
T4	SYMPTOM 31 38	小腹或乳房胀痛
T5	DRUG_EFFICACY 42 46	软坚散结
T6	DRUG_EFFICACY 47 51	活血化瘀
T7	DRUG_EFFICACY 52 56	扶正固本
T8	DISEASE 59 63	子宫肌瘤
T9	SYNDROME 72 74	气滞
T10	SYNDROME 74 76	血瘀
T11	SYMPTOM 80 84	经期延长
T12	SYMPTOM 85 89	经量过多
T13	SYMPTOM 90 96	经色紫暗有块
T14	SYMPTOM 97 99	小腹
T15	SYMPTOM 100 104	乳房胀痛
T16	PERSON_GROUP 105 107	孕妇
T17	DRUG_DOSAGE 182 185	胶囊剂
T18	DRUG_DOSAGE 194 196	颗粒
T19	DRUG_TASTE 197 200	气微腥
T20	DRUG_TASTE 201 203	微苦
T1	DRUG_DOSAGE 4 8	薄膜衣片
T2	DRUG_TASTE 24 27	气芳香
T3	DRUG_TASTE 28 31	味微苦
T4	DRUG_EFFICACY 41 45	祛瘀消肿
T5	DRUG_EFFICACY 46 50	散结止痛
T6	SYMPTOM 59 63	乳房肿痛
T1	PERSON_GROUP 25 27	孕妇
T2	PERSON_GROUP 28 33	哺乳期妇女
T3	DRUG_EFFICACY 38 42	清热解毒
T4	DISEASE 50 55	慢性盆腔炎
T5	SYNDROME 61 66	湿热蕴结证
T6	SYMPTOM 72 79	腰骶部胀痛不适
T7	SYMPTOM 80 84	带下量多
T8	SYMPTOM 97 101	神疲乏力
T9	SYMPTOM 109 113	月经量多
T10	SYMPTOM 114 118	经期延长
T11	SYMPTOM 119 123	小便黄赤
T12	SYMPTOM 124 128	舌苔黄腻
T13	SYMPTOM 240 244	偶见皮肤
T14	DRUG_DOSAGE 252 255	品为硬
T15	D

T1	DRUG_TASTE 30 32	气微
T2	DRUG_TASTE 33 35	味甜
T3	FOOD_GROUP 96 98	辛辣
T4	FOOD_GROUP 98 101	刺激性
T5	DRUG_EFFICACY 187 189	安胎
T6	DRUG_EFFICACY 216 218	保胎
T7	DRUG_EFFICACY 265 269	健脾固肾
T8	DRUG_EFFICACY 270 274	养血安胎
T9	SYNDROME 277 279	肾虚
T10	SYNDROME 321 323	肾虚
T11	SYNDROME 325 329	气血虚弱
T1	SYMPTOM 20 22	经闭
T2	SYMPTOM 23 27	月经不调
T3	SYMPTOM 28 30	难产
T4	SYMPTOM 36 42	产后瘀血腹痛
T5	SYMPTOM 70 72	经闭
T6	SYMPTOM 73 77	月经不调
T7	SYMPTOM 78 80	难产
T8	SYMPTOM 86 92	产后瘀血腹痛
T9	DRUG_DOSAGE 114 117	胶囊剂
T10	DRUG_TASTE 128 130	气微
T11	DRUG_TASTE 131 133	味咸
T12	DRUG_TASTE 134 136	微苦
T13	PERSON_GROUP 141 143	孕妇
T14	SYNDROME 153 157	脾肾虚寒
T1	PERSON_GROUP 0 2	孕妇
T2	PERSON_GROUP 41 43	孕妇
T3	SYMPTOM 98 102	口干舌燥
T4	DISEASE 115 118	糖尿病
T5	DISEASE 124 127	高血压
T6	PERSON_GROUP 146 148	小儿
T7	SYMPTOM 195 199	食欲不振
T8	SYMPTOM 200 202	头痛
T9	PERSON_GROUP 237 239	儿童
T10	DRUG_EFFICACY 307 311	温补肾阳
T11	DRUG_DOSAGE 367 370	胶囊剂
T12	DRUG_TASTE 380 385	有肉桂芳香
T13	DRUG_TASTE 385 387	气味
T14	DRUG_TASTE 388 390	微苦
T15	SYNDROME 406 410	肾阳不足
T16

T1	DRUG_DOSAGE 11 13	颗粒
T2	DRUG_TASTE 14 16	味甜
T3	DRUG_TASTE 17 19	微苦
T4	PERSON_GROUP 35 37	孕妇
T5	FOOD_GROUP 48 50	辛辣
T6	FOOD_GROUP 50 52	生冷
T7	DRUG_EFFICACY 57 61	清热凉血
T8	DRUG_EFFICACY 67 71	消肿止痛
T9	DISEASE 78 81	盆腔炎
T10	DISEASE 82 87	子宫内膜炎
T11	SYMPTOM 95 104	带下腹痛纤维蛋白溶
T12	DRUG_EFFICACY 108 110	镇痛
T13	DRUG_EFFICACY 206 208	镇痛
T14	DRUG_EFFICACY 211 213	抑菌
T15	DRUG_EFFICACY 216 218	抗炎
T1	SYMPTOM 38 42	月经量少
T2	SYMPTOM 46 48	痛经
T3	DRUG_DOSAGE 103 106	水蜜丸
T4	DRUG_TASTE 107 109	味苦
T5	DRUG_TASTE 112 114	略涩
T6	SYMPTOM 179 183	月经过少
T7	SYMPTOM 185 189	经期错后
T8	SYMPTOM 191 198	阴道不规则出血
T9	SYMPTOM 200 205	带下伴阴痒
T10	DRUG_EFFICACY 225 229	治疗痛经
T11	PERSON_GROUP 392 394	儿童
T12	DRUG_EFFICACY 436 440	补气养血
T13	DRUG_EFFICACY 441 445	调经止带
T14	SYMPTOM 448 452	气血凝滞
T15	SYMPTOM 458 462	月经量少
T16	SYMPTOM 466 468	痛经
T17	SYMPTOM 469 473	白带量多
T18	SYMPTOM 474 478	小腹下坠
T19	PERSON_GROUP 504 506	孕妇
T20	DISEASE 509 512	糖尿病
T1	SYMPTOM 37 41	阴道流血
T2	SYMPTOM 42 46	月经过多
T3	DRUG_EFFICACY 83 85	活血
T4	DRUG_EFFICACY 86 88	祛瘀
T5

In [104]:
valid_pred = []
for i in range(800,1000):
    valid_pred.extend(list(map(lambda x:str(i)+' '+re.sub(r'T[\d+]{1,2}\t','',x),valid_result[i])))
    

In [105]:
valid_true = []
for i in range(800,1000):
    with open('data/valid/ann/%d.ann'%i) as file_obj:
        valid_label = file_obj.read().split('\n')
        valid_true.extend(list(map(lambda x:str(i)+' '+re.sub(r'T[\d+]{1,2}\t','',x),valid_label)))


In [106]:
def eval(valid_pred,valid_true):
    P = len(set(valid_pred) & set(valid_true))/len(set(valid_pred))
    R = len(set(valid_pred) & set(valid_true))/len(set(valid_true))
    F = 2*P*R/(P+R)
    print('P = %.4f'%P)
    print('R = %.4f'%R)
    print('F = %.4f'%F)
    return P,R,F

In [107]:
eval(valid_pred,valid_true)

P = 0.4953
R = 0.4428
F = 0.4676


(0.49534510433386836, 0.44275466284074605, 0.46757575757575753)

In [None]:
#(0.46909962706446456, 0.5053084648493543, 0.4865312888520513)

In [18]:
maxlen = 100
result = {}
test_data_path = 'data/chusai_xuanshou/'
#test_data_path = 'data/valid/'
for i in range(len(os.listdir(test_data_path))):
#for i in range(7):
    test_file = test_data_path+str(i+1000)+'.txt'
    with open(test_file, "r", encoding="utf8") as test:
        sentence = test.read()
    sentences = sentence.split('。')
    y_ner = []

    for sent in sentences:
        sent = sent.replace(' ','_')
        sent_chars = list(sent+'。')
        sent2id = [vocab2idx[word] if word in vocab2idx else vocab2idx['<UNK>'] for word in sent_chars]

        sent2id_new = np.array([[0] * (maxlen-len(sent2id)) + sent2id[:maxlen]])
        y_pred = model.predict(sent2id_new)
        y_label = np.argmax(y_pred, axis=2)
        y_label = y_label.reshape(1, -1)[0]
        y_ner_ = [idx2label[i] for i in y_label][-len(sent_chars):]
        y_ner.extend(y_ner_)
    result_words = get_valid_nertag(sentence, y_ner)
    ans = []
    for res in result_words:
        number = res[0]
        #tag_start_end = res[1]
        tag = res[1]
        start = res[2]
        end = res[3]
        word = res[4].replace(' ','_')
        ans.append('{}\t{} {} {}\t{}'.format('T'+str(len(ans)+1), tag,start, end, word))
        #ans.append(, tag, start,end, "".join(word))
        print('{}\t{} {} {}\t{}'.format('T'+str(len(ans)), tag,start, end, word))
    #print('='*100)
    
    result[i+1000] = ans

T1	SYMPTOM 80 83	胸卧位
T2	DRUG_EFFICACY 148 152	祛瘀止痛
T3	DRUG_EFFICACY 153 156	散结消
T4	SYMPTOM 167 171	小腹疼痛
T5	SYMPTOM 172 176	腰骶酸痛
T6	SYMPTOM 177 181	带下量多
T1	PERSON_GROUP 31 33	孕妇
T2	DRUG_EFFICACY 76 78	补血
T3	DRUG_EFFICACY 79 81	活血
T4	SYMPTOM 87 91	月经量少
T5	SYMPTOM 95 101	血虚萎黄后错
T6	SYMPTOM 102 106	血虚萎黄
T7	SYMPTOM 107 111	风湿痹痛
T8	SYMPTOM 112 116	肢体麻木
T9	DISEASE 116 119	糖尿病
T1	FOOD_GROUP 25 27	辛辣
T2	FOOD_GROUP 30 32	油腻
T3	DISEASE 36 38	感冒
T4	SYMPTOM 38 40	发热
T5	DISEASE 51 54	高血压
T6	DISEASE_GROUP 55 58	心脏病
T7	DISEASE_GROUP 59 61	肝病
T8	DISEASE 62 65	糖尿病
T9	DISEASE_GROUP 66 68	肾病
T10	DISEASE_GROUP 69 72	慢性病
T11	SYMPTOM 90 94	月经紊乱
T12	SYMPTOM 109 111	眩晕
T13	PERSON_GROUP 158 163	过敏体质者
T14	PERSON_GROUP 192 194	儿童
T15	DRUG_DOSAGE 242 244	颗粒
T16	DRUG_TASTE 245 248	气微香
T17	DRUG_TASTE 249 252	味微苦
T18	SYNDROME 274 276	阴虚
T19	DISEASE_GROUP 276 279	肝旺症
T20	SYMPTOM 282 286	烘热汗出
T21	SYMPTOM 287 291	头晕耳鸣
T22	SYMPTOM 292 296	失眠多梦
T23	SYMPTOM 297 301	五心烦热
T24	SYMPTOM 302 306	腰背酸痛
T25	SYMPTOM 307 311	大便干燥
T26	

T1	PERSON_GROUP 90 92	孕妇
T2	DRUG_EFFICACY 108 110	活血
T3	DRUG_EFFICACY 111 113	化瘀
T4	SYMPTOM 121 125	宿有癥块
T5	SYMPTOM 127 131	血瘀经闭
T6	SYMPTOM 132 136	行经腹痛
T7	SYMPTOM 137 143	产后恶露不尽
T8	DRUG_DOSAGE 194 197	大蜜丸
T9	DRUG_TASTE 198 200	味甜
T10	DRUG_DOSAGE 203 205	丸剂
T11	SYMPTOM 227 231	行经腹痛
T12	SYNDROME 238 240	血瘀
T13	SYMPTOM 240 242	经闭
T14	SYMPTOM 243 247	行经腹痛
T15	SYMPTOM 248 254	产后恶露不尽
T1	PERSON_GROUP 8 10	孕妇
T2	DRUG_DOSAGE 22 24	颗粒
T3	DRUG_TASTE 25 27	气微
T4	DRUG_TASTE 28 30	味甜
T5	DRUG_TASTE 31 33	微涩
T6	DRUG_TASTE 34 36	微苦
T7	DRUG_EFFICACY 40 43	清湿热
T8	SYNDROME 54 56	湿热
T9	DRUG_EFFICACY 56 59	清湿热
T10	DRUG_EFFICACY 60 65	止带下头晕
T11	PERSON_GROUP 100 102	孕妇
T1	DRUG_DOSAGE 24 27	水蜜丸
T2	DRUG_DOSAGE 74 77	大蜜丸
T3	DRUG_TASTE 78 80	味甘
T4	DRUG_TASTE 81 84	苦味甘
T5	PERSON_GROUP 89 91	孕妇
T6	FOOD_GROUP 111 113	生冷
T7	SYMPTOM 131 135	月经不调
T8	SYMPTOM 136 144	经期不准行经腹痛
T9	DRUG_EFFICACY 146 150	养血调经
T10	SYMPTOM 151 155	舒郁化滞
T11	SYNDROME 158 162	气虚血寒
T12	SYNDROME 163 167	肝郁不舒
T13	SYMPTOM 170 174	经期不准
T14	SYMPTOM 17

T1	DRUG_EFFICACY 0 4	活血调经
T2	SYMPTOM 7 11	月经量少
T3	SYMPTOM 12 16	产后腹痛
T4	PERSON_GROUP 16 18	儿童
T5	PERSON_GROUP 30 32	孕妇
T6	FOOD_GROUP 39 41	生冷
T7	SYNDROME 46 50	气血两虚
T8	SYNDROME 57 61	气血两虚
T9	SYMPTOM 64 68	月经量少
T10	SYMPTOM 76 80	头晕心悸
T11	SYMPTOM 81 85	疲乏无力
T12	DISEASE 96 99	高血压
T13	DISEASE_GROUP 100 103	心脏病
T14	DISEASE_GROUP 104 106	肾病
T15	DISEASE 107 110	糖尿病
T16	SYMPTOM 147 150	经量少
T17	PERSON_GROUP 160 165	青春期少女
T18	PERSON_GROUP 166 171	更年期妇女
T19	SYMPTOM 188 190	腹痛
T20	SYMPTOM 192 196	阴道出血
T21	PERSON_GROUP 249 252	过敏者
T22	PERSON_GROUP 255 260	过敏体质者
T23	PERSON_GROUP 290 292	儿童
T24	DRUG_DOSAGE 332 335	软胶囊
T25	DRUG_DOSAGE 350 352	液体
T26	DRUG_TASTE 353 356	气微香
T27	DRUG_TASTE 357 359	味苦
T28	PERSON_GROUP 379 381	孕妇
T1	DRUG_EFFICACY 6 10	养血安神
T2	SYNDROME 13 17	脾胃虚弱
T3	SYNDROME 18 22	心脾两虚
T4	SYNDROME 25 28	血虚证
T5	SYMPTOM 31 39	面色萎黄或白光白
T6	SYMPTOM 40 44	食少纳呆
T7	SYMPTOM 45 49	脘腹胀闷
T8	SYMPTOM 50 54	大便不调
T9	SYMPTOM 55 59	烦躁多汗
T10	SYMPTOM 60 64	倦怠乏力
T11	SYMPTOM 65 69	舌胖色淡
T12	SYMPTOM 70 73	苔薄白
T13	

T1	PERSON_GROUP 18 23	月经过多者
T2	DRUG_EFFICACY 28 32	活血调经
T3	DRUG_EFFICACY 33 37	行气止痛
T4	SYNDROME 40 42	气滞
T5	SYNDROME 42 44	血瘀
T6	SYMPTOM 46 50	月经不调
T7	SYMPTOM 51 53	痛经
T8	SYMPTOM 73 75	痛经
T9	SYMPTOM 105 109	重度痛经
T10	PERSON_GROUP 186 189	过敏者
T11	PERSON_GROUP 192 197	过敏体质者
T12	PERSON_GROUP 224 226	儿童
T13	DRUG_EFFICACY 262 266	活血调经
T14	SYMPTOM 269 273	月经不调
T15	SYMPTOM 274 276	痛经
T16	SYMPTOM 277 281	产后腹痛
T1	DRUG_EFFICACY 6 10	通络下乳
T2	SYNDROME 15 19	气血虚弱
T3	SYMPTOM 25 27	少乳
T4	PERSON_GROUP 87 92	哺乳疾病者
T5	SYNDROME 101 105	气血虚弱
T6	DRUG_DOSAGE 160 162	颗粒
T7	DRUG_TASTE 163 165	味甜
T8	DRUG_TASTE 166 168	微苦
T1	DRUG_EFFICACY 54 58	抗炎镇痛
T2	DRUG_EFFICACY 64 73	促进生殖系统微循环
T3	DRUG_EFFICACY 74 80	化解体内肿块
T4	DRUG_EFFICACY 83 88	增强免疫力
T5	DRUG_DOSAGE 198 202	薄膜衣片
T6	DRUG_TASTE 219 222	气微香
T7	DRUG_TASTE 223 227	味苦微咸
T8	SYMPTOM 233 236	瘕积聚
T9	SYMPTOM 237 241	痛经闭经
T10	SYMPTOM 242 246	赤白带下
T11	DISEASE 247 252	慢性盆腔炎
T12	DRUG_EFFICACY 261 265	活血调经
T13	DRUG_EFFICACY 268 270	止痛
T14	DRUG_EFFICACY 271 275	软坚散结
T15	SYM

T1	SYNDROME 3 7	气血两虚
T2	SYMPTOM 10 14	月经不调
T3	SYMPTOM 17 23	月经周期错后
T4	SYNDROME 23 27	气血两虚
T5	SYMPTOM 30 34	月经不调
T6	SYMPTOM 37 43	月经周期错后
T7	SYMPTOM 44 48	行经量少
T8	SYMPTOM 49 53	精神不振
T9	DRUG_EFFICACY 107 111	益气养血
T10	DRUG_EFFICACY 112 116	活血调经
T11	SYNDROME 119 123	气血两虚
T12	SYNDROME 125 127	血瘀
T13	SYMPTOM 130 134	月经不调
T14	SYMPTOM 137 143	月经周期错后
T15	SYMPTOM 144 148	行经量少
T16	SYMPTOM 149 153	精神不振
T17	SYMPTOM 154 158	肢体乏力
T18	SYMPTOM 158 162	月经不调
T19	DRUG_EFFICACY 163 166	补气血
T1	DRUG_EFFICACY 53 57	滋阴清热
T2	DRUG_EFFICACY 58 62	除烦安神
T3	SYMPTOM 71 75	潮热汗出
T4	SYMPTOM 76 78	眩晕
T5	SYMPTOM 79 81	耳鸣
T6	SYMPTOM 151 155	潮热汗出
T7	SYMPTOM 156 158	眩晕
T8	SYMPTOM 159 161	耳鸣
T9	SYMPTOM 162 164	失眠
T10	SYMPTOM 165 169	烦燥不安
T1	SYMPTOM 78 82	潮热汗出
T2	SYMPTOM 83 85	眩晕
T3	SYMPTOM 86 88	耳鸣
T4	FOOD_GROUP 115 117	辛辣
T5	FOOD_GROUP 120 122	油腻
T6	DISEASE 125 127	感冒
T7	SYMPTOM 127 129	发热
T8	DISEASE 139 142	高血压
T9	DISEASE_GROUP 143 146	心脏病
T10	DISEASE_GROUP 147 149	肝病
T11	DISEASE 150 153	糖尿病
T12	DISEASE_GROUP 154 156	肾病
T13	

T1	DRUG_DOSAGE 1 3	丸剂
T2	DRUG_DOSAGE 4 7	水蜜丸
T3	PERSON_GROUP 10 12	孕妇
T4	DRUG_EFFICACY 86 90	活血化瘀
T5	DRUG_EFFICACY 91 95	缓消瘀块
T6	SYMPTOM 100 104	宿有血块
T7	SYMPTOM 108 112	漏下不止
T8	SYMPTOM 113 117	胎动不安
T9	SYMPTOM 119 123	血瘀经闭
T10	SYMPTOM 124 128	行经腹痛
T11	SYMPTOM 168 172	宿有瘕块
T12	SYMPTOM 174 178	血瘀经闭
T13	SYMPTOM 179 183	行经腹痛
T14	SYMPTOM 184 190	产后恶露不尽
T1	PERSON_GROUP 91 93	孕妇
T2	DRUG_INGREDIENT 148 150	人参
T3	DRUG_INGREDIENT 151 153	白芍
T4	DRUG_INGREDIENT 154 157	反藜芦
T5	DRUG_INGREDIENT 161 163	藜芦
T6	DRUG_INGREDIENT 175 177	甘草
T7	DRUG_INGREDIENT 178 181	反甘遂
T8	DRUG_INGREDIENT 182 184	大戟
T9	DRUG_INGREDIENT 185 187	海藻
T10	DRUG_INGREDIENT 188 190	芫花
T11	DRUG_INGREDIENT 194 196	甘遂
T12	DRUG_INGREDIENT 197 199	大戟
T13	DRUG_INGREDIENT 200 202	海藻
T14	DRUG_INGREDIENT 203 205	芫花
T15	FOOD_GROUP 218 220	生冷
T16	FOOD_GROUP 221 223	辛辣
T17	FOOD_GROUP 224 226	荤腥
T18	FOOD_GROUP 226 228	油腻
T19	DRUG_INGREDIENT 277 279	皂荚
T20	PERSON_GROUP 334 336	孕妇
T21	DRUG_EFFICACY 340 344	补气养血
T22	DRUG_EFFICACY 345 349	调经止带
T23	

T1	DRUG_EFFICACY 21 23	镇痛
T2	SYMPTOM 28 33	平滑肌收缩
T3	DRUG_INGREDIENT 50 52	艾叶
T4	DRUG_EFFICACY 54 58	抑制纤溶
T5	DRUG_EFFICACY 59 61	抗炎
T6	DRUG_EFFICACY 75 77	镇痛
T7	DRUG_EFFICACY 86 92	抑制子宫收缩
T8	SYMPTOM 140 144	月经不调
T9	SYMPTOM 145 147	痛经
T10	SYMPTOM 148 152	宫寒不孕
T11	SYMPTOM 153 155	崩漏
T12	SYMPTOM 156 158	带下
T13	SYMPTOM 175 182	降低肠管紧张性
T14	SYMPTOM 197 199	胃痛
T15	SYMPTOM 200 204	慢性肠炎
T16	SYMPTOM 205 211	尿频慢性肠炎
T17	SYMPTOM 212 214	尿频
T18	DRUG_DOSAGE 267 270	大蜜丸
T19	DRUG_TASTE 271 273	气微
T20	DRUG_TASTE 274 279	味甘而后苦
T21	DRUG_TASTE 280 283	辛气微
T22	DRUG_TASTE 284 289	味甘而后苦
T23	FOOD_GROUP 358 360	生冷
T24	DISEASE 372 374	感冒
T25	SYMPTOM 374 376	发热
T26	DISEASE 386 389	高血压
T27	DISEASE_GROUP 390 393	心脏病
T28	DISEASE_GROUP 394 396	肝病
T29	DISEASE 397 400	糖尿病
T30	DISEASE_GROUP 401 403	肾病
T31	DISEASE_GROUP 404 407	慢性病
T32	PERSON_GROUP 422 427	青春期少女
T33	PERSON_GROUP 428 433	更年期妇女
T34	SYMPTOM 456 460	月经过少
T35	SYMPTOM 462 466	经期错后
T36	SYMPTOM 468 475	阴道不规则出血
T37	SYMPTOM 487 489	痛经
T38	SYMPTOM 553 557	月经不调
T39	P

T1	FOOD_GROUP 29 31	辛辣
T2	FOOD_GROUP 32 34	生冷
T3	DISEASE 39 41	感冒
T4	SYMPTOM 41 43	发热
T5	DISEASE 53 56	高血压
T6	DISEASE_GROUP 57 60	心脏病
T7	DISEASE_GROUP 61 63	肝病
T8	DISEASE 64 67	糖尿病
T9	DISEASE_GROUP 68 70	肾病
T10	DISEASE_GROUP 71 74	慢性病
T11	PERSON_GROUP 89 91	孕妇
T12	PERSON_GROUP 94 99	青春期少女
T13	PERSON_GROUP 100 105	更年期妇女
T14	SYMPTOM 128 132	月经过少
T15	SYMPTOM 134 138	经期错后
T16	SYMPTOM 140 147	阴道不规则出血
T17	SYMPTOM 157 161	月经量多
T18	PERSON_GROUP 211 216	过敏体质者
T19	PERSON_GROUP 244 246	儿童
T20	DRUG_EFFICACY 325 329	益气养血
T21	DRUG_EFFICACY 330 334	理气活血
T22	SYNDROME 338 342	气血两虚
T23	SYNDROME 343 345	气滞
T24	SYNDROME 345 347	血瘀
T25	SYMPTOM 350 354	月经不调
T26	SYMPTOM 357 361	月经提前
T27	SYMPTOM 362 366	月经错后
T28	SYMPTOM 367 371	月经量多
T29	SYMPTOM 372 376	神疲乏力
T30	SYMPTOM 377 381	行经腹痛
T31	DRUG_DOSAGE 425 428	大蜜丸
T32	DRUG_DOSAGE 429 432	大蜜丸
T33	DRUG_TASTE 433 436	气芳香
T34	DRUG_TASTE 437 439	味甜
T35	DRUG_TASTE 440 442	微苦
T1	DRUG_EFFICACY 0 4	活血调经
T2	SYMPTOM 7 11	月经不调
T3	SYMPTOM 15 19	产后腹痛
T4	DRUG_EFFICACY 76 80	活血调经

T1	DRUG_EFFICACY 14 18	祛瘀生新
T2	SYMPTOM 21 25	月经量少
T3	SYMPTOM 29 33	经来腹痛
T4	DRUG_EFFICACY 113 117	活血调经
T5	SYNDROME 120 122	血瘀
T6	SYMPTOM 125 129	月经不调
T7	SYMPTOM 132 136	经水量少
T8	PERSON_GROUP 137 139	孕妇
T1	DRUG_EFFICACY 22 28	养血调经止痛
T2	SYMPTOM 31 35	月经不调
T3	SYMPTOM 36 40	经期腹痛
T4	DRUG_EFFICACY 51 53	养血
T5	DRUG_EFFICACY 54 56	调经
T6	DRUG_EFFICACY 57 59	止痛
T7	SYMPTOM 62 66	月经不调
T8	SYMPTOM 67 71	经期腹痛
T9	PERSON_GROUP 72 74	孕妇
T1	DRUG_DOSAGE 11 13	颗粒
T2	DRUG_TASTE 14 16	气香
T3	DRUG_TASTE 17 19	味甜
T4	DRUG_EFFICACY 29 31	养血
T5	DRUG_EFFICACY 32 34	调经
T6	DRUG_EFFICACY 35 37	止痛
T7	SYMPTOM 40 44	月经量少
T8	SYMPTOM 48 52	经期腹痛
T9	FOOD_GROUP 57 59	生冷
T10	SYMPTOM 95 99	月经过少
T11	SYMPTOM 101 109	经期错后月经过少
T12	SYMPTOM 111 115	经期错后
T13	SYMPTOM 176 180	重度痛经
T14	PERSON_GROUP 219 224	过敏体质者
T15	PERSON_GROUP 251 253	儿童
T16	DRUG_EFFICACY 290 292	养血
T17	DRUG_EFFICACY 293 295	调经
T18	DRUG_EFFICACY 296 298	止痛
T19	SYMPTOM 301 305	月经量少
T20	SYMPTOM 309 313	经期腹痛
T21	PERSON_GROUP 345 347	孕妇
T1	DRUG_TASTE 8 13	味甜而微苦
T2	DRUG_DOSAG

T1	SYNDROME 95 99	血虚气滞
T2	SYNDROME 100 104	下焦虚寒
T3	SYMPTOM 107 111	月经不调
T4	SYMPTOM 112 114	痛经
T5	PERSON_GROUP 116 118	孕妇
T6	PERSON_GROUP 123 125	孕妇
T7	DRUG_EFFICACY 146 150	理气养血
T8	DRUG_EFFICACY 151 155	暖宫调经
T9	SYNDROME 158 162	血虚气滞
T10	SYNDROME 163 167	下焦虚寒
T11	SYMPTOM 170 174	月经不调
T12	SYMPTOM 175 177	痛经
T13	SYMPTOM 180 184	行经后错
T14	SYMPTOM 185 188	经量少
T15	SYMPTOM 189 192	有血块
T16	SYMPTOM 193 197	小腹疼痛
T17	SYMPTOM 200 206	小腹冷痛喜热
T18	DRUG_EFFICACY 232 234	镇痛
T19	SYMPTOM 239 244	平滑肌收缩
T20	DRUG_INGREDIENT 261 263	艾叶
T21	DRUG_EFFICACY 265 269	抑制纤溶
T22	DRUG_EFFICACY 270 272	抗炎
T23	DRUG_EFFICACY 286 288	镇痛
T24	DRUG_EFFICACY 297 303	抑制子宫收缩
T25	SYMPTOM 351 355	月经不调
T26	SYMPTOM 356 358	痛经
T27	SYMPTOM 359 363	宫寒不孕
T28	SYMPTOM 364 366	崩漏
T29	SYMPTOM 367 369	带下
T30	SYMPTOM 386 393	降低肠管紧张性
T31	SYMPTOM 408 410	胃痛
T32	SYMPTOM 411 415	慢性肠炎
T33	SYMPTOM 416 418	尿频
T1	SYMPTOM 18 22	眩晕耳鸣
T2	SYMPTOM 23 27	烦躁失眠
T3	DRUG_EFFICACY 104 106	滋阴
T4	DRUG_EFFICACY 107 111	除烦安神
T5	SYMPTOM 122 126	眩晕耳鸣
T6	SYMPTOM 127 1

T1	DRUG_EFFICACY 11 15	收缩子宫
T2	DRUG_EFFICACY 74 78	促进造血
T3	SYNDROME 165 167	血瘀
T4	SYMPTOM 317 321	恶露不行
T5	SYMPTOM 322 326	行而不畅
T6	SYMPTOM 327 331	夹有血块
T7	SYMPTOM 332 336	小腹冷痛
T1	DRUG_EFFICACY 63 65	镇痛
T2	SYMPTOM 70 75	平滑肌收缩
T3	DRUG_INGREDIENT 92 94	艾叶
T4	DRUG_EFFICACY 96 100	抑制纤溶
T5	DRUG_EFFICACY 101 103	抗炎
T6	DRUG_EFFICACY 117 119	镇痛
T7	DRUG_EFFICACY 128 134	抑制子宫收缩
T8	SYMPTOM 182 186	月经不调
T9	SYMPTOM 187 189	痛经
T10	SYMPTOM 190 194	宫寒不孕
T11	SYMPTOM 195 197	崩漏
T12	SYMPTOM 198 200	带下
T13	SYMPTOM 217 224	降低肠管紧张性
T14	SYMPTOM 239 241	胃痛
T15	SYMPTOM 242 246	慢性肠炎
T16	SYMPTOM 247 249	尿频
T17	PERSON_GROUP 278 280	孕妇
T18	PERSON_GROUP 284 286	孕妇
T19	DRUG_EFFICACY 291 295	理气养血
T20	DRUG_EFFICACY 296 300	暖宫调经
T21	SYNDROME 303 307	血虚气滞
T22	SYNDROME 308 312	下焦虚寒
T23	SYMPTOM 315 319	月经不调
T24	SYMPTOM 320 322	痛经
T25	SYMPTOM 325 329	行经后错
T26	SYMPTOM 330 333	经量少
T27	SYMPTOM 334 337	有血块
T28	SYMPTOM 338 342	小腹疼痛
T29	SYMPTOM 345 351	小腹冷痛喜热
T30	SYNDROME 361 365	血虚气滞
T31	SYNDROME 366 370	下焦虚寒
T32	SYMPTOM 373 377	

T1	DRUG_EFFICACY 39 41	镇痛
T2	SYMPTOM 46 51	平滑肌收缩
T3	DRUG_INGREDIENT 68 70	艾叶
T4	DRUG_EFFICACY 72 76	抑制纤溶
T5	DRUG_EFFICACY 77 79	抗炎
T6	DRUG_EFFICACY 93 95	镇痛
T7	DRUG_EFFICACY 104 110	抑制子宫收缩
T8	SYMPTOM 158 162	月经不调
T9	SYMPTOM 163 165	痛经
T10	SYMPTOM 166 170	宫寒不孕
T11	SYMPTOM 171 173	崩漏
T12	SYMPTOM 174 176	带下
T13	SYMPTOM 193 200	降低肠管紧张性
T14	SYMPTOM 215 217	胃痛
T15	SYMPTOM 218 222	慢性肠炎
T16	SYMPTOM 223 225	尿频
T17	DRUG_EFFICACY 292 296	理气补血
T18	DRUG_EFFICACY 297 301	暖宫调经
T19	SYMPTOM 309 313	月经不调
T20	SYNDROME 323 327	子宫虚寒
T21	SYMPTOM 327 331	月经不调
T22	PERSON_GROUP 368 370	孕妇
T23	FOOD_GROUP 392 394	生冷
T24	DISEASE 406 408	感冒
T25	SYMPTOM 408 410	发热
T26	DISEASE 420 423	高血压
T27	DISEASE_GROUP 424 427	心脏病
T28	DISEASE_GROUP 428 430	肝病
T29	DISEASE 431 434	糖尿病
T30	DISEASE_GROUP 435 437	肾病
T31	DISEASE_GROUP 438 441	慢性病
T32	PERSON_GROUP 456 461	青春期少女
T33	PERSON_GROUP 462 467	更年期妇女
T34	SYMPTOM 490 494	月经过少
T35	SYMPTOM 496 500	经期错后
T36	SYMPTOM 502 509	阴道不规则出血
T37	SYMPTOM 521 523	痛经
T38	SYMPTOM 587 591	月经不调
T39

T1	DRUG_EFFICACY 31 37	养血调经止痛
T2	SYMPTOM 40 44	月经不调
T3	SYMPTOM 45 49	经期腹痛
T4	PERSON_GROUP 50 52	孕妇
T5	DRUG_EFFICACY 78 80	养血
T6	DRUG_EFFICACY 81 83	调经
T7	DRUG_EFFICACY 84 86	止痛
T8	SYMPTOM 89 93	月经不调
T9	SYMPTOM 94 98	经期腹痛
T1	PERSON_GROUP 41 43	孕妇
T2	PERSON_GROUP 87 89	孕妇
T3	DRUG_EFFICACY 101 105	活血调经
T4	SYNDROME 108 110	血瘀
T5	SYMPTOM 113 117	月经不调
T6	SYMPTOM 120 124	经水量少
T7	DRUG_EFFICACY 125 129	祛瘀生新
T8	SYMPTOM 132 136	月经量少
T9	SYMPTOM 140 144	经来腹痛
T1	FOOD_GROUP 19 21	生冷
T2	DISEASE 56 58	感冒
T3	SYMPTOM 58 60	发热
T4	DISEASE 72 75	高血压
T5	DISEASE_GROUP 76 79	心脏病
T6	DISEASE_GROUP 80 82	肝病
T7	DISEASE 83 86	糖尿病
T8	DISEASE_GROUP 87 89	肾病
T9	DISEASE_GROUP 90 93	慢性病
T10	PERSON_GROUP 110 115	青春期少女
T11	PERSON_GROUP 116 121	更年期妇女
T12	SYMPTOM 165 169	月经过少
T13	SYMPTOM 171 175	经期错后
T14	SYMPTOM 177 184	阴道不规则出血
T15	SYMPTOM 269 273	月经不调
T16	PERSON_GROUP 306 311	过敏体质者
T17	PERSON_GROUP 344 346	儿童
T18	SYNDROME 401 403	血瘀
T19	SYMPTOM 406 410	月经后期
T20	SYMPTOM 411 413	痛经
T21	SYMPTOM 416 420	行经后错
T22	SYMPTOM 423 42

T1	DRUG_EFFICACY 8 11	补气血
T2	DRUG_EFFICACY 33 37	益气养血
T3	DRUG_EFFICACY 38 42	活血调经
T4	SYNDROME 45 49	气血两虚
T5	SYNDROME 60 64	气血两虚
T6	SYNDROME 66 68	血瘀
T7	SYMPTOM 71 75	月经不调
T8	SYMPTOM 78 84	月经周期错后
T9	SYMPTOM 85 89	行经量少
T10	SYMPTOM 90 94	精神不振
T11	SYMPTOM 95 99	肢体乏力
T12	DRUG_EFFICACY 99 102	补气血
T13	SYNDROME 154 158	气血两虚
T14	SYMPTOM 161 165	月经不调
T15	SYMPTOM 168 174	月经周期错后
T16	SYMPTOM 175 179	行经量少
T17	SYMPTOM 180 184	精神不振
T18	SYMPTOM 185 189	肢体乏力
T1	DRUG_EFFICACY 0 4	开郁顺气
T2	DRUG_EFFICACY 5 9	调经养血
T3	SYMPTOM 12 16	月经错后
T4	SYMPTOM 17 21	胸胁胀痛
T5	SYMPTOM 22 26	小腹冷痛
T6	PERSON_GROUP 27 29	孕妇
T1	PERSON_GROUP 1 3	孕妇
T2	DRUG_EFFICACY 8 12	开郁顺气
T3	DRUG_EFFICACY 13 17	调经养血
T4	SYMPTOM 20 24	月经错后
T5	SYMPTOM 29 33	月经错后
T6	SYMPTOM 34 38	胸胁胀痛
T7	SYMPTOM 39 43	小腹冷痛
T1	DRUG_EFFICACY 3 7	促进造血
T2	DRUG_EFFICACY 8 10	止血
T3	DRUG_EFFICACY 118 120	保肝
T4	DRUG_EFFICACY 190 194	增强免疫
T5	DRUG_EFFICACY 275 281	抗炎增强免疫
T6	DRUG_INGREDIENT 517 519	人参
T7	DRUG_INGREDIENT 520 522	白芍
T8	DRUG_INGREDIENT 523 526	反藜芦
T9	DRUG_INGRED

T1	SYNDROME 75 79	血虚肝郁
T2	SYMPTOM 81 85	月经不调
T3	SYMPTOM 86 88	痛经
T4	PERSON_GROUP 121 123	孕妇
T5	DRUG_EFFICACY 135 139	养血舒肝
T6	DRUG_EFFICACY 140 144	调经止痛
T7	SYNDROME 147 151	血虚肝郁
T8	SYMPTOM 153 157	月经不调
T9	SYMPTOM 158 160	痛经
T10	SYMPTOM 170 174	行经后错
T11	SYMPTOM 175 179	经水量少
T12	SYMPTOM 186 190	小腹疼痛
T13	SYMPTOM 200 204	双乳胀痛
T14	SYMPTOM 208 214	食欲不振解痉
T15	DRUG_EFFICACY 214 216	镇痛
T16	DRUG_EFFICACY 216 220	抑制变态
T17	PERSON_GROUP 248 250	孕妇
T18	DRUG_INGREDIENT 319 321	香附
T19	DRUG_INGREDIENT 322 324	延胡
T20	DRUG_INGREDIENT 325 327	赤芍
T21	DRUG_INGREDIENT 378 380	香附
T22	DRUG_INGREDIENT 381 383	延胡
T23	DRUG_INGREDIENT 384 386	赤芍
T24	DRUG_EFFICACY 404 408	解痉镇痛
T25	SYMPTOM 421 425	月经不调
T26	SYMPTOM 426 428	痛经
T1	PERSON_GROUP 26 28	孕妇
T2	DRUG_EFFICACY 33 37	活血调经
T3	SYNDROME 40 42	血瘀
T4	SYMPTOM 45 49	月经不调
T5	SYMPTOM 52 56	经水量少
T6	PERSON_GROUP 56 58	孕妇
T7	PERSON_GROUP 98 100	孕妇
T8	SYMPTOM 134 138	月经量少
T9	SYMPTOM 142 146	经来腹痛
T1	SYNDROME 12 16	气血两虚
T2	SYNDROME 18 20	血瘀
T3	SYMPTOM 23 27	月经不调
T4	SYMPTOM 30 

T1	DRUG_EFFICACY 26 30	祛瘀生新
T2	SYMPTOM 33 37	月经量少
T3	SYMPTOM 41 45	经来腹痛
T4	PERSON_GROUP 91 93	孕妇
T5	PERSON_GROUP 116 118	孕妇
T6	DRUG_EFFICACY 123 127	活血调经
T7	SYNDROME 130 132	血瘀
T8	SYMPTOM 135 139	月经不调
T9	SYMPTOM 142 146	经水量少
T1	PERSON_GROUP 1 3	孕妇
T2	PERSON_GROUP 8 10	孕妇
T3	SYMPTOM 82 86	月经量少
T4	SYMPTOM 90 94	经来腹痛
T5	DRUG_EFFICACY 95 99	活血调经
T6	SYNDROME 102 104	血瘀
T7	SYMPTOM 107 111	月经不调
T8	SYMPTOM 114 118	经水量少
T1	PERSON_GROUP 84 86	孕妇
T2	PERSON_GROUP 91 93	孕妇
T3	DRUG_EFFICACY 98 102	活血调经
T4	SYNDROME 105 107	血瘀
T5	SYMPTOM 110 114	月经不调
T6	SYMPTOM 117 121	经水量少
T7	DRUG_EFFICACY 122 126	祛瘀生新
T8	SYMPTOM 129 133	月经量少
T9	SYMPTOM 137 141	经来腹痛
T1	DRUG_EFFICACY 1 5	祛瘀生新
T2	SYMPTOM 8 12	月经量少
T3	SYMPTOM 16 20	经来腹痛
T4	PERSON_GROUP 34 36	孕妇
T5	SYMPTOM 36 40	月经量少
T6	SYMPTOM 44 48	经来腹痛
T7	PERSON_GROUP 50 52	孕妇
T8	DRUG_EFFICACY 63 67	活血调经
T9	SYNDROME 70 72	血瘀
T10	SYMPTOM 75 79	月经不调
T11	SYMPTOM 82 86	经水量少
T12	PERSON_GROUP 87 89	孕妇
T13	PERSON_GROUP 196 198	孕妇
T1	DRUG_EFFICACY 0 4	活血调经
T2	SYNDROME 7 9	血瘀


T1	DRUG_EFFICACY 8 11	补气血
T2	SYNDROME 124 128	气血两虚
T3	SYMPTOM 131 135	月经不调
T4	SYMPTOM 138 144	月经周期错后
T5	SYMPTOM 145 149	行经量少
T6	SYMPTOM 150 154	精神不振
T7	SYMPTOM 155 159	肢体乏力
T8	DRUG_EFFICACY 160 164	益气养血
T9	DRUG_EFFICACY 165 169	活血调经
T10	SYNDROME 172 176	气血两虚
T11	SYNDROME 178 180	血瘀
T12	SYMPTOM 183 187	月经不调
T13	SYMPTOM 190 196	月经周期错后
T14	SYMPTOM 197 201	行经量少
T15	SYMPTOM 202 206	精神不振
T16	SYMPTOM 207 211	肢体乏力
T1	PERSON_GROUP 34 36	孕妇
T2	DRUG_EFFICACY 41 45	祛瘀生新
T3	SYMPTOM 48 52	月经量少
T4	SYMPTOM 56 60	经来腹痛
T5	DRUG_EFFICACY 112 116	活血调经
T6	SYNDROME 119 121	血瘀
T7	SYMPTOM 124 128	月经不调
T8	SYMPTOM 131 135	经水量少
T9	PERSON_GROUP 136 138	孕妇
T1	PERSON_GROUP 54 56	孕妇
T2	DRUG_INGREDIENT 125 127	香附
T3	DRUG_INGREDIENT 128 130	延胡
T4	DRUG_INGREDIENT 131 133	赤芍
T5	DRUG_EFFICACY 151 155	解痉镇痛
T6	SYMPTOM 168 172	月经不调
T7	SYMPTOM 173 175	痛经
T8	PERSON_GROUP 185 187	孕妇
T9	SYNDROME 194 198	血虚肝郁
T10	SYMPTOM 200 204	月经不调
T11	SYMPTOM 205 207	痛经
T12	DRUG_EFFICACY 229 233	养血舒肝
T13	DRUG_EFFICACY 234 238	调经止痛
T14	SYNDROME

T1	DRUG_EFFICACY 4 6	调经
T2	DRUG_EFFICACY 7 9	止痛
T3	SYMPTOM 12 16	月经量少
T4	SYMPTOM 20 24	经期腹痛
T5	DRUG_EFFICACY 84 86	调经
T6	DRUG_EFFICACY 87 89	止痛
T7	SYMPTOM 92 96	月经量少
T8	SYMPTOM 100 104	经期腹痛
T9	PERSON_GROUP 105 107	孕妇
T1	DRUG_DOSAGE 38 40	丸剂
T2	FOOD_GROUP 57 59	辛辣
T3	FOOD_GROUP 60 62	生冷
T4	DISEASE 67 69	感冒
T5	SYMPTOM 69 71	发热
T6	DISEASE 81 84	高血压
T7	DISEASE_GROUP 85 88	心脏病
T8	DISEASE_GROUP 89 91	肝病
T9	DISEASE 92 95	糖尿病
T10	DISEASE_GROUP 96 98	肾病
T11	DISEASE_GROUP 99 102	慢性病
T12	PERSON_GROUP 117 122	青春期少女
T13	PERSON_GROUP 123 128	更年期妇女
T14	SYMPTOM 151 155	月经过少
T15	SYMPTOM 157 161	经期错后
T16	SYMPTOM 163 170	阴道不规则出血
T17	PERSON_GROUP 209 214	过敏体质者
T18	PERSON_GROUP 241 243	儿童
T19	SYNDROME 317 321	气血两虚
T20	SYMPTOM 324 328	月经不调
T21	SYMPTOM 331 337	月经周期错后
T22	SYMPTOM 338 342	行经量少
T23	SYMPTOM 343 347	精神不振
T24	SYMPTOM 348 352	肢体乏力
T25	DRUG_EFFICACY 354 357	补气血
T26	DRUG_EFFICACY 393 397	益气养血
T27	DRUG_EFFICACY 398 402	活血调经
T28	SYNDROME 405 409	气血两虚
T29	SYNDROME 411 413	血瘀
T30	SYMPTOM 416 420	月经不调
T31

T1	DRUG_EFFICACY 34 38	收缩子宫
T2	DRUG_EFFICACY 151 155	促进造血
T3	SYNDROME 242 244	血瘀
T4	DRUG_EFFICACY 376 380	养血祛瘀
T5	SYMPTOM 412 416	恶露不行
T6	SYMPTOM 417 421	行而不畅
T7	SYMPTOM 422 426	夹有血块
T8	SYMPTOM 427 431	小腹冷痛
T1	DRUG_EFFICACY 1 5	祛瘀生新
T2	SYMPTOM 8 12	月经量少
T3	SYMPTOM 16 20	经来腹痛
T4	PERSON_GROUP 47 49	孕妇
T5	DRUG_EFFICACY 86 90	活血调经
T6	SYNDROME 93 95	血瘀
T7	SYMPTOM 98 102	月经不调
T8	SYMPTOM 105 110	经水量少孕
T1	DRUG_EFFICACY 57 61	益气养血
T2	DRUG_EFFICACY 62 66	活血调经
T3	SYNDROME 69 73	气血两虚
T4	SYNDROME 75 77	血瘀
T5	SYMPTOM 80 84	月经不调
T6	SYMPTOM 87 93	月经周期错后
T7	SYMPTOM 94 98	行经量少
T8	SYMPTOM 99 103	精神不振
T9	SYMPTOM 104 108	肢体乏力
T10	SYNDROME 126 130	气血两虚
T11	SYMPTOM 133 137	月经不调
T12	SYMPTOM 140 146	月经周期错后
T13	SYMPTOM 147 151	行经量少
T14	SYMPTOM 152 156	精神不振
T15	SYMPTOM 157 161	肢体乏力
T16	DRUG_EFFICACY 161 164	补气血
T1	SYNDROME 50 54	气血两虚
T2	SYMPTOM 57 61	月经不调
T3	SYMPTOM 64 70	月经周期错后
T4	SYMPTOM 71 75	行经量少
T5	SYMPTOM 76 80	精神不振
T6	SYMPTOM 81 85	肢体乏力
T7	DRUG_EFFICACY 86 90	益气养血
T8	DRUG_EFFICACY 91 95	活血调经
T9	SYNDROME 9

T1	DRUG_EFFICACY 1 5	养血舒肝
T2	DRUG_EFFICACY 6 10	调经止痛
T3	SYNDROME 13 17	血虚肝郁
T4	SYMPTOM 19 23	月经不调
T5	SYMPTOM 24 26	痛经
T6	SYMPTOM 26 30	月经不调
T7	SYNDROME 30 32	血虚
T8	SYNDROME 32 34	肝郁
T9	DRUG_EFFICACY 34 38	养血舒肝
T10	DRUG_EFFICACY 39 43	调经止痛
T11	SYNDROME 46 50	血虚肝郁
T12	SYMPTOM 52 56	月经不调
T13	SYMPTOM 57 59	痛经
T14	SYMPTOM 69 73	行经后错
T15	SYMPTOM 74 78	经水量少
T16	SYMPTOM 85 89	小腹疼痛
T17	SYMPTOM 90 95	血块排出痛
T18	SYMPTOM 99 103	双乳胀痛
T19	SYMPTOM 107 111	食欲不振
T20	PERSON_GROUP 121 123	孕妇
T21	DRUG_INGREDIENT 278 280	香附
T22	DRUG_INGREDIENT 281 283	延胡
T23	DRUG_INGREDIENT 284 286	赤芍
T24	DRUG_EFFICACY 304 308	解痉镇痛
T25	PERSON_GROUP 319 321	妇女
T26	SYMPTOM 321 325	月经不调
T27	PERSON_GROUP 325 327	妇女
T28	DRUG_EFFICACY 327 329	解痉
T29	DRUG_EFFICACY 329 331	镇痛
T30	SYMPTOM 344 348	月经不调
T31	SYMPTOM 349 351	痛经
T32	PERSON_GROUP 361 363	孕妇
T33	PERSON_GROUP 368 370	孕妇
T34	SYMPTOM 370 372	痛经
T35	SYNDROME 411 415	血虚肝郁
T36	SYMPTOM 417 421	月经不调
T37	SYMPTOM 422 424	痛经
T1	DRUG_EFFICACY 38 42	养血舒肝
T2	DRUG_EFFICACY 43 47	调经止痛
T3	

T1	DRUG_EFFICACY 21 23	镇痛
T2	SYMPTOM 28 33	平滑肌收缩
T3	DRUG_INGREDIENT 50 52	艾叶
T4	DRUG_EFFICACY 54 58	抑制纤溶
T5	DRUG_EFFICACY 59 61	抗炎
T6	DRUG_EFFICACY 75 77	镇痛
T7	DRUG_EFFICACY 86 92	抑制子宫收缩
T8	SYMPTOM 140 144	月经不调
T9	SYMPTOM 145 147	痛经
T10	SYMPTOM 148 152	宫寒不孕
T11	SYMPTOM 153 155	崩漏
T12	SYMPTOM 156 158	带下
T13	SYMPTOM 175 182	降低肠管紧张性
T14	SYMPTOM 197 199	胃痛
T15	SYMPTOM 200 204	慢性肠炎
T16	SYMPTOM 205 207	尿频
T17	DRUG_EFFICACY 219 223	理气养血
T18	DRUG_EFFICACY 224 228	暖宫调经
T19	SYNDROME 231 235	血虚气滞
T20	SYNDROME 236 240	下焦虚寒
T21	SYMPTOM 243 247	月经不调
T22	SYMPTOM 248 250	痛经
T23	SYMPTOM 253 257	行经后错
T24	SYMPTOM 258 261	经量少
T25	SYMPTOM 262 265	有血块
T26	SYMPTOM 266 270	小腹疼痛
T27	SYMPTOM 273 279	小腹冷痛喜热
T28	SYMPTOM 284 290	行经后错痛经
T29	SYMPTOM 290 295	月经不调下
T30	SYNDROME 295 298	焦虚寒
T31	SYNDROME 298 300	血虚
T32	SYNDROME 300 302	气滞
T33	DRUG_EFFICACY 302 306	理气养血
T34	DRUG_EFFICACY 307 311	暖宫调经
T35	SYNDROME 314 318	血虚气滞
T36	SYNDROME 319 323	下焦虚寒
T37	SYMPTOM 326 330	月经不调
T38	SYMPTOM 331 333	痛经
T39	SYMPTOM 336 340	行经

T1	SYNDROME 3 7	气血两虚
T2	SYMPTOM 10 14	月经不调
T3	SYMPTOM 17 23	月经周期错后
T4	SYMPTOM 24 28	行经量少
T5	SYMPTOM 29 33	精神不振
T6	SYMPTOM 34 38	肢体乏力
T7	DRUG_EFFICACY 55 59	益气养血
T8	DRUG_EFFICACY 60 64	活血调经
T9	SYNDROME 67 71	气血两虚
T10	SYNDROME 73 75	血瘀
T11	SYMPTOM 78 82	月经不调
T12	SYMPTOM 85 91	月经周期错后
T13	SYMPTOM 92 96	行经量少
T14	SYMPTOM 97 101	精神不振
T15	SYMPTOM 102 106	肢体乏力
T16	DRUG_EFFICACY 106 110	益气养血
T17	DRUG_EFFICACY 111 115	活血调经
T18	SYNDROME 118 122	气血两虚
T19	SYNDROME 124 126	血瘀
T20	SYMPTOM 129 133	月经不调
T21	SYMPTOM 136 142	月经周期错后
T22	DRUG_EFFICACY 142 145	补气血
T23	DRUG_EFFICACY 218 221	补气血
T1	PERSON_GROUP 33 35	孕妇
T2	PERSON_GROUP 38 40	儿童
T3	PERSON_GROUP 45 47	儿童
T4	DRUG_EFFICACY 52 54	活血
T5	DRUG_EFFICACY 55 57	祛瘀
T6	DRUG_EFFICACY 58 60	止痛
T7	SYMPTOM 65 69	恶露不行
T8	SYMPTOM 72 76	小腹冷痛
T9	SYMPTOM 77 81	有块拒按
T10	SYMPTOM 82 86	形寒肢冷
T11	SYMPTOM 104 112	月经过多阴道流血
T12	SYMPTOM 116 119	腹冷痛
T13	SYMPTOM 119 125	恶露不行活血
T14	DRUG_EFFICACY 126 128	祛瘀
T15	DRUG_EFFICACY 129 131	止痛
T16	SYMPTOM 136 140	恶露不行
T17	SYMPTOM 143 1

T1	DRUG_EFFICACY 33 35	祛瘀
T2	DRUG_EFFICACY 44 48	养血祛瘀
T3	SYMPTOM 55 59	恶露不行
T4	SYMPTOM 60 64	行而不畅
T5	SYMPTOM 65 69	夹有血块
T6	SYMPTOM 69 73	恶露不行
T7	SYMPTOM 74 78	行而不畅
T8	SYMPTOM 79 83	夹有血块
T9	DRUG_EFFICACY 110 114	收缩子宫
T10	DRUG_EFFICACY 173 177	促进造血
T11	SYNDROME 264 266	血瘀
T1	DRUG_EFFICACY 8 12	益气养血
T2	DRUG_EFFICACY 13 17	理气活血
T3	SYNDROME 23 27	气血两虚
T4	SYNDROME 28 30	气滞
T5	SYNDROME 30 32	血瘀
T6	SYMPTOM 35 39	月经不调
T7	SYMPTOM 42 46	月经提前
T8	SYMPTOM 47 51	月经错后
T9	SYMPTOM 52 56	月经量多
T10	SYMPTOM 57 61	神疲乏力
T11	SYMPTOM 62 66	行经腹痛
T12	DRUG_EFFICACY 66 70	益气养血
T13	DRUG_EFFICACY 71 75	理气活血
T14	DRUG_EFFICACY 76 78	止痛
T15	DRUG_DOSAGE 117 120	水蜜丸
T16	PERSON_GROUP 132 134	孕妇
T1	SYNDROME 3 7	血虚气滞
T2	SYNDROME 8 12	下焦虚寒
T3	SYMPTOM 15 19	月经不调
T4	SYMPTOM 20 22	痛经
T5	FOOD_GROUP 95 97	寒凉
T6	FOOD_GROUP 98 100	生冷
T7	DISEASE 105 107	感冒
T8	SYMPTOM 126 130	月经量少
T9	SYMPTOM 132 136	月经错后
T10	SYMPTOM 138 145	阴道不规则出血
T11	PERSON_GROUP 198 201	过敏者
T12	PERSON_GROUP 204 209	过敏体质者
T13	PERSON_GROUP 236 238	儿童
T14	DRUG_DOSAGE 

T1	DRUG_EFFICACY 22 25	补气血
T2	DRUG_EFFICACY 26 29	调月经
T3	SYMPTOM 32 36	月经不调
T4	PERSON_GROUP 71 73	孕妇
T5	DRUG_EFFICACY 95 98	补气血
T6	SYMPTOM 105 109	头晕心慌
T7	SYMPTOM 110 114	疲乏无力
T8	SYMPTOM 115 119	月经量少
T9	SYMPTOM 123 128	经期后错调
T10	SYMPTOM 128 130	月经
T11	DRUG_EFFICACY 130 133	补气血
T12	PERSON_GROUP 133 135	孕妇
T1	PERSON_GROUP 1 3	孕妇
T2	DRUG_EFFICACY 8 12	益气养血
T3	DRUG_EFFICACY 13 17	理气活血
T4	SYNDROME 23 27	气血两虚
T5	SYNDROME 28 30	气滞
T6	SYNDROME 30 32	血瘀
T7	SYMPTOM 35 39	月经不调
T8	SYMPTOM 42 46	月经提前
T9	SYMPTOM 47 51	月经错后
T10	SYMPTOM 52 56	月经量多
T11	SYMPTOM 57 61	神疲乏力
T12	SYMPTOM 62 66	行经腹痛
T13	DRUG_DOSAGE 77 80	水蜜丸
T1	DRUG_EFFICACY 4 6	调经
T2	DRUG_EFFICACY 7 9	止痛
T3	SYMPTOM 12 16	月经不调
T4	SYMPTOM 17 21	经期腹痛
T5	DRUG_EFFICACY 71 77	养血调经止痛
T6	SYMPTOM 80 84	月经不调
T7	SYMPTOM 85 89	经期腹痛
T8	PERSON_GROUP 90 92	孕妇
T1	SYNDROME 22 26	气血两虚
T2	SYMPTOM 29 33	月经不调
T3	SYMPTOM 36 42	月经周期错后
T4	SYMPTOM 42 46	月经不调
T5	SYNDROME 46 50	气血两虚
T6	SYMPTOM 53 57	月经不调
T7	SYMPTOM 60 66	月经周期错后
T8	SYMPTOM 67 71	行经量少
T9	SYMPTOM 72 76	

T1	PERSON_GROUP 59 61	孕妇
T2	PERSON_GROUP 61 63	孕妇
T3	PERSON_GROUP 83 85	孕妇
T4	DRUG_EFFICACY 90 94	祛瘀生新
T5	SYMPTOM 97 101	月经量少
T6	SYMPTOM 105 109	经来腹痛
T7	DRUG_EFFICACY 131 135	活血调经
T8	SYNDROME 138 140	血瘀
T9	SYMPTOM 143 147	月经不调
T10	SYMPTOM 150 154	经水量少
T1	PERSON_GROUP 1 3	孕妇
T2	PERSON_GROUP 3 5	孕妇
T3	DRUG_EFFICACY 41 45	活血调经
T4	SYNDROME 48 50	血瘀
T5	SYMPTOM 53 57	月经不调
T6	SYMPTOM 60 64	经水量少
T7	PERSON_GROUP 65 67	孕妇
T8	DRUG_EFFICACY 98 102	祛瘀生新
T9	SYMPTOM 105 109	月经量少
T10	SYMPTOM 113 117	经来腹痛
T11	PERSON_GROUP 151 153	孕妇
T1	DRUG_EFFICACY 1 5	益气养血
T2	DRUG_EFFICACY 6 10	活血调经
T3	SYNDROME 13 17	气血两虚
T4	SYNDROME 19 21	血瘀
T5	SYMPTOM 24 28	月经不调
T6	SYMPTOM 31 37	月经周期错后
T7	SYMPTOM 42 48	月经周期错后
T8	SYMPTOM 49 53	行经量少
T9	SYMPTOM 54 58	精神不振
T10	SYMPTOM 59 63	肢体乏力
T11	SYMPTOM 63 65	活血
T12	DRUG_EFFICACY 65 67	调经
T13	DRUG_EFFICACY 67 71	益气养血
T14	DRUG_EFFICACY 72 76	活血调经
T15	SYNDROME 79 83	气血两虚
T16	SYMPTOM 90 94	月经不调
T17	DRUG_EFFICACY 94 97	补气血
T18	SYNDROME 133 137	气血两虚
T19	SYMPTOM 140 144	月经不调
T20	SYMPTOM 

T1	SYNDROME 45 49	气血两虚
T2	SYMPTOM 52 56	月经不调
T3	SYMPTOM 59 65	月经周期错后
T4	SYMPTOM 66 70	行经量少
T5	SYMPTOM 71 75	精神不振
T6	SYMPTOM 76 80	肢体乏力
T7	SYMPTOM 80 86	月经周期错后
T8	SYMPTOM 87 91	行经量少
T9	SYMPTOM 92 96	精神不振
T10	SYMPTOM 97 101	肢体乏力
T11	DRUG_EFFICACY 124 128	益气养血
T12	DRUG_EFFICACY 129 133	活血调经
T13	SYNDROME 136 140	气血两虚
T14	SYNDROME 142 144	血瘀
T15	SYMPTOM 147 151	月经不调
T16	SYMPTOM 154 160	月经周期错后
T17	SYMPTOM 161 165	行经量少
T18	SYMPTOM 166 170	精神不振
T19	SYMPTOM 171 175	肢体乏力
T20	SYNDROME 175 179	气血两虚
T21	DRUG_EFFICACY 206 209	补气血
T1	DRUG_EFFICACY 22 25	清湿热
T2	SYNDROME 32 36	湿热下注
T3	SYMPTOM 37 43	赤白带下色黄
T4	DRUG_EFFICACY 139 142	清湿热
T5	SYNDROME 149 153	湿热下注
T6	DRUG_EFFICACY 153 155	止带
T7	DRUG_EFFICACY 155 161	除湿湿热下注
T8	DRUG_EFFICACY 222 225	清湿热
T9	DRUG_EFFICACY 226 235	止带下清热带下量多
T1	DRUG_EFFICACY 8 12	益气养血
T2	DRUG_EFFICACY 13 17	理气活血
T3	SYNDROME 23 27	气血两虚
T4	SYNDROME 28 30	气滞
T5	SYNDROME 30 32	血瘀
T6	SYMPTOM 35 39	月经不调
T7	SYMPTOM 42 46	月经提前
T8	SYMPTOM 47 51	月经错后
T9	SYMPTOM 52 56	月经量多
T10	SYMPTOM 57 61	

T1	DRUG_EFFICACY 14 18	祛瘀生新
T2	SYMPTOM 21 25	月经量少
T3	SYMPTOM 29 33	经来腹痛
T4	DRUG_EFFICACY 75 79	活血调经
T5	SYNDROME 82 84	血瘀
T6	SYMPTOM 87 91	月经不调
T7	SYMPTOM 94 98	经水量少
T8	DRUG_EFFICACY 98 102	活血调经
T9	PERSON_GROUP 103 105	孕妇
T1	DRUG_EFFICACY 7 10	补气血
T2	SYNDROME 19 23	气血两虚
T3	SYNDROME 30 34	气血两虚
T4	SYMPTOM 37 41	月经不调
T5	SYMPTOM 44 50	月经周期错后
T6	SYMPTOM 51 55	行经量少
T7	SYMPTOM 56 60	精神不振
T8	SYMPTOM 61 65	肢体乏力
T9	SYMPTOM 65 69	行经量少
T10	SYMPTOM 70 74	精神不振
T11	SYMPTOM 75 79	肢体乏力
T12	FOOD_GROUP 190 192	辛辣
T13	FOOD_GROUP 193 195	生冷
T14	DISEASE 200 202	感冒
T15	SYMPTOM 202 204	发热
T16	DISEASE 214 217	高血压
T17	DISEASE_GROUP 218 221	心脏病
T18	DISEASE_GROUP 222 224	肝病
T19	DISEASE 225 228	糖尿病
T20	DISEASE_GROUP 229 231	肾病
T21	DISEASE_GROUP 232 235	慢性病
T22	PERSON_GROUP 250 255	青春期少女
T23	PERSON_GROUP 256 261	更年期妇女
T24	SYMPTOM 284 288	月经过少
T25	SYMPTOM 290 294	经期错后
T26	SYMPTOM 296 303	阴道不规则出血
T27	PERSON_GROUP 336 339	过敏者
T28	PERSON_GROUP 342 347	过敏体质者
T29	PERSON_GROUP 374 376	儿童
T30	PERSON_GROUP 376 379	过敏者
T31	PE

T1	DRUG_EFFICACY 15 19	益气养血
T2	DRUG_EFFICACY 20 24	理气活血
T3	SYNDROME 30 34	气血两虚
T4	SYNDROME 35 37	气滞
T5	SYNDROME 37 39	血瘀
T6	SYMPTOM 42 46	月经不调
T7	SYMPTOM 49 53	月经提前
T8	SYMPTOM 54 58	月经错后
T9	SYMPTOM 59 63	月经量多
T10	SYMPTOM 64 68	神疲乏力
T11	SYMPTOM 69 73	行经腹痛
T12	PERSON_GROUP 102 104	孕妇
T13	DRUG_DOSAGE 112 115	水蜜丸
T1	DRUG_EFFICACY 38 40	镇痛
T2	SYMPTOM 45 50	平滑肌收缩
T3	DRUG_INGREDIENT 67 69	艾叶
T4	DRUG_EFFICACY 71 75	抑制纤溶
T5	DRUG_EFFICACY 76 78	抗炎
T6	DRUG_EFFICACY 92 94	镇痛
T7	DRUG_EFFICACY 103 109	抑制子宫收缩
T8	SYMPTOM 157 161	月经不调
T9	SYMPTOM 162 164	痛经
T10	SYMPTOM 165 169	宫寒不孕
T11	SYMPTOM 170 172	崩漏
T12	SYMPTOM 173 175	带下
T13	SYMPTOM 192 199	降低肠管紧张性
T14	SYMPTOM 214 216	胃痛
T15	SYMPTOM 217 221	慢性肠炎
T16	SYMPTOM 222 224	尿频
T17	SYNDROME 238 242	血虚气滞
T18	SYNDROME 243 247	下焦虚寒
T19	SYMPTOM 250 254	月经不调
T20	SYMPTOM 255 257	痛经
T21	DRUG_EFFICACY 259 263	理气养血
T22	DRUG_EFFICACY 264 268	暖宫调经
T23	SYNDROME 271 275	血虚气滞
T24	SYNDROME 276 280	下焦虚寒
T25	SYMPTOM 283 287	月经不调
T26	SYMPTOM 288 290	痛经
T27	SYMPTOM 293 297	行经

In [None]:
#“实体类别”、“起始位置”、“结束位置”以空格分隔

In [19]:
for i in range(1000,1500):
    with open('data/submit/%d.ann'%i,'w', encoding='utf-8') as wr:
        wr.write('\n'.join(result[i]))

In [None]:
#for i in range(1000,1500):
#    pd.DataFrame(result[i]).to_csv('data/submit/%d.ann'%i,
#                                      sep='\t',
#                                      header = None,
#                                      index = 0,
#                                      encoding = 'utf-8')