# CRF+LSTM

keras 2.2.4

tensorflow 1.13

pip install git+https://www.github.com/keras-team/keras-contrib.git

In [72]:
import re
import os
import pandas as pd

In [53]:
char_vocab_path = "CRF/data/char_vocabs.txt" # 字典文件
#train_data_path = 'data/train_data/train_data_000' # 训练数据
#train_data_path = './data/train_data' # 训练数据
#test_data_path = 'data/train_data/train_data_000' # 测试数据

special_words = ['<PAD>', '<UNK>'] # 特殊词表示

# "BIO"标记的标签
#label2idx = {"O": 0,
#             "B-PER": 1, "I-PER": 2,
#             "B-LOC": 3, "I-LOC": 4,
#             "B-ORG": 5, "I-ORG": 6
#            }
label2idx = {'O': 0,
             'B-DISEASE': 1, 'B-DISEASE_GROUP': 2,
             'B-DRUG_DOSAGE': 3, 'B-DRUG_EFFICACY': 4,
             'B-DRUG_INGREDIENT': 5, 'B-DRUG_TASTE': 6,
             'B-FOOD_GROUP':7, 'B-PERSON_GROUP':8,
             'B-SYMPTOM':9, 'B-SYNDROME':10,
             'I-DISEASE': 11, 'I-DISEASE_GROUP': 12,
             'I-DRUG_DOSAGE': 13, 'I-DRUG_EFFICACY': 14,
             'I-DRUG_INGREDIENT': 15, 'I-DRUG_TASTE': 16,
             'I-FOOD_GROUP':17, 'I-PERSON_GROUP':18,
             'I-SYMPTOM':19, 'I-SYNDROME':20
            }

# 索引和BIO标签对应
idx2label = {idx: label for label, idx in label2idx.items()}

# 读取字符词典文件
with open(char_vocab_path, "r", encoding="utf8") as fo:
    char_vocabs = [line.strip() for line in fo]
char_vocabs = special_words + char_vocabs

# 字符和索引编号对应
idx2vocab = {idx: char for idx, char in enumerate(char_vocabs)}
vocab2idx = {char: idx for idx, char in idx2vocab.items()}

In [54]:
# 读取训练语料
def read_corpus(corpus_path, vocab2idx, label2idx):
    with open(corpus_path, encoding='utf-8') as fr:
        lines = fr.readlines()

    sent_, tag_ = [], []
    for letter in lines:
        [char,label,_] = re.split('\t|\n',letter)
        sent_.append(char)
        tag_.append(label)

    sent_ids = [vocab2idx[char] if char in vocab2idx else vocab2idx['<UNK>'] for char in sent_]
    tag_ids = [label2idx[label] if label in label2idx else 0 for label in tag_]
    return sent_ids, tag_ids

# 加载训练集
#train_datas, train_labels = read_corpus(train_data_path, vocab2idx, label2idx)
# 加载测试集
#test_datas, test_labels = read_corpus(test_data_path, vocab2idx, label2idx)


In [55]:
train_datas = []
train_labels = []
files = os.listdir('data/train_data')
for file in files:
    train_data_path_i = 'data/train_data/'+file
    train_datas_i, train_labels_i = read_corpus(train_data_path_i, vocab2idx, label2idx)
    train_datas.append(train_datas_i)
    train_labels.append(train_labels_i)
    #if i%10==0:
    #    print(i)

In [56]:
valid_datas = []
valid_labels = []
files = os.listdir('data/valid_data')
for file in files:
    valid_data_path_i = 'data/valid_data/'+file
    valid_datas_i, valid_labels_i = read_corpus(valid_data_path_i, vocab2idx, label2idx)
    valid_datas.append(valid_datas_i)
    valid_labels.append(valid_labels_i)

In [57]:
print(train_datas[50])
print([idx2vocab[idx] for idx in train_datas[50]])
print(train_labels[50])
print([idx2label[idx] for idx in train_labels[50]])

[1, 61, 77, 1, 1, 17, 181, 3093, 3817, 2654, 6214, 1959, 2177, 286, 6802, 5965, 519, 1408, 2644, 2102, 2732, 1842, 889, 2545, 3093, 3817]
['<UNK>', 'b', 'r', '<UNK>', '<UNK>', '3', '、', '治', '疗', '期', '间', '忌', '房', '事', '，', '配', '偶', '如', '有', '感', '染', '应', '同', '时', '治', '疗']
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


In [58]:
import numpy as np
import keras
from keras.models import Sequential
from keras.models import Model
from keras.layers import Masking, Embedding, Bidirectional, LSTM, Dense, Input, TimeDistributed, Activation
from keras.preprocessing import sequence
from keras_contrib.layers import CRF
from keras_contrib.losses import crf_loss
from keras_contrib.metrics import crf_viterbi_accuracy
from keras import backend as K
K.clear_session()

EPOCHS = 50
BATCH_SIZE = 128
EMBED_DIM = 48
HIDDEN_SIZE = 16
MAX_LEN = 50
VOCAB_SIZE = len(vocab2idx)
CLASS_NUMS = len(label2idx)
print(VOCAB_SIZE, CLASS_NUMS)

print('padding sequences')
train_datas = sequence.pad_sequences(train_datas, maxlen=MAX_LEN)
train_labels = sequence.pad_sequences(train_labels, maxlen=MAX_LEN)
valid_datas = sequence.pad_sequences(valid_datas, maxlen=MAX_LEN)
valid_labels = sequence.pad_sequences(valid_labels, maxlen=MAX_LEN)
print('x_train shape:', train_datas.shape)
print('x_test shape:', valid_datas.shape)

train_labels = keras.utils.to_categorical(train_labels, CLASS_NUMS)
valid_labels = keras.utils.to_categorical(valid_labels, CLASS_NUMS)
print('trainlabels shape:', train_labels.shape)
print('testlabels shape:', valid_labels.shape)

## BiLSTM+CRF模型构建
inputs = Input(shape=(MAX_LEN,), dtype='int32')
x = Masking(mask_value=0)(inputs)
x = Embedding(VOCAB_SIZE, EMBED_DIM, mask_zero=True)(x)
x = Bidirectional(LSTM(HIDDEN_SIZE, return_sequences=True))(x)
x = TimeDistributed(Dense(CLASS_NUMS))(x)#TimeDistributed层的作用就是把Dense层应用到这10个具体的向量上，对每一个向量进行了一个Dense操作
outputs = CRF(CLASS_NUMS)(x)
model = Model(inputs=inputs, outputs=outputs)
model.summary()

model.compile(loss=crf_loss, optimizer='adam', metrics=[crf_viterbi_accuracy])
model.fit(train_datas, train_labels, epochs=EPOCHS, verbose=1, validation_split=0.1)

score = model.evaluate(valid_datas, valid_labels, batch_size=BATCH_SIZE)
print(model.metrics_names)
print(score)

6874 21
padding sequences
x_train shape: (6899, 50)
x_test shape: (1987, 50)
trainlabels shape: (6899, 50, 21)
testlabels shape: (1987, 50, 21)
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         (None, 50)                0         
_________________________________________________________________
masking_1 (Masking)          (None, 50)                0         
_________________________________________________________________
embedding_1 (Embedding)      (None, 50, 48)            329952    
_________________________________________________________________
bidirectional_1 (Bidirection (None, 50, 32)            8320      
_________________________________________________________________
time_distributed_1 (TimeDist (None, 50, 21)            693       
_________________________________________________________________
crf_1 (CRF)                  (None, 50, 21)            945      

Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
['loss', 'crf_viterbi_accuracy']
[2.821839642392731, 0.8834322501680751]


In [59]:
# save model
model.save("model/ch_ner_model.h5")

In [111]:
def get_valid_nertag(input_data, result_tags):
    result_words = []
    start, end =0, 1 # 实体开始结束位置标识
    tag_label = "O" # 实体类型标识
    number = 0
    for i, tag in enumerate(result_tags):
        if tag.startswith("B"):
            number += 1
            if tag_label != "O": # 当前实体tag之前有其他实体     
                result_words.append(('T'+str(number), tag_label, start, end,input_data[start: end]))
                #result_words.append(('T'+str(number), tag_label+' '+str(start)+' '+str(end),input_data[start: end])) # 获取实体
            tag_label = tag.split("-")[1] # 获取当前实体类型
            start, end = i, i+1 # 开始和结束位置变更
        elif tag.startswith("I"):
            temp_label = tag.split("-")[1]
            if temp_label == tag_label: # 当前实体tag是之前实体的一部分
                end += 1 # 结束位置end扩展
        elif tag == "O":
            if tag_label != "O": # 当前位置非实体 但是之前有实体
                #result_words.append(('T'+str(number), tag_label+' '+str(start)+' '+str(end),input_data[start: end])) # 获取实体
                result_words.append(('T'+str(number), tag_label, start, end,input_data[start: end]))
                tag_label = "O"  # 实体类型置"O"
            start, end = i, i+1 # 开始和结束位置变更
    if tag_label != "O": # 最后结尾还有实体
        number += 1
        result_words.append(('T'+str(number), tag_label, start, end,input_data[start: end]))
        #result_words.append(('T'+str(number),tag_label+' '+str(start)+' '+str(end),input_data[start: end])) # 获取结尾的实体
    return result_words

In [136]:
maxlen = 50
result = {}
test_data_path = 'data/chusai_xuanshou/'
for i in range(500):
    test_file = test_data_path+str(i+1000)+'.txt'
    with open(test_file, "r", encoding="utf8") as test:
        sentence = test.read()
    sentences = sentence.split('。')
    y_ner = []

    for sent in sentences:
        sent = sent.replace(' ','_')
        sent_chars = list(sent+'。')
        sent2id = [vocab2idx[word] if word in vocab2idx else vocab2idx['<UNK>'] for word in sent_chars]

        sent2id_new = np.array([[0] * (maxlen-len(sent2id)) + sent2id[:maxlen]])
        y_pred = model.predict(sent2id_new)
        y_label = np.argmax(y_pred, axis=2)
        y_label = y_label.reshape(1, -1)[0]
        y_ner_ = [idx2label[i] for i in y_label][-len(sent_chars):]
        y_ner.extend(y_ner_)
    result_words = get_valid_nertag(sentence, y_ner)
    ans = []
    for res in result_words:
        number = res[0]
        #tag_start_end = res[1]
        tag = res[1]
        start = res[2]
        end = res[3]
        word = res[4].replace(' ','')
        ans.append('{}\t{} {} {}\t{}'.format('T'+str(len(ans)), tag,start, end, word))
        #ans.append(, tag, start,end, "".join(word))
        print('{}\t{} {} {}\t{}'.format('T'+str(len(ans)), tag,start, end, word))
    result[i+1000] = ans

T1	DRUG_EFFICACY 138 142	清热解毒
T2	DRUG_EFFICACY 143 147	化湿除带
T3	DRUG_EFFICACY 148 152	祛瘀止痛
T4	DISEASE 160 165	慢性盆腔炎
T1	DISEASE 36 39	糖尿病
T2	SYMPTOM 87 91	月经量少
T3	SYMPTOM 95 101	血虚萎黄后错
T4	SYMPTOM 102 106	血虚萎黄
T5	SYMPTOM 107 111	风湿痹痛
T6	SYMPTOM 112 116	肢体麻木
T7	DISEASE 116 119	糖尿病
T1	PERSON_GROUP 36 42	感冒发热病人
T2	DISEASE 51 54	高血压
T3	DISEASE_GROUP 55 58	心脏病
T4	DISEASE_GROUP 59 61	肝病
T5	DISEASE_GROUP 66 68	肾病
T6	SYMPTOM 90 94	月经紊乱
T7	SYMPTOM 109 111	眩晕
T8	PERSON_GROUP 152 155	过敏者
T9	PERSON_GROUP 158 163	过敏体质者
T10	PERSON_GROUP 192 194	儿童
T11	DRUG_DOSAGE 242 244	颗粒
T12	DRUG_TASTE 245 248	气微香
T13	DRUG_TASTE 249 252	味微苦
T14	SYMPTOM 282 286	烘热汗出
T15	SYMPTOM 287 291	头晕耳鸣
T16	SYMPTOM 297 301	五心烦热
T17	SYMPTOM 302 306	腰背酸痛
T18	SYMPTOM 307 311	大便干燥
T19	SYMPTOM 312 315	心烦易
T20	SYNDROME 387 389	2g
T21	SYNDROME 389 391	*1
T1	DISEASE 55 59	子宫肌瘤
T2	SYNDROME 59 63	气滞血瘀
T3	SYMPTOM 66 70	经期延长
T4	SYMPTOM 71 75	经量过多
T5	SYMPTOM 76 82	经色紫黯有块
T6	SYMPTOM 83 90	小腹或乳房胀痛
T7	DRUG_DOSAGE 145 148	硬胶囊
T8	DRUG_TASTE 160 16

T1	DISEASE 25 27	皮疹
T2	DRUG_EFFICACY 76 80	祛瘀生新
T3	DRUG_EFFICACY 81 85	消肿止痛
T4	SYMPTOM 120 124	小腹疼痛
T1	DISEASE 34 38	贫血
T2	SYNDROME 108 112	气血不足
T1	FOOD_GROUP 52 54	生冷
T2	FOOD_GROUP 55 57	油腻
T3	DRUG_DOSAGE 85 88	大蜜丸
T4	SYMPTOM 106 110	tr><
T5	SYMPTOM 111 115	rcl
T6	SYMPTOM 116 120	ss='
T7	SYMPTOM 121 125	olor
T8	SYMPTOM 146 150	h><t
T9	SYMPTOM 151 155	>补肾，
T10	SYMPTOM 156 160	寒，止痛
T11	SYMPTOM 161 165	用于肾经
T12	PERSON_GROUP 165 167	虚寒
T13	DRUG_EFFICACY 167 170	引起的
T14	DRUG_EFFICACY 171 173	腿酸
T15	DRUG_EFFICACY 174 178	，阳痿遗
T16	DRUG_EFFICACY 179 181	，小
T17	SYMPTOM 191 195	补肾，
T18	SYMPTOM 196 200	寒，止痛
T19	SYMPTOM 201 205	用于肾经
T20	SYMPTOM 206 210	寒引起的
T21	SYMPTOM 210 218	腰腿酸痛，阳痿遗
T22	SYMPTOM 219 223	，小便频
T23	SYMPTOM 224 228	，小腹冷
T24	PERSON_GROUP 391 393	4、
T25	DRUG_DOSAGE 447 451	敏者禁用
T26	DRUG_DOSAGE 452 455	过敏体
T1	DISEASE 33 36	盆腔炎
T2	SYMPTOM 39 43	带下量多
T3	SYMPTOM 44 48	下腹疼痛
T4	DRUG_DOSAGE 55 59	薄膜衣片
T5	FOOD_GROUP 72 74	香，
T6	FOOD_GROUP 75 77	苦。
T7	FOOD_GROUP 78 80	1
T8	DRUG_DOSAGE 280 282

T1	SYMPTOM 41 45	宿有瘕块
T2	SYMPTOM 60 64	行经腹痛
T3	DRUG_EFFICACY 87 91	月。
T4	SYMPTOM 101 105	用于妇人
T5	SYMPTOM 109 113	，妊娠后
T6	SYMPTOM 114 118	下不止，
T7	SYMPTOM 120 124	不安，或
T8	SYMPTOM 125 129	瘀经闭，
T9	SYMPTOM 132 135	痛，产
T1	DRUG_DOSAGE 4 8	薄膜衣片
T2	DRUG_TASTE 21 24	气微香
T3	DRUG_TASTE 25 28	味微甜
T4	DRUG_TASTE 29 31	略苦
T5	DISEASE_GROUP 32 34	
T6	SYMPTOM 53 57	小腹胀痛
T1	DRUG_EFFICACY 1 5	祛瘀生新
T2	DRUG_DOSAGE 70 72	颗粒
T3	DRUG_TASTE 73 75	昧甜
T4	DRUG_TASTE 76 78	微苦
T5	FOOD_GROUP 92 94	生冷
T6	SYNDROME 99 103	气血两虚
T7	SYMPTOM 106 110	月经量少
T8	SYMPTOM 111 115	色淡质稀
T9	SYMPTOM 118 122	头晕心悸
T10	SYMPTOM 123 127	疲乏无力
T11	DISEASE 138 141	高血压
T12	DISEASE_GROUP 142 145	心脏病
T13	DISEASE_GROUP 146 148	肾病
T14	DISEASE 149 152	糖尿病
T15	SYMPTOM 189 192	经量少
T16	PERSON_GROUP 202 207	青春期少女
T17	PERSON_GROUP 208 213	更年期妇女
T18	SYMPTOM 230 232	腹痛
T19	SYMPTOM 234 238	阴道出血
T20	PERSON_GROUP 297 302	过敏体质者
T21	PERSON_GROUP 330 332	儿童
T22	SYNDROME 375 377	血瘀
T23	SYMPTOM 380 384	月经不调
T1	SYMPTOM 10 14	经前腹痛
T2	SYMPTOM 15 19	男子少精
T3	DRUG_EFFIC

T1	SYNDROME 3 7	气血两虚
T2	SYMPTOM 10 14	月经不调
T3	SYMPTOM 30 34	月经不调
T4	SYMPTOM 37 43	月经周期错后
T5	SYMPTOM 44 48	行经量少
T6	DRUG_EFFICACY 83 87	方药物（
T7	SYNDROME 90 94	,国家基
T8	SYMPTOM 108 114	气养血，活血
T9	SYMPTOM 115 119	经。用于
T10	SYMPTOM 120 124	血两虚兼
T11	SYMPTOM 125 129	血瘀所致
T12	SYMPTOM 129 134	的月经不调
T13	DRUG_EFFICACY 134 137	。症见
T14	DRUG_EFFICACY 138 141	经周期
T1	SYMPTOM 58 62	除烦安神
T2	SYMPTOM 63 65	用于
T3	SYMPTOM 66 68	年期
T4	SYMPTOM 69 71	现的
T5	DISEASE 128 134	一日2～3次
T6	SYMPTOM 138 142	善妇女更
T7	SYMPTOM 143 145	期综
T8	SYMPTOM 146 148	症症
T9	SYMPTOM 149 151	，如
T10	SYMPTOM 152 157	热汗出，眩
T1	DISEASE 68 74	更年期综合症
T2	SYMPTOM 78 82	潮热汗出
T3	SYMPTOM 83 85	眩晕
T4	SYMPTOM 86 88	耳鸣
T5	SYMPTOM 89 91	失眠
T6	PERSON_GROUP 103 109	徽)有限公司
T7	DISEASE 117 120	，少进
T8	DISEASE_GROUP 121 124	腻。2
T9	DISEASE_GROUP 125 127	感冒
T10	DISEASE 128 131	热病人
T11	DISEASE_GROUP 132 134	宜服
T12	DISEASE_GROUP 135 138	。3.
T13	SYMPTOM 155 159	病等慢性
T14	SYMPTOM 173 175	4.
T15	PERSON_GROUP 241 246	无缓解，应
T16	PERSON_GROUP 274 276	品性
T17	DRUG_DOSAGE 316 3

T1	SYNDROME 58 62	清热除
T1	SYNDROME 47 49	血瘀
T2	SYMPTOM 52 56	月经不调
T3	SYMPTOM 59 63	经水量少
T4	DRUG_EFFICACY 78 82	祛瘀生新
T5	SYMPTOM 85 89	月经量少
T6	SYMPTOM 93 97	经来腹痛
T7	DISEASE_GROUP 103 105	
T1	SYMPTOM 3 7	经期腹痛
T2	SYMPTOM 52 56	乙类）
T3	FOOD_GROUP 153 155	粒，
T4	SYMPTOM 193 195	人参
T1	DRUG_EFFICACY 4 6	调经
T2	DRUG_EFFICACY 7 9	止痛
T3	SYMPTOM 12 16	气血凝滞
T4	SYMPTOM 17 21	小腹胀疼
T1	PERSON_GROUP 69 71	孕妇
T2	DRUG_EFFICACY 83 87	活血化瘀
T3	SYMPTOM 97 101	宿有血块
T4	SYMPTOM 105 109	漏下不止
T5	SYMPTOM 110 114	胎动不安
T6	SYMPTOM 116 120	血瘀经闭
T7	SYMPTOM 121 125	行经腹痛
T8	SYMPTOM 128 131	恶露不
T9	SYMPTOM 148 152	月。
T1	DRUG_EFFICACY 31 35	滋补气血
T2	DRUG_EFFICACY 36 40	调经舒郁
T3	SYMPTOM 43 47	月经不调
T4	SYMPTOM 48 52	经行腹痛
T5	SYMPTOM 53 57	崩漏下血
T6	SYMPTOM 58 62	赤白带下
T7	SYMPTOM 63 67	贫血衰弱
T8	SYMPTOM 68 72	血晕血脱
T9	SYMPTOM 73 77	产后诸虚
T10	SYMPTOM 78 83	骨蒸潮热
T11	DRUG_INGREDIENT 174 176	次半
T12	DRUG_EFFICACY 182 189	日2次，温开水
T13	DRUG_INGREDIENT 190 192	服。
T14	DRUG_INGREDIENT 193 195	方
T15	DRUG_INGREDIENT 196 198	人参
T16	DRUG_INGREDIENT 199 201	

T1	SYMPTOM 56 60	月经量少
T2	PERSON_GROUP 72 74	孕妇
T3	FOOD_GROUP 81 83	生冷
T4	SYMPTOM 95 99	月经量少
T5	SYMPTOM 100 104	色淡质稀
T6	SYMPTOM 107 111	头晕心悸
T7	SYMPTOM 112 116	疲乏无力
T8	DISEASE 127 130	高血压
T9	DISEASE_GROUP 131 134	心脏病
T10	DISEASE_GROUP 135 137	肾病
T11	SYMPTOM 179 182	经量少
T12	PERSON_GROUP 192 197	青春期少女
T13	PERSON_GROUP 198 203	更年期妇女
T14	SYMPTOM 224 228	阴道出血
T15	PERSON_GROUP 302 304	儿童
T16	PERSON_GROUP 381 383	孕妇
T17	SYNDROME 390 392	血瘀
T1	DRUG_EFFICACY 13 17	活血调经
T2	SYNDROME 20 24	气血两虚
T3	SYMPTOM 38 44	月经周期错后
T4	SYMPTOM 45 49	行经量少
T5	SYMPTOM 50 54	精神不振
T6	SYMPTOM 55 60	肢体乏力
T7	SYNDROME 75 79	气血两虚
T8	DRUG_EFFICACY 172 175	物（甲
T1	SYMPTOM 39 43	月经不调
T2	SYMPTOM 73 77	月经不调
T3	SYMPTOM 78 83	经期腹痛
T1	SYMPTOM 48 52	月经不调
T2	SYMPTOM 53 57	经期腹痛
T3	PERSON_GROUP 57 60	孕妇
T4	PERSON_GROUP 60 62	孕妇
T5	SYMPTOM 98 102	月经不调
T6	SYMPTOM 103 107	经期腹痛
T1	DRUG_EFFICACY 8 12	补气养血
T2	SYMPTOM 20 24	月经不调
T3	DRUG_EFFICACY 92 94	止血
T4	DRUG_INGREDIENT 429 431	数的
T5	DRUG_INGREDIENT 432 434	多。
T6	DRUG_INGREDIENT 435 438	红桃

T1	SYNDROME 8 10	血瘀
T2	SYMPTOM 13 17	月经不调
T3	SYMPTOM 20 24	经水量少
T4	PERSON_GROUP 60 62	孕妇
T5	DISEASE_GROUP 71 73	
T6	DRUG_EFFICACY 85 89	祛瘀生新
T7	SYMPTOM 92 96	月经量少
T8	SYMPTOM 100 104	经来腹痛
T1	DRUG_EFFICACY 0 4	祛瘀生新
T2	SYMPTOM 7 11	月经量少
T3	SYMPTOM 15 19	经来腹痛
T4	PERSON_GROUP 19 21	孕妇
T5	PERSON_GROUP 59 61	孕妇
T6	DISEASE_GROUP 64 66	
T7	SYNDROME 86 88	血瘀
T8	SYMPTOM 91 95	月经不调
T9	DISEASE 98 103	经水量少
T1	SYNDROME 32 36	气血两虚
T2	SYMPTOM 39 43	月经不调
T3	SYMPTOM 46 52	月经周期错后
T4	SYMPTOM 53 57	行经量少
T5	SYMPTOM 58 62	精神不振
T6	SYMPTOM 63 67	肢体乏力
T7	DRUG_EFFICACY 67 70	补气血
T8	DRUG_EFFICACY 71 74	调月经
T9	DRUG_EFFICACY 82 86	活血调经
T10	SYNDROME 89 93	气血两虚
T11	SYMPTOM 107 113	月经周期错后
T12	SYMPTOM 114 118	行经量少
T13	SYMPTOM 119 123	精神不振
T14	SYMPTOM 124 129	肢体乏力
T15	DISEASE 136 138	
T1	DRUG_EFFICACY 8 12	养血祛瘀
T2	SYMPTOM 19 23	恶露不行
T3	SYMPTOM 24 28	行而不畅
T4	SYMPTOM 29 33	夹有血块
T5	DRUG_EFFICACY 59 63	收缩子宫
T6	DRUG_EFFICACY 122 126	促进造血
T7	DRUG_EFFICACY 176 180	抑制醋酸
T8	SYNDROME 213 215	血瘀
T9	DRUG_EFFICACY 327 331	本品养
T10	SYN

T1	SYNDROME 61 63	可能
T2	SYNDROME 63 65	会发
T3	SYMPTOM 73 77	详情请咨
T4	DRUG_EFFICACY 117 121	妇禁用。
T5	SYNDROME 124 126	妇禁
T6	SYNDROME 126 128	用。
T7	SYMPTOM 141 143	～3
T8	SYMPTOM 146 150	理气养血
T9	SYMPTOM 151 154	暖宫调
T10	SYMPTOM 155 158	。用于
T11	SYMPTOM 159 163	虚气滞、
T12	SYMPTOM 164 172	焦虚寒所致的月经
T13	DRUG_INGREDIENT 178 180	症见
T14	DRUG_EFFICACY 182 186	后错、经
T15	DRUG_EFFICACY 187 189	少、
T16	DRUG_EFFICACY 203 205	痛喜
T17	DRUG_EFFICACY 214 220	现代药理研究
T18	SYMPTOM 256 260	.方中主
T19	SYMPTOM 261 263	艾叶
T20	SYMPTOM 264 268	有抑制纤
T21	SYMPTOM 269 271	、抗
T22	SYMPTOM 272 274	等作
T23	SYNDROME 278 280	香附
T24	SYMPTOM 291 298	子宫平滑肌，抑
T25	SYMPTOM 313 315	金黄
T26	SYMPTOM 316 320	葡萄球菌
T27	SYMPTOM 321 323	某些
T1	SYMPTOM 18 22	眩晕耳鸣
T2	SYMPTOM 23 29	烦躁失眠
T3	DRUG_EFFICACY 96 100	（201
T4	DRUG_EFFICACY 101 105	）滋
T5	SYMPTOM 116 120	期潮热汗
T6	SYMPTOM 121 125	，眩晕耳
T7	SYNDROME 147 151	一日3次
T8	DRUG_EFFICACY 168 178	3g1.改善心脑
T9	DRUG_EFFICACY 179 183	管血液循
T10	DRUG_EFFICACY 184 188	，调节心
T11	DRUG_EFFICACY 197 201	调节精神
T12	DRUG_EFFICACY 

T1	PERSON_GROUP 8 10	孕妇
T2	SYNDROME 17 19	血虚
T3	SYNDROME 19 21	气滞
T4	SYNDROME 22 26	下焦虚寒
T5	SYMPTOM 29 33	月经不调
T6	DRUG_EFFICACY 58 60	镇痛
T7	DRUG_INGREDIENT 69 71	缩，
T8	DRUG_EFFICACY 73 77	其紧张度
T9	DRUG_EFFICACY 78 80	功能
T10	DRUG_EFFICACY 94 96	溶、
T11	DRUG_EFFICACY 105 111	附能提高痛阈
T12	SYMPTOM 147 151	某些真菌
T13	SYMPTOM 152 154	长，
T14	SYMPTOM 155 159	具有雌激
T15	SYMPTOM 160 162	样作
T16	SYMPTOM 163 165	。4
T17	SYNDROME 169 171	主要
T18	SYMPTOM 182 189	痛经，宫寒不孕
T19	SYMPTOM 204 206	。此
T20	SYMPTOM 207 211	，本丸还
T21	SYMPTOM 212 214	降低
T22	SYNDROME 317 319	）,
T23	SYNDROME 319 321	国家
T24	SYMPTOM 334 336	理
T25	SYMPTOM 339 343	，暖宫调
T26	SYMPTOM 344 347	。用于
T27	SYMPTOM 348 351	虚气滞
T28	SYMPTOM 352 356	下焦虚寒
T29	SYMPTOM 357 365	致的月经不调、痛
T1	DRUG_EFFICACY 1 5	祛瘀生新
T2	SYMPTOM 8 12	月经量少
T3	SYMPTOM 16 20	经来腹痛
T4	SYNDROME 36 38	血瘀
T5	SYMPTOM 41 45	月经不调
T6	SYMPTOM 48 52	经水量少
T1	DRUG_DOSAGE 0 3	丸剂
T2	DRUG_DOSAGE 42 45	水蜜丸
T3	DRUG_EFFICACY 76 80	理气活血
T4	SYNDROME 86 90	气血两虚
T5	SYNDROME 91 93	气滞
T6	SYNDROME 93 95	血瘀
T7	SYMPT

T1	DRUG_EFFICACY 18 21	补气血
T2	DRUG_EFFICACY 22 25	调月经
T3	DISEASE 82 85	糖尿病
T4	FOOD_GROUP 95 97	辛辣
T5	FOOD_GROUP 98 100	生冷
T6	PERSON_GROUP 105 111	感冒发热病人
T7	DISEASE 119 122	高血压
T8	DISEASE_GROUP 123 126	心脏病
T9	DISEASE_GROUP 127 129	肝病
T10	DISEASE 130 133	糖尿病
T11	DISEASE_GROUP 134 136	肾病
T12	DISEASE_GROUP 137 140	慢性病
T13	PERSON_GROUP 155 160	青春期少女
T14	PERSON_GROUP 161 166	更年期妇女
T15	SYMPTOM 189 193	月经过少
T16	SYMPTOM 195 199	经期错后
T17	SYMPTOM 201 208	阴道不规则出血
T18	PERSON_GROUP 241 244	过敏者
T19	PERSON_GROUP 247 252	过敏体质者
T20	PERSON_GROUP 279 281	儿童
T21	DRUG_DOSAGE 298 301	小蜜丸
T22	DRUG_TASTE 304 306	香气
T23	DRUG_TASTE 310 312	微苦
T24	DRUG_EFFICACY 320 324	活血调经
T25	SYNDROME 327 331	气血两虚
T26	SYNDROME 333 335	血瘀
T27	SYMPTOM 338 342	月经不调
T28	SYMPTOM 345 351	月经周期错后
T29	SYMPTOM 352 356	行经量少
T30	SYMPTOM 357 361	精神不振
T31	SYMPTOM 362 366	肢体乏力
T32	SYNDROME 369 373	气血两虚
T1	DRUG_EFFICACY 14 18	调节心律
T2	DRUG_EFFICACY 19 23	降低血压
T3	DRUG_EFFICACY 32 36	安神养心
T4	DRUG_EFFICACY 37 41	改善睡眠
T5	DRUG_EFFICACY 44 49	调节内分泌
T

T1	SYNDROME 41 43	气滞
T2	SYNDROME 43 45	血瘀
T3	SYNDROME 45 49	气血两虚
T4	DRUG_EFFICACY 49 53	理气活血
T5	DRUG_EFFICACY 54 56	止痛
T6	DRUG_EFFICACY 56 60	益气养血
T7	SYNDROME 71 75	气血两虚
T8	SYNDROME 76 78	气滞
T9	SYNDROME 78 80	血瘀
T10	SYMPTOM 83 87	月经不调
T11	SYMPTOM 94 98	月经不调
T12	SYMPTOM 101 105	月经提前
T13	SYMPTOM 106 110	月经错后
T14	SYMPTOM 111 115	月经量多
T15	SYMPTOM 116 119	神疲乏
T16	DISEASE_GROUP 119 121	力、
T17	DRUG_DOSAGE 138 141	吉
T1	DRUG_EFFICACY 41 45	促进造血
T2	DRUG_EFFICACY 46 48	止血
T3	DRUG_EFFICACY 272 278	刺激后的分裂
T4	SYMPTOM 403 407	用。本品
T5	SYMPTOM 408 412	抑制巴豆
T6	SYMPTOM 413 421	所致小鼠耳廓肿胀
T7	SYMPTOM 422 426	抑制角叉
T8	SYMPTOM 427 431	胶所致的
T9	SYMPTOM 432 436	鼠足肿胀
T10	DRUG_INGREDIENT 480 482	血，
T11	DRUG_INGREDIENT 483 486	经止带
T12	DRUG_INGREDIENT 487 489	用于
T13	DISEASE 518 521	腰腿酸
T14	DISEASE_GROUP 522 525	，白带
T15	DRUG_INGREDIENT 741 743	接触
T16	DRUG_INGREDIENT 744 746	地方
T17	DRUG_INGREDIENT 747 750	12
T18	DRUG_INGREDIENT 754 756	服用
T19	DRUG_INGREDIENT 768 770	询医
T20	DRUG_INGREDIENT 771 774	或药师
T21	DRUG_INGREDIENT

T1	SYNDROME 75 79	血虚肝郁
T2	DRUG_EFFICACY 93 97	诸证
T3	DRUG_EFFICACY 98 102	片重0.
T4	SYNDROME 105 107	三
T5	SYNDROME 107 109	门峡
T6	SYMPTOM 111 115	生物制药
T7	SYMPTOM 116 118	限公
T8	SYMPTOM 133 137	养血
T9	SYMPTOM 138 141	肝，调
T10	SYMPTOM 142 148	止痛。用于血
T11	SYMPTOM 149 151	肝郁
T12	SYMPTOM 151 153	所致
T13	DRUG_INGREDIENT 240 242	3
T14	DRUG_INGREDIENT 243 245	个月
T15	DRUG_INGREDIENT 246 248	
T16	DRUG_INGREDIENT 290 292	，抑
T17	DRUG_INGREDIENT 293 295	变态
T18	DRUG_INGREDIENT 296 298	应性
T19	DRUG_EFFICACY 299 305	证，促进网织
T20	SYMPTOM 333 337	缩四物汤
T21	SYMPTOM 338 340	有促
T1	SYNDROME 40 42	血瘀
T2	SYMPTOM 45 49	月经不调
T3	SYMPTOM 52 56	经水量少
T4	DISEASE_GROUP 56 59	孕妇
T5	PERSON_GROUP 98 100	孕妇
T6	DRUG_EFFICACY 127 131	祛瘀生新
T7	SYMPTOM 134 138	月经量少
T1	SYMPTOM 23 27	月经不调
T2	SYMPTOM 30 36	月经周期错后
T3	SYMPTOM 37 42	行经量少
T4	DRUG_EFFICACY 57 61	益气养
T5	SYNDROME 64 68	血调经。
T6	SYMPTOM 82 88	经不调。症见
T7	SYMPTOM 89 93	经周期错
T8	SYMPTOM 94 98	、行经量
T9	SYMPTOM 99 103	、精神不
T1	PERSON_GROUP 15 17	孕妇
T2	DRUG_INGREDIENT 33 36	何首乌
T3	DRUG_EFFICAC

T1	DRUG_EFFICACY 14 18	收缩子宫
T2	DRUG_EFFICACY 77 81	促进造血
T3	DRUG_EFFICACY 131 135	抑制醋酸
T4	SYNDROME 168 170	血瘀
T5	DRUG_EFFICACY 272 276	本品养
T6	SYMPTOM 308 314	1、产后出
T7	DRUG_INGREDIENT 331 333	中含
T8	DRUG_INGREDIENT 337 340	不宜与
T9	DRUG_INGREDIENT 341 343	大戟
T10	DRUG_INGREDIENT 344 346	芫花
T11	SYMPTOM 377 387	血块，小腹冷痛产后出
T1	DRUG_DOSAGE 4 7	胶囊剂
T2	DRUG_TASTE 20 23	气微香
T3	DRUG_TASTE 24 27	味微甘
T4	FOOD_GROUP 48 50	生冷
T5	SYNDROME 81 85	气血亏虚
T6	SYMPTOM 88 90	痛经
T7	SYMPTOM 91 95	月经失调
T8	SYMPTOM 109 113	小腹隐痛
T9	SYMPTOM 118 120	痛经
T10	SYMPTOM 121 125	月经失调
T11	PERSON_GROUP 227 232	过敏体质者
T12	PERSON_GROUP 260 262	儿童
T13	DRUG_EFFICACY 311 315	止痛调经
T14	SYMPTOM 318 322	经期腹痛
T15	SYMPTOM 328 332	月经失调
T16	SYMPTOM 335 339	经期腹痛
T17	SYMPTOM 346 351	月经失调
T1	DRUG_EFFICACY 1 5	祛瘀生新
T2	SYMPTOM 8 12	月经量少
T3	SYMPTOM 16 20	经来腹痛
T4	DISEASE_GROUP 20 22	
T5	PERSON_GROUP 42 44	孕妇
T6	PERSON_GROUP 44 46	孕妇
T7	SYNDROME 99 101	血瘀
T8	SYMPTOM 104 108	月经不调
T9	SYMPTOM 111 116	经水量少
T10	DISEASE_GROUP 151 153	
T1	DRUG_EFFICACY 9 13	活血

T1	DRUG_EFFICACY 59 63	开郁顺气
T2	DRUG_EFFICACY 64 68	调经养血
T3	SYMPTOM 71 75	月经错后
T4	SYMPTOM 81 85	小腹冷痛
T5	PERSON_GROUP 85 87	孕妇
T1	DRUG_DOSAGE 0 3	丸剂
T2	DRUG_EFFICACY 13 17	收缩子宫
T3	DRUG_EFFICACY 76 80	促进造血
T4	DRUG_EFFICACY 130 134	抑制醋酸
T5	SYNDROME 167 169	血瘀
T6	DRUG_EFFICACY 250 254	抑制醋酸
T7	SYNDROME 287 289	血瘀
T8	SYMPTOM 385 389	后受寒恶
T9	SYMPTOM 390 394	不行或行
T10	SYMPTOM 395 399	不畅，夹
T11	DRUG_EFFICACY 449 453	本品养
T12	SYNDROME 454 456	祛瘀
T1	PERSON_GROUP 8 10	孕妇
T2	PERSON_GROUP 10 12	孕妇
T3	DISEASE_GROUP 48 50	
T4	DRUG_EFFICACY 75 79	祛瘀生新
T5	SYMPTOM 82 86	月经量少
T6	SYMPTOM 90 94	经来腹痛
T7	SYNDROME 148 150	血瘀
T8	SYMPTOM 160 164	经水量少
T1	SYMPTOM 21 30	月经不调行经腹痛
T2	DRUG_INGREDIENT 56 58	白术
T3	DRUG_EFFICACY 64 71	鹿角霜壮阳益精
T4	DRUG_INGREDIENT 72 74	当归
T5	DRUG_INGREDIENT 75 77	熟地
T6	DRUG_INGREDIENT 78 80	白芍
T7	DRUG_INGREDIENT 81 83	阿胶
T8	DRUG_INGREDIENT 83 85	补血
T9	DRUG_INGREDIENT 86 88	枸杞
T10	DRUG_EFFICACY 88 92	滋阴补肾
T11	DRUG_EFFICACY 111 115	、三七等
T12	DRUG_EFFICACY 116 120	血行气止
T13	DRUG_EFFICACY 207 210	发生

T1	DRUG_DOSAGE 4 7	薄膜衣
T2	DRUG_TASTE 19 22	气微香
T3	DRUG_TASTE 23 26	味微苦
T4	SYNDROME 52 56	湿热下注
T5	SYMPTOM 57 61	白带过多
T6	DISEASE 94 97	盆腔炎
T7	PERSON_GROUP 97 99	
T8	PERSON_GROUP 99 101	孕妇
T9	PERSON_GROUP 186 188	老人
T10	PERSON_GROUP 189 191	少女
T11	PERSON_GROUP 225 230	过敏体质者
T12	PERSON_GROUP 258 260	儿童
T1	SYMPTOM 85 89	经期腹痛
T2	DRUG_EFFICACY 114 118	止痛调经
T3	SYMPTOM 121 125	经期腹痛
T1	DRUG_DOSAGE 11 13	丸剂
T2	DRUG_DOSAGE 14 17	水蜜丸
T3	PERSON_GROUP 42 48	感冒发热病人
T4	DISEASE 56 59	高血压
T5	DISEASE_GROUP 60 63	心脏病
T6	DISEASE_GROUP 64 66	肝病
T7	DISEASE 67 70	糖尿病
T8	DISEASE_GROUP 71 73	肾病
T9	DISEASE_GROUP 74 77	慢性病
T10	PERSON_GROUP 97 102	青春期少女
T11	PERSON_GROUP 103 108	更年期妇女
T12	SYMPTOM 131 135	月经过少
T13	SYMPTOM 137 141	经期错后
T14	SYMPTOM 143 150	阴道不规则出血
T15	SYMPTOM 160 164	月经量多
T16	PERSON_GROUP 214 219	过敏体质者
T17	PERSON_GROUP 247 249	儿童
T18	DRUG_DOSAGE 325 328	水蜜丸
T19	DRUG_EFFICACY 366 370	气养血,
T20	SYNDROME 381 385	血两虚、
T21	SYMPTOM 388 392	瘀所效的
T22	SYMPTOM 395 399	调，症见
T23	SYMPTOM 400 404	经提前、
T24	SYMPTOM 405

T1	SYNDROME 68 72	湿热下注
T2	SYMPTOM 73 77	赤白带下
T1	PERSON_GROUP 0 2	孕妇
T2	SYNDROME 52 54	血瘀
T3	SYMPTOM 57 61	月经不调
T4	DRUG_EFFICACY 99 103	祛瘀生新
T5	SYMPTOM 106 110	月经量少
T6	SYMPTOM 114 119	经来腹痛
T1	SYMPTOM 33 37	月经量少
T2	SYMPTOM 41 45	经来腹痛
T3	DRUG_EFFICACY 62 66	活血调经
T4	SYNDROME 69 71	血瘀
T5	SYMPTOM 74 78	月经不调
T1	DRUG_EFFICACY 53 57	活血调经
T2	SYNDROME 60 64	气血两虚
T3	SYMPTOM 78 84	月经周期错后
T4	SYMPTOM 85 89	行经量少
T5	SYMPTOM 90 94	精神不振
T6	SYMPTOM 95 100	肢体乏力
T7	DRUG_EFFICACY 128 131	师或药
T8	DRUG_EFFICACY 132 135	。
T9	SYNDROME 140 144	月经。
T10	SYMPTOM 147 151	气血两虚
T11	SYMPTOM 154 160	月经不调，症
T12	SYMPTOM 161 165	月经周期
T13	SYMPTOM 166 170	后、行经
T14	SYMPTOM 171 175	少、精神
T1	PERSON_GROUP 0 2	孕妇
T2	DRUG_EFFICACY 7 11	补气养血
T3	SYMPTOM 19 23	月经不调
T4	SYMPTOM 24 28	经期腹痛
T5	DRUG_EFFICACY 85 89	促进造血
T6	DRUG_EFFICACY 90 92	止血
T7	SYNDROME 385 389	所致的大
T8	SYMPTOM 390 394	足肿胀及
T9	SYMPTOM 395 399	鼠棉球肉
T10	SYMPTOM 400 404	肿耳廓肿
T11	DRUG_INGREDIENT 519 521	情况
T12	DRUG_INGREDIENT 522 524	急可
T13	DRUG_INGREDIENT 525 528	停止使
T14	DRUG

T1	DRUG_EFFICACY 21 23	镇痛
T2	SYMPTOM 28 33	平滑肌收缩
T3	DRUG_INGREDIENT 50 52	艾叶
T4	DRUG_EFFICACY 54 58	抑制纤溶
T5	DRUG_EFFICACY 59 61	抗炎
T6	DRUG_EFFICACY 75 77	镇痛
T7	DRUG_EFFICACY 86 92	抑制子宫收缩
T8	SYMPTOM 128 132	.故临床
T9	SYMPTOM 133 135	要用
T10	SYMPTOM 136 140	治疗妇女
T11	SYMPTOM 141 143	经不
T12	SYMPTOM 144 146	，痛
T13	SYNDROME 150 152	不孕
T14	SYMPTOM 163 170	寒证型者。此外
T15	SYMPTOM 185 187	乙酰
T16	SYMPTOM 188 192	碱的作用
T17	SYMPTOM 193 195	临床
T18	DRUG_EFFICACY 212 216	定的疗效
T19	SYNDROME 219 221	理气
T20	SYNDROME 221 223	养血
T21	SYMPTOM 236 238	下焦
T22	SYMPTOM 241 245	致的月经
T23	SYMPTOM 246 249	调、痛
T24	SYMPTOM 250 253	，症见
T25	SYMPTOM 254 258	经后错、
T26	SYMPTOM 259 267	量少、有血块、小
T27	SYNDROME 269 271	痛、
T28	SYNDROME 271 273	经行
T29	SYMPTOM 286 288	后错
T30	SYMPTOM 291 295	经不调下
T31	SYMPTOM 296 299	虚寒血
T32	SYMPTOM 300 303	气滞理
T33	SYMPTOM 304 308	养血，暖
T34	SYMPTOM 309 317	调经。用于血虚气
T35	DRUG_EFFICACY 327 329	经不
T36	DRUG_EFFICACY 338 344	后错、经量少
T37	SYMPTOM 380 384	作用。3
T38	SYMPTOM 385 387	香附
T39	SYMPTOM 388 392	提高痛阈
T40	SYMPTOM

T1	DRUG_EFFICACY 55 57	祛瘀
T2	SYMPTOM 65 69	恶露不行
T3	SYMPTOM 72 76	小腹冷痛
T4	SYMPTOM 82 86	形寒肢冷
T5	DRUG_EFFICACY 126 128	祛瘀
T6	DRUG_EFFICACY 129 131	止痛
T7	SYMPTOM 136 140	恶露不行
T8	SYMPTOM 143 147	小腹冷痛
T9	SYMPTOM 153 157	形寒肢冷
T10	PERSON_GROUP 157 159	儿童
T11	PERSON_GROUP 159 161	孕妇
T12	SYMPTOM 170 174	恶露不行
T13	SYMPTOM 192 196	阴道流血
T14	SYMPTOM 197 201	月经过多
T15	SYMPTOM 201 204	热
T16	DRUG_EFFICACY 465 469	纤维蛋白
T17	DRUG_EFFICACY 489 492	解聚，
T18	DRUG_EFFICACY 676 678	膜结
T19	PERSON_GROUP 745 747	化颗
T20	PERSON_GROUP 747 749	粒对
T21	PERSON_GROUP 773 775	萄球
T22	DRUG_EFFICACY 775 779	菌均有很
T23	SYMPTOM 780 784	的抑菌作
T1	DRUG_EFFICACY 1 5	祛瘀生新
T2	SYMPTOM 8 12	月经量少
T3	SYNDROME 35 37	血瘀
T4	SYMPTOM 40 44	月经不调
T5	SYMPTOM 47 51	经水量少
T6	PERSON_GROUP 78 80	孕妇
T7	PERSON_GROUP 105 107	孕妇
T8	DISEASE_GROUP 128 130	
T1	DRUG_EFFICACY 3 7	养血祛瘀
T2	SYNDROME 8 11	血热证
T3	DRUG_EFFICACY 19 23	收缩子宫
T4	DRUG_EFFICACY 81 85	、促进造
T5	DRUG_EFFICACY 135 139	，抑制醋
T6	SYNDROME 172 174	“血
T7	SYMPTOM 276 280	露不行或
T8	SYMPTOM 281 285	而不畅，
T1	

T1	DRUG_EFFICACY 41 45	活血调经
T2	SYNDROME 48 52	气血两虚
T3	SYMPTOM 66 72	月经周期错后
T4	SYMPTOM 73 77	行经量少
T5	SYMPTOM 78 82	精神不振
T6	SYMPTOM 83 87	肢体乏力
T7	DRUG_EFFICACY 95 98	补气血
T8	DRUG_EFFICACY 99 102	调月经
T9	SYNDROME 172 176	气血两虚
T10	SYMPTOM 179 183	月经不调
T11	SYMPTOM 186 192	月经周期错后
T12	SYMPTOM 193 197	行经量少
T13	SYMPTOM 198 202	精神不振
T14	SYMPTOM 203 207	肢体乏力
T1	DRUG_EFFICACY 14 17	补气血
T2	DRUG_EFFICACY 18 21	调月经
T3	DRUG_EFFICACY 52 56	益气养血
T4	DRUG_EFFICACY 57 61	活血调经
T5	SYNDROME 64 68	气血两虚
T6	SYMPTOM 82 88	月经周期错后
T7	SYMPTOM 89 93	行经量少
T8	SYMPTOM 94 98	精神不振
T9	SYMPTOM 99 103	肢体乏力
T10	SYNDROME 134 138	药物同时
T11	SYMPTOM 141 145	能会发生
T12	SYMPTOM 148 154	互作用，详情
T13	SYMPTOM 155 159	咨询医师
T14	SYMPTOM 160 164	药师。
T15	SYMPTOM 165 170	用于气血两
T1	SYMPTOM 33 37	月经量少
T2	SYMPTOM 41 46	经来腹痛
T3	SYNDROME 67 69	血瘀
T4	SYMPTOM 81 85	月经不调
T5	DISEASE_GROUP 115 117	基本
T1	DRUG_EFFICACY 3 7	养血祛瘀
T2	SYNDROME 15 18	血热证
T3	SYMPTOM 63 67	行而不畅
T4	SYMPTOM 68 72	夹有血块
T5	DRUG_EFFICACY 133 137	幅度和频
T6	DRUG_EFFICACY 148 152	产妇产后
T7	DRUG_

T1	SYNDROME 34 36	血瘀
T2	SYMPTOM 39 43	月经不调
T3	SYMPTOM 46 50	经水量少
T4	PERSON_GROUP 50 52	孕妇
T5	DISEASE_GROUP 80 82	
T6	DRUG_EFFICACY 94 98	祛瘀生新
T7	SYMPTOM 101 105	月经量少
T8	SYMPTOM 109 113	经来腹痛
T1	DRUG_EFFICACY 6 10	活血调经
T2	SYNDROME 13 17	气血两虚
T3	SYMPTOM 31 37	月经周期错后
T4	SYMPTOM 38 42	行经量少
T5	SYMPTOM 43 47	精神不振
T6	SYMPTOM 57 61	月经不调
T7	SYNDROME 61 67	血瘀气血两虚
T8	DISEASE_GROUP 112 114	师或
T9	SYNDROME 145 149	尚不明确
T10	SYMPTOM 152 156	吉林省正
T11	SYMPTOM 159 165	业有限公司
T12	SYMPTOM 166 170	口服。一
T13	SYMPTOM 171 175	6克，一
T14	SYMPTOM 176 180	2次。
T15	SYMPTOM 180 182	用
T16	DRUG_EFFICACY 182 185	于气血
T17	DRUG_EFFICACY 186 189	虚所致
T1	DRUG_EFFICACY 43 45	止痛
T2	SYMPTOM 48 52	月经不调
T3	SYMPTOM 53 57	经期腹痛
T4	PERSON_GROUP 57 59	孕妇
T5	SYMPTOM 76 80	月经不调
T6	SYMPTOM 81 85	经期腹痛
T7	PERSON_GROUP 85 87	
T8	PERSON_GROUP 87 89	孕妇
T1	PERSON_GROUP 59 61	孕妇
T2	PERSON_GROUP 61 63	孕妇
T3	PERSON_GROUP 76 78	孕妇
T4	SYMPTOM 97 101	月经量少
T5	DISEASE_GROUP 116 118	
T6	SYNDROME 138 140	血瘀
T7	SYMPTOM 143 147	月经不调
T8	SYMPTOM 150 154	经水量少
T1	

T1	PERSON_GROUP 29 31	孕妇
T2	DISEASE_GROUP 34 36	
T3	SYMPTOM 81 85	月经量少
T4	SYMPTOM 89 93	经来腹痛
T5	SYNDROME 128 130	血瘀
T6	SYMPTOM 140 144	经水量少
T1	DRUG_EFFICACY 17 20	补气血
T2	DRUG_EFFICACY 21 24	调月经
T3	SYMPTOM 27 31	头晕心慌
T4	SYMPTOM 32 36	疲乏无力
T5	SYMPTOM 37 41	月经量少
T6	SYMPTOM 45 51	经期后错头晕
T7	DRUG_EFFICACY 54 57	补气血
T8	DRUG_EFFICACY 58 61	调月经
T9	SYMPTOM 64 68	月经不调
T1	DRUG_EFFICACY 3 7	养血祛瘀
T2	SYNDROME 15 17	血热
T3	DRUG_EFFICACY 40 44	收缩子宫
T4	DRUG_EFFICACY 103 107	促进造血
T5	DRUG_EFFICACY 157 161	抑制醋酸
T6	SYNDROME 194 196	血瘀
T7	SYMPTOM 324 328	不行或行
T8	SYMPTOM 329 333	不畅，夹
T1	FOOD_GROUP 26 28	辛辣
T2	FOOD_GROUP 29 31	生冷
T3	PERSON_GROUP 36 43	感冒发热病人
T4	DISEASE 52 55	高血压
T5	DISEASE_GROUP 56 59	心脏病
T6	DISEASE_GROUP 60 62	肝病
T7	DISEASE_GROUP 67 69	肾病
T8	DISEASE_GROUP 70 73	慢性病
T9	PERSON_GROUP 94 99	青春期少女
T10	PERSON_GROUP 100 105	更年期妇女
T11	SYMPTOM 129 133	月经过少
T12	SYMPTOM 135 139	经期错后
T13	SYMPTOM 141 148	阴道不规则出血
T14	SYMPTOM 158 162	月经量多
T15	PERSON_GROUP 214 219	过敏体质者
T16	PERSON_GROUP 249 251	儿童
T17	DRUG_DO

T1	SYNDROME 17 21	气血两虚
T2	SYMPTOM 35 41	月经周期错后
T3	SYMPTOM 42 46	行经量少
T4	SYMPTOM 47 51	精神不振
T5	SYMPTOM 52 56	肢体乏力
T6	SYMPTOM 56 61	行经量少
T7	SYMPTOM 120 124	用于
T8	SYMPTOM 127 133	虚所致的月经
T9	DRUG_EFFICACY 163 166	明确。
T10	DRUG_EFFICACY 167 170	每丸
T1	DRUG_EFFICACY 8 12	活血化瘀
T2	SYMPTOM 22 26	宿有血块
T3	SYMPTOM 30 34	漏下不止
T4	SYMPTOM 35 39	胎动不安
T5	SYMPTOM 41 45	血瘀经闭
T6	SYMPTOM 46 50	行经腹痛
T7	SYMPTOM 113 117	。一次6
T8	SYMPTOM 118 122	，一日1
T1	DRUG_EFFICACY 22 26	理气止痛
T2	SYMPTOM 46 48	痛经
T3	SYMPTOM 49 53	小腹胀痛
T4	SYMPTOM 54 59	腰腿酸痛痛
T5	FOOD_GROUP 68 70	辛辣
T6	FOOD_GROUP 71 73	生冷
T7	PERSON_GROUP 79 85	感冒发热病人
T8	DISEASE 94 97	高血压
T9	DISEASE_GROUP 98 101	心脏病
T10	DISEASE_GROUP 102 104	肝病
T11	DISEASE_GROUP 109 111	肾病
T12	DISEASE_GROUP 112 115	慢性病
T13	PERSON_GROUP 136 141	青春期少女
T14	PERSON_GROUP 142 147	更年期妇女
T15	SYMPTOM 171 175	月经过少
T16	SYMPTOM 177 181	经期错后
T17	SYMPTOM 183 190	阴道不规则出血
T18	SYMPTOM 201 205	月经量多
T19	PERSON_GROUP 257 264	过敏体质过敏者
T20	PERSON_GROUP 267 272	过敏体质者
T21	PERSON_GROUP 302 304	儿童
T22	DRUG_DOS

In [137]:
#“实体类别”、“起始位置”、“结束位置”以空格分隔

In [138]:
for i in range(1000,1500):
    with open('data/submit/%d.ann'%i,'w', encoding='utf-8') as wr:
        wr.write('\n'.join(result[i]))

In [129]:
''.join(result[1001])

'T1\tDISEASE 36 39\t糖尿病\nT2\tSYMPTOM 87 91\t月经量少\nT3\tSYMPTOM 95 101\t血虚萎黄后错\nT4\tSYMPTOM 102 106\t血虚萎黄\nT5\tSYMPTOM 107 111\t风湿痹痛\nT6\tSYMPTOM 112 116\t肢体麻木\nT7\tDISEASE 116 119\t糖尿病\n'

In [116]:
#for i in range(1000,1500):
#    pd.DataFrame(result[i]).to_csv('data/submit/%d.ann'%i,
#                                      sep='\t',
#                                      header = None,
#                                      index = 0,
#                                      encoding = 'utf-8')