# CRF+LSTM

keras 2.2.4

tensorflow 1.13

pip install git+https://www.github.com/keras-team/keras-contrib.git

In [52]:
import re
import os

In [53]:
char_vocab_path = "CRF/data/char_vocabs.txt" # 字典文件
#train_data_path = 'data/train_data/train_data_000' # 训练数据
#train_data_path = './data/train_data' # 训练数据
#test_data_path = 'data/train_data/train_data_000' # 测试数据

special_words = ['<PAD>', '<UNK>'] # 特殊词表示

# "BIO"标记的标签
#label2idx = {"O": 0,
#             "B-PER": 1, "I-PER": 2,
#             "B-LOC": 3, "I-LOC": 4,
#             "B-ORG": 5, "I-ORG": 6
#            }
label2idx = {'O': 0,
             'B-DISEASE': 1, 'B-DISEASE_GROUP': 2,
             'B-DRUG_DOSAGE': 3, 'B-DRUG_EFFICACY': 4,
             'B-DRUG_INGREDIENT': 5, 'B-DRUG_TASTE': 6,
             'B-FOOD_GROUP':7, 'B-PERSON_GROUP':8,
             'B-SYMPTOM':9, 'B-SYNDROME':10,
             'I-DISEASE': 11, 'I-DISEASE_GROUP': 12,
             'I-DRUG_DOSAGE': 13, 'I-DRUG_EFFICACY': 14,
             'I-DRUG_INGREDIENT': 15, 'I-DRUG_TASTE': 16,
             'I-FOOD_GROUP':17, 'I-PERSON_GROUP':18,
             'I-SYMPTOM':19, 'I-SYNDROME':20
            }

# 索引和BIO标签对应
idx2label = {idx: label for label, idx in label2idx.items()}

# 读取字符词典文件
with open(char_vocab_path, "r", encoding="utf8") as fo:
    char_vocabs = [line.strip() for line in fo]
char_vocabs = special_words + char_vocabs

# 字符和索引编号对应
idx2vocab = {idx: char for idx, char in enumerate(char_vocabs)}
vocab2idx = {char: idx for idx, char in idx2vocab.items()}

In [54]:
# 读取训练语料
def read_corpus(corpus_path, vocab2idx, label2idx):
    with open(corpus_path, encoding='utf-8') as fr:
        lines = fr.readlines()

    sent_, tag_ = [], []
    for letter in lines:
        [char,label,_] = re.split('\t|\n',letter)
        sent_.append(char)
        tag_.append(label)

    sent_ids = [vocab2idx[char] if char in vocab2idx else vocab2idx['<UNK>'] for char in sent_]
    tag_ids = [label2idx[label] if label in label2idx else 0 for label in tag_]
    return sent_ids, tag_ids

# 加载训练集
#train_datas, train_labels = read_corpus(train_data_path, vocab2idx, label2idx)
# 加载测试集
#test_datas, test_labels = read_corpus(test_data_path, vocab2idx, label2idx)


In [55]:
train_datas = []
train_labels = []
files = os.listdir('data/train_data')
for file in files:
    train_data_path_i = 'data/train_data/'+file
    train_datas_i, train_labels_i = read_corpus(train_data_path_i, vocab2idx, label2idx)
    train_datas.append(train_datas_i)
    train_labels.append(train_labels_i)
    #if i%10==0:
    #    print(i)

In [56]:
valid_datas = []
valid_labels = []
files = os.listdir('data/valid_data')
for file in files:
    valid_data_path_i = 'data/valid_data/'+file
    valid_datas_i, valid_labels_i = read_corpus(valid_data_path_i, vocab2idx, label2idx)
    valid_datas.append(valid_datas_i)
    valid_labels.append(valid_labels_i)

In [57]:
print(train_datas[50])
print([idx2vocab[idx] for idx in train_datas[50]])
print(train_labels[50])
print([idx2label[idx] for idx in train_labels[50]])

[1, 61, 77, 1, 1, 17, 181, 3093, 3817, 2654, 6214, 1959, 2177, 286, 6802, 5965, 519, 1408, 2644, 2102, 2732, 1842, 889, 2545, 3093, 3817]
['<UNK>', 'b', 'r', '<UNK>', '<UNK>', '3', '、', '治', '疗', '期', '间', '忌', '房', '事', '，', '配', '偶', '如', '有', '感', '染', '应', '同', '时', '治', '疗']
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


In [58]:
import numpy as np
import keras
from keras.models import Sequential
from keras.models import Model
from keras.layers import Masking, Embedding, Bidirectional, LSTM, Dense, Input, TimeDistributed, Activation
from keras.preprocessing import sequence
from keras_contrib.layers import CRF
from keras_contrib.losses import crf_loss
from keras_contrib.metrics import crf_viterbi_accuracy
from keras import backend as K
K.clear_session()

EPOCHS = 50
BATCH_SIZE = 128
EMBED_DIM = 48
HIDDEN_SIZE = 16
MAX_LEN = 50
VOCAB_SIZE = len(vocab2idx)
CLASS_NUMS = len(label2idx)
print(VOCAB_SIZE, CLASS_NUMS)

print('padding sequences')
train_datas = sequence.pad_sequences(train_datas, maxlen=MAX_LEN)
train_labels = sequence.pad_sequences(train_labels, maxlen=MAX_LEN)
valid_datas = sequence.pad_sequences(valid_datas, maxlen=MAX_LEN)
valid_labels = sequence.pad_sequences(valid_labels, maxlen=MAX_LEN)
print('x_train shape:', train_datas.shape)
print('x_test shape:', valid_datas.shape)

train_labels = keras.utils.to_categorical(train_labels, CLASS_NUMS)
valid_labels = keras.utils.to_categorical(valid_labels, CLASS_NUMS)
print('trainlabels shape:', train_labels.shape)
print('testlabels shape:', valid_labels.shape)

## BiLSTM+CRF模型构建
inputs = Input(shape=(MAX_LEN,), dtype='int32')
x = Masking(mask_value=0)(inputs)
x = Embedding(VOCAB_SIZE, EMBED_DIM, mask_zero=True)(x)
x = Bidirectional(LSTM(HIDDEN_SIZE, return_sequences=True))(x)
x = TimeDistributed(Dense(CLASS_NUMS))(x)
outputs = CRF(CLASS_NUMS)(x)
model = Model(inputs=inputs, outputs=outputs)
model.summary()

model.compile(loss=crf_loss, optimizer='adam', metrics=[crf_viterbi_accuracy])
model.fit(train_datas, train_labels, epochs=EPOCHS, verbose=1, validation_split=0.1)

score = model.evaluate(valid_datas, valid_labels, batch_size=BATCH_SIZE)
print(model.metrics_names)
print(score)

6874 21
padding sequences
x_train shape: (6899, 50)
x_test shape: (1987, 50)
trainlabels shape: (6899, 50, 21)
testlabels shape: (1987, 50, 21)
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         (None, 50)                0         
_________________________________________________________________
masking_1 (Masking)          (None, 50)                0         
_________________________________________________________________
embedding_1 (Embedding)      (None, 50, 48)            329952    
_________________________________________________________________
bidirectional_1 (Bidirection (None, 50, 32)            8320      
_________________________________________________________________
time_distributed_1 (TimeDist (None, 50, 21)            693       
_________________________________________________________________
crf_1 (CRF)                  (None, 50, 21)            945      

Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
['loss', 'crf_viterbi_accuracy']
[2.821839642392731, 0.8834322501680751]


In [59]:
# save model
model.save("model/ch_ner_model.h5")

In [60]:
def get_valid_nertag(input_data, result_tags):
    result_words = []
    start, end =0, 1 # 实体开始结束位置标识
    tag_label = "O" # 实体类型标识
    for i, tag in enumerate(result_tags):
        if tag.startswith("B"):
            if tag_label != "O": # 当前实体tag之前有其他实体
                result_words.append((start,end,input_data[start: end], tag_label)) # 获取实体
            tag_label = tag.split("-")[1] # 获取当前实体类型
            start, end = i, i+1 # 开始和结束位置变更
        elif tag.startswith("I"):
            temp_label = tag.split("-")[1]
            if temp_label == tag_label: # 当前实体tag是之前实体的一部分
                end += 1 # 结束位置end扩展
        elif tag == "O":
            if tag_label != "O": # 当前位置非实体 但是之前有实体
                result_words.append((start,end,input_data[start: end], tag_label)) # 获取实体
                tag_label = "O"  # 实体类型置"O"
            start, end = i, i+1 # 开始和结束位置变更
    if tag_label != "O": # 最后结尾还有实体
        result_words.append((start,end,input_data[start: end], tag_label)) # 获取结尾的实体
    return result_words

In [61]:
maxlen = 50
result = {}
test_data_path = 'data/chusai_xuanshou/'
for i in range(500):
    test_file = test_data_path+str(i+1000)+'.txt'
    with open(test_file, "r", encoding="utf8") as test:
        sentence = test.read()
    sentences = sentence.split('。')
    y_ner = []

    for sent in sentences:
        sent = sent.replace(' ','_')
        sent_chars = list(sent+'。')
        sent2id = [vocab2idx[word] if word in vocab2idx else vocab2idx['<UNK>'] for word in sent_chars]

        sent2id_new = np.array([[0] * (maxlen-len(sent2id)) + sent2id[:maxlen]])
        y_pred = model.predict(sent2id_new)
        y_label = np.argmax(y_pred, axis=2)
        y_label = y_label.reshape(1, -1)[0]
        y_ner_ = [idx2label[i] for i in y_label][-len(sent_chars):]
        y_ner.extend(y_ner_)
    result_words = get_valid_nertag(sentence, y_ner)
    result[i+1000] = result_words
    for res in result_words:
        start = res[0]
        end = res[1]
        word = res[2]
        tag = res[3]
        print(i+1000, start, end, "".join(word), tag)

1000 138 142 清热解毒 DRUG_EFFICACY
1000 143 147 化湿除带 DRUG_EFFICACY
1000 148 152 祛瘀止痛 DRUG_EFFICACY
1000 160 165 慢性盆腔炎 DISEASE
1001 36 39 糖尿病 DISEASE
1001 87 91 月经量少 SYMPTOM
1001 95 101 血虚萎黄后错 SYMPTOM
1001 102 106 血虚萎黄 SYMPTOM
1001 107 111 风湿痹痛 SYMPTOM
1001 112 116 肢体麻木 SYMPTOM
1001 116 119 糖尿病 DISEASE
1002 36 42 感冒发热病人 PERSON_GROUP
1002 51 54 高血压 DISEASE
1002 55 58 心脏病 DISEASE_GROUP
1002 59 61 肝病 DISEASE_GROUP
1002 66 68 肾病 DISEASE_GROUP
1002 90 94 月经紊乱 SYMPTOM
1002 109 111 眩晕 SYMPTOM
1002 152 155 过敏者 PERSON_GROUP
1002 158 163 过敏体质者 PERSON_GROUP
1002 192 194 儿童 PERSON_GROUP
1002 242 244 颗粒 DRUG_DOSAGE
1002 245 248 气微香 DRUG_TASTE
1002 249 252 味微苦 DRUG_TASTE
1002 282 286 烘热汗出 SYMPTOM
1002 287 291 头晕耳鸣 SYMPTOM
1002 297 301 五心烦热 SYMPTOM
1002 302 306 腰背酸痛 SYMPTOM
1002 307 311 大便干燥 SYMPTOM
1002 312 315 心烦易 SYMPTOM
1002 387 389 2g SYNDROME
1002 389 391 *1 SYNDROME
1003 55 59 子宫肌瘤 DISEASE
1003 59 63 气滞血瘀 SYNDROME
1003 66 70 经期延长 SYMPTOM
1003 71 75 经量过多 SYMPTOM
1003 76 82 经色紫黯有块 SYMPTOM
1003 83 90

1029 0 2 孕妇 PERSON_GROUP
1029 19 23 肝郁气滞 SYNDROME
1029 31 35 乳腺增生 DISEASE
1030 0 4 补气养血 DRUG_EFFICACY
1030 12 16 气血两虚 SYNDROME
1030 17 21 身体瘦弱 SYMPTOM
1030 22 26 腰膝酸软 SYMPTOM
1030 27 31 月经不调 SYMPTOM
1030 32 35 带下  SYMPTOM
1030 45 48 水蜜丸 DRUG_DOSAGE
1030 49 51 味甜 DRUG_TASTE
1030 52 54 微苦 DRUG_TASTE
1030 55 59   丸剂 DRUG_DOSAGE
1030 60 63 水蜜丸 DRUG_DOSAGE
1030 99 101 止血 DRUG_EFFICACY
1030 432 434 多。 FOOD_GROUP
1030 435 437  尚 FOOD_GROUP
1030 461 463 适量 DRUG_INGREDIENT
1030 464 467 水溶后 DRUG_INGREDIENT
1030 468 470 。  DRUG_INGREDIENT
1030 477 479 业有 DISEASE
1030 489 493 /瓶。  SYMPTOM
1030 528 532 芦、五灵 SYMPTOM
1030 534 538 皂荚或其 SYMPTOM
1030 540 547 。3、感冒时不 SYMPTOM
1030 606 611 阴道不规则 PERSON_GROUP
1030 639 641 咨询 PERSON_GROUP
1030 685 689 状发生改 DRUG_EFFICACY
1030 697 701 0、请将 SYMPTOM
1030 702 706 品放在儿 SYMPTOM
1030 738 740 或药 DRUG_INGREDIENT
1030 741 743 。  DRUG_INGREDIENT
1030 744 747 孕妇禁 DRUG_INGREDIENT
1030 751 753 补气 DRUG_INGREDIENT
1030 764 766 经不 DRUG_INGREDIENT
1030 767 770 、经期 DRUG_INGREDI

1050 45 47 妇女 PERSON_GROUP
1050 47 51 月经量少 SYMPTOM
1050 80 82 颗粒 DRUG_DOSAGE
1050 83 85 味苦 DRUG_TASTE
1050 86 87 涩 DRUG_TASTE
1050 88 90 微酸 DRUG_TASTE
1051 65 70 赤白带下  SYMPTOM
1051 70 74 湿热下注 SYNDROME
1052 15 19 女性患者 PERSON_GROUP
1052 64 66 气香 DRUG_TASTE
1052 67 69 味苦 DRUG_TASTE
1052 70 72 微辛 DRUG_TASTE
1052 155 159 疏肝解郁 DRUG_EFFICACY
1052 160 164 理气止痛 DRUG_EFFICACY
1052 165 169 活血破瘀 DRUG_EFFICACY
1052 175 179 软坚散结 DRUG_EFFICACY
1052 180 184 补气健脾 DRUG_EFFICACY
1052 187 192 乳腺增生  DISEASE
1052 222 226 食欲减退 SYMPTOM
1053 91 96 慢性宫颈炎 DISEASE_GROUP
1053 97 101 宫颈糜烂 SYMPTOM
1053 102 106 阴道炎  DISEASE
1054 21 25   怀化 DRUG_INGREDIENT
1054 79 81 头昏 SYMPTOM
1054 194 198 缩短小鼠 DRUG_EFFICACY
1054 227 231 菌、大肠 SYMPTOM
1054 235 239 型链球菌 DRUG_DOSAGE
1055 26 28 妇女 PERSON_GROUP
1055 28 32 血虚气滞 SYNDROME
1055 33 37 月经不调 SYMPTOM
1055 41 45 经后腹痛 SYMPTOM
1055 45 47 腰痛 SYMPTOM
1055 103 106 味微苦 DRUG_TASTE
1055 136 138    DRUG_DOSAGE
1056 85 89 活血止痛 DRUG_EFFICACY
1056 121 124 软硬下 SYMPTOM
1057 47 49 栓剂 DRUG_DOSAGE

1083 18 22 活血化瘀 DRUG_EFFICACY
1083 23 27 消散乳块 DRUG_EFFICACY
1083 30 34 肝气郁结 SYNDROME
1083 35 39 气滞血瘀 SYNDROME
1083 40 44 乳腺增生 DISEASE
1083 45 49 乳房胀痛 SYMPTOM
1083 49 53 乳腺增生 DISEASE
1084 25 27 孕妇 PERSON_GROUP
1084 64 68 宿有瘕块 SYMPTOM
1084 70 74 血瘀经闭 SYMPTOM
1084 74 78 血瘀经闭 SYMPTOM
1084 79 83 行经腹痛 SYMPTOM
1084 115 119  活血化 DRUG_EFFICACY
1084 129 133 人宿有血 SYMPTOM
1084 137 141 后漏下不 SYMPTOM
1084 142 146 ，胎动不 SYMPTOM
1084 148 152 或血瘀经 SYMPTOM
1084 153 157 ，行经腹 SYMPTOM
1084 160 163 后恶露 SYMPTOM
1085 13 17 止痛调经 DRUG_EFFICACY
1085 20 24 经期腹痛 SYMPTOM
1085 30 34 月经失调 SYMPTOM
1085 37 41 经期腹痛 SYMPTOM
1085 48 54 月经失调   SYMPTOM
1086 1 5 开郁顺气 DRUG_EFFICACY
1086 6 10 调经养血 DRUG_EFFICACY
1086 13 17 月经错后 SYMPTOM
1086 18 22 胸胁胀痛 SYMPTOM
1087 34 37 补气血 DRUG_EFFICACY
1087 38 41 调月经 DRUG_EFFICACY
1087 84 88 活血调经 DRUG_EFFICACY
1087 91 95 气血两虚 SYNDROME
1087 109 115 月经周期错后 SYMPTOM
1087 116 120 行经量少 SYMPTOM
1087 121 125 精神不振 SYMPTOM
1087 126 130 肢体乏力 SYMPTOM
1087 167 171 气血两虚 SYNDROME
1087 174 178 月经不调 SYMPTOM
108

1110 4 6 辛辣 FOOD_GROUP
1110 7 9 生冷 FOOD_GROUP
1110 14 20 感冒发热病人 PERSON_GROUP
1110 28 31 高血压 DISEASE
1110 32 35 心脏病 DISEASE_GROUP
1110 36 38 肝病 DISEASE_GROUP
1110 39 42 糖尿病 DISEASE
1110 43 45 肾病 DISEASE_GROUP
1110 46 49 慢性病 DISEASE_GROUP
1110 64 69 青春期少女 PERSON_GROUP
1110 70 75 更年期妇女 PERSON_GROUP
1110 98 102 月经过少 SYMPTOM
1110 104 108 经期错后 SYMPTOM
1110 110 117 阴道不规则出血 SYMPTOM
1110 171 176 过敏体质者 PERSON_GROUP
1110 204 206 儿童 PERSON_GROUP
1110 238 242 促进造血 DRUG_EFFICACY
1110 243 245 止血 DRUG_EFFICACY
1110 534 538 角叉菜胶 DRUG_EFFICACY
1110 544 548 肿胀及大 SYNDROME
1110 549 553 棉球肉芽 SYMPTOM
1110 554 558 的形成， SYMPTOM
1110 559 563 能抑制羧 SYMPTOM
1110 564 568 基纤维素 SYMPTOM
1110 572 575 渗出液 DRUG_DOSAGE
1110 641 643 一日 DRUG_INGREDIENT
1110 644 646 次。 DRUG_INGREDIENT
1110 647 650  雷允 DRUG_INGREDIENT
1110 654 656 限公 DRUG_INGREDIENT
1110 668 670 品请 DRUG_INGREDIENT
1110 671 674 知医师 DRUG_INGREDIENT
1110 675 677 药师 DRUG_INGREDIENT
1110 678 680 包括 DRUG_INGREDIENT
1110 681 683 何从 DRUG_INGREDIENT
1110 687 689 市或 DR

1127 21 23 镇痛 DRUG_EFFICACY
1127 28 33 平滑肌收缩 SYMPTOM
1127 50 52 艾叶 DRUG_INGREDIENT
1127 54 58 抑制纤溶 DRUG_EFFICACY
1127 59 61 抗炎 DRUG_EFFICACY
1127 75 77 镇痛 DRUG_EFFICACY
1127 86 92 抑制子宫收缩 DRUG_EFFICACY
1127 128 132 .故临床 SYMPTOM
1127 133 135 要用 SYMPTOM
1127 136 140 治疗妇女 SYMPTOM
1127 141 143 经不 SYMPTOM
1127 144 146 ，痛 SYMPTOM
1127 150 152 不孕 SYNDROME
1127 163 170 寒证型者。此外 SYMPTOM
1127 185 187 乙酰 SYMPTOM
1127 188 192 碱的作用 DISEASE
1127 193 199 临床用治胃痛 SYMPTOM
1127 200 202 慢性 SYMPTOM
1127 249 252 板/盒 DRUG_DOSAGE
1127 253 255    DRUG_TASTE
1127 340 342 省通 FOOD_GROUP
1127 354 360  1.忌生冷 PERSON_GROUP
1127 368 371 澡。2 DISEASE
1127 372 375 感冒发 DISEASE_GROUP
1127 376 378 病人 DISEASE_GROUP
1127 379 382 宜服用 DISEASE
1127 383 385 3. DISEASE_GROUP
1127 386 389 高血压 DISEASE_GROUP
1127 404 409 慢性病严重 PERSON_GROUP
1127 410 415 应在医师指 PERSON_GROUP
1127 438 442 导下服用 SYMPTOM
1127 444 448 .平素月 SYMPTOM
1127 450 457 常，突然出现月 SYMPTOM
1127 518 522 指导下服 SYMPTOM
1127 535 539 或重度痛 SYMPTOM
1127 569 574 应去医院就 PERSON_GROUP
11

1144 113 115 血性 DRUG_INGREDIENT
1144 116 119 球菌和 DRUG_INGREDIENT
1144 120 123 肤真菌 DRUG_EFFICACY
1144 160 162 车前 DRUG_INGREDIENT
1144 163 167 ，赤勺有 DRUG_EFFICACY
1144 187 191 ，除风湿 SYNDROME
1144 192 196 利关节的 SYMPTOM
1144 197 200 用。  DISEASE
1144 260 264 热利湿， SYNDROME
1144 265 269 血通络， SYMPTOM
1144 270 273 经止带 DISEASE
1145 11 15 湿热下注 SYNDROME
1145 16 19 赤白带 SYMPTOM
1146 116 118 鼠耳 DRUG_EFFICACY
1146 119 121 胀， DRUG_EFFICACY
1146 124 128 鼠正常子 SYMPTOM
1146 129 133 平滑肌收 SYMPTOM
1146 134 138 和催产素 SYMPTOM
1147 69 73 经量增多 SYMPTOM
1147 113 117 出血过多 SYMPTOM
1147 128 132 子宫肌瘤 DISEASE
1147 134 139 月经过多  SYMPTOM
1148 3 7 促进造血 DRUG_EFFICACY
1148 8 10 止血 DRUG_EFFICACY
1148 345 349 数的增多 SYNDROME
1148 350 354   黑龙 SYMPTOM
1148 355 359 天宏药业 SYMPTOM
1148 360 364 份有限公 SYMPTOM
1148 399 401 调经 DRUG_INGREDIENT
1148 402 404 带。 DRUG_INGREDIENT
1148 405 408 于气血 DRUG_INGREDIENT
1148 412 414 体瘦 DRUG_INGREDIENT
1148 426 428 如果 DRUG_INGREDIENT
1148 429 432 用任何 DRUG_INGREDIENT
1148 433 435 他药 DRUG_INGREDIENT
1148 436 

1171 0 4 清热利湿 DRUG_EFFICACY
1171 17 21 湿热下注 SYNDROME
1171 22 26 白带过多 SYMPTOM
1171 27 31 盆腔炎  DISEASE
1171 57 61 湿热下注 SYNDROME
1171 63 67 白带异常 SYMPTOM
1172 40 42 颗粒 DRUG_DOSAGE
1172 43 46 气微香 DRUG_TASTE
1172 47 49 味苦 DRUG_TASTE
1172 89 95   养血调经 DRUG_EFFICACY
1172 96 100 顺气解郁 DRUG_EFFICACY
1172 103 107 月经不调 SYMPTOM
1172 108 112 腰腹疼痛 SYMPTOM
1172 113 117 赤白带下 SYMPTOM
1172 118 122 精神倦怠 SYMPTOM
1172 123 127 饮食减少 SYMPTOM
1173 0 4 补气养血 DRUG_EFFICACY
1173 12 16 气血两虚 SYNDROME
1173 17 21 身体瘦弱 SYMPTOM
1173 22 26 腰膝酸软 SYMPTOM
1173 27 31 月经量少 SYMPTOM
1173 153 155 生冷 DRUG_INGREDIENT
1173 156 159 物。2 DRUG_INGREDIENT
1173 160 162 服本 DRUG_INGREDIENT
1173 189 192 五灵脂 DISEASE
1173 193 196 皂荚及 DISEASE_GROUP
1173 220 225 患有高血压 SYMPTOM
1173 441 443 师或 DRUG_INGREDIENT
1173 444 446 师， DRUG_INGREDIENT
1173 447 450 括任何 DRUG_INGREDIENT
1173 454 456 超市 DRUG_INGREDIENT
1173 468 470 药品 DRUG_INGREDIENT
1173 471 474  本药 DRUG_INGREDIENT
1173 475 477 所含 DRUG_INGREDIENT
1173 478 480 参、 DRUG_INGREDIENT
1173 481 483 芍， D

1192 0 3  丸剂 DRUG_DOSAGE
1192 4 7 大蜜丸 DRUG_DOSAGE
1192 43 46 大蜜丸 DRUG_DOSAGE
1192 47 50 微有香 DRUG_TASTE
1192 76 82 、生冷食物。 PERSON_GROUP
1192 90 93 不宜服 DISEASE
1192 94 97 。3. DISEASE_GROUP
1192 98 100 高血 DISEASE_GROUP
1192 101 104 、心脏 DISEASE
1192 105 107 、肝 DISEASE_GROUP
1192 108 111 、糖尿 DISEASE_GROUP
1192 126 131 指导下服用 PERSON_GROUP
1192 132 137 4.青春期 PERSON_GROUP
1192 160 164 经正常， SYMPTOM
1192 166 170 出现月经 SYMPTOM
1192 172 179 ，或经期错后， SYMPTOM
1192 212 215 就诊。 PERSON_GROUP
1192 218 223 本品过敏者 PERSON_GROUP
1192 250 252 9. PERSON_GROUP
1192 292 295 药师。 DRUG_DOSAGE
1192 319 323 0s 益 DRUG_EFFICACY
1192 326 330 ，活血调 SYNDROME
1192 332 334 用于 SYNDROME
1192 337 341 虚兼有血 SYMPTOM
1192 344 350 的月经不调， SYMPTOM
1192 351 355 见月经周 SYMPTOM
1192 356 360 错后、行 SYMPTOM
1192 361 365 量少、精 SYMPTOM
1192 365 368 神不振 DRUG_EFFICACY
1192 369 372 肢体乏 DRUG_EFFICACY
1192 405 411 的月经不调， SYMPTOM
1192 412 416 见月经周 SYMPTOM
1192 417 421 错后、行 SYMPTOM
1193 34 36 镇痛 DRUG_EFFICACY
1193 41 46 平滑肌收缩 SYMPTOM
1193 56 58 。2 DRUG_INGR

1215 36 40 恶露不行 SYMPTOM
1215 58 62 阴道流血 SYMPTOM
1215 63 67 月经过多 SYMPTOM
1215 67 70  孕妇 PERSON_GROUP
1215 232 240 能明显减少大鼠扭 DRUG_EFFICACY
1215 339 343 度，增加 DRUG_EFFICACY
1215 363 366 液粘度 DRUG_EFFICACY
1215 550 552 补体 DRUG_EFFICACY
1215 624 626 杆菌 DRUG_EFFICACY
1215 634 638 杆菌和金 SYMPTOM
1215 641 645 萄球菌均 SYMPTOM
1215 651 655 作用。  SYMPTOM
1215 668 672 后恶露不 SYMPTOM
1215 673 677 ，症见小 SYMPTOM
1216 39 41 镇痛 DRUG_EFFICACY
1216 46 51 平滑肌收缩 SYMPTOM
1216 68 70 艾叶 DRUG_INGREDIENT
1216 72 76 抑制纤溶 DRUG_EFFICACY
1216 77 79 抗炎 DRUG_EFFICACY
1216 93 95 镇痛 DRUG_EFFICACY
1216 104 110 抑制子宫收缩 DRUG_EFFICACY
1216 146 150 .故临床 SYMPTOM
1216 151 153 要用 SYMPTOM
1216 154 158 治疗妇女 SYMPTOM
1216 159 161 经不 SYMPTOM
1216 162 164 ，痛 SYMPTOM
1216 168 170 不孕 SYNDROME
1216 181 188 寒证型者。此外 SYMPTOM
1216 203 205 乙酰 SYMPTOM
1216 206 210 碱的作用 SYMPTOM
1216 211 213 临床 SYMPTOM
1216 285 289 师或药师 DRUG_EFFICACY
1216 302 306 用于子宫 SYMPTOM
1216 307 311 寒，月经 SYMPTOM
1216 359 361 目录 FOOD_GROUP
1216 373 379   兰州佛慈 PERSON_GROUP
1216 387 390

1231 46 48    DISEASE_GROUP
1231 87 89 孕妇 PERSON_GROUP
1231 113 117 月经不调 SYMPTOM
1231 120 125 经水量少  SYMPTOM
1231 125 129 祛瘀生新 DRUG_EFFICACY
1231 132 136 月经量少 SYMPTOM
1231 140 144 经来腹痛 SYMPTOM
1232 19 21 生冷 FOOD_GROUP
1232 55 62  感冒发热病人 PERSON_GROUP
1232 72 75 高血压 DISEASE
1232 76 79 心脏病 DISEASE_GROUP
1232 80 82 肝病 DISEASE_GROUP
1232 83 86 糖尿病 DISEASE
1232 87 89 肾病 DISEASE_GROUP
1232 90 93 慢性病 DISEASE_GROUP
1232 109 115  青春期少女 PERSON_GROUP
1232 116 121 更年期妇女 PERSON_GROUP
1232 165 169 月经过少 SYMPTOM
1232 171 175 经期错后 SYMPTOM
1232 177 184 阴道不规则出血 SYMPTOM
1232 269 273 月经不调 SYMPTOM
1232 306 311 过敏体质者 PERSON_GROUP
1232 344 346 儿童 PERSON_GROUP
1232 401 403 血瘀 SYNDROME
1232 406 410 月经后期 SYMPTOM
1232 411 413 痛经 SYMPTOM
1232 416 420 行经后错 SYMPTOM
1232 421 427 行经小腹冷痛 SYMPTOM
1232 427 431 行经后错 SYMPTOM
1232 432 438 行经小腹冷痛 SYMPTOM
1232 444 447 有血块 SYMPTOM
1232 511 514 2）  DRUG_DOSAGE
1233 0 3 补气血 DRUG_EFFICACY
1233 4 7 调月经 DRUG_EFFICACY
1233 10 14 月经不调 SYMPTOM
1233 37 40 高血压 DISEASE
1233 41 44 心脏病 DISEA

1251 27 29 镇痛 DRUG_EFFICACY
1251 34 39 平滑肌收缩 SYMPTOM
1251 56 58 艾叶 DRUG_INGREDIENT
1251 60 64 抑制纤溶 DRUG_EFFICACY
1251 65 67 抗炎 DRUG_EFFICACY
1251 81 83 镇痛 DRUG_EFFICACY
1251 83 85 抗炎 DRUG_EFFICACY
1251 99 101 镇痛 DRUG_EFFICACY
1251 110 116 抑制子宫收缩 DRUG_EFFICACY
1251 152 156 .故临床 SYMPTOM
1251 156 158 主要 PERSON_GROUP
1251 158 162 用于治疗 SYMPTOM
1251 163 165 女月 SYMPTOM
1251 173 177 调，痛经 SYMPTOM
1251 178 180 宫寒 SYMPTOM
1251 181 183 孕痛 SYMPTOM
1251 196 203 疾病属虚寒证型 SYMPTOM
1251 218 220 性， SYMPTOM
1251 221 225 抗乙酰胆 SYMPTOM
1251 226 228 的作 SYMPTOM
1251 238 242 性肠炎， DRUG_DOSAGE
1251 243 246 频等病 DRUG_DOSAGE
1251 254 258   丸剂 DRUG_EFFICACY
1251 261 263 丸) SYNDROME
1251 263 265    SYNDROME
1251 278 280 虚气 SYMPTOM
1251 283 287 焦虚寒所 SYMPTOM
1251 288 291 的月经 SYMPTOM
1251 292 295 调、痛 SYMPTOM
1251 296 300 ，症见行 SYMPTOM
1251 301 309 后错、经量少、有 SYMPTOM
1251 337 341 后错痛经 SYMPTOM
1251 354 358 在经前3 SYMPTOM
1251 388 393 .服药后痛 PERSON_GROUP
1251 440 444 .对本品 DRUG_EFFICACY
1251 465 469  口服， DRUG_EFFICACY
1251 469 475 

1266 27 29 孕妇 PERSON_GROUP
1266 46 50 月经不调 SYMPTOM
1266 53 58 经水量少  SYMPTOM
1266 58 62 祛瘀生新 DRUG_EFFICACY
1266 65 69 月经量少 SYMPTOM
1266 73 77 经来腹痛 SYMPTOM
1266 121 123    DISEASE_GROUP
1267 23 27 祛瘀生新 DRUG_EFFICACY
1267 30 34 月经量少 SYMPTOM
1267 68 70 淋沥 SYMPTOM
1268 4 8 收缩子宫 DRUG_EFFICACY
1268 67 71 促进造血 DRUG_EFFICACY
1268 121 128 抑制醋酸足肿胀 DRUG_EFFICACY
1268 129 133 抑制醋酸 DRUG_EFFICACY
1268 166 168 血瘀 SYNDROME
1268 270 274  本品养 DRUG_EFFICACY
1268 275 278 祛瘀， SYNDROME
1268 309 314 重9g 养 DRUG_EFFICACY
1268 326 330 不行或行 SYMPTOM
1268 331 335 不畅，夹 SYMPTOM
1269 22 24 生冷 FOOD_GROUP
1269 27 29 油腻 FOOD_GROUP
1269 32 36 肾虚带下 SYMPTOM
1269 45 49 肾阳虚者 PERSON_GROUP
1269 49 53 白带清稀 SYMPTOM
1269 57 60 质稀薄 SYMPTOM
1269 63 67 腰酸如折 SYMPTOM
1269 73 77 小便清长 SYMPTOM
1269 128 130 医师 PERSON_GROUP
1269 131 133 导下 PERSON_GROUP
1269 134 136 药。 PERSON_GROUP
1269 159 164 老人、少女 PERSON_GROUP
1269 330 334 其他药物 SYNDROME
1269 334 340 同时使用可能 DRUG_EFFICACY
1269 355 362 医师或药师。  SYMPTOM
1269 362 366 白带丸清 DISEASE_GROUP
1270 55 

1294 38 42 气血两虚 SYNDROME
1294 56 60 月经不调 SYMPTOM
1294 63 69 月经周期错后 SYMPTOM
1294 70 74 行经量少 SYMPTOM
1294 75 79 精神不振 SYMPTOM
1294 80 84 肢体乏力 SYMPTOM
1294 86 90 周期错后 SYNDROME
1294 104 110 力 益气养血 SYMPTOM
1294 111 115 活血调经 SYMPTOM
1294 116 120 用于气血 SYMPTOM
1294 121 125 虚兼有血 SYMPTOM
1294 125 127 瘀所 DRUG_DOSAGE
1294 128 132 的月经不 DRUG_DOSAGE
1294 161 164 蜜丸  DRUG_EFFICACY
1294 165 168 服。一 DRUG_EFFICACY
1295 21 23 镇痛 DRUG_EFFICACY
1295 28 33 平滑肌收缩 SYMPTOM
1295 50 52 艾叶 DRUG_INGREDIENT
1295 54 58 抑制纤溶 DRUG_EFFICACY
1295 59 61 抗炎 DRUG_EFFICACY
1295 75 77 镇痛 DRUG_EFFICACY
1295 86 92 抑制子宫收缩 DRUG_EFFICACY
1295 128 132 .故临床 SYMPTOM
1295 133 135 要用 SYMPTOM
1295 136 140 治疗妇女 SYMPTOM
1295 141 143 经不 SYMPTOM
1295 144 146 ，痛 SYMPTOM
1295 150 152 不孕 SYNDROME
1295 163 170 寒证型者。此外 SYMPTOM
1295 185 187 乙酰 SYMPTOM
1295 188 192 碱的作用 SYMPTOM
1295 193 195 临床 SYMPTOM
1295 233 235 ，一 SYNDROME
1295 235 237 日2 SYNDROME
1295 238 242 3次。  SYNDROME
1295 245 249 血虚气滞 SYMPTOM
1295 330 332 家医 SYNDROME
1295 332 334 保目 SYNDR

1317 39 43 月经不调 SYMPTOM
1317 46 52 月经周期错后 SYMPTOM
1317 53 57 行经量少 SYMPTOM
1317 58 62 精神不振 SYMPTOM
1317 63 67 肢体乏力 SYMPTOM
1317 73 77 泰药业股 SYNDROME
1317 91 97 经。用于气血 SYMPTOM
1317 98 102 虚兼有血 SYMPTOM
1317 103 107 所致的月 SYMPTOM
1317 108 112 不调。症 SYMPTOM
1317 150 153 ）,国 DRUG_EFFICACY
1318 36 40 月经不调 SYMPTOM
1318 43 49 月经周期错后 SYMPTOM
1318 108 112 口服。一 DRUG_EFFICACY
1318 115 119 ，一日2 SYNDROME
1318 133 139 远药业有限公 SYMPTOM
1318 140 144   补气 SYMPTOM
1318 145 149 ，调月经 SYMPTOM
1318 150 154   益气 SYMPTOM
1319 38 40 血虚 SYNDROME
1319 40 42 肝郁 SYNDROME
1319 49 51 痛经 SYMPTOM
1319 77 79 孕妇 PERSON_GROUP
1319 102 104 辛辣 FOOD_GROUP
1319 105 107 生冷 FOOD_GROUP
1319 112 118 感冒发热病人 PERSON_GROUP
1319 126 129 高血压 DISEASE
1319 130 133 心脏病 DISEASE_GROUP
1319 134 136 肝病 DISEASE_GROUP
1319 137 140 糖尿病 DISEASE
1319 141 143 肾病 DISEASE_GROUP
1319 144 147 慢性病 DISEASE_GROUP
1319 162 167 青春期少女 PERSON_GROUP
1319 168 173 更年期妇女 PERSON_GROUP
1319 196 200 月经过少 SYMPTOM
1319 202 206 经期错后 SYMPTOM
1319 208 215 阴道不规则出血 SYMPTOM
1319 

1342 1 5 祛瘀生新 DRUG_EFFICACY
1342 8 12 月经量少 SYMPTOM
1342 16 20 经来腹痛 SYMPTOM
1342 93 95 血瘀 SYNDROME
1342 98 102 月经不调 SYMPTOM
1342 105 109 经水量少 SYMPTOM
1342 109 111 孕妇 PERSON_GROUP
1343 57 61 益气养血 DRUG_EFFICACY
1343 64 68 调经。用 SYNDROME
1343 82 88 不调。症见月 SYMPTOM
1343 89 93 周期错后 SYMPTOM
1343 94 98 行经量少 SYMPTOM
1343 99 103 精神不振 SYMPTOM
1343 121 125 。  用 SYNDROME
1343 128 132 两虚所致 SYMPTOM
1343 135 141 不调，症见月 SYMPTOM
1343 142 146 周期错后 SYMPTOM
1343 147 151 行经量少 SYMPTOM
1343 152 156 精神不振 SYMPTOM
1343 156 159 、肢体 DRUG_EFFICACY
1343 160 163 力补气 DRUG_EFFICACY
1344 57 61 月经不调 SYMPTOM
1344 64 70 月经周期错后 SYMPTOM
1344 71 75 行经量少 SYMPTOM
1344 76 80 精神不振 SYMPTOM
1344 81 84 肢体乏 SYMPTOM
1344 86 90 益气养血 SYNDROME
1344 104 110 血瘀所致的月 SYMPTOM
1344 111 115 不调。症 SYMPTOM
1344 116 120 月经周期 SYMPTOM
1344 121 125 后、行经 SYMPTOM
1344 169 172 县东方 DRUG_EFFICACY
1344 173 176 制药有 DRUG_EFFICACY
1345 3 7 气血两虚 SYNDROME
1345 10 14 月经不调 SYMPTOM
1345 17 23 月经周期错后 SYMPTOM
1345 24 28 行经量少 SYMPTOM
1345 29 33 精神不振 SYMPTOM
1345 34 38 肢

1363 50 52 血虚 SYNDROME
1363 52 54 肝郁 SYNDROME
1363 56 60 月经不调 SYMPTOM
1363 61 63 痛经 SYMPTOM
1363 78 82 经水量少 SYMPTOM
1363 83 86 有血块 SYMPTOM
1363 87 93 行经小腹疼痛 SYMPTOM
1363 94 96 血块 SYMPTOM
1363 96 98 排出 SYMPTOM
1363 98 100 痛减 DRUG_INGREDIENT
1363 101 103 经前 DRUG_INGREDIENT
1363 104 106 乳胀 DRUG_INGREDIENT
1363 107 113 、烦躁小腹疼 DRUG_EFFICACY
1363 141 145 胀痛、烦 SYMPTOM
1363 145 147 躁， PERSON_GROUP
1363 147 151 食欲不振 SYMPTOM
1363 237 239 本方 DRUG_INGREDIENT
1363 240 242 四物 DRUG_INGREDIENT
1363 243 245 加味 DRUG_INGREDIENT
1363 246 252 成。现代药理 DRUG_EFFICACY
1363 280 284 炎证，促 SYMPTOM
1363 285 287 网织 SYMPTOM
1363 344 346 月经 SYNDROME
1363 346 348 不调 SYNDROME
1363 350 354 经等有较 SYMPTOM
1363 355 357 的疗 SYMPTOM
1363 441 445 家医保目 DRUG_EFFICACY
1363 446 450 （甲类） DRUG_EFFICACY
1363 450 452 ,国 PERSON_GROUP
1364 0 5  内分泌失 DISEASE_GROUP
1365 6 10 活血调经 DRUG_EFFICACY
1365 13 17 气血两虚 SYNDROME
1365 31 37 月经周期错后 SYMPTOM
1365 38 42 行经量少 SYMPTOM
1365 43 47 精神不振 SYMPTOM
1365 48 52 肢体乏力 SYMPTOM
1365 52 56 益气养血 DRUG_EFFICA

1381 13 17   丸剂 DRUG_DOSAGE
1381 18 21 水蜜丸 DRUG_DOSAGE
1381 41 47 产后出血量多 SYMPTOM
1381 55 57 孕妇 PERSON_GROUP
1381 68 70 甘草 DRUG_INGREDIENT
1381 74 77 京大戟 DRUG_INGREDIENT
1381 78 80 芫花 DRUG_INGREDIENT
1381 81 83 甘遂 DRUG_INGREDIENT
1381 107 110 水蜜丸 DRUG_DOSAGE
1381 111 114 气微香 DRUG_TASTE
1381 115 118 味微辛 DRUG_TASTE
1381 118 121 水蜜丸 DRUG_DOSAGE
1381 162 166 行而不畅 SYMPTOM
1381 196 198 甘草 DRUG_INGREDIENT
1381 202 205 京大戟 DRUG_INGREDIENT
1381 206 208 芫花 DRUG_INGREDIENT
1381 242 246 药师。  DRUG_EFFICACY
1381 247 250 尚不明 SYNDROME
1382 71 73 气滞 SYNDROME
1382 74 80 下焦虚寒血虚 SYNDROME
1382 80 82 气滞 SYNDROME
1382 99 101 1. DRUG_INGREDIENT
1382 103 107 药理研究 DRUG_EFFICACY
1382 108 110 明， DRUG_EFFICACY
1382 124 126 子宫 DRUG_EFFICACY
1382 135 141 紧张度的功能 DRUG_EFFICACY
1382 177 181 弛子宫平 SYMPTOM
1382 181 184 滑肌， PERSON_GROUP
1382 187 189 宫收 DRUG_INGREDIENT
1382 196 198 度和 DRUG_EFFICACY
1382 212 214 生长 DRUG_EFFICACY
1382 223 229 用。4.故临 DRUG_EFFICACY
1382 265 269 香附能提 SYMPTOM
1382 270 272 痛阈 SYMPTOM
1382 273 277 镇

1396 13 16   用 SYMPTOM
1396 17 21 经期腹痛 SYMPTOM
1396 28 34 月经失调   SYMPTOM
1396 34 38 通调气血 DRUG_EFFICACY
1396 39 43 止痛调经 DRUG_EFFICACY
1396 46 50 经期腹痛 SYMPTOM
1396 56 60 月经失调 SYMPTOM
1396 60 62 止痛 DRUG_EFFICACY
1396 62 68 调经通调气血 DRUG_EFFICACY
1396 69 73 止痛调经 DRUG_EFFICACY
1397 63 67 气血两虚 SYNDROME
1397 68 72 气滞血瘀 SYNDROME
1397 87 91 气血两虚 SYNDROME
1397 92 94 气滞 SYNDROME
1397 94 96 血瘀 SYNDROME
1397 99 103 月经不调 SYMPTOM
1397 106 110 月经提前 SYMPTOM
1397 111 115 月经错后 SYMPTOM
1397 116 120 月经量多 SYMPTOM
1397 121 125 神疲乏力 SYMPTOM
1397 126 130 行经腹痛 SYMPTOM
1397 134 137 水蜜丸 DRUG_DOSAGE
1398 19 21    DISEASE
1398 47 50 水蜜丸 DRUG_DOSAGE
1398 77 81 气血两虚 SYNDROME
1398 82 84 气滞 SYNDROME
1398 84 86 血瘀 SYNDROME
1398 89 93 月经不调 SYMPTOM
1398 96 100 月经提前 SYMPTOM
1398 101 105 月经错后 SYMPTOM
1398 105 109 月经提前 SYMPTOM
1398 110 114 月经错后 SYMPTOM
1398 115 119 月经量多 SYMPTOM
1398 120 124 神疲乏力 SYMPTOM
1399 46 50 月经量少 SYMPTOM
1399 54 58 经来腹痛 SYMPTOM
1399 58 62 祛瘀生新 DRUG_EFFICACY
1399 65 69 月经量少 SYMPTOM
1399 73 77 经来腹痛 SYMPTOM

1417 33 37 月经量少 SYMPTOM
1417 41 46 经来腹痛  SYMPTOM
1417 67 69 血瘀 SYNDROME
1417 81 85 月经不调 SYMPTOM
1417 115 117 基本 DISEASE_GROUP
1418 3 7 养血祛瘀 DRUG_EFFICACY
1418 15 18 血热证 SYNDROME
1418 63 67 行而不畅 SYMPTOM
1418 68 72 夹有血块 SYMPTOM
1418 133 137 幅度和频 DRUG_EFFICACY
1418 148 152 产妇产后 DRUG_EFFICACY
1418 202 206 小鼠的红 DRUG_EFFICACY
1418 239 241 抑制 SYNDROME
1419 25 29 活血调经 DRUG_EFFICACY
1419 30 34 补血活血 DRUG_EFFICACY
1419 61 65 新之功能 DRUG_EFFICACY
1419 66 70 川芎化瘀 DRUG_EFFICACY
1419 81 87 、红花能活血 DRUG_EFFICACY
1419 88 93 气，祛瘀生 DRUG_EFFICACY
1419 285 289 育年龄段 SYMPTOM
1419 290 294 妇的疗效 SYMPTOM
1419 386 388 主要 PERSON_GROUP
1419 445 448  口服 DRUG_INGREDIENT
1419 463 467 后服用。 SYMPTOM
1419 468 472 妇在产后 SYMPTOM
1419 472 476 立即服用 SYMPTOM
1419 476 480 ；痛经于 SYMPTOM
1419 481 485 经来潮前 SYMPTOM
1420 13 17 益气养血 DRUG_EFFICACY
1420 18 22 活血调经 DRUG_EFFICACY
1420 25 29 气血两虚 SYNDROME
1420 31 33 血瘀 SYNDROME
1420 36 40 月经不调 SYMPTOM
1420 43 49 月经周期错后 SYMPTOM
1420 50 54 行经量少 SYMPTOM
1420 55 59 精神不振 SYMPTOM
1420 60 64 肢体乏力 SYMP

1440 34 36 血瘀 SYNDROME
1440 39 43 月经不调 SYMPTOM
1440 46 50 经水量少 SYMPTOM
1440 50 52 孕妇 PERSON_GROUP
1440 80 82    DISEASE_GROUP
1440 94 98 祛瘀生新 DRUG_EFFICACY
1440 101 105 月经量少 SYMPTOM
1440 109 113 经来腹痛 SYMPTOM
1441 6 10 活血调经 DRUG_EFFICACY
1441 13 17 气血两虚 SYNDROME
1441 31 37 月经周期错后 SYMPTOM
1441 38 42 行经量少 SYMPTOM
1441 43 47 精神不振 SYMPTOM
1441 57 61 月经不调 SYMPTOM
1441 61 67 血瘀气血两虚 SYNDROME
1441 112 114 师或 DISEASE_GROUP
1441 145 149 尚不明确 SYNDROME
1441 152 156 吉林省正 SYMPTOM
1441 159 165 业有限公司  SYMPTOM
1441 166 170 口服。一 SYMPTOM
1441 171 175 6克，一 SYMPTOM
1441 176 180 2次。  SYMPTOM
1441 180 182  用 SYMPTOM
1441 182 185 于气血 DRUG_EFFICACY
1441 186 189 虚所致 DRUG_EFFICACY
1442 43 45 止痛 DRUG_EFFICACY
1442 48 52 月经不调 SYMPTOM
1442 53 57 经期腹痛 SYMPTOM
1442 57 59 孕妇 PERSON_GROUP
1442 76 80 月经不调 SYMPTOM
1442 81 85 经期腹痛 SYMPTOM
1442 85 87    PERSON_GROUP
1442 87 89 孕妇 PERSON_GROUP
1443 59 61 孕妇 PERSON_GROUP
1443 61 63 孕妇 PERSON_GROUP
1443 76 78 孕妇 PERSON_GROUP
1443 97 101 月经量少 SYMPTOM
1443 116 118    DISEASE_GRO

1461 43 45    DISEASE
1461 68 72 开郁顺气 DRUG_EFFICACY
1461 73 77 调经养血 DRUG_EFFICACY
1461 80 84 月经错后 SYMPTOM
1462 14 18 益气养血 DRUG_EFFICACY
1462 19 23 活血调经 DRUG_EFFICACY
1462 26 30 气血两虚 SYNDROME
1462 46 50 月经不调 SYMPTOM
1462 53 59 月经周期错后 SYMPTOM
1462 60 64 行经量少 SYMPTOM
1462 65 69 精神不振 SYMPTOM
1462 70 74 肢体乏力 SYMPTOM
1462 124 127 补气血 DRUG_EFFICACY
1462 128 131 调月经 DRUG_EFFICACY
1462 169 173 月经不调 SYMPTOM
1462 176 182 月经周期错后 SYMPTOM
1463 47 51 月经量少 SYMPTOM
1463 52 57 产后腹痛  SYMPTOM
1463 79 83 活血调经 DRUG_EFFICACY
1464 37 44 清热除湿 止带 DRUG_EFFICACY
1464 44 47 清热  DRUG_EFFICACY
1464 78 82 湿热下注 SYNDROME
1464 83 86 赤白带 SYMPTOM
1465 29 31 孕妇 PERSON_GROUP
1465 34 36    DISEASE_GROUP
1465 81 85 月经量少 SYMPTOM
1465 89 93 经来腹痛 SYMPTOM
1465 128 130 血瘀 SYNDROME
1465 140 144 经水量少 SYMPTOM
1466 17 20 补气血 DRUG_EFFICACY
1466 21 24 调月经 DRUG_EFFICACY
1466 27 31 头晕心慌 SYMPTOM
1466 32 36 疲乏无力 SYMPTOM
1466 37 41 月经量少 SYMPTOM
1466 45 51 经期后错头晕 SYMPTOM
1466 54 57 补气血 DRUG_EFFICACY
1466 58 61 调月经 DRUG_EFFICACY
1466 64 68 月经不

1482 11 15 眩晕耳鸣 SYMPTOM
1482 16 20 烦躁失眠 SYMPTOM
1482 121 123 s; FOOD_GROUP
1482 126 128    FOOD_GROUP
1482 131 133 食辛 DISEASE
1482 143 147 冒时不宜 SYMPTOM
1482 154 157 月经紊 DISEASE
1482 158 161 或其他 DISEASE_GROUP
1482 162 165 病如： DISEASE
1482 166 171 血压、心脏 DISEASE_GROUP
1482 172 175 、糖尿 DISEASE
1482 191 194 者，应 DISEASE
1482 250 253 本品不 PERSON_GROUP
1482 256 261 服用。6、 PERSON_GROUP
1482 288 290 时禁 PERSON_GROUP
1482 290 297 止使用。8、请 PERSON_GROUP
1482 300 305 放在儿童过 PERSON_GROUP
1482 332 334 时禁 PERSON_GROUP
1482 382 386   长春 DRUG_EFFICACY
1482 387 391 平药业有 DRUG_EFFICACY
1482 402 406 烦安神。 SYMPTOM
1482 407 415 于更年期潮热汗出 SYMPTOM
1482 415 419 ，眩晕耳 DRUG_EFFICACY
1482 420 424 ，烦躁失 DRUG_EFFICACY
1483 84 88 。  清 SYMPTOM
1484 17 21 气血两虚 SYNDROME
1484 35 41 月经周期错后 SYMPTOM
1484 42 46 行经量少 SYMPTOM
1484 47 51 精神不振 SYMPTOM
1484 52 56 肢体乏力 SYMPTOM
1484 56 61 行经量少  SYMPTOM
1484 120 124   用于 SYMPTOM
1484 127 133 虚所致的月经 SYMPTOM
1484 163 166 明确。 DRUG_EFFICACY
1484 167 170  每丸 DRUG_EFFICACY
1485 8 12 活血化瘀 DRUG_EFFICA

In [51]:
result

{1000: [(123, 135, '50毫升装）-安徽天洋药', 'DRUG_EFFICACY'),
  (136, 140, '  清热', 'DRUG_EFFICACY'),
  (141, 145, '毒，化湿', 'DRUG_EFFICACY')],
 1001: [(31, 33, '孕妇', 'PERSON_GROUP'),
  (79, 81, '活血', 'DRUG_EFFICACY'),
  (82, 84, '通络', 'DRUG_INGREDIENT'),
  (87, 91, '月经量少', 'SYMPTOM'),
  (95, 101, '血虚萎黄后错', 'SYMPTOM'),
  (102, 106, '血虚萎黄', 'SYMPTOM'),
  (107, 111, '风湿痹痛', 'SYMPTOM'),
  (112, 116, '肢体麻木', 'SYMPTOM'),
  (116, 119, '糖尿病', 'DISEASE')],
 1002: [(36, 38, '感冒', 'DISEASE'),
  (38, 40, '发热', 'SYMPTOM'),
  (51, 54, '高血压', 'DISEASE'),
  (55, 58, '心脏病', 'DISEASE_GROUP'),
  (59, 61, '肝病', 'DISEASE_GROUP'),
  (62, 65, '糖尿病', 'DISEASE'),
  (66, 68, '肾病', 'DISEASE_GROUP'),
  (69, 72, '慢性病', 'DISEASE_GROUP'),
  (90, 94, '月经紊乱', 'SYMPTOM'),
  (109, 111, '眩晕', 'SYMPTOM'),
  (152, 155, '过敏者', 'PERSON_GROUP'),
  (192, 194, '儿童', 'PERSON_GROUP'),
  (242, 244, '颗粒', 'DRUG_DOSAGE'),
  (245, 248, '气微香', 'DRUG_TASTE'),
  (249, 252, '味微苦', 'DRUG_TASTE'),
  (253, 259, '  滋养肝肾', 'DRUG_EFFICACY'),
  (260, 264,

In [24]:
from keras.models import load_model
import numpy as np

maxlen = 40
sentence = " 北京同仁堂科技发展股份有限公司制药厂  1.忌食辛辣，少进油腻。 2.感冒发热病人不宜服用。 3.有高血压、心脏病、肝病、糖尿病、肾病等慢性病严重者应在医师指导下服用。 4.伴有月经紊乱者，应在医师指导下服用。 5.眩晕症状较重者，应及时去医院就诊。 6.服药2周症状无缓解，应去医院就诊。 7.对本品过敏者禁用，过敏体质者慎用。 8.本品性状发生改变时禁止使用。 9.请将本品放在儿童不能接触的地方。 10.如正在使用其他药品，使用本品前请咨询医师或药师。  本品为浅黄色至棕黄色颗粒，气微香，味微苦。  滋养肝肾、宁心安神。用于更年期综合症属阴虚肝旺症，症见烘热汗出，头晕耳鸣，失眠多梦，五心烦热，腰背酸痛，大便干燥，心烦易怒，舌红少苔，脉弦细或弦细 开水冲服。一次1袋(12g)，一日3次。  如与其他药物同时使用可能会发生药物相互作用，详情请咨询医师或药师。  12g*10袋/盒  用于更年期综合症属阴虚肝旺症  铝塑复合膜包装，每袋装12克，每盒装10袋。  非处方药物（甲类）,中药保护品种二级  12g*10袋/盒  用于更年期综合症属阴虚肝旺更年期综合症气微香，味微苦。"
#sentence = sentence.replace(' ','_')
sentences = sentence.split('。')
y_ner = []

for sent in sentences:
    sent = sent.replace(' ','_')
    sent_chars = list(sent+'。')
    sent2id = [vocab2idx[word] if word in vocab2idx else vocab2idx['<UNK>'] for word in sent_chars]

    sent2id_new = np.array([[0] * (maxlen-len(sent2id)) + sent2id[:maxlen]])
    y_pred = model.predict(sent2id_new)
    y_label = np.argmax(y_pred, axis=2)
    y_label = y_label.reshape(1, -1)[0]
    y_ner_ = [idx2label[i] for i in y_label][-len(sent_chars):]
    y_ner.extend(y_ner_)

In [27]:
result_words = get_valid_nertag(sentence, y_ner)
for (word, tag) in result_words:
    print("".join(word), tag)

感冒 DISEASE
发热 SYMPTOM
高血压 DISEASE
心脏病 DISEASE_GROUP
肝病 DISEASE_GROUP
糖尿病 DISEASE
肾病 DISEASE_GROUP
慢性病 DISEASE_GROUP
月经紊乱 SYMPTOM
眩晕 SYMPTOM
过敏者 PERSON_GROUP
儿童 PERSON_GROUP
颗粒 DRUG_DOSAGE
气微香 DRUG_TASTE
味微苦 DRUG_TASTE
  滋养肝肾 DRUG_EFFICACY
宁心安神 DRUG_EFFICACY
烘热汗出 SYMPTOM
头晕耳鸣 SYMPTOM
失眠多梦 SYMPTOM
五心烦热 SYMPTOM
腰背酸 SYMPTOM


In [25]:
list(zip(list(sentence),y_ner))

[(' ', 'O'),
 ('北', 'O'),
 ('京', 'O'),
 ('同', 'O'),
 ('仁', 'O'),
 ('堂', 'O'),
 ('科', 'O'),
 ('技', 'O'),
 ('发', 'O'),
 ('展', 'O'),
 ('股', 'O'),
 ('份', 'O'),
 ('有', 'O'),
 ('限', 'O'),
 ('公', 'O'),
 ('司', 'O'),
 ('制', 'O'),
 ('药', 'O'),
 ('厂', 'O'),
 (' ', 'O'),
 (' ', 'O'),
 ('1', 'O'),
 ('.', 'O'),
 ('忌', 'O'),
 ('食', 'O'),
 ('辛', 'O'),
 ('辣', 'O'),
 ('，', 'O'),
 ('少', 'O'),
 ('进', 'O'),
 ('油', 'O'),
 ('腻', 'O'),
 ('。', 'O'),
 (' ', 'O'),
 ('2', 'O'),
 ('.', 'O'),
 ('感', 'B-DISEASE'),
 ('冒', 'I-DISEASE'),
 ('发', 'B-SYMPTOM'),
 ('热', 'I-SYMPTOM'),
 ('病', 'O'),
 ('人', 'O'),
 ('不', 'O'),
 ('宜', 'O'),
 ('服', 'O'),
 ('用', 'O'),
 ('。', 'O'),
 (' ', 'O'),
 ('3', 'O'),
 ('.', 'O'),
 ('有', 'O'),
 ('高', 'B-DISEASE'),
 ('血', 'I-DISEASE'),
 ('压', 'I-DISEASE'),
 ('、', 'O'),
 ('心', 'B-DISEASE_GROUP'),
 ('脏', 'I-DISEASE_GROUP'),
 ('病', 'I-DISEASE_GROUP'),
 ('、', 'O'),
 ('肝', 'B-DISEASE_GROUP'),
 ('病', 'I-DISEASE_GROUP'),
 ('、', 'O'),
 ('糖', 'B-DISEASE'),
 ('尿', 'I-DISEASE'),
 ('病', 'I-DISEASE'),
 ('、'