 # English-Chinese Frame Alignment (YZ)

This algorithm uses Open Multilingual WordNet to output translations of English LUs and vote for the closest Chinese frames. The results are compared against 70 manually aligned frame pairs for which F1, precision and recall are computed. 

In [18]:
import xml.etree.ElementTree as ET
import os
import re
import nltk
from hanziconv import HanziConv
from nltk.corpus import wordnet as wn
import numpy as np

# Object creation
Thanks to Steven Cen! :)

In [19]:
data_dir_str = "data/"
chin_frame_dir_str = "chin/"
eng_frame_dir_str = "bfn/"

In [20]:
class Frame_CHIN:
    def __init__(self, ID, name, name_en, dfn="---"):
        self.ID = ID
        self.name = name # TODO: changeto be named lex_name
        self.name_en = name_en
        self.dfn = dfn # no definition of frame
        
        self.lus = []
    
    def __str__(self):
        return str(self.ID) + ", " + self.name + ", (" + self.name_en + "): "# + str(self.lus[0]) + ". " # TODO: LUs

class Frame_EN:
    def __init__(self, ID, name, dfn):
        self.ID = ID
        self.name = name
        self.dfn = dfn
        
        self.lus = []
        
    def __str__(self):
        return self.name + ": " + self.dfn + ": " + (str(self.lus[0]) if len(self.lus) > 0 else "") + ".\n"

# shared between all languages
class LU:
    def __init__(self, ID, name, pos, lex_name="---", dfn="---"):
        self.ID = ID
        self.name = name
        self.pos = pos
        
        self.lex_name = lex_name # TODO: what's this
        self.dfn = dfn
        
    def __str__(self):
        return self.name

In [21]:
chin_frames = []
eng_frames = []

chin_id_to_frame = {}
eng_id_to_frame = {}

# To help find the number of frames in each language
eng_max_ID = 0
chin_max_ID = 0

In [22]:
# Parse a Chinese Frame from the XML data
def parse_chin_frame(file_name):
    global chin_max_ID
    
    tree = ET.parse(file_name)
    root = tree.getroot()

    fc = Frame_CHIN(int(root.get("id")), root.get("name"), root.get("name_en"))
    chin_max_ID = max(chin_max_ID, int(root.get("id")))
    for lu_elem in root.findall("LexicalUnit"):
        lu = LU(lu_elem.get("id"), lu_elem.get("name"), lu_elem.get("POS_MARK"))
        fc.lus.append(lu)
    
    chin_frames.append(fc)
    
    
# TODO: figure out which words don't have a certain element, although this shouldn't happen
    
def parse_eng_frame(file_name):
    global eng_max_ID
    
    tree = ET.parse(file_name)
    root = tree.getroot()
    f_eng = Frame_EN(int(root.get("ID")), root.get("name"), root.find("{http://framenet.icsi.berkeley.edu}definition").text)
    eng_max_ID = max(eng_max_ID, int(root.get("ID")))
    
    for lu_elem in root.findall("{http://framenet.icsi.berkeley.edu}lexUnit"):
        lexeme_elem = lu_elem.find("{http://framenet.icsi.berkeley.edu}lexeme")
        lu = LU(lu_elem.get("ID"), lu_elem.get("name"), lu_elem.get("POS"), lexeme_elem.get("name"), lu_elem.find("{http://framenet.icsi.berkeley.edu}definition").text)
        f_eng.lus.append(lu)
        
    eng_frames.append(f_eng)

In [23]:
# Read FrameNet Files

chin_dir = os.fsencode(data_dir_str + chin_frame_dir_str)
eng_dir = os.fsencode(data_dir_str + eng_frame_dir_str)

for file in os.listdir(chin_dir):
     file_name = os.fsdecode(file)
     if file_name.endswith(".xml"):
        parse_chin_frame(os.path.join(chin_dir.decode(), file_name))

print(chin_frames[0])


for file in os.listdir(eng_dir):
     file_name = os.fsdecode(file)
     if file_name.endswith(".xml"):
        parse_eng_frame(os.path.join(eng_dir.decode(), file_name))

print(eng_frames[1])

28, 知觉特征, (perception_description_holistic): 
Attitude_description: <def-root>The lexical units in this frame are descriptions of a <fen>Cognizer</fen>'s <fen>Attitude</fen> about or outlook on a <fen>State_of_affairs</fen>.   

<ex></ex>
<ex><fex name="Cog">Carl</fex> is becoming <fex name="Deg">more</fex> <t>pessimistic</t> <fex name="State">about the negotiations</fex> every day.</ex>

<ex>The benefits of cluelessness come from living in a society where <fex name="Cog">people</fex> <m>take</m> an <t>optimistic</t> <fex name="Att">view</fex> <fex name="State">of life</fex>.</ex>
<ex></ex>
The <fen>State_of_affairs</fen> can be expressed without a <fen>Cognizer</fen> in many cases, as shown in the following:
<ex></ex>
<ex><fex name="State">The situation</fex> is <fex name="Deg">fairly</fex> <t>grim</t> at the moment.</ex>
<ex></ex>

</def-root>: optimistic.a.



In [24]:
# Generate mapping from ID to Frame object

for chin_frame in chin_frames:
    chin_id_to_frame[chin_frame.ID] = chin_frame
for eng_frame in eng_frames:
    eng_id_to_frame[eng_frame.ID] = eng_frame

In [25]:
print(len(chin_frames), len(eng_frames))

323 1221


In [26]:
print("NON-UNIQUE")
print("Num of English LUs: " + str(sum([len(eng_frames[i].lus) for i in range(len(eng_frames))])))
print("Num of Chinese LUs: " + str(sum([len(eng_frames[i].lus) for i in range(len(chin_frames))])))
# s = 10
# len(eng_frames[s].lus)

NON-UNIQUE
Num of English LUs: 13631
Num of Chinese LUs: 3522


In [27]:
chin_lemma_to_frame = {} # chin_lemma_to_frame[LU]: maps LU to its list of frame objects 
                        # TODO: use ID's instead

# Go through each Chinese frame and map every LU to all the frames that that LU is a part of
# Note: if the same LU, ie. "in" is listed multiple times as an LU for a certain frame (ie. Conditional_occurrence) it will be counted multiple times!
for chin_frame in chin_frames:
#     print(chin_frame.name)
    for lu in chin_frame.lus:
        if lu.name in chin_lemma_to_frame:
#             if chin_frame not in chin_lemma_to_frame[lu.name]: # Only add this frame if we haven't connected this lu to chin_frame yet
            chin_lemma_to_frame[lu.name].append(chin_frame) #.append(chin_frame.name)
#                 if lu.name == "in": 
#                     print(lu.name, chin_frame.name)
        else:
            chin_lemma_to_frame[lu.name] = [chin_frame] #[chin_frame]
            
# print(chin_lemma_to_frame)
avg = sum([len(frame_list) for frame_list in chin_lemma_to_frame.values()]) / len(chin_lemma_to_frame.values())
print("Average number of Chinese frames each lemma is an LU of: " + str(avg))
print(len(chin_lemma_to_frame.values()) * avg) # sanity check. Should equal the above quantity "Num of English LUs: 3947"

Average number of Chinese frames each lemma is an LU of: 1.1935288781372846
3947.0


In [28]:
# Sample array use: weights_table[c_idx][e_idx] = "weight"
weights_table = [[0 for c in range(chin_max_ID)] for e in range(eng_max_ID)]

print (len(weights_table), len(weights_table[0])) # number of chinese frames, number of English frames

weight = {} # weight[(English frame ID, Chinese frame ID)]: weight of that alignment relationship

3020 323


# Alignment
## Find translations and add weights to table

In [29]:
for eng_frame in eng_frames:
        frame_trans_list= []
        for eng_lu in eng_frame.lus:
                stripped_eng_lu = re.sub('\s?[^\w&\s&\-].*', '', eng_lu.name)   # Remove " ()", " []", "." and POS tags to convert the English LUs to valid WordNet entries.
                #print (eng_lu)
                eng_lu_trans = []
                for i in range(len(wn.synsets(stripped_eng_lu))):
                            if wn.synsets(stripped_eng_lu)[i].lemmas(lang='cmn'):    # Use the Chinese Open Wordnet to find lemma translations
                                    syns_trans = wn.synsets(stripped_eng_lu)[i].lemmas(lang='cmn')   # A list of lemma translations of the synset using Chinese Open Wordnet.
                            else:
                                    syns_trans = wn.synsets(stripped_eng_lu)[i].lemmas(lang='qcn') # If translation can't be found in the Chinese Open Wordnet, use the Chinese Wordnet (Taiwan).
                                    #print (syns_trans)
                            # Make the translations match by POS:
                            lemma_trans = []
                            for lemma in syns_trans:
                                    if eng_lu.name.endswith('.n'):  # Nouns
                                            if '.n' in str(lemma):
                                                lemma_trans.append(re.findall(r'[\u4e00-\u9fff]+', str(lemma))[0]) # Append translated strings to list.
                                    elif eng_lu.name.endswith('.v'):  # Verbs
                                            if '.v' in str(lemma):
                                                lemma_trans.append(re.findall(r'[\u4e00-\u9fff]+', str(lemma))[0]) # Append translated strings to list.
                                    elif eng_lu.name.endswith('.a'):  # Adjectives
                                            if '.a' in str(lemma) or '.s' in str(lemma):
                                                lemma_trans.append(re.findall(r'[\u4e00-\u9fff]+', str(lemma))[0]) # Append translated strings to list.
                                    elif eng_lu.name.endswith('.adv'):  # Adverbs
                                            if '.r' in str(lemma):
                                                lemma_trans.append(re.findall(r'[\u4e00-\u9fff]+', str(lemma))[0]) # Append translated strings to list.
                                    else:  # All other cases (nums and preps)
                                            if re.search(r'[\u4e00-\u9fff]+', str(lemma)):
                                                lemma_trans.append(re.findall(r'[\u4e00-\u9fff]+', str(lemma))[0])  # Load all possible translations to list.
                            #print (lemma_trans)
                            for word in lemma_trans:
                                    word = HanziConv.toSimplified(word)    # Convert traditional Chinese characters to simplified characters
                                    eng_lu_trans.append(word)
                            eng_lu_trans = list(set(eng_lu_trans))    # Remove translation duplicates.
                #print (eng_lu_trans)
                frame_trans_list.append(eng_lu_trans)
        print (frame_trans_list)
        for lu_trans in frame_trans_list:
                for word in lu_trans:
                            if word in chin_lemma_to_frame: # If this translated version of the LU is an LU for any Chinese frame
                                    # print("\n", word, "is in", [c.name for c in chin_lemma_to_frame[word]], "\n")
                                    for chin_frame in chin_lemma_to_frame[word]:
                                            # Update weights in the table and the dictionary (TODO: more graceful way of keeping track)
                                            # TODO: merge these two to be graceful
                                            weights_table[eng_frame.ID][chin_frame.ID] += 1
                                            if (eng_frame, chin_frame) not in weight:
                                                    weight[(eng_frame, chin_frame)] = 1
                                            else:
                                                    weight[(eng_frame, chin_frame)] += 1
                 

[]
[['乐观', '乐观主义', '肯定'], [], [], ['正', '阳性', '实证主义', '带正电荷', '带正电', '实证'], ['阴性', '带负电荷', '负', '带负电'], ['无能', '不行', '糟糕'], ['阴沉', '阴郁', '沉闷', '暗', '深色', '深暗色', '黑暗', '深', '郁郁不乐', '阴暗', '隐秘', '秘密', '忧郁', '沮丧', '暗色调', '单调', '隐藏', '悲观']]
[[], []]
[['疲劳', '疲倦', '疲', '厌倦', '累'], ['困'], ['欲火中烧', '好色', '性兴奋', '性欲冲动', '欲火焚身的'], ['热望', '腹空', '渴望', '饥饿', '饿', '感到饿', '挨饿', '辘辘饥肠', '饥', '感到饥饿', '需要食物'], ['热望', '干渴', '渴望', '干燥', '口干', '干旱', '口渴', '渴'], ['欲火中烧', '角状', '好色', '性兴奋', '性欲冲动', '有角', '有角状突起', '欲火焚身的'], [], [], ['敝', '疲劳', '劳', '疲倦', '疲倦极', '空'], ['疲劳不堪', '非常疲劳', '疲倦', '疲乏不堪', '精疲力竭'], ['疲倦'], ['疲劳不堪', '非常疲劳', '疲倦', '疲乏不堪', '精疲力竭'], [], ['疲倦极', '疲劳', '疲倦'], ['疲倦极', '疲劳', '疲倦'], [], [], [], [], ['筋疲力尽'], ['倦怠', '疲劳', '乏力', '疲倦'], ['竭尽', '枯竭', '筋疲力尽', '疲惫不堪', '极度疲劳', '衰竭'], ['疲劳', '倦怠', '乏力', '疲倦'], ['疲劳', '倦怠', '乏力', '疲倦'], ['渴', '口渴'], ['充满激情', '欲火中烧', '好色', '性兴奋', '激动', '性欲冲动', '紧张', '欲火焚身的'], ['唤起', '激励', '觉醒', '睡醒'], [], ['体力缺乏', '衰弱', '虚弱', '无力'], [], [], [], ['欲吐', '令人作呕', '恶臭的', '使人

[['罢工', '击', '碰撞', '打击', '使用', '占用', '按', '击打', '碰上', '采取', '撞击', '打下来', '冲撞', '采纳', '偶然看见', '鼓动', '感染', '撞倒', '影响', '删掉', '碰击', '意外发现', '达到', '撞', '采用', '冲击', '停工', '偶然发现', '删去', '打', '得到', '感动', '击中', '使撞击'], ['轻拍', '拍击', '罢工', '停工', '攻击', '轻敲', '轻打'], []]
[['散开', '使散开', '撒', '散布', '散去', '传', '广为传播', '驱散', '分散', '铺开', '散播', '推广', '传播', '洒', '消散', '使广为人知'], ['分裂', '溶解', '化', '终止', '液化', '解散', '结束', '融化', '使溶解'], ['散开', '使散开', '撒', '伸展', '散去', '散布', '驱散', '分散', '铺开', '展开', '洒', '消散'], ['分裂', '溶解', '分解'], ['散播', '传播', '散布'], ['散播', '传播', '散布'], ['施予', '堆', '分布', '铺开', '散布', '遍散', '推广', '传阅', '使广为人知', '传', '散发', '分配', '分发', '铺', '广为传播', '给予', '分给', '散播', '传播', '使分布', '供应'], [], ['伸展', '分散', '蔓延', '铺开', '覆盖一层', '散布', '扩张', '布满', '释放', '推广', '铺盖', '放出', '使广为人知', '散开', '涂', '传', '展开', '抹', '扩散', '敷', '铺', '广为传播', '张', '散播', '传播'], [], ['洗', '降小雨', '撒', '散布', '打', '分散', '小雨', '洒'], ['广为传播', '传', '散布', '铺开', '散播', '推广', '传播', '使广为人知'], []]
[['痊愈', '复原', '恢复'], ['恢复', '康复'], ['治愈', '使恢复正常'], [

[['缓行漫步'], ['资助', '倒退', '下', '后退', '支持', '帮助', '赞成', '使倒退', '批准', '拥护', '赞助'], ['闯入', '冲入'], [], ['捆', '捆扎', '黏附', '跳动', '使黏合', '蹦跳', '系', '弹跳', '约束', '结合', '跳跃', '黏着', '粘附', '跳', '接近', '粘住', '限制', '附着', '捆绑', '联系', '束缚', '束紧', '拘束', '束', '蹦', '依附', '绑', '限定', '跃过', '粘着', '黏合', '飞跃', '套', '跳越', '跳过'], ['穿过'], ['使活跃'], ['慢跑', '使慢跑'], ['雀跃', '蹦蹦跳跳', '欢跃'], [], ['爬上', '价值增加', '攀升', '上升', '爬升', '升起', '增加', '增大', '攀登', '上涨'], [], ['畏缩', '爬', '爬泳', '匍', '自由泳', '奉承', '退缩', '匍匐', '蛇行', '挤满', '爬满', '爬行', '蠕动', '阿谀', '抖缩'], ['畏缩', '爬', '抖缩', '攀附', '匍', '长满', '奉承', '退缩', '蔓延', '蛇行', '爬行', '蠕动', '阿谀', '匍匐'], ['舞蹈', '雀跃', '舞', '跳舞', '手舞足蹈'], ['快走', '疾走', '勐冲', '冲刺'], ['款式', '风度'], ['使落空', '快走', '冲撞', '使受挫', '使破灭', '挫败', '使沮丧', '打碎', '疾走', '使碰撞', '粉碎', '勐冲', '冲刺'], [], [], ['跑来跑去'], [], ['跑来跑去'], ['加快', '疾驰', '飞驰', '赶快', '促进', '加工', '快进', '赶紧', '加紧', '冲进', '疾走', '急于', '推进', '加速'], ['加薪', '提薪'], ['提高', '远足', '增加', '徒步旅行', '勐提高', '抬高'], ['搭便车', '免费搭车'], ['妨碍', '阻碍', '束缚'], ['跃过', '跳跃', '乘飞机飞越', '轻跳', 

[['肉眼的', '裸眼的', '赤裸裸', '打', '空', '只用耳朵的'], ['打', '赤裸裸', '空'], [], ['不穿鞋', '赤脚', '赤足'], ['赤脚', '不穿鞋袜'], [], ['黯淡', '赤裸裸', '赤裸', '裸体', '凄凉的气氛'], ['赤裸', '裸体', '赤裸裸'], ['覆盖'], [], ['用坏', '表现', '经久耐用', '绑', '穿', '显出', '耐磨', '运行', '持续', '踏', '坏了', '戴', '冠', '呈现', '套', '带'], ['敷药防护', '装扮', '打扮'], ['赤脚', '不穿鞋袜'], ['朴', '刚刚充足', '无遮蔽', '赤裸裸', '抽出鞘', '仅仅', '打', '勉强', '无覆盖', '拙', '刚好够', '空', '勉强够格', '最低限度'], ['传世'], [], [], [], [], [], [], ['赤脚', '不穿鞋袜'], [], ['无顶'], [], [], ['暴露'], [], ['装扮', '打扮'], [], [], [], [], [], ['装扮', '打扮'], ['装扮', '打扮'], [], [], [], [], [], ['之间', '英寸', '间', '在职', '铟'], [], [], [], ['跑来跑去', '吹嘘'], [], []]
[['总计', '添', '产生', '加', '长', '下', '添加', '给予', '补充说', '增加', '总数', '提供', '加上', '加起来', '合计', '饶', '增添', '共计为'], ['种', '乘', '使相乘'], ['添加', '加法', '附加物', '增加', '增建物', '增加物', '增加量', '增加部分', '添加物', '附加部分', '附加'], ['增多', '倍增', '增加']]
[['添', '增长', '增加', '加大', '增大', '增'], ['增值', '增额', '增量', '增加', '加大', '增大', '增加量', '增多'], ['被占领', '落下', '倾斜', '跌落', '传下', '减轻', '被分类', '陷落', '下降', '到

[['音乐伴奏', '音乐'], ['表现', '运行', '实行', '运转', '履行', '演奏', '执行'], ['投机', '游戏', '企图获得', '戏剧', '轮', '剧本', '玩', '赌胜负', '赌博', '完全自由', '比赛回合', '容易干的事情']]
[['舔舐', '舔', '哗哗响', '舐', '发嗖嗖声', '折叠', '部分重叠', '作嗖嗖声'], [], [], [], [], ['精练', '打下', '推敲', '下', '击落'], ['啜饮', '抿', '啜', '抿吸'], [], [], [], ['宴'], ['流进', '付费给', '给小费', '餵', '流', '使满足', '付小费', '喂养', '支持', '流向', '流动', '施', '喂食', '粪', '使满意'], [], [], [], ['用餐', '进正餐', '进餐', '吃', '吃正餐', '喝'], ['吸收', '服', '被同化', '食用'], ['看护', '照顾', '挟', '护理', '照料'], [], ['伤', '食', '吃东西', '吃饭', '吃掉', '吃', '消耗'], ['敬酒', '干', '饮', '喝'], [], [], ['伤', '浪费', '挥霍无度', '挥霍', '服', '吃掉', '吃', '消耗', '食用'], [], [], [], [], ['接受', '服', '罹患', '生', '食用', '引起', '取得', '罹', '拥有', '引', '生育', '掌握', '持有', '生下来', '有', '碰', '面临', '获得', '引得', '承受', '接到', '惹', '拿', '对抗', '收到', '具有', '得到', '占有'], ['吸入', '吸收', '饮', '吸取', '喝'], [], [], [], [], ['插入', '塞入'], ['摄取', '纳入']]
[['使聚集', '见', '遭受', '适宜', '接触', '互相靠拢', '聚拢', '集会', '偶然遇见', '忍受', '遭遇', '见面', '合适', '遇见', '对', '符合', '应战', '偶然看见', '碰', '认识',

[['空洞', '说大话', '浮夸', '夸大', '做作', '巨大', '夸夸其谈', '大'], ['成年', '自大', '成年人', '巨大', '已成熟', '长足', '大'], ['庞大', '极大', '巨大', '极广大'], ['低下', '谦逊', '细微', '小', '谦虚', '谦卑', '小型', '卑下'], [], ['小型', '矮', '短', '小'], [], ['正', '巨大', '莫大'], [], [], [], [], ['奢华', '高级', '贵族的', '雄', '奢侈', '特别精良', '豪华'], ['庞大', '极大', '巨大', '极广大'], [], ['整块的'], ['相当大'], ['实心', '有营养', '营养丰富', '坚固'], ['相当大'], [], [], [], [], [], ['蜿蜒', '弯曲', '卷绕', '扭曲'], [], [], [], [], [], ['弱小', '微不足道'], ['极广大', '庞大', '极大', '大人国', '巨大'], ['小人国'], ['中'], [], ['中型']]
[[]]
[[], [], ['强击机'], [], [], ['游击队', '游击队员']]
[['速率', '率', '费率', '速度']]
[['访客', '客人', '来访者'], ['视察', '加诸', '聊天', '访', '拜访', '拉', '长', '访问', '聊', '参观', '暂住', '短', '看望', '串', '游览', '安'], ['拜访', '访问', '游览', '参观', '作客', '看望'], [], ['电话联络', '鸟语', '吆喝', '大叫', '叫喊', '电话联系', '电话', '叫声', '喊叫', '喊声', '短暂的拜访', '鸟叫声']]
[['节奏', '旋律', '循环地'], ['有节奏', '照拍子', '有韵律'], ['心跳节拍', '旋律', '心跳', '脉搏', '脉动', '节奏'], ['旋律', '有韵律', '有节奏', '节奏', '合拍'], ['时', '之秋', '刑期', '时刻', '遭', '时候', '时间', '岁', '年头', '

[['起反作用', '势均力敌', '反对', '抗争'], [], [], [], ['证实', '支持', '确证', '受', '拥护', '支撑', '支承', '忍受', '确认', '同意', '证明', '认同', '托住', '帮助', '赞成', '说话', '支援', '讲话', '赞同', '承受住', '援助', '支撑住', '容忍', '忍耐', '承担'], [], ['倾斜', '争论中的一个方面', '首', '斜坡', '坡', '边', '表面', '方面', '面'], ['阻力', '反对的立场', '野', '抵抗', '对抗者', '在野党', '反对派', '反对者', '敌人', '敌军', '对立', '抵制', '反对', '反对党', '仇敌', '对抗'], [], ['支持', '支援'], ['敌手', '对手'], ['助理', '下体弹力护身', '帮手', '助手', '护裆', '袜带', '帮助者'], ['阻力', '反对的立场', '野', '抵抗', '对抗者', '在野党', '反对派', '反对者', '敌人', '敌军', '对立', '抵制', '反对', '反对党', '仇敌', '对抗'], ['签署', '保证', '支持', '帮助', '赞成', '批准', '拥护'], ['资助', '倒退', '下', '后退', '支持', '帮助', '赞成', '使倒退', '批准', '拥护', '赞助'], ['资金后盾', '底座', '托板', '财政支援', '财政支持', '资金支持', '衬垫物', '供给'], ['相信', '认为', '以为', '想', '看待', '信'], ['角色', '好处', '角', '津贴', '地方', '局部', '段', '任务', '人物', '贡献', '区', '提成', '地', '部位', '分配', '部分', '份额', '要素', '流域']]
[['人造', '人工', '人造的'], ['假', '伪'], ['假', '伪'], ['假', '伪'], ['不真实的', '假的', '虚假的', '假', '虚伪', '不切实际', '错误', '做作', '欺诈', '虚妄的', '谬误', '伪

[['商行', '审议会', '人家', '房屋', '星座', '家', '事务所', '朝', '户', '房子', '库房', '企业', '代', '众议院', '家庭', '商号', '家庭成员', '住宅', '朝代', '立法会议', '家族'], ['船屋'], ['教堂', '教会', '礼拜堂'], ['塔', '楼阁', '柱形', '塔楼', '楼台'], ['村舍', '小屋'], ['小木屋', '客舱', '船舱', '舱房', '舱', '机舱', '舱室'], ['车', '象棋中的车', '城堡'], ['分套购置的公寓'], ['村舍', '小屋'], ['俄国的乡间邸宅', '达恰'], ['集体寝室', '宿舍', '大寝室', '学生宿舍'], ['住宅', '住所', '住处'], ['农舍'], ['人家', '舒适安逸的地方', '家庭', '避难所', '疗养所', '家庭成员', '休养所', '住宅', '住所', '本垒', '住处', '疗养院', '家族', '户'], ['医务室', '医院', '院'], ['宿舍', '招待所', '旅舍', '青年旅舍', '旅店', '青年旅馆', '旅社'], ['旅馆', '饭店', '宾馆', '酒店'], ['拱形圆顶小屋'], ['宿舍', '招待所', '旅舍', '俱乐部', '小屋', '旅店', '团体', '门房', '旅社'], ['大厦', '宅第', '公馆', '府', '甲第', '星座'], ['修道院'], ['汽车旅馆', '汽车游客旅馆'], ['宫殿', '宫'], ['补助金'], [], ['大厦', '居所', '公馆', '宅第', '府', '甲第', '住宅', '住处'], ['茅屋', '简陋小屋', '小屋', '棚屋', '寮', '棚子'], ['茅屋', '简陋小屋', '小屋', '棚屋', '寮', '棚子'], ['避税手段', '收容所', '避难所', '保卫', '保护'], [], ['帐篷'], ['别墅'], ['卫城'], ['体育场', '舞台', '领域', '活动场所', '场', '竞技场', '竞争场所', '范围', '田地', '场地', '室内运动场', '露天体

[['使生色', '使增色', '修饰', '装饰', '美化'], [], ['蒙', '盖', '保护', '覆', '负担支付', '覆盖', '代替', '掩盖', '採访', '对付', '包含', '过度补偿', '延续', '庇护', '铺', '包括', '论述', '掩饰', '遮盖', '涉及', '延伸', '套', '掩护'], ['洒', '撒', '分散', '散布'], ['装载'], ['持有', '使挤满', '捆扎', '包装', '挤', '装', '拿起', '填满', '驼', '挤入', '挤向', '塞满', '附有', '携带', '拿', '蜂拥进入'], ['花'], ['伸展', '分散', '蔓延', '铺开', '覆盖一层', '散布', '扩张', '布满', '释放', '推广', '铺盖', '放出', '使广为人知', '散开', '涂', '传', '展开', '抹', '扩散', '敷', '铺', '广为传播', '张', '散播', '传播'], ['装填', '大口吞食', '塞', '吃过量', '狼吞虎咽', '塞满', '暴食', '使吃得过饱'], ['包', '裹', '锁'], [], ['披'], ['轻拍', '轻击', '轻按', '拍', '轻摸', '轻触', '轻叩', '轻敲', '轻抚'], ['涂抹', '涂', '涂上'], ['打下', '打', '注入', '注射', '打针'], ['仓促应考'], ['播种'], ['提供种子基金', '播种'], ['拂', '轻拭', '拭去', '刷', '刷掉', '轻拂', '掸掉', '扫', '掸', '擦', '除去'], ['搭', '专心', '悬挂', '挂', '沉重', '注意', '展出', '被吊死', '垂下', '垂', '绞死', '使悬而未决', '使搁置', '留意', '吊', '陈列', '难以承担'], ['小雨', '降小雨'], ['溅', '洗', '使溅起水', '泼', '打', '发出溅水声', '溅开'], [], ['喷射', '喷', '以大片小液滴分撒液体', '喷洒液体', '喷涂'], ['洗', '降小雨', '撒', '散布', '打', '分散

[['方法', '接近球', '接近目标航迹', '途径', '接近', '进场航线'], ['开始', '提议', '临近', '靠近', '走近', '接近', '近乎'], ['到达者'], ['办成', '达成', '抵达', '出现', '到达', '做到', '到', '达到预期目的', '到来'], ['总计', '总共达', '出来', '传下', '被分类', '发展成', '最终发生', '来自于', '遗传', '到来', '至', '抵达', '过活', '来', '临到', '临近', '演变成', '分成', '遭遇', '达到性高潮', '结果', '来自', '临', '出现', '包含', '达到性交高潮', '出生于', '导致', '到', '合计', '达到', '归到', '到达', '祖传', '被收到', '终归', '伸展到', '起源于'], ['开始', '打下来', '注册', '继承', '进', '入', '登录', '征募', '登记', '着手', '进入', '载入', '从事', '记下来'], ['入口', '进口', '入口道路', '入场', '门口', '通道', '进入'], ['归还', '回乡', '收入', '利润', '纳税申报单', '回来', '收益', '赢利', '恢复', '归来', '送还', '复原', '返回', '归国', '退税申请', '还乡'], ['回话', '回来', '改选', '恢复', '报偿', '回去', '再选', '被继承', '回到', '重选', '复原', '退回', '退款', '归还', '退钱', '偿', '带来', '归', '赔', '偿还', '出产', '产生', '归返', '送还', '返回', '回', '顶'], ['拜访', '访问', '游览', '参观', '作客', '看望'], ['视察', '加诸', '聊天', '访', '拜访', '拉', '长', '访问', '聊', '参观', '暂住', '短', '看望', '串', '游览', '安'], ['递给', '抵达', '达到', '传递', '取得', '到达', '实现', '伸出', '交给', '给', '完成'], ['构', '

[['执笔', '写', '立', '添'], [], ['拼写', '执笔', '写', '添', '立', '字', '落款', '拼', '创作音乐作品', '出版', '作曲', '拼字'], ['执笔', '写', '添', '立', '创作音乐作品', '作曲', '构成', '组成', '编成'], ['构', '打'], [], [], ['发响声', '发言', '响', '讲话', '发', '吐出', '发声', '说话', '吐出来', '吐', '谈话', '津津乐道'], ['称', '读', '指明', '曰', '告诉', '讲', '陈述', '说明', '示', '标明', '宣称', '说', '显示', '讲述', '断言', '声称', '主张'], ['表示', '发言', '名', '置', '示', '鸣', '表达出来', '发', '吐出', '做声', '表达', '表', '吐出来', '吐', '寄予', '流通', '发出'], [], [], [], [], ['印刷'], ['打', '敲'], [], [], [], [], [], [], [], ['签署', '认可', '签名', '打', '缔结', '签字', '签约雇用', '签准', '订约', '批准', '比'], [], ['列出来', '倾斜', '列于表上', '使倾斜', '记入名单内']]
[['判定', '决定'], ['决定'], [], ['设定', '判', '判定', '论', '决定', '裁']]
[[], [], [], ['独居', '无敌', '独特', '无比', '孤独', '独一无二', '无与伦比', '单独', '唯一的'], [], ['同', '一同', '共同', '一块', '一併', '一起', '一块儿', '集体']]
[['杀死', '杀', '否决', '杀害', '杀戮', '使极不舒服', '折磨', '彻底衰竭', '精疲力竭', '使终止', '使疼痛难忍', '精疲力尽', '使停止', '致命', '戕杀', '扼杀'], [], ['诋毁', '刺杀', '暗杀', '行刺'], ['砍头', '斩首'], ['驳回', '解', '拉', '除掉', '废除',

[['胳膊', '臂', '分支', '兵器', '臂膀', '臂状物', '袖子', '武器', '手臂', '扶手', '武装', '胳臂', '港湾'], ['距骨小腿关节', '腿腕子', '脚踝', '脚腕子', '踝关节', '踝'], ['粪门', '肛门'], ['嵴骨', '封面', '背部', '背', '靠背', '背骨', '嵴椎', '骨干', '后面', '后', '背后', '背面', '嵴柱'], ['胡须', '胡子', '足丝', '颌毛'], ['膨胀部分', '凸起部分', '肚子', '胃', '腹部', '腹'], ['身体', '尸体', '躯干', '车身', '躯体'], ['咪咪', '波', '胸部', '胸', '乳房'], ['后部', '臀', '屁股', '臀部', '尾部'], ['脸', '厚颜', '脸颊', '厚脸皮', '腮帮子', '面颊', '两颊', '腮', '脸蛋', '鲁莽', '厚颜无耻', '颊', '脸皮', '脸蛋子'], ['衣柜', '胸部', '胸', '胸膛', '箱子', '五斗柜', '胸腔', '抽屉柜', '箱'], ['下巴颏', '下巴', '颔', '下颚', '颏'], ['穗', '耳穗', '头状花序', '耳朵'], [], ['形弯管', '肘关节', '肘部', '肘', '弯曲处', '关节', '急弯处', '短袖', '肘管', '形弯头'], ['眼睑', '睑', '盖子', '眼皮'], ['脸', '字', '厚脸皮', '容', '厚颜无耻', '鬼脸', '表面', '脸色', '人类的脸', '面', '颜'], ['手指部分', '指头', '指幅', '手指'], ['肉体', '人体', '果肉', '体格', '外形', '体形', '肌肉', '肌肉组织'], ['英尺', '脚', '足', '地基', '脚部', '基础'], [], ['额头', '前额', '额', '前部'], ['防波堤'], ['毛发', '头', '头发', '毛布', '绒毛'], ['帮忙', '在牌局中玩牌者所拿的牌', '针', '帮工', '长度单位', '拍手喝彩', '帮助', '援助之手', '支援', '前足',

[['肢端肥大症'], ['记忆缺失', '失忆症'], ['关节炎'], ['厌食症', '厌食'], ['血液中缺氧', '窒息'], ['气喘', '哮喘'], ['支气管炎', '支气管感染'], ['癌症', '黄道蟹属', '恶性肿瘤'], ['假丝酵母', '假丝酵母属'], ['白内障'], ['胆管炎', '胆道炎'], ['胆囊炎'], ['霍乱', '瘟疫'], ['肝硬化', '硬化'], ['寒冷', '冷', '感冒', '伤风'], ['结肠炎'], ['结膜炎'], [], ['痢疾'], ['盖印', '印记', '凹陷地', '低气压', '抑郁', '消沉', '大萧条', '经济危机', '萧条', '地平角', '衰退', '凹陷', '抑郁症', '印痕', '沮丧', '忧郁症', '压痕', '压抑'], ['皮炎', '皮肤炎'], ['糖尿病', '多尿症'], ['白喉'], ['憩室病'], [], ['湿疹'], ['流感', '流行性感冒'], ['流感', '流行性感冒'], ['肝炎'], ['疝气', '小肠串气'], ['高血压', '高血压症'], ['低血糖'], ['疾病', '生病'], ['病', '疾病', '症', '病症'], ['疾病', '恶心', '生病'], ['侵染', '传染病', '传染', '被感染', '感染'], ['黄疸病', '黄疸'], ['麻风', '癞病', '麻风病', '麻疯病'], ['白血病'], ['疟疾'], ['麻疹'], ['髓膜炎', '脑膜炎'], ['痛经', '月经过多'], ['小儿麻痹', '嵴髓灰质炎', '小儿麻痹症'], ['干癣', '牛皮癣', '银屑病'], ['肾盂肾炎'], ['红斑痤疮'], ['精神分裂症'], ['坐骨神经痛'], ['休克', '电击', '昏迷', '恍惚', '发呆'], ['压力', '不安', '紧张', '重压', '着重'], [], ['梅毒'], ['肌肉痉挛', '破伤风', '牙关紧闭症'], ['结核', '肺结核'], ['瘤', '瘤子', '肿瘤', '肿疡'], ['溃疡'], ['风疹', '麻疹'], ['流行性腮腺炎', '腮腺炎'], [], [],

[['绷脸', '笼罩', '引以为忧', '闹情绪', '生气', '不悦', '担', '可怖地出现', '急', '显得大', '愠怒'], ['想', '打量', '争论', '当作', '考虑', '看待', '当成', '熟虑', '思考', '以为', '论', '当做', '权衡', '计', '视作', '视为', '斟酌', '相信', '看成', '看作', '认为', '看做', '注视', '凝视'], ['情况', '体谅', '体贴', '思考', '深思', '要考虑的事', '细想', '聘金', '考虑周到', '形势', '聘请定金', '考虑', '关切'], ['仔细考虑', '思考', '沉思', '细想', '注视', '冥思苦想', '考虑', '默想', '凝视', '深思熟虑'], ['反省'], ['斟酌', '熟虑', '仔细考虑', '争论', '权衡'], ['深思熟虑'], ['居住于', '引以为忧', '担', '急', '住'], ['仔细考虑', '沉思', '思考', '细想', '冥思苦想', '考虑', '默想'], [], [], ['仔细考虑', '沉思', '思考', '细想', '冥思苦想', '考虑', '默想'], ['仔细考虑', '沉思', '思考', '细想', '冥思苦想', '考虑', '默想'], ['反照', '反映', '沉思', '仔细考虑', '思考', '细想', '考虑', '使反射', '反射', '冥思苦想', '使弹回', '反射光', '映出', '默想', '使回响'], ['反省', '反映', '反射', '坐标转换'], ['仔细考虑', '沉思', '思考', '细想', '冥思苦想', '考虑', '默想'], ['怀疑', '不确定'], ['想', '追忆', '记得', '试图', '有心', '意图', '看待', '待', '思索', '思考', '以为', '想到', '图', '相信', '认为', '回忆', '回想', '记忆', '企图', '想起', '忆起'], [], ['主意', '思考', '思想', '思维', '调', '想法', '构想', '考虑', '理念']]
[['邻近', '隔壁的', '相

[['钓', '倾斜', '使转动角度', '屈身', '倾向', '钓鱼'], ['接受', '表现', '怀有', '接管', '受', '生', '携', '含', '含有', '忍受', '作出表现', '生育', '掌握', '生下来', '包含', '运', '带', '容纳', '持', '为人', '出产', '具有', '产生', '容忍', '接收', '忍耐', '携带', '占有'], ['打'], ['涉', '交叉', '越过', '挫败', '阻止', '渡', '阻碍', '阻挠', '穿过', '相交', '经过'], ['落下', '俯就', '屈尊', '传下', '祖传', '下降', '降格', '降低', '起源于', '来自', '来自于', '遗传'], ['下沉', '落下', '使暗淡', '倾斜', '染', '浸泡', '向下倾斜', '使模煳', '下降', '浸', '使微降', '下滑', '使失去光泽', '沾', '弄暗'], ['落下', '恶化', '摇摆', '停止工作', '花去', '下降', '停止执行', '滴下', '自由地悬挂', '解雇', '抖出', '下沉', '贬值', '停止做', '花费', '掉落', '倒下', '抖出来', '悬荡', '下', '悬摆', '下跌', '掉', '摇晃地悬挂', '掉下', '垂落', '开除', '使滴下', '用去', '悬垂着', '使下降', '停工', '花', '沉', '降低', '歇工', '消耗'], ['渐渐地移动', '徐徐移动', '缓缓移动', '缓慢地移动', '徐进', '慢慢前进'], ['显现', '形成', '浮现', '显现出来', '出现', '显出', '暴露'], ['退出', '翘辫子', '离去', '离开', '死亡', '去世', '退场', '消逝', '死去', '出去', '动身', '出门'], ['退出', '离开', '致使', '放弃', '留下', '告知', '剩余', '走开', '交托', '留给', '透露', '剩下', '留', '动身', '出门', '走', '遗留', '退场', '传授', '导致', '信托', '离去', '出发', '脱离'

[[], ['护照'], [], ['认股权证', '保证', '逮捕证', '许可证', '搜查证', '保证书', '担保', '保用'], ['单据', '证书', '凭证'], ['报章', '作文', '报', '论文', '文件', '文档', '文献', '学术论文', '公文', '报纸', '纸'], ['执照', '许可', '放纵', '放肆', '许可证', '特许'], ['票'], [], ['作为', '动作', '行为', '转让契约'], ['租期', '租物', '租契', '供出租的财产', '租约'], ['协定', '意见的一致', '协调', '一致', '协议', '商定', '响应', '和谐', '语法上的一致'], ['协议', '协定', '条约'], ['特许状', '营业执照', '许可证', '凭照'], [], ['存款', '存放', '储蓄', '沉淀', '沉积', '放置'], [], [], ['宣誓书'], ['意志', '遗嘱', '决心', '意志力', '决断力'], [], ['遗嘱'], [], [], ['公众意见', '见解', '意见', '判决书', '看法', '调', '民意', '舆论', '民众之声'], ['标题', '头衔', '冠军', '称号', '所有权', '权利', '转让契约'], ['命令', '秩序', '规则', '命', '圣职', '俱乐部', '阶级', '订单', '团体', '敕', '牧师职', '定单', '法令', '整齐', '阶层', '社会等级', '次'], ['合约', '合同'], ['执照', '许可', '许可证', '特许', '古氏鲳鲹'], ['证券', '证件', '文件', '文档', '文献', '凭证', '公文', '交单'], ['契约性', '合同性', '契约', '合同', '契约规定'], ['协定', '意见的一致', '协调', '条约', '一致', '协议', '和谐'], ['确认', '确认的事物', '证实'], ['确认', '鉴定行为', '证明', '辨认', '鉴定', '识别', '身份证明', '认出', '验明'], []]
[]
[['强调'], [], ['

[['果子', '果实', '成果', '水果'], ['苹果'], ['香蕉'], ['青菜', '蔬菜'], ['胡萝卜', '红萝卜'], ['马铃薯', '土豆'], ['麦豌豆', '麦豆', '毕豆', '豌豆籽', '雪豆', '寒豆', '麻累', '国豆', '豌豆'], ['核', '肉', '仁', '籽', '核心', '肉食'], ['肉牛', '牛肉', '菜牛'], ['羊羔'], [], [], ['鸡', '胆怯者', '小鸡'], ['火鸡'], ['鱼', '鱼类', '鱼肉'], ['鲑鱼', '三文鱼', '鲑', '大麻哈鱼'], ['鲔鱼', '金枪鱼'], ['软体动物'], ['小虾', '虾'], ['大螯虾', '龙螯虾', '龙虾'], ['牛奶', '奶', '乳'], ['奶酪', '乳酪', '芝士', '干酪'], ['蛋类', '鸡蛋', '卵', '蛋'], ['奶油', '牛油', '黄油'], ['怪人', '坚果', '热衷于某事的人', '略带神经病的人', '疯子'], ['杏树', '杏仁', '扁桃'], ['花生', '落花生'], [], ['脑袋'], ['香草', '芳草'], ['香料'], ['秦椒', '海椒', '黑胡椒', '辣角', '番椒', '辣子', '胡椒', '辣椒'], ['兰香子', '罗勒子', '兰香', '罗勒', '山薄荷', '明列子', '奇异子'], ['谷物', '谷类食品', '荞麦食品'], ['钱币', '钱财', '金钱'], ['浆果', '浆果类', '莓'], ['钱币', '钱财', '面包', '金钱'], ['卷', '卷曲', '螺纹', '一卷钞票', '小面包', '手头的钱', '花名册', '现钞', '包子', '小圆面包', '馒头', '旋曲', '面包卷', '手头的现金', '击鼓声', '馍'], ['爆竹', '彩包爆竹', '鞭炮'], ['块状物', '蛋糕'], [], [], [], [], ['饼干', '小点心', '小甜点'], ['饼干', '小点心', '小甜点'], ['点心', '餐后甜点', '西点', '甜食', '甜点'], ['朱古力', '巧克力'], ['饵'

[['阻止', '阻塞', '阻碍', '拦阻', '妨碍'], ['阻止', '妨碍', '阻碍'], ['阻止', '妨碍', '阻碍', '阻'], ['阻断', '阻塞', '阻碍', '拦阻', '阻隔', '阻', '妨碍'], ['限制', '限定', '约束', '束缚', '拘束'], ['克制', '使变紧', '阻止', '绷紧', '阻碍', '抑制'], ['阻止', '妨碍', '阻碍'], ['禁止', '抑制', '镇压', '征服', '压抑', '使止住'], ['阻止', '阻碍', '抑制', '克制'], ['减慢', '使延期', '延迟', '延误', '延缓', '阻止', '耽搁', '妨碍', '阻滞'], ['迟缓', '受到阻滞', '减慢速度', '减慢', '拖住', '延缓', '延迟', '使减速', '阻止', '降低速度', '推迟', '妨碍', '减速', '阻滞'], ['障碍', '妨碍', '妨害', '阻碍物'], [], ['产权负担', '妨害', '障碍', '妨碍', '阻碍物'], ['障碍', '妨碍', '受阻'], ['障碍', '妨碍', '受阻'], [], ['介入', '调停', '干涉', '干预', '妨碍'], ['干涉', '障碍', '干预', '妨害', '妨碍', '阻碍物'], ['跨栏用栏'], ['不幸', '困难', '逆境', '苦难'], ['阻断', '中止', '终止', '传导阻滞', '阻止', '阻塞', '拦阻', '阻碍', '忘', '使停止', '停止', '阻隔', '阻', '妨碍', '忘记'], ['克制', '使服从', '压制', '抑制', '镇压'], ['禁止', '阻止', '抑制'], ['限制', '克制', '限定', '约束', '束缚', '阻止', '阻碍', '拘束', '抑制'], ['克制', '被约束', '束缚', '控制', '抑制'], ['减慢速度', '延缓', '放慢', '变慢', '减速', '降低速度'], [], []]
[[], ['神经过敏', '易激动', '易惊', '担心', '神经系统', '神经', '激动', '易兴奋', '焦虑'], [], 

[['优越', '克制', '优势', '俯视', '权势', '控制', '管理', '控制器', '抑制', '对一技艺的完全精通', '掌握', '运用能力', '支配'], ['俯临', '俯视', '主宰', '占优势', '控制', '占上风', '占主导地位', '统治', '使失色', '俯瞰', '使黯然失色', '使阴暗', '支配'], ['最高权力'], ['监督', '用不光彩的方法获得', '管理', '处理', '把', '哄骗', '经营', '使诡计', '对付', '指挥', '获得', '用诡计获得', '设法', '指导', '应付', '完成', '办理', '欺骗', '赢得', '做到', '设法对付'], ['指导', '管理', '指挥'], ['伪造', '操纵', '控制', '假造', '把持', '伪装', '篡改', '幕后操纵', '操作', '摆布'], [], ['控制', '规定', '管理', '占优势', '占上风', '统治', '治', '支配'], ['操纵', '克制', '核实', '约束', '节制', '控制', '束缚', '管理', '遏制', '证实', '统帅', '校验', '统率', '抑制', '操作', '验证', '检验']]
[['伤害', '伤', '违法', '使激怒', '使惊骇', '使受伤', '犯罪', '冒犯', '激怒'], [], [], [], ['令人作呕', '恶臭的', '与袭击有关', '为袭击而设计', '使人作呕', '令人不快', '攻击用', '感官产生不快', '恶心'], ['无礼', '辱骂', '诽谤', '侮辱', '虐待'], ['无礼', '伤感情', '粗鲁', '失礼', '攻势', '刑事犯罪', '罪', '不恭', '罪行', '攻击', '无礼貌', '犯罪', '冒犯', '得罪', '进攻'], ['感兴趣', '挂念', '关系到', '关心', '涉及', '有关'], []]
[['开始', '开始从事', '建立', '创立', '着手进行', '成立', '确立', '发射', '创办', '设立'], [], [], ['划船', '拉出', '划行', '行驶', '做错事', '拖

[['快乐', '令人满足', '令人愉快'], [], [], [], ['痛苦', '极痛苦'], ['使人高兴', '安慰', '喝彩', '令人振奋', '欢唿', '令人高兴'], ['伤脑筋'], ['令人严肃思考', '严肃', '发人深省'], [], [], [], ['使更恶化', '恶化的'], ['使更恶化', '伤脑筋', '恶化的'], ['讨厌', '伤脑筋', '磨'], [], [], [], [], [], [], ['使发生兴趣', '吸引人', '诱人', '迷人', '诱惑', '诱惑人'], [], ['使人高兴', '安慰', '喝彩', '令人振奋', '欢唿', '令人高兴'], [], [], [], [], [], [], ['毛骨悚然', '令人发抖'], ['惊人', '使人惊骇', '令人吃惊', '令人惊讶', '令人震惊', '令人惊骇'], ['使奋起', '鼓舞的', '使兴奋的'], ['刺刺'], ['有刺激性', '刺激'], ['令人吃惊'], ['安'], ['令人作呕', '恶心', '使人作呕', '恶臭的'], ['令人迷惑', '使迷惑', '混淆', '令人困惑', '混乱'], ['伤脑筋'], ['令人震惊', '骇人听闻', '可怕', '耸人听闻'], [], ['令人惊讶'], [], ['反斥', '抵抗', '排斥'], [], [], [], [], ['快乐', '惬意', '愉快', '令人愉快'], ['讨厌', '不愉快', '使人不愉快'], ['快乐', '令人满足', '令人愉快'], ['快乐', '令人满足', '令人愉快'], [], [], [], [], [], [], [], ['矬', '蠢', '闷', '拙'], ['刺激性', '磨', '讨厌', '刺激'], [], ['讨厌', '磨'], ['讨厌', '磨'], [], [], ['讨厌', '磨'], ['讨厌', '磨'], [], ['矬', '蠢', '闷', '拙'], ['激励', '奖励', '鼓舞人心'], [], ['使不和', '挑拨'], ['矬', '蠢', '闷', '拙'], ['了不起', '精彩', '惊人', '使人惊骇', '令人吃惊'

[[], ['迟来', '迟', '误期'], ['在初期', '早', '早期'], ['仿效', '遵循', '信守', '追', '审视', '追踪', '使受监视', '继', '从事', '跟不上', '遵守', '照办', '产生结果', '证明是', '坚守', '随同', '继承', '顺', '随', '采纳', '坚持', '使后接', '追赶', '接着', '结果是', '观察', '采用', '密切注视', '依循', '跟', '跟着', '注意', '跟随', '追逐', '沿行', '服从', '随后导致'], ['接下来', '下', '下列', '接着', '次'], ['迟', '晚', '误期', '迟来', '故', '前'], ['逾'], ['优先于', '提早日期', '居先', '在前面', '领先'], [], ['提早日期', '在前面', '居先'], ['不当令', '不合时宜', '不到时候', '不时', '过早', '不按时'], ['前面', '老式', '旧式', '前'], ['早', '先'], [], ['随后', '后来'], ['迟来', '迟', '误期'], [], ['前', '前方', '先', '之前', '前面', '进', '事先'], ['落后', '稍后', '跟不上'], ['之后', '稍后', '之余', '晚', '过后', '此后', '回头', '以降', '后', '以后'], ['之后', '之余', '过后', '此后', '以降', '后', '以后', '很尾部'], ['宁可', '宁愿', '毋宁'], [], ['之后', '之余', '过后', '此后', '以降', '后', '以后'], ['前面', '早', '前'], [], [], ['一会儿', '一下', '一段时间'], [], ['确定性', '最后', '终点', '临终', '上', '末端', '最终', '不可更改', '决定性'], ['过去', '结束'], [], [], [], ['邻近', '接下来', '隔壁的', '下', '下列', '靠近', '毗邻', '接着', '邻接', '次'], ['迟', '晚', '误期', '迟来', '故', '

[['讨论', '推理', '论据', '争论', '论点', '辩论', '自变量'], ['表示', '论证', '证明', '证实', '显示', '作证'], ['确认', '证明', '使更坚定', '确定', '证实', '批准'], ['确认', '证明', '证实', '支持', '确证', '帮助', '支援'], ['演示', '表示', '论证', '证明', '展示', '展览', '展出', '显示', '示威游行', '作证', '示范', '示威'], ['表示', '论证', '证明', '显示', '作证'], ['寄', '打', '借', '演出', '有感而发'], ['论证', '证明', '证明是', '证', '发', '化验', '测试', '作证', '发酵', '试验', '检验'], ['揭开', '揭发', '露出', '启示', '揭露', '泄露', '透露', '显示', '遁道', '揭示', '暴露', '显露', '使公诸于世'], ['演示', '表现', '展现', '引导', '表明', '论证', '指出', '展出', '显示', '引', '证明', '展览', '寄', '作证', '领', '有感而发', '指', '表示', '炫耀', '展示', '打', '卖弄', '借', '演出', '示范', '指示'], ['确认', '化身', '证明', '使具体化', '使实体化', '象征', '证实', '实现', '偿还', '体现'], ['证明', '作证'], ['核实', '肯定', '证实', '校验', '宣誓', '断言', '验证', '检验'], [], [], ['指明', '证明', '讨论', '争辩', '争论', '评理', '辩论', '指示'], ['蕴涵', '衍推', '有心', '企图', '图', '意图', '意味', '意味着', '意在', '待', '试图', '意思是', '暗示', '意指'], ['证', '证据', '根据', '基本原则'], [], ['提议', '表示', '建议', '使人产生', '使人想起', '唤起', '暗示'], ['指', '表示', '指明', '证明', '指出', '表明', 

[['穿衣', '服装', '衣裳', '衣服', '女服', '女裙衫', '打扮', '连衣裙', '服饰', '衣着'], ['女服', '女裙衫', '连衣裙'], [], [], ['女用裙裤'], ['宽松女服', '女式内衣'], ['马靴', '马裤'], ['袜子'], [], ['护腿', '绑腿'], [], ['插条', '失礼', '滑', '条', '女式内衣', '失态', '插枝', '陶饰土', '出丑', '枕套'], ['女裙服', '女式礼服', '手术服', '礼服', '女长服', '女夜礼服'], ['菌环', '环轮', '环节', '环带', '女裙', '裙子', '裙', '孔环'], ['平角裤', '短裤', '四角裤', '短路', '衬裤', '裤衩'], ['裤子', '女式灯笼裤', '短裤', '灯笼裤'], ['裤子', '裤腿', '裤管'], [], ['衬衣', '衬衫'], ['女衬衫', '宽松短衫', '宽松的上衣'], ['遮盖物', '斗篷', '披风'], ['斗篷', '披肩'], ['涂层', '外层', '外套', '大衣', '短上衣', '外衣'], ['厚重长大衣', '厚外套'], ['厚重长大衣', '厚外套'], ['齿冠', '封套', '夹克', '外皮', '弹壳', '短上衣'], [], ['交往', '联合', '联系', '交际', '领带', '连接物', '平分', '社会交际关系', '连结', '链环', '平局', '结交'], ['袜类', '紧身裤', '男式紧身裤', '软管'], ['袜类'], ['衣服'], ['衣裳', '服饰', '服装', '衣服'], ['华丽的服饰'], ['讼案', '诉讼案', '案', '西装', '套装', '诉讼', '追求', '起诉', '控告', '官司', '求爱', '案件', '诉讼案件'], ['领带'], [], ['宽腰带'], [], [], ['蝴蝶结领带', '蝶形领结'], [], ['袜带'], [], ['女式灯笼裤', '短裤', '灯笼裤', '马裤', '裤子'], ['运动衫', '针织套衫', '毛衣'], ['跨接线', '围巾', '跳线', '工

[[], ['树皮', '三桅帆船'], [], [], [], ['爆炸', '抨击', '谴责', '轰隆声'], [], ['传声器架', '吊杆', '帆杆', '繁荣', '景气', '帆桁'], [], [], [], ['咯', '咯咯'], [], [], [], [], [], ['瓣阀'], [], ['不和', '冲突', '争执', '摩擦', '矛盾'], [], [], ['监禁', '监牢', '监狱'], [], ['咳嗽', '咳', '咳出'], [], ['缺乏', '危急情况', '困境', '艰难局面', '不足', '物资的短缺', '压碎', '粉碎'], ['无人驾驶飞机', '低音部音塞', '无人飞机', '雄蜂'], [], [], [], ['石鲈'], [], [], [], [], ['忙', '繁忙', '忙碌'], ['海鸥', '喵'], [], [], [], [], [], [], [], [], [], [], ['轻拍', '拍击', '怨', '轻敲', '轻打'], [], [], [], ['疤痕', '擦伤', '擦', '磨损'], [], [], [], [], ['味道', '海洛因', '气味', '滋味'], [], [], ['鼾声', '唿声'], [], ['呆子', '卑劣的家伙', '孬种', '蠢货', '混蛋', '不要脸的家伙', '下贱人', '无赖', '可恶的家伙', '坏蛋', '混账东西', '唿吸困难', '讨厌的人', '卑鄙的人', '恶棍', '蠢人', '兔崽子', '气绝', '可鄙的人', '狗杂种', '王八蛋', '饭桶', '愚蠢的人', '傻瓜', '笨蛋', '讨厌鬼'], [], [], ['通通'], [], ['海洛因'], [], [], ['代价', '通行费', '价值', '价格', '过桥费', '铃', '成本'], ['喇叭', '小号'], [], [], [], [], [], [], ['笛'], [], [], [], [], [], ['听觉', '音', '鸣', '声音信号'], ['随机性', '无序性', '噪音'], ['轰隆声']]
[['分遣', '分派', '派遣'], [], [

[[], ['犬吠', '吠', '汪汪叫'], [], ['吼', '咆哮'], [], ['研磨', '磨碎', '磨'], ['起潺潺声', '发汩汩声', '作汩汩声'], [], ['啼'], ['啼'], ['咯咯', '咯'], [], [], ['翘辫子', '死亡', '去世', '消逝', '死去'], [], [], ['哭泣', '大叫', '喊', '叫喊', '哭', '鸣', '悲叹', '唿喊', '尖叫', '鸣唱', '叫'], ['嗡嗡作声', '嗡嗡叫', '嗡嗡响'], ['气促', '喘息', '气喘吁吁', '喘气'], ['使发出刺耳的声音', '发出刺耳的摩擦声', '刮出刺耳声', '发刺耳声地摩擦'], ['诉冤', '呻吟'], [], ['哼'], ['作汩汩声', '发汩汩声', '潺潺而流', '起潺潺声'], ['发出嘶嘶声'], [], [], ['诉冤', '呻吟'], [], ['发出嗖嗖声', '飕飕作声', '作唿唿声', '嗡嗡转动', '发出嗡嗡声', '发飕飕声'], ['轻打', '轻敲'], [], ['喋喋不休地说', '喋喋不休'], ['大声叫喊', '吼', '咆哮'], ['低沉地说', '发隆隆声', '辘辘响', '使隆隆响'], ['唿啸', '大嚷', '大叫', '喊', '叫喊', '尖叫着说', '唿喊', '尖叫', '尖声地说', '叫', '嗷叫', '叫着说'], ['嘎嘎作响', '吱吱叫'], [], [], ['咆哮', '使缠结', '打', '纠缠', '使困惑', '使混乱', '吃', '吼叫'], ['哼着鼻子'], [], ['发噼啪声'], [], ['嘎嘎作响', '吱吱叫'], ['供认'], ['轰隆隆地移动', '轰隆地响', '发出隆隆声', '打雷', '发隆隆声'], [], [], [], [], [], [], ['喘息'], [], ['嘎嘎作响', '吱吱叫'], ['哮咳'], ['大嚷', '大叫', '喊', '叫喊', '尖叫着说', '唿喊', '尖叫', '尖声地说', '叫', '嗷叫', '叫着说'], []]
[['明明白白', '显然', '明显', '显而易见', '无疑', '显着'],

[[], ['挤', '填满', '挟', '挤向', '使卡住', '塞满', '挤入', '阻', '吃', '蜂拥进入'], ['打下', '调情的注意', '碰撞', '击', '攻', '打击', '抵达', '杀', '击打', '按', '碰上', '杀害', '撞击', '冲撞', '撞倒', '碰击', '谋杀', '达到', '撞', '残杀', '冲击', '敲', '打', '到达', '偶然碰上', '击中', '使撞击'], ['伤害', '产生剧痛', '疼', '伤', '使受伤', '刺痛', '剧痛', '疼痛', '受痛苦', '痛', '伤痛'], ['伤害', '伤', '致伤', '损害', '受伤', '使受伤', '击伤'], ['揭发', '终止', '进行', '减轻', '使戒除', '使降级', '断绝', '推翻', '陷落', '放弃', '破碎', '停止', '分离', '毁坏', '发生', '使降等', '崩落', '散去', '露出', '使放弃', '违法', '使不能成立', '中断', '使毁灭', '崩溃', '演变成', '倒塌', '透露', '坏了', '切断', '结束', '戒除', '犯罪', '违反', '散开', '倒坍', '缓冲', '用坏', '打断', '中止', '出现', '解', '解体', '使中止', '闯入', '砸', '使去掉', '破坏', '休息时间', '碎', '使中断', '暴露', '打破', '分开', '消散', '垮掉', '显现', '降低', '突然逃跑', '使降低地位', '暂停', '打', '脱离', '揭露', '泄露', '毁灭', '非法进入', '突然改变方向', '遁道', '衰减', '减少', '妨碍'], [], ['使或变的紧张', '控', '紧张起来', '勉强', '澄', '紧张'], ['折曲', '搓成', '弄弯', '捻', '拧', '弯曲', '扭动', '扭曲', '使弯曲', '捻成', '缠绕', '蠕动', '扭', '搓', '盘绕', '卷绕'], ['划船', '拉出', '划行', '行驶', '做错事', '拖', '取出', '开动', '拉', '拔出', '牵

[[], ['反复地打', '劳', '痛击', '逃税', '拍动', '逃单', '咚咚地敲', '跳动', '打成', '超过', '滴答响', '打败', '好于', '敲打', '征服', '艰难地前进', '直射', '拍打', '扑打', '扑动', '发出滴答声', '打', '赛过', '搏动', '轻敲', '胜过', '剧烈搅拌'], ['烧开', '熬', '汽化', '煮沸', '沸腾', '煮', '煮开'], ['灸', '灼', '使用', '容光焕发', '燃', '用烙器灼', '用烙器烧', '发红', '发热', '烧毁', '烧伤', '刺痛', '烧香灰', '烧光', '发光', '烧灼', '燃烧', '烧死', '灼烧', '烧', '刺'], ['强制', '胁迫', '强迫', '威胁'], ['协作', '联手', '联合', '结合'], ['挤', '痛击', '榨', '禁止', '压迫', '打败', '抑制', '压榨', '征服', '压抑'], ['剪', '缺席', '剪下', '理', '浓缩', '切', '删节', '杀', '缩短', '变淡', '精简', '割', '剪下来', '冲淡', '对付', '削', '突然转向', '削减', '裁', '做', '卸', '不闻不问', '减少', '降低', '稀释', '跳过', '略过'], ['片'], ['打'], ['打下', '调情的注意', '碰撞', '击', '攻', '打击', '抵达', '杀', '击打', '按', '碰上', '杀害', '撞击', '冲撞', '撞倒', '碰击', '谋杀', '达到', '撞', '残杀', '冲击', '敲', '打', '到达', '偶然碰上', '击中', '使撞击'], ['抱怨', '发牢骚', '悲叹', '蹴', '踹', '埋怨', '踢'], ['捅', '刺伤', '戳', '用刀切割', '用刀割伤', '用刀弄伤', '刺'], ['打洞', '穿孔于', '戳洞', '用拳勐击', '以拳痛击', '打孔', '拳打', '打眼于'], ['撞', '用力撞', '使毁灭', '推翻', '毁灭', '破坏', '打碎', '勐击', '粉碎'

## Normalization
Consider revision

In [30]:
# #Weight normalization:
# denom = [0] * len(weights_table[0])
# for eng_frame_weights in weights_table:
#         for i in range(len(eng_frame_weights)):
#                 denom[i] += eng_frame_weights[i]
# #print (denom)
# for eng_frame_weights in weights_table:
#         for i in range(len(eng_frame_weights)):
#                 if denom[i] == 0:
#                     eng_frame_weights[i] = 0
#                 else:
#                     eng_frame_weights[i] = eng_frame_weights[i]/denom[i]
# print (weights_table[5])




## Output alignments

In [31]:
f = open("eng_to_chin_best.txt","w+")

num_aligned = 0 # TODO: change name
eng__chin_alignments = {} # A dictionary that holds English and Chinese frame ID mappings.

for eng_ID in range(1, len(weights_table)):
    total_vote_count = 0
    for weight in weights_table[eng_ID]:
        total_vote_count += weight 
#     if total_vote_count == 0:
#         print (0)
#     else:
#         print (max(weights_table[eng_ID])/total_vote_count, max(weights_table[eng_ID]))
    eng_array = np.array(weights_table[eng_ID])
    best_chin_frame_ID = np.argmax(eng_array)
    if max(weights_table[eng_ID]) > 4 and max(weights_table[eng_ID])/total_vote_count > 0.09:   # Establish thresholds for winning vote count and weight distribution.
        if eng_ID in eng_id_to_frame.keys():
            s = "(" + str(eng_ID) + ") " + eng_id_to_frame[eng_ID].name + " ~= (" + str(best_chin_frame_ID) + ") " + chin_id_to_frame[best_chin_frame_ID].name
            print(s)
            f.write(s + "\n")
            num_aligned += 1
            eng__chin_alignments[str(eng_ID)] = str(best_chin_frame_ID)
    else:
        if eng_ID in eng_id_to_frame.keys():  # Skip the gaps in English frame IDs.
            s = "(" + str(eng_ID) + ") No match found for " + eng_id_to_frame[eng_ID].name
            print(s)
            f.write(s + "\n")
            eng__chin_alignments[str(eng_ID)] = '0'  # Set alignment ID to '0' is no match is found.
    
#     print(chin_ID, chin_id_to_frame[chin_ID])
#print (eng__chin_alignments)

f.close()

(5) Causation ~= (116) 因果
(6) Communication ~= (3) 陈述 
(7) Motion ~= (22) 位移
(8) No match found for Perception
(9) No match found for Reciprocality
(10) No match found for Transitive_action
(11) Duplication ~= (122) 行为重启
(12) No match found for Feigning
(13) Cause_to_amalgamate ~= (180) 结合
(15) No match found for Separating
(16) No match found for Body_movement
(17) No match found for Manipulation
(18) Posture ~= (128) 姿势变化
(19) Awareness ~= (88) 思考
(20) Becoming_aware ~= (7) 发现 
(21) Categorization ~= (8) 范畴化
(22) Cogitation ~= (88) 思考
(23) No match found for Coming_to_believe
(24) Differentiation ~= (1) 辨别
(25) Evidence ~= (118) 证明
(26) Expectation ~= (115) 预期
(27) Coming_up_with ~= (42) 发明
(28) Judgment ~= (250) 传达评价
(29) Mental_property ~= (230) 心理刺激
(31) Scrutiny ~= (283) 寻找
(32) Candidness ~= (3) 陈述 
(33) No match found for Commitment
(34) Discussion ~= (3) 陈述 
(35) Encoding ~= (3) 陈述 
(36) No match found for Gesture
(37) No match found for Hearsay
(38) Communication_manner ~= (6

(950) No match found for Law
(960) Being_located ~= (188) 位置
(962) Practice ~= (265) 练习
(964) No match found for Attributes
(965) Measurable_attributes ~= (189) 体型特征
(966) No match found for Speed_description
(967) Taking_time ~= (91) 挑选
(970) No match found for Shaped_part
(971) No match found for Architectural_part
(972) No match found for Age
(973) No match found for People_by_age
(974) No match found for People_by_origin
(978) No match found for Losing_it
(979) Grasp ~= (68) 理解
(981) No match found for Craft
(982) No match found for Idiosyncrasy
(990) No match found for Capability
(1000) No match found for Rest
(1001) No match found for Increment
(1010) No match found for Partitive
(1012) Evoking ~= (13) 记忆
(1015) No match found for Gradable_attributes
(1016) No match found for Aesthetics
(1017) No match found for Noise_makers
(1019) Religious_belief ~= (130) 宗教信仰
(1021) No match found for People_by_religion
(1023) No match found for People_by_jurisdiction
(1024) Halt ~= (105) 行为绝对

(2270) Color_qualities ~= (28) 知觉特征
(2280) No match found for Social_event_individuals
(2281) No match found for Social_event_collective
(2282) No match found for Size
(2284) No match found for Heat_potential
(2285) No match found for Mining
(2286) No match found for Subjective_temperature
(2290) No match found for Time_period_of_action
(2301) No match found for Container_focused_removing
(2302) No match found for Placing_scenario
(2303) No match found for Container_focused_placing
(2320) Cause_bodily_experience ~= (19) 身体感知
(2330) No match found for Tasting
(2340) No match found for Trying_out
(2350) No match found for Opportunity
(2360) No match found for Probability
(2370) No match found for Repayment
(2371) No match found for Bond_maturation
(2380) No match found for Popularity
(2390) No match found for Appellations
(2400) No match found for Exercising
(2411) No match found for Personal_success
(2421) No match found for Rate_description
(2425) No match found for Rate_quantification

In [32]:
#num_aligned

# Evals
## Answer key

In [33]:
# Create gold alignments to map English frame IDs to Chinese frame IDs. The current version contains 70 pairs of frames.
# "0" denotes no alignment.
gold_alignments = {'53': '90', '112': '117', '2971': '35', '69': '6', '135': '13', '1310': '38', '1341': '43', '1152': '108', '117': '210', '1534': '209', '58': '227',
                   '1370': '232', '278': '296', '2800': '307', '299': '0', '72': '120', '2724': '0', '134': '0', '22': '88', '240': '26', '1344': '26', '402': '0', '2831': '0',
                   '2591': '0', '1573': '0', '59': '234', '260': '0', '480': '0', '1348': '0', '2743': '0', '1085': '0', '2719': '0', '2860': '0', '974': '0', '2604': '0', '1615': '0',
                   '51': '0', '1000': '280', '347': '0', '2838': '0', '15': '0', '328': '0', '74': '0', '1090': '0', '2911': '0', '2131': '0', '1731': '0', '1532': '0', '505': '302',
                   '1632': '0', '2890': '0', '342': '0', '1801': '0', '241': '0', '1908': '0', '147': '0', '2350': '0', '1728': '275', '283': '0', '2668': '0', '1130': '0', '2142': '0',
                   '290': '0', '2470': '0', '235': '0', '115': '0', '352': '91', '1542': '264', '1622': '49', '2675': '0'}
print (len(gold_alignments))

70


## Precision, recall and F1

In [34]:
# Compute precision, recall and F1 score on the sample outputs.
sample_alignments = {}
for eng_frame_id in gold_alignments.keys():
    sample_alignments[eng_frame_id] = eng__chin_alignments[eng_frame_id]
#print (sample_alignments)

# Precision over ALL sample frames:
precision_count = 0
for eng_frame_id in sample_alignments.keys():
#     if sample_alignments[eng_frame_id] != '0':
#         print ("(" + eng_frame_id + ") " + str(eng_id_to_frame[int(eng_frame_id)].name) + " ~= " + "(" + sample_alignments[eng_frame_id] + ") " +
#                str(chin_id_to_frame[int(sample_alignments[eng_frame_id])].name))
#     else:
#         print (str(eng_id_to_frame[int(eng_frame_id)].name) + " < no match >")
    if sample_alignments[eng_frame_id] == gold_alignments[eng_frame_id]:
        precision_count += 1
precision = precision_count / len(sample_alignments)
print ('precision = ' + str(precision))
    
# Recall over aligned frames (''no match" cases in the gold alignments are excluded):
recall_num = 0
recall_denom = 0
for eng_frame_id in gold_alignments.keys():
    if gold_alignments[eng_frame_id] != '0':
        recall_denom += 1
        if sample_alignments[eng_frame_id] == gold_alignments[eng_frame_id]:
            recall_num += 1
recall = recall_num / recall_denom
print ('recall = ' + str(recall))

#F1 score:
f1_score = 2*(precision*recall)/(precision+recall)
print ('f1 = ' + str(f1_score))

precision = 0.7428571428571429
recall = 0.68
f1 = 0.7100401606425704
