In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
import pickle
import pandas as pd
import numpy as np
from mesh_import import mesh
import mesh.affix as affix

  from tqdm.autonotebook import tqdm


In [3]:
affix_analyzer = affix.AffixoidAnalyzer()

In [4]:
len(affix_analyzer.results)

44868

In [5]:
affix_dir = mesh.get_data_dir() / "affix"
affixoids = affix.CkipAffixoids(affix_dir)

In [6]:
affixoids.query("開")

[<Root(Start): 開>, <Root(Start): 開>, <Root(End): 開>, <Root(End): 開>]

In [7]:
affixoids.query("開")[0].example_words

[('VR', '開入'),
 ('VR', '開回'),
 ('VR', '開好'),
 ('VR', '開行'),
 ('VR', '開完'),
 ('VR', '開走'),
 ('VR', '開到'),
 ('VR', '開往'),
 ('VR', '開赴'),
 ('VR', '開進'),
 ('VR', '開遍'),
 ('VR', '開駛'),
 ('VR', '開錯'),
 ('VO', '開車')]

In [8]:
affixoids.query("開")[1].example_words

[('VO', '開傘'),
 ('VO', '開架'),
 ('VO', '開屏'),
 ('VO', '開席'),
 ('VO', '開基'),
 ('VO', '開筆'),
 ('VO', '開源'),
 ('VO', '開摘'),
 ('VO', '開箱'),
 ('VO', '開胡'),
 ('AV', '開映'),
 ('AV', '開唱'),
 ('AV', '開踢'),
 ('AV', '開跳'),
 ('AV', '開舞'),
 ('VR', '開成'),
 ('VR', '開有'),
 ('VV', '開解'),
 ('VV', '開合')]

In [9]:
affixoids.query("開")[2].example_words

[('VR', '叉開'),
 ('VR', '勾開'),
 ('VR', '扔開'),
 ('VR', '列開'),
 ('VR', '弄開'),
 ('VR', '扭開'),
 ('VR', '抓開'),
 ('VR', '抽開'),
 ('VR', '泅開'),
 ('VR', '挖開'),
 ('VR', '炸開'),
 ('VR', '飛開'),
 ('VR', '破開'),
 ('VR', '啄開'),
 ('VR', '帶開'),
 ('VR', '掃開'),
 ('VR', '清開'),
 ('VR', '渲開'),
 ('VR', '裁開'),
 ('VR', '搖開'),
 ('VR', '彈開'),
 ('VR', '撩開'),
 ('VR', '磕開'),
 ('VR', '蓬開'),
 ('VR', '衝開'),
 ('VR', '踏開'),
 ('VR', '鋪開'),
 ('VR', '導開'),
 ('VR', '燒開'),
 ('VR', '辦開'),
 ('VR', '壓開'),
 ('VR', '擠開'),
 ('VR', '斷開'),
 ('VR', '轉開'),
 ('VR', '勸開'),
 ('VR', '觸開'),
 ('VR', '飄開'),
 ('VR', '躍開'),
 ('VR', '撣開')]

In [10]:
affixoids.query("開")[3].example_words

[('VR', '散播開'),
 ('VR', '揭發開'),
 ('VR', '區分開'),
 ('VR', '區隔開'),
 ('VR', '流散開'),
 ('VR', '流傳開'),
 ('VR', '分割開'),
 ('VR', '分散開'),
 ('VR', '伸展開'),
 ('VR', '拆解開'),
 ('VR', '排解開'),
 ('VR', '脫離開'),
 ('VR', '舒鬆開'),
 ('VR', '解剖開'),
 ('VR', '遊盪開'),
 ('VR', '擴展開'),
 ('VR', '笑開'),
 ('VR', '聊開'),
 ('VR', '談開')]

In [11]:
from itertools import chain
from collections import Counter
word_iter = chain.from_iterable(x.example_words for x in affixoids.affixoids)
Counter(x[0] for x in word_iter)

Counter({'prefix': 10390,
         'VR': 10399,
         'VO': 698,
         'VV': 1363,
         'AV': 958,
         'SV': 1,
         'RV': 10,
         'V O': 1,
         'AN': 7,
         'suffix': 21523})

In [14]:
affixoids.query("學")

[<Affix(Prefix): 學>, <Affix(Suffix): 學>]

In [15]:
affixoids.query("學")[0].example_words

[('prefix', '學人'),
 ('prefix', '學力'),
 ('prefix', '學分'),
 ('prefix', '學代'),
 ('prefix', '學刊'),
 ('prefix', '學行'),
 ('prefix', '學系'),
 ('prefix', '學妹'),
 ('prefix', '學姐'),
 ('prefix', '學姊'),
 ('prefix', '學長姊'),
 ('prefix', '學季'),
 ('prefix', '學門'),
 ('prefix', '學則'),
 ('prefix', '學用品'),
 ('prefix', '學苑'),
 ('prefix', '學能'),
 ('prefix', '學務'),
 ('prefix', '學區'),
 ('prefix', '學域'),
 ('prefix', '學統'),
 ('prefix', '學報'),
 ('prefix', '學程'),
 ('prefix', '學雜費'),
 ('prefix', '學號'),
 ('prefix', '學運'),
 ('prefix', '學銜'),
 ('prefix', '學分數'),
 ('prefix', '學潮'),
 ('prefix', '學緣'),
 ('prefix', '學養'),
 ('prefix', '學經歷'),
 ('prefix', '學資歷'),
 ('prefix', '學藝'),
 ('prefix', '學妺')]

In [16]:
affixoids.query("學")[1].example_words

[('suffix', '生化學'),
 ('suffix', '心理學'),
 ('suffix', '生理學'),
 ('suffix', '地理學'),
 ('suffix', '物理學'),
 ('suffix', '倫理學'),
 ('suffix', '病理學'),
 ('suffix', '管理學'),
 ('suffix', '藥理學'),
 ('suffix', '力學'),
 ('suffix', '工學'),
 ('suffix', '王學'),
 ('suffix', '史學'),
 ('suffix', '光學'),
 ('suffix', '佛學'),
 ('suffix', '性學'),
 ('suffix', '武學'),
 ('suffix', '法學'),
 ('suffix', '品學'),
 ('suffix', '紅學'),
 ('suffix', '美學'),
 ('suffix', '哲學'),
 ('suffix', '神學'),
 ('suffix', '商學'),
 ('suffix', '碑學'),
 ('suffix', '詩學'),
 ('suffix', '農學'),
 ('suffix', '電學'),
 ('suffix', '漢學'),
 ('suffix', '數學'),
 ('suffix', '論學'),
 ('suffix', '儒學'),
 ('suffix', '禪學'),
 ('suffix', '績學'),
 ('suffix', '聲學'),
 ('suffix', '藥學'),
 ('suffix', '顯學'),
 ('suffix', '人類學'),
 ('suffix', '女性學'),
 ('suffix', '公關學'),
 ('suffix', '分類學'),
 ('suffix', '心臟學'),
 ('suffix', '主日學'),
 ('suffix', '史前學'),
 ('suffix', '未來學'),
 ('suffix', '民俗學'),
 ('suffix', '民族學'),
 ('suffix', '犯罪學'),
 ('suffix', '生物學'),
 ('suffix', '生態學'),
 ('suffix', '休閒學'),
 ('suffi

In [17]:
affix_analyzer.get_result("學", "形上學")

{'position': 1,
 'prod_morph': 19,
 'prod_pos': [('Na', 19)],
 'meaning': [['學', '学', '教', '，', '的', '國', '究', '有', '亞', '師'],
  ['學', '学', '：', '形', '的', '科', '師', '上', '為', '，'],
  ['學', '学', '形', '讀', '或', '話', '的', '習', '作', '師'],
  ['學', '学', '理', '論', '形', '的', '觀', '法', '解', '上'],
  ['學', '学', '，', '課', '師', '的', '上', '。', '實', '、'],
  ['學', '学', '理', '的', '論', '心', '師', '觀', '亞', '化'],
  ['學', '学', '帝', '師', '教', '國', '來', '院', '的', '，'],
  ['學', '学', '師', '的', '上', '教', '，', '亞', '國', '理'],
  ['學', '学', '，', '的', '、', '理', '師', '之', '論', '上'],
  ['學', '理', '学', '的', '國', '，', '化', '觀', '論', '亞'],
  ['學', '学', '理', '的', '，', '論', '形', '觀', '師', '了'],
  ['學', '学', '的', '上', '國', '理', '亞', '論', '，', '科'],
  ['學', '学', '師', '的', '上', '教', '，', '亞', '國', '理'],
  ['學', '学', '的', '亞', '理', '院', '國', '海', '師', '上'],
  ['學', '学', '理', '，', '的', '論', '與', '、', '了', '。'],
  ['學', '学', '理', '的', '亞', '師', '國', '了', '究', '上'],
  ['學', '学', '理', '的', '亞', '論', '觀', '國', '究', '義'],
  ['學', '

In [18]:
affix_analyzer.get_result("學", "學分")

{'position': 0,
 'prod_morph': 246,
 'prod_pos': [('Na', 246)],
 'meaning': [['學', '課', '部', '学', '專', '大', '讀', '師', '院', '科'],
  ['學', '國', '專', '課', '学', '部', '公', '師', '究', '體'],
  ['學', '專', '課', '國', '学', '之', '讀', '會', '職', '三'],
  ['學', '課', '專', '，', '学', '之', '讀', '的', '國', '大'],
  ['學', '課', '学', '之', '專', '部', '理', '亞', '讀', '，'],
  ['學', '專', '課', '獎', '之', '國', '部', '職', '會', '亞'],
  ['學', '課', '專', '部', '讀', '学', '大', '國', '分', '三'],
  ['學', '部', '課', '專', '分', '究', '之', '成', '三', '学'],
  ['學', '專', '部', '課', '大', '学', '國', '分', '教', '校'],
  ['學', '課', '大', '学', '部', '讀', '國', '專', '校', '區'],
  ['學', '專', '課', '年', '学', '分', '師', '級', '部', '科'],
  ['學', '課', '專', '部', '学', '校', '職', '業', '之', '師'],
  ['學', '課', '学', '部', '專', '，', '級', '大', '為', '分'],
  ['學', '課', '專', '学', '部', '院', '教', '大', '理', '讀'],
  ['學', '讀', '学', '了', '得', '畢', '成', '復', '過', '師'],
  ['學', '課', '学', '讀', '師', '專', '業', '職', '理', '成'],
  ['學', '課', '部', '得', '大', '成', '学', '分', '讀', '了'],
  ['學',