# Cwn Graph Query

In [4]:
%load_ext autoreload
%autoreload 2

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


In [5]:
import pickle
from CwnGraph import CwnBase, CwnAnnotator
from CwnGraph import CwnRelationType

CwnGraph can be installed as a package.
When run first time, prepare cwn_graph.pyobj and install with install_cwn().
After installation, CwnGraph use CWN data in its own home directory, regardless of working directory.

In [6]:
cwn = CwnBase.install_cwn("data/cwn_graph.pyobj")

CWN data installed


In [7]:
cwn = CwnBase()

In [8]:
# this line may take a few seconds
cwn.get_hash()

'6ebdc3'

## Basic Query

In [9]:
lemmas = cwn.find_lemma("電腦")
print(lemmas)

[<CwnLemma: 電腦_1>, <CwnLemma: 電腦化_1>, <CwnLemma: 微電腦_1>]


In [10]:
lemma0 = lemmas[0]
senses = lemma0.senses
print(senses)

[<CwnSense[06613601](電腦): 一種資料處理裝置，能自動接受並儲存、處理輸入的資料，然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。>, <CwnSense[06613602](電腦): 研究或操作電腦的知識。>, <CwnSense[06613603](電腦): 比喻計算或記憶能力很強的人。>]


In [11]:
for sense_x in senses:
    print(sense_x)
    print(sense_x.relations)
    print("--")

<CwnSense[06613601](電腦): 一種資料處理裝置，能自動接受並儲存、處理輸入的資料，然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。>
[('has_facet', <CwnFacet[0661360101](電腦): 普通名詞。電腦的功能，通常包括程式、軟體等。>), ('has_facet', <CwnFacet[0661360102](電腦): 普通名詞。電腦的實體，特別指外表，通常包括螢幕、鍵盤、主機等。>), ('is_synset', <CwnSense[syn_004128](----): >), ('hypernym', <CwnSense[06582901](工具): 工作時必須使用的具有特定功能的器具。>), ('hyponym(rev)', <CwnSense[06582901](工具): 工作時必須使用的具有特定功能的器具。>)]
--
<CwnSense[06613602](電腦): 研究或操作電腦的知識。>
[('is_synset', <CwnSense[syn_016365](----): >)]
--
<CwnSense[06613603](電腦): 比喻計算或記憶能力很強的人。>
[('is_synset', <CwnSense[syn_014518](----): >)]
--


In [10]:
senses[1].data()

{'node_type': 'sense',
 'pos': 'Na',
 'examples': ['小朋友都覺得放假好煩，比上學更累，他們要學<電腦>，上補習班。\r\n',
  '這樣規定豈不是加重學生的負擔？還不如學<電腦>或英文更有實效。\r\n',
  '陶公我在高一時就認為他<電腦>超強的，但是現在我認為muscle你也不差。\r\n'],
 'domain': '',
 'annot': {},
 'def': '研究或操作電腦的知識。'}

In [11]:
cwn.find_senses(lemma="^車$")

[<CwnSense[06665201](車): 在陸地上以輪子行駛的運輸工具。>,
 <CwnSense[06665202](車): 以車子為形象製成的人造物。>,
 <CwnSense[06665203](車): 開放式用於乘載或放置物品的有輪子的工具。>,
 <CwnSense[06665204](車): 相互連結用在軌道上行駛的運輸工具中的一節。>,
 <CwnSense[06665205](車): 計算一車承載物的量的單位。>,
 <CwnSense[06665206](車): 利用機械切削特定物品。>,
 <CwnSense[06665207](車): 大型的紡織機械。>,
 <CwnSense[06665208](車): 利用機器來縫製衣物。>,
 <CwnSense[07021501](車): 姓。>,
 <CwnSense[07021601](車): 象棋遊戲中所使用的棋子之一，走直線。>]

In [12]:
cwn.find_senses(definition="輪子")

[<CwnSense[03027001](輛): 計算有輪子的機械裝置的單位。>,
 <CwnSense[04082906](台): 計算有輪子的機械裝置的單位。>,
 <CwnSense[04153906](臺): 計算有輪子的機械裝置的單位。>,
 <CwnSense[05075709](部): 計算有輪子的機械裝置的單位。>,
 <CwnSense[05131903](輪): 計算輪子的單位。>,
 <CwnSense[05131904](輪): 形狀像輪子的物體。>,
 <CwnSense[06521401](車子): 在陸地上以輪子行駛的運輸工具。>,
 <CwnSense[06552201](汽車): 在陸地上行駛的有四個以上的輪子的運輸工具。>,
 <CwnSense[06665201](車): 在陸地上以輪子行駛的運輸工具。>,
 <CwnSense[06665203](車): 開放式用於乘載或放置物品的有輪子的工具。>,
 <CwnSense[08008101](胎): 輪子外面包覆的環形橡膠製品。為英語tire的音譯。>,
 <CwnSense[09004101](汽): 在陸地上行駛的有四個以上的輪子的運輸工具。>]

In [13]:
cwn.find_senses(examples="學步車")

[<CwnSense[05041401](連): 兩物體在空間上相連。>,
 <CwnSense[06665203](車): 開放式用於乘載或放置物品的有輪子的工具。>]

In [14]:
spend_senses = cwn.find_senses(lemma="花費")
spend_senses[0].facets

[<CwnFacet[0506490101](花費): 消耗後述時間或能量。>,
 <CwnFacet[0506490102](花費): 付出金錢。>,
 <CwnFacet[0506490103](花費): 付出金錢。>]

In [15]:
spend_senses[0].examples

''

In [16]:
spend_senses[0].all_examples()

['總統對中油努力探勘油源所<花費>的心力，表示肯定。',
 '因為資訊實在太多，即使走馬看花，也要<花費>不少時間。',
 '薄薄的一張證明，又不需要<花費>很大人力，卻要索價三百元。',
 '第一階段選擇場址評估約需<花費>一千五百萬元。',
 'IBM相當重視研究開發，每年<花費>在此方面的經費不下數十億美元。',
 '整體經營與制度化，導致包括交通、住宿及其他<花費>的資金，大多未能流入當地社會。',
 '職業訓練是投資，而不是<花費>。',
 '只要有興趣，就不會在乎金錢上的<花費>。',
 '計有卅八宗個案，<花費>金額為四十六萬五千五百廿五元。']

## Annotation

In [13]:
annot = CwnAnnotator(cwn, "seantyh_test")

loading saved session from  annot/cwn_annot_seantyh_test.json


In [14]:
my_lemma = annot.create_lemma("平板")
my_lemma

<CwnLemma: 平板_1>

In [15]:
my_lemma.zhuyin = "ㄆㄧㄥˊ ㄅㄢˇ"
annot.set_lemma(my_lemma)

In [16]:
my_sense = annot.create_sense("一種具有平面螢幕且易攜帶的的電腦裝置")

In [17]:
my_sense

<CwnSense[seantyh_test_000006](----): 一種具有平面螢幕且易攜帶的的電腦裝置>

In [18]:
my_sense.pos = "N"
my_sense.examples = ["蘋果在發表會上推出了新的<平板>。"]
annot.set_sense(my_sense)

In [19]:
annot.V

{'seantyh_test_000001': {'node_type': 'lemma',
  'lemma': '平板',
  'lemma_sno': 1,
  'zhuyin': 'ㄆㄧㄥˊ ㄅㄢˇ',
  'annot': {}},
 'seantyh_test_000002': {'node_type': 'sense',
  'pos': 'N',
  'examples': ['蘋果在發表會上推出了新的<平板>。'],
  'annot': {},
  'def': '一種具有平面螢幕且易攜帶的的電腦裝置'},
 '06613601': {'node_type': 'sense',
  'pos': 'Na',
  'examples': ['大家學著使用<電腦>來處理資料。'],
  'domain': '',
  'annot': {},
  'def': '一種資料處理裝置，能自動接受並儲存、處理輸入的資料，然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。'},
 'seantyh_test_000003': {'node_type': 'lemma',
  'lemma': '平板',
  'lemma_sno': 1,
  'zhuyin': 'ㄆㄧㄥˊ ㄅㄢˇ',
  'annot': {}},
 'seantyh_test_000004': {'node_type': 'sense',
  'pos': 'N',
  'examples': ['蘋果在發表會上推出了新的<平板>。'],
  'domain': '',
  'annot': {},
  'def': '一種具有平面螢幕且易攜帶的的電腦裝置'},
 'seantyh_test_000005': {'node_type': 'lemma',
  'lemma': '平板',
  'lemma_sno': 1,
  'zhuyin': 'ㄆㄧㄥˊ ㄅㄢˇ',
  'annot': {}},
 'seantyh_test_000006': {'node_type': 'sense',
  'pos': 'N',
  'examples': ['蘋果在發表會上推出了新的<平板>。'],
  'domain': '',
  'annot': {},
  'def': '一種

In [20]:
# create_relation(src_id, tgt_id, rel_type)
rel1 = annot.create_relation(senses[0].id, my_sense.id, CwnRelationType.hyponym)
rel2 = annot.create_relation(my_sense.id, senses[0].id, CwnRelationType.hypernym)
print(rel1, rel2)
tablet_has_sense = annot.create_relation(my_lemma.id, my_sense.id, CwnRelationType.has_sense)

<CwnRelation> hyponym: 06613601 -> seantyh_test_000006 <CwnRelation> hypernym: seantyh_test_000006 -> 06613601


In [21]:
annot.E

{('06613601', 'seantyh_test_000002'): {'edge_type': 'hyponym', 'annot': {}},
 ('seantyh_test_000002', '06613601'): {'edge_type': 'hypernym', 'annot': {}},
 ('seantyh_test_000001', 'seantyh_test_000002'): {'edge_type': 'has_sense',
  'annot': {}},
 ('06613601', 'seantyh_test_000004'): {'edge_type': 'hyponym', 'annot': {}},
 ('seantyh_test_000004', '06613601'): {'edge_type': 'hypernym', 'annot': {}},
 ('seantyh_test_000003', 'seantyh_test_000004'): {'edge_type': 'has_sense',
  'annot': {}},
 ('06613601', 'seantyh_test_000006'): {'edge_type': 'hyponym', 'annot': {}},
 ('seantyh_test_000006', '06613601'): {'edge_type': 'hypernym', 'annot': {}},
 ('seantyh_test_000005', 'seantyh_test_000006'): {'edge_type': 'has_sense',
  'annot': {}}}

In [22]:
computer0 = annot.find_lemmas("電腦")[0]
senses_computer = computer0.senses
print(senses_computer[0])

<CwnSense[06613601](電腦): 一種資料處理裝置，能自動接受並儲存、處理輸入的資料，然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。>


In [23]:
senses_computer[0].relations

[('hyponym', <CwnSense[seantyh_test_000002](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>),
 ('hyponym', <CwnSense[seantyh_test_000004](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>),
 ('hyponym', <CwnSense[seantyh_test_000006](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>),
 ('hypernym(rev)', <CwnSense[seantyh_test_000002](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>),
 ('hypernym(rev)', <CwnSense[seantyh_test_000004](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>),
 ('hypernym(rev)', <CwnSense[seantyh_test_000006](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>),
 ('has_facet',
  <CwnSense[06613601](電腦): 一種資料處理裝置，能自動接受並儲存、處理輸入的資料，然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。>),
 ('is_synset', <CwnSense[syn_004128](----): >),
 ('hypernym', <CwnSense[06582901](工具): 工作時必須使用的具有特定功能的器具。>),
 ('has_facet(rev)',
  <CwnSense[06613601](電腦): 一種資料處理裝置，能自動接受並儲存、處理輸入的資料，然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。>),
 ('hyponym(rev)', <CwnSense[06582901](工具): 工作時必須使用的具有特定功能的器具。>)]

In [24]:
senses[0].data()

{'node_type': 'sense',
 'pos': 'Na',
 'examples': '',
 'domain': '',
 'annot': {},
 'def': '一種資料處理裝置，能自動接受並儲存、處理輸入的資料，然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。'}

In [25]:
senses[0].examples = ["大家學著使用<電腦>來處理資料。"]

In [26]:
senses[0].data()

{'node_type': 'sense',
 'pos': 'Na',
 'examples': ['大家學著使用<電腦>來處理資料。'],
 'domain': '',
 'annot': {},
 'def': '一種資料處理裝置，能自動接受並儲存、處理輸入的資料，然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。'}

In [27]:
annot.set_sense(senses[0])

In [28]:
annot.save()

## Load last session

In [29]:
annot2 = CwnAnnotator(cwn, "seantyh_test")
computer0 = annot2.find_lemmas("電腦")[0]
senses_computer = computer0.senses
print(senses_computer[0])
print(senses_computer[0].examples)
print(senses_computer[0].relations)

loading saved session from  annot/cwn_annot_seantyh_test.json
<CwnSense[06613601](電腦): 一種資料處理裝置，能自動接受並儲存、處理輸入的資料，然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。>
['大家學著使用<電腦>來處理資料。']
[('hyponym', <CwnSense[seantyh_test_000002](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>), ('hyponym', <CwnSense[seantyh_test_000004](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>), ('hyponym', <CwnSense[seantyh_test_000006](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>), ('hypernym(rev)', <CwnSense[seantyh_test_000002](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>), ('hypernym(rev)', <CwnSense[seantyh_test_000004](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>), ('hypernym(rev)', <CwnSense[seantyh_test_000006](平板): 一種具有平面螢幕且易攜帶的的電腦裝置>), ('has_facet', <CwnSense[06613601](電腦): 一種資料處理裝置，能自動接受並儲存、處理輸入的資料，然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。>), ('is_synset', <CwnSense[syn_004128](----): >), ('hypernym', <CwnSense[06582901](工具): 工作時必須使用的具有特定功能的器具。>), ('has_facet(rev)', <CwnSense[06613601](電腦): 一種資料處理裝置，能自動接受並儲存、處理輸入的資料，然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。>), ('hyponym(rev)', <CwnSense[06582901](工具): 工作時必須使用的具有特定功能的器具。>)]
