# 単語間の演算
単語ベクトルを使って、単語間の演算を行います。

## データの読み込み、及びword2vecによる学習
これまでと同様に、データの読み込み及びword2vecによる学習を行います。

In [1]:
import pickle
from gensim.models import word2vec

with open('wagahai_words.pickle', mode='rb') as f:
    wagahai_words = pickle.load(f)

# print(wagahai_words)

# size : 中間層のニューロン数
# min_count : この値以下の出現回数の単語を無視
# window : 対象単語を中心とした前後の単語数
# iter : epochs数
# sg : CBOWを使うかskip-gramを使うか 0:CBOW 1:skip-gram
model = word2vec.Word2Vec(wagahai_words,
                          vector_size=100,
                          min_count=5,
                          window=5,
                          epochs=20,
                          sg = 0)



## 単語同士の演算
word2vecにより、単語同士の足し算、引き算が可能になります。  
以下は単語同士の演算の例ですが、単語のベクトル同士で演算が行われ、結果に最も近い単語が表示されます。

In [2]:
model.wv.most_similar(positive=["猫", "蜂"])

[('甲', 0.8473480343818665),
 ('庵', 0.8330943584442139),
 ('笹', 0.8268882036209106),
 ('亀', 0.8256972432136536),
 ('巣', 0.8232040405273438),
 ('按', 0.8229126930236816),
 ('鴨', 0.8215996026992798),
 ('匹', 0.8055710792541504),
 ('叮', 0.8024418950080872),
 ('之', 0.7996940612792969)]

positiveは足し合わせる単語のリストです。  
従って、上記は
**猫 + 人間**
を計算しています。

以下では、  
**人間 + 猫 - 夢**  
を演算しています。  

In [3]:
model.wv.most_similar(positive=["蜂", "猫"], negative=["夢"])

[('帽', 0.688755214214325),
 ('玉', 0.6557716131210327),
 ('硝', 0.6545644998550415),
 ('童', 0.6501428484916687),
 ('菓', 0.6467989087104797),
 ('庵', 0.6419408321380615),
 ('河', 0.6379307508468628),
 ('規', 0.635828971862793),
 ('蛮', 0.6288950443267822),
 ('妨', 0.6278883218765259)]

negativeは引く単語のリストです。

## 課題:
以下に示す単語同士の演算を行い、結果に最も近い単語を表示しましょう。  
**教師 - 夢**