# 4章 Word2vecの高速化

## 4.1.2 Embeddingレイヤの実装

Embeddingレイヤとは、「単語IDに該当する行（ベクトル）」を抜き出すためのレイヤ

In [4]:
import numpy as np
W = np.arange(21).reshape(7,3)
W

array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 6,  7,  8],
       [ 9, 10, 11],
       [12, 13, 14],
       [15, 16, 17],
       [18, 19, 20]])

In [6]:
W[2]

array([6, 7, 8])

pythonで特定の行を抜き出すには、W[i]のように書くだけで良い。

In [10]:
# 複数行の抽出
idx = np.array([1, 0, 3, 0]) # リストに行番号を保存
W[idx]

array([[ 3,  4,  5],
       [ 0,  1,  2],
       [ 9, 10, 11],
       [ 0,  1,  2]])

In [12]:
# Embeddingレイヤの実装例
class Embedding:
    def __init__(self, W):
        self.params = [W]
        self.grads = [np.zeros_like[W]] # 既存の配列の形状（Wの形状）を受け継いで新しい配列を作成
        self.idx = None # 取り出す行を指定する

    def forward(self, idx):
        W, = self.params
        self.idx = idx
        out = W[idx] # 指定された行を取り出す
        return out

    # 逆伝播は前の層から来た出力をそのまま戻すだけ
    def backward(self, dout):
        dW, = self.grads
        dW[...] = 0 # dWの要素を形状を保ったまま0に上書きする

        for i, word_id in enumerate(self.idx):
            np.add.at(dW, self.idx, dout) # 重複したラベルが来た時用に加算処理する
        return None


        

# 4.2.4 多値分類から二値分類へ