### 깃 클론

In [None]:
! git clone https://github.com/WegraLee/deep-learning-from-scratch-2.git

Cloning into 'deep-learning-from-scratch-2'...
remote: Enumerating objects: 580, done.[K
remote: Total 580 (delta 0), reused 0 (delta 0), pack-reused 580[K
Receiving objects: 100% (580/580), 29.81 MiB | 40.64 MiB/s, done.
Resolving deltas: 100% (349/349), done.


In [None]:
import os
os.chdir('/content/deep-learning-from-scratch-2')

# 4.3.1  CBOW 구현

In [None]:
import sys
sys.path.append('..')
from common.np import *  # import numpy as np
from common.layers import Embedding
from ch04.negative_sampling_layer import NegativeSamplingLoss


class CBOW:
    def __init__(self, vocab_size, hidden_size, window_size, corpus):
        V, H = vocab_size, hidden_size

        # 가중치 초기화
        W_in = 0.01 * np.random.randn(V, H).astype('f')
        W_out = 0.01 * np.random.randn(V, H).astype('f')

        # 계층 생성
        self.in_layers = []
        for i in range(2 * window_size):
            layer = Embedding(W_in)  # Embedding 계층 사용
            self.in_layers.append(layer)
       
        self.ns_loss = NegativeSamplingLoss(W_out, corpus, power=0.75, sample_size=5)

        # 모든 가중치와 기울기를 배열에 모은다.
        layers = self.in_layers + [self.ns_loss]
        self.params, self.grads = [], []
        for layer in layers:
            self.params += layer.params
            self.grads += layer.grads

        # 인스턴스 변수에 단어의 분산 표현을 저장한다.
        self.word_vecs = W_in


    def forward(self, contexts, target):
        h = 0
        # 입력층 n개의 평균을 h에 저장
        for i, layer in enumerate(self.in_layers):
            h += layer.forward(contexts[:, i])
        h *= 1 / len(self.in_layers)
        loss = self.ns_loss.forward(h, target)
        return loss

    def backward(self, dout=1):
        dout = self.ns_loss.backward(dout)
        dout *= 1 / len(self.in_layers)           #곱노드의 역전파시 순전파에서 곱한 값을 곱해준다.
        for layer in self.in_layers:
            layer.backward(dout)
        return None


# 4.2.2 CBOW 모델 학습 구현 코드

In [None]:
from common import config
# GPU에서 실행하려면 아래 주석을 해제하세요(CuPy 필요).
# ====================
#config.GPU = True
# ===============================================
import pickle
from common.trainer import Trainer
from common.optimizer import Adam
from ch04.cbow import CBOW
from ch04.skip_gram import SkipGram
from common.util import create_contexts_target, to_cpu, to_gpu
from dataset import ptb


# 하이퍼파라미터 설정
window_size = 5
hidden_size = 100
batch_size = 100
max_epoch = 10

# 데이터 읽기
corpus, word_to_id, id_to_word = ptb.load_data('train')
vocab_size = len(word_to_id)

contexts, target = create_contexts_target(corpus, window_size)
#if config.GPU:
#    contexts, target = to_gpu(contexts), to_gpu(target)

# 모델 등 생성
model = CBOW(vocab_size, hidden_size, window_size, corpus)
# model = SkipGram(vocab_size, hidden_size, window_size, corpus)
optimizer = Adam()
trainer = Trainer(model, optimizer)

# 학습 시작
trainer.fit(contexts, target, max_epoch, batch_size)
trainer.plot()

# 나중에 사용할 수 있도록 필요한 데이터 저장
word_vecs = model.word_vecs
if config.GPU:
    word_vecs = to_cpu(word_vecs)
params = {}
params['word_vecs'] = word_vecs.astype(np.float16)
params['word_to_id'] = word_to_id
params['id_to_word'] = id_to_word
pkl_file = 'cbow_params.pkl'  # or 'skipgram_params.pkl'
with open(pkl_file, 'wb') as f:
    pickle.dump(params, f, -1)

| 에폭 1 |  반복 1 / 9295 | 시간 0[s] | 손실 4.16
| 에폭 1 |  반복 21 / 9295 | 시간 1[s] | 손실 4.16
| 에폭 1 |  반복 41 / 9295 | 시간 2[s] | 손실 4.15
| 에폭 1 |  반복 61 / 9295 | 시간 4[s] | 손실 4.12
| 에폭 1 |  반복 81 / 9295 | 시간 5[s] | 손실 4.05
| 에폭 1 |  반복 101 / 9295 | 시간 7[s] | 손실 3.93
| 에폭 1 |  반복 121 / 9295 | 시간 8[s] | 손실 3.78
| 에폭 1 |  반복 141 / 9295 | 시간 10[s] | 손실 3.63
| 에폭 1 |  반복 161 / 9295 | 시간 11[s] | 손실 3.50
| 에폭 1 |  반복 181 / 9295 | 시간 12[s] | 손실 3.36
| 에폭 1 |  반복 201 / 9295 | 시간 14[s] | 손실 3.27
| 에폭 1 |  반복 221 / 9295 | 시간 15[s] | 손실 3.18
| 에폭 1 |  반복 241 / 9295 | 시간 17[s] | 손실 3.08
| 에폭 1 |  반복 261 / 9295 | 시간 18[s] | 손실 3.02
| 에폭 1 |  반복 281 / 9295 | 시간 19[s] | 손실 2.96
| 에폭 1 |  반복 301 / 9295 | 시간 21[s] | 손실 2.91
| 에폭 1 |  반복 321 / 9295 | 시간 22[s] | 손실 2.88
| 에폭 1 |  반복 341 / 9295 | 시간 24[s] | 손실 2.85


KeyboardInterrupt: ignored

# 4.3.3 CBOW 모델 평가
** 벡터로 나타내 보기


In [None]:
import sys
sys.path.append('..')
from common.util import most_similar, analogy
import pickle


pkl_file = 'cbow_params.pkl'
# pkl_file = 'skipgram_params.pkl'

with open(pkl_file, 'rb') as f:
    params = pickle.load(f)
    word_vecs = params['word_vecs']
    word_to_id = params['word_to_id']
    id_to_word = params['id_to_word']

# 가장 비슷한(most similar) 단어 뽑기
querys = ['you', 'year', 'car', 'toyota']
for query in querys:
    most_similar(query, word_to_id, id_to_word, word_vecs, top=5)

# 유추(analogy) 작업
print('-'*50)
analogy('king', 'man', 'queen',  word_to_id, id_to_word, word_vecs)
analogy('take', 'took', 'go',  word_to_id, id_to_word, word_vecs)
analogy('car', 'cars', 'child',  word_to_id, id_to_word, word_vecs)
analogy('good', 'better', 'bad',  word_to_id, id_to_word, word_vecs)
