#### Word2Vec 모델 활용 
#### 생성된 Word2Vec 모델 파일 읽어와 실제로 단어 임베딩된 값과 벡터 공간상 유사한 단어들을 확인하는 실습

In [1]:
# Word2Vec 모델 활용 

from gensim.models import Word2Vec 

# 모델 로딩
# Word2Vec 객체 생성 
model = Word2Vec.load('./word2vec/nvmc.model') 
print('corpus_total_words :', model.corpus_total_words) 

# '사랑' 단어로 생성한 단어 임베딩 벡터 
# 모델 학습할 때 설정한 vector_size 하이퍼파라미터 만큼 단어 임베딩 벡터 차원 크기결정
print('사랑 : ', model.wv['사랑']) 

# 단어 유사도 계산 
# gensim 패키지 model.wv.similarity() 함수 호출하면 두 단어 간의 유사도 계산 
print('일요일 = 월요일\t', model.wv.similarity(w1='일요일', w2='월요일')) 
print('안성기 = 배우\t', model.wv.similarity(w1='안성기', w2='배우'))
print('대기업 = 삼성\t', model.wv.similarity(w1='대기업', w2='삼성'))
print('일요일 != 삼성\t', model.wv.similarity(w1='일요일', w2='삼성'))
print('히어로 != 삼성\t', model.wv.similarity(w1='히어로', w2='삼성'))

# 가장 유사한 단어 추출 
# gensim 패키지 model.wv.most_similar() 함수 호출하면 인자로 사용한 단어와 가장 유사한 단어 리스트로 반환.
# 벡터 공간에서 가장 가까운 거리에 있는 단어 반환 
# topn 인자는 반환되는 유사한 단어 수를 의미.
print(model.wv.most_similar('안성기', topn=5))
print(model.wv.most_similar('시리즈', topn=5))

corpus_total_words : 1076899
사랑 :  [ 1.05117284e-01 -5.61056733e-01  2.59262204e-01 -7.89954811e-02
  2.17539489e-01 -1.51002809e-01 -2.92797208e-01  2.61966944e-01
 -2.11621717e-01  1.99567601e-01  1.65059686e-01 -1.60983548e-01
  1.29249707e-01  1.20795593e-02  6.21797256e-02  3.79749507e-01
 -3.25907394e-02 -5.15211280e-03  8.81729946e-02 -2.28114516e-01
  1.71788245e-01  3.71526867e-01 -2.69237071e-01  1.05925977e-01
 -1.15749687e-01 -1.46060988e-01 -4.48328666e-02 -2.64435913e-02
 -3.46578419e-01 -1.25591457e-01 -1.11184437e-02 -2.08312213e-01
 -1.47137165e-01 -2.35152736e-01  2.96372920e-01  2.70349145e-01
  1.01661399e-01 -7.71923885e-02 -1.01667047e-01 -1.43746227e-01
 -1.50680706e-01  7.96779841e-02 -2.40597889e-01 -3.72045726e-01
  3.97346407e-01  1.21259905e-01 -1.66391179e-01 -1.71774238e-01
  1.76648766e-01 -7.64416531e-02  9.60787982e-02 -4.33756948e-01
 -7.69154355e-02 -9.01477635e-02  2.92562187e-01  1.17107421e-01
  3.34723979e-01 -3.49366605e-01  1.71262756e-01 -9.796