## Table of Contents
### 1. What is Embedding Layer
### 2. Embedding Implementation - Scratch
### 3. Embedding Implementation - PyTorch - ``torch.nn.Embedding()``

---

## 1. What is embedding layer?

### Purpose & Role
입력되는 값(보통은 one-hot encoded된 sparse한 정수 vector/matrix)을 dense vector로 mapping하고, 이 dense vector가 다시 neural net의 input으로 들어간다.

이를 통해 sparse하지 않게, 특정 성질(word embedding에서는 각 단어, NCF에서는 user나 item)을 상대적으로 low dimensiond의 dense vector로 바꿔 줄 수 있다는 장점이 있다.


### Usage
* Word Embedding
    - 각 단어들을 n차원의 dense vector로 mapping해준다.
* RecSys - Neural Collaborative Filtering
    - user와 item은 각각 one-hot encoding된 vector로 표현된다. 이들은 embedding 층을 거쳐 각각이 dense한 vector로 표현된다. 이 때,  dense vector의 각 value는 latent factor의 value로 해석 될 수 있다.

---

## 2. Embedding Implementation - Scratch
**Word Embedding Case**

Preprocessing

In [1]:
train_data= 'you need to know how to code'
word_set= set(train_data.split())
vocab= {word: i+2 for i, word in enumerate(word_set)}
vocab['<unk>']= 0
vocab['<pad>']= 1
print(vocab)

{'code': 2, 'how': 3, 'need': 4, 'to': 5, 'you': 6, 'know': 7, '<unk>': 0, '<pad>': 1}


Embedding Table

In [2]:
import torch
embedding_table= torch.FloatTensor([
    [0.0, 0.0, 0.0],
    [0.0, 0.0, 0.0],
    [0.2, 0.9, 0.3],
    [0.1, 0.5, 0.7],
    [0.2, 0.1, 0.8],
    [0.4, 0.1, 0.1],
    [0.1, 0.8, 0.9],
    [0.6, 0.1, 0.1]])

word/sentence to embedding vectors

In [3]:
sample= 'you need to run'.split()
idxes= []

for word in sample:
    try:
        idxes.append(vocab[word])
    except KeyError:
        idxes.append(vocab['<unk>'])
        
idxes= torch.LongTensor(idxes)

look_up= embedding_table[idxes, :]
print(look_up)

tensor([[0.1000, 0.8000, 0.9000],
        [0.2000, 0.1000, 0.8000],
        [0.4000, 0.1000, 0.1000],
        [0.0000, 0.0000, 0.0000]])


---
## 3. Embedding Implementation - PyTorch

same preprocessing

In [4]:
train_data= 'you need to know how to code'
word_set= set(train_data.split())
vocab= {word: i+2 for i, word in enumerate(word_set)}
vocab['<unk>']= 0
vocab['<pad>']= 1
print(vocab)

{'code': 2, 'how': 3, 'need': 4, 'to': 5, 'you': 6, 'know': 7, '<unk>': 0, '<pad>': 1}


``nn.Embedding()``
* ``num_embeddings``: embedding 할 item의 개수 - embedding layer의 row 수 처럼 생각
* ``embedding_dim``: embedding 할 vector의 차원 - embedding layer의 column 수 처럼 생각
* ``padding_idx``: (optional) 해당 index는 embedding 값을 0으로 설정(아래 예시 참고)

In [5]:
import torch.nn as nn
embedding_layer= nn.Embedding(num_embeddings= len(vocab),
                             embedding_dim= 3,
                             padding_idx= 1)

In [6]:
print(embedding_layer.weight)

Parameter containing:
tensor([[-1.0610,  0.6827, -1.1725],
        [ 0.0000,  0.0000,  0.0000],
        [-0.7623,  0.1139,  1.1588],
        [ 0.6956,  0.4195, -0.0237],
        [-1.0562, -1.9752,  0.6914],
        [ 0.1812,  0.6025,  0.1532],
        [ 0.3423, -0.1915, -2.1392],
        [ 0.6244,  0.2271, -0.5618]], requires_grad=True)
