* Pecu https://github.com/pecu/PyTorch_CSX/blob/master/01_PyTorch_Basic/01_TensorDef.ipynb
* 作者: 莫烦 https://morvanzhou.github.io/tutorials/machine-learning/torch/2-02-variable/

In [1]:
import numpy as np

import torch
import torch.nn as nn
from torch.autograd import Variable
import torch.nn.functional as F
import torch.optim as optim

torch.manual_seed(1)

<torch._C.Generator at 0x7f84d675ca50>

# Tensor  &  numpy array
* PyTorch tensor 本質上和 numpy array差不多，可以互相轉換。

In [2]:
list1 = [[3,2,1], [4,5,6]]

# list > numpy:
arr1 = np.array(list1)
print(arr1)


# list > pytorch-tensor
tr1 = torch.FloatTensor(list1)
print(tr1)

[[3 2 1]
 [4 5 6]]

 3  2  1
 4  5  6
[torch.FloatTensor of size 2x3]



In [3]:
# numpy => pytorch tensor
tr2 = torch.from_numpy(arr1) # dtype same as numpy
print(tr2)


# pytorch tensor => numpy
arr2 = tr1.numpy()
print(arr2)


 3  2  1
 4  5  6
[torch.LongTensor of size 2x3]

[[ 3.  2.  1.]
 [ 4.  5.  6.]]


# Pytorch Variable
* 在Torch中的 Variable 就是一個存放可變化數值的位置，裡面值可不停的變化，如果用一個變量進行計算，那結果也是一個同類型的變量。
* 變量計算時，會默默搭建計算圖將所有的計算步驟連接起來，最後進行誤差反向傳遞的時候，一次性將所有變量裡面的微分值都計算出來。

In [4]:
# 先產生數值
tensor = torch.FloatTensor([[1,2],[3,4]])


# 把值放到變數籃子裡 ( requires_grad表示是否參與誤差反向傳播 & 要不要計算梯度 )
variable = Variable(tensor, requires_grad=True)
variable

Variable containing:
 1  2
 3  4
[torch.FloatTensor of size 2x2]

In [5]:
# 變數做計算
v_out = torch.mean(variable * variable)   
print(v_out)

Variable containing:
 7.5000
[torch.FloatTensor of size 1]



In [6]:
v_out.backward() 
print(variable.grad)    # 初始 Variable 的梯度
# v_out = (1/4) * sum(variable * variable)  =>  v_out 對 variable 微分 ＝ 1/2 (variable) #次方下乘,次方減 1

Variable containing:
 0.5000  1.0000
 1.5000  2.0000
[torch.FloatTensor of size 2x2]



In [7]:
# 變數很多運算做不了，可以用 variable.data 取出數值（變成 Tensor）
print(variable.data)  


 1  2
 3  4
[torch.FloatTensor of size 2x2]



# Review: Embedding
* 將一組數字轉成一組向量，且數字與向量嚴格一對一對應。

In [8]:
# 有一組字串
'I love machine learning !'

# 字典化(我們只能處理數字)
word_to_idx = {'I': 0, 'love': 1, 'machine':2, 'learning':3, '!':4}  

# 張量
word_tensor = torch.LongTensor([word_to_idx["I"]])

# 裝進 Variable
word_var = Variable(word_tensor)

# 把這個 Variable 變成一串數字 
embeds = nn.Embedding(1, 10)
word_embed = embeds(word_var)

print(word_embed)

Variable containing:
 0.6614  0.2669  0.0617  0.6213 -0.4519 -0.1661 -1.5228  0.3817 -1.0276 -0.5631
[torch.FloatTensor of size 1x10]



In [9]:
# 一次將一句話向量化(裝在變數裡)
word_tensor = torch.LongTensor([ word_to_idx["I"],
                                 word_to_idx["love"],
                                 word_to_idx["machine"],
                                 word_to_idx["learning"],
                                
                                 word_to_idx["learning"] # 重複
                               ])

# 裝進 Variable
word_var = Variable(word_tensor)

# 把這個 Variable 變成一串數字 
embeds = nn.Embedding(5, 10)
word_embed = embeds(word_var)

print(word_embed)

Variable containing:
-0.8923 -0.0583 -0.1955 -0.9656  0.4224  0.2673 -0.4212 -0.5107 -1.5727 -0.1232
 3.5870 -1.8313  1.5987 -1.2770  0.3255 -0.4791  1.3790  2.5286  0.4107 -0.9880
-0.9081  0.5423  0.1103 -2.2590  0.6067 -0.1383  0.8310 -0.2477 -0.8029  0.2366
 0.2857  0.6898 -0.6331  0.8795 -0.6842  0.4533  0.2912 -0.8317 -0.5525  0.6355
 0.2857  0.6898 -0.6331  0.8795 -0.6842  0.4533  0.2912 -0.8317 -0.5525  0.6355
[torch.FloatTensor of size 5x10]



In [16]:
# 常犯錯誤：

# 把一個 index 改成 6 則超出原本 nn.Embedding(5, 10) [0,1,2,3,5] 的範圍
word_to_ix = {'I': 0, 'love': 1, 'machine':2, 'learning':3, '!':5}  

# 一次將一句話向量化(裝在變數裡)
word_tensor = torch.LongTensor([ word_to_ix["I"],
                                 word_to_ix["love"],
                                 word_to_ix["machine"],
                                 word_to_ix["learning"],
                                 word_to_ix["!"]
                               ])



word_var = Variable(word_tensor)
# 把這個 Variable 變成一串數字 
embeds = nn.Embedding(5, 10)
word_embed = embeds(word_var)

print(word_embed)

RuntimeError: index out of range at /opt/conda/conda-bld/pytorch_1518244421288/work/torch/lib/TH/generic/THTensorMath.c:277

## 順便名詞解釋：
##### 詞向量
詞向量(word vector）是近年在自然語言處理中被廣泛使用的一種技術。一言以蔽之，我們想使用一個向量來表示每一個詞，如此一來，就能把一段由許多詞組成的文句，轉換成一個個詞向量來表示，並把這樣數值化的資料，送到模型裡做後續的應用。

###### one-hot representation 直接表示法：
最直觀的詞表示方法, 把每個詞表示為一個很長的向量，維度是詞表大小，其中大多數元素為0，只有一個維度的值為1代表了當前的詞。<br>
本方式無法表格每個詞的遠近關係。<br>
ex: 上面的 'I' =    [1, 0, 0, 0, 0]
ex: 上面的 'love' = [0, 1, 0, 0, 0]





###### word embedding 結合神經網絡訓練：
透詞直接向量化後去配合模型訓練後，讓模型自己找出最好的向量表示方式。<br>
可以解決one-hot 維度過大的缺點，將原來稀疏的巨大維度壓縮嵌入到一個更小維度的空間。<br>




###### word2vec 語言模型：
Word2Vec是從大量文本語料中學習語義知識的一種模型，目的想衣文本學到更好的向量化表示。<br>
Word2Vec = Continuous Bag Of Words（CBOW）+ k-skip-N-gram <br>
* k-skip-N-gram: 輸入目標詞詞向量，預測出可能的前後詞<br> 
* CBOW: 輸入前後詞(contex word)詞向量，要預測出可能的目標詞(target word)



# Pytorch 兩個函數說明(Attention 會用到)

In [11]:
# Applies a linear transformation to the incoming data: y = Ax + b
m = nn.Linear(5, 10, bias=True)


input = Variable(torch.FloatTensor([1,2,3,4,5]))
output = m(input)
print(output)

Variable containing:
-0.6248
 4.1177
-0.6597
 0.0831
-1.2536
-1.3168
 0.8288
 0.7194
 2.5193
-0.5759
[torch.FloatTensor of size 10]



In [12]:
# torch.bmm(很多矩陣相乘)
batch1 = torch.randn(10, 3, 4) # 10 個 3X4
batch2 = torch.randn(10, 4, 5) # 10 個 4X5


res = torch.bmm(batch1, batch2)
res.size()# 10 個 3X5

torch.Size([10, 3, 5])