In [27]:
# ENVIORNMENT
# OS : Ubuntu 14.04.5
# Interpreter : Python 3.6.2
# Pytorch version : 0.2.0, gpu version.
# CUDA : 8.0

# 01. Pytorch Basics

Pytorch는 파이썬 기반의 딥러닝 모델 개발을 타겟으로 하는 과학 계산용 패키지 입니다. Pytorch와 같은 딥러닝 라이브러리는 대표적으로 Tensorflow, Caffe, Theano, Chainer 등이 있고, 각각 장단점이 있습니다. 이와같은 라이브러리를 사용하면, GPU의 연산력을 사용하여 빠른 연산을 수행하여 딥러닝 모델을 학습시킬 수 있습니다. Pytorch에는 다음과 같은 장단점이 있습니다.

**장점**
- Numpy 기반의 계산을 GPU의 빠른 연산을 사용하여 처리할 수 있다.
- Tensorflow와 비교했을 떄, Pytorch는 동적 그래프 생성을 이요하여 정적 계산 그래프를 만들 필요 없이, 더 간단하고 유연하게  모델을 구성할 수 있다.
- 활발한 커뮤니티와 포럼(https://discuss.pytorch.org)이 형성되어 있으며, 개발 활동(https://github.com/pytorch) 또한 활발하다. 


** 단점 **
- Tensorflow 보다는 분산 학습 시스템이 좋지 않다. (하지만 Pytorch 에서도 multi-GPU 사용 가능하다.)
- 초보자가 디버깅하기 용이하다.
- 현재, 개발된 모델을 상용화하여 배포할 수단이 마땅치 않다, 그러므로 주로 연구 용도로 쓰인다.(Tensorflow의 경우에는 여러 배포 수단이 마련되어있다.) 

## 0. Import

In [74]:
import torch
import numpy as np

<IPython.core.display.Latex object>

## 1. 텐서(Tensors)

Pytorch에서 텐서란 고차원 데이터의 연산을 위한 데이터타입으로, Numpy의 ndarray와 기본적으로 같은 개념입니다.
그러나 Numpy의 ndarray는 GPU 연산을 적용할 수 없다는 단점이 있습니다. (GPU 연산은 CPU 연산보다 약 50배 정도 빠른 속도를 갖습니다.)
매우 많은 연산량을 요구하는 딥러닝 모델 학습에서는 GPU 연산이 필수적이므로, Pytorch에서는 GPU 연산에 적용 가능한 Tensor 데이터 타입을 사용합니다. 이 Tensor 데이터는 cuda 데이터타입으로 변환시키면, GPU의 고속 연산에 쓰일 수 있습니다.


### 1.1 텐서를 생성하는 여러가지 방법들

In [49]:
# 텐서를 만들어보자.

print("Various ways to create Tensor\n")

# 파이썬 리스트에서 초기화
tensor_from_list = torch.FloatTensor([[1,2,3],[-4,-5,-6]])
print("tensor_from_list : ",tensor_from_list)

# 비어있는 텐서 1
zero_tensor = torch.zeros(2,3)
print("zero_tensor : ",zero_tensor)

# 비어있는 텐서 2
empty_tensor = torch.IntTensor(2,3).zero_()
print("empty tensor: ", empty_tensor)

# 끝에 _(under score)가 붙은 method는 텐서 자체를 변화(mutate)시킨다.
tensor_from_list.abs_()
print("Apply .abs_(): ", tensor_from_list)

# 초기값이 주어지지 않은 텐서는 임의로 초기화된다.
uninitialized_tensor = torch.Tensor(2,3)
print("uninitialized_tensor : ",uninitialized_tensor)

# [0,1) uniform distribution에서 초기화
random_tensor = torch.rand(2,3)
print("random_tensor : ",random_tensor)

# N(0,1) Normal distribution에서 초기화
normal_tensor = torch.randn(2,3)
print("normal_tensor : ",normal_tensor)

# ndarray에서 텐서 생성
ndarr = np.array([[1,2,3],[6,5,4]])
from_numpy_tensor = torch.from_numpy(ndarr)
print("from_numpy_tensor : ", from_numpy_tensor)

# Tensor에서 ndarray 생성
from_tensor_ndarray = from_numpy_tensor.numpy()
print("from_tensor_ndarray : ", from_tensor_ndarray)

Various ways to create Tensor

tensor_from_list :  
 1  2  3
-4 -5 -6
[torch.FloatTensor of size 2x3]

zero_tensor :  
 0  0  0
 0  0  0
[torch.FloatTensor of size 2x3]

empty tensor:  
 0  0  0
 0  0  0
[torch.IntTensor of size 2x3]

Apply .abs_():  
 1  2  3
 4  5  6
[torch.FloatTensor of size 2x3]

uninitialized_tensor :  
-4.1687e+30  4.5602e-41 -4.1687e+30
 4.5602e-41  4.4842e-44  0.0000e+00
[torch.FloatTensor of size 2x3]

random_tensor :  
 0.1137  0.9316  0.9716
 0.6507  0.6547  0.1322
[torch.FloatTensor of size 2x3]

normal_tensor :  
 0.1877 -1.0770  0.5325
 1.4852 -1.2210  0.1852
[torch.FloatTensor of size 2x3]

from_numpy_tensor :  
 1  2  3
 6  5  4
[torch.LongTensor of size 2x3]

from_tensor_ndarray :  [[1 2 3]
 [6 5 4]]


이외에도, 여러가지 방법으로 텐서를 생성해 낼 수 있습니다.

(참고 : http://pytorch.org/docs/master/torch.html?highlight=randn#creation-ops)

### 1.2 텐서 indexing, slicing

numpy의 ndarray을 변화시키는 여러 함수가 정의되어 있듯, Pytorch 에서도 텐서를 변화시키는 다양한 함수가 정의되어 있습니다.

In [48]:
# 텐서를 여러가지 방식으로 변화시켜보자.

X = torch.randn(3,5)
print("Original : ",X)

# Concatenation
concat_tensor_0 = torch.cat((X,X,X),0)
print("Concat through axis 0 :", concat_tensor_0)
concat_tensor_1 = torch.cat((X,X,X),1)
print("Concat through axis 1 : ", concat_tensor_1)

# Chunking
chunk_tensor = torch.chunk(X,3,dim=0)
print("chunk_tensor : ", chunk_tensor)

# Non-zero
eye_tensor = torch.eye(3,3)
nonzero_index = torch.nonzero(eye_tensor)
print("nonzero_index : ", nonzero_index)

# Transpose
trans_tensor = torch.t(X)
print("trans_tensor", trans_tensor)

Original :  
 2.0982  1.6688  0.5680  1.2038 -0.6548
 0.4918  1.5725  1.1214  0.5146 -0.9568
-0.8925  1.5325  1.0058  0.2413 -1.5421
[torch.FloatTensor of size 3x5]

Concat through axis 0 : 
 2.0982  1.6688  0.5680  1.2038 -0.6548
 0.4918  1.5725  1.1214  0.5146 -0.9568
-0.8925  1.5325  1.0058  0.2413 -1.5421
 2.0982  1.6688  0.5680  1.2038 -0.6548
 0.4918  1.5725  1.1214  0.5146 -0.9568
-0.8925  1.5325  1.0058  0.2413 -1.5421
 2.0982  1.6688  0.5680  1.2038 -0.6548
 0.4918  1.5725  1.1214  0.5146 -0.9568
-0.8925  1.5325  1.0058  0.2413 -1.5421
[torch.FloatTensor of size 9x5]

Concat through axis 1 :  

Columns 0 to 9 
 2.0982  1.6688  0.5680  1.2038 -0.6548  2.0982  1.6688  0.5680  1.2038 -0.6548
 0.4918  1.5725  1.1214  0.5146 -0.9568  0.4918  1.5725  1.1214  0.5146 -0.9568
-0.8925  1.5325  1.0058  0.2413 -1.5421 -0.8925  1.5325  1.0058  0.2413 -1.5421

Columns 10 to 14 
 2.0982  1.6688  0.5680  1.2038 -0.6548
 0.4918  1.5725  1.1214  0.5146 -0.9568
-0.8925  1.5325  1.0058  0.2413 -1

### 1.3 텐서 operation

In [72]:
# 텐서에 여러가지 연산을 적용해보자.

A = torch.randn(2,2)
B = torch.randn(2,2)

print("Original A : ", A)
print("Original B : ", B)

# element-wise tensor addition
added_tensor = torch.add(A,B)
print("Added tensor : ",added_tensor)

# Clamping tensor
clamp_tensor = torch.clamp(A, min=-0.5, max=0.5)
print("clamp_tensor : ", clamp_tensor)

# Divide
divide_by_const_tensor = torch.div(A,2)
divide_by_tensor = torch.div(A,B)
print("divide_by_const_tensor : ",divide_by_const_tensor)
print("divide_by_tensor : ",divide_by_tensor)

# Element-wise multiplication
mul_by_const_tensor = torch.mul(A,10)
mul_by_tensor = torch.mul(A,B)
print("mul_by_const_tensor : ",mul_by_const_tensor)
print("mul_by_tensor : ",mul_by_tensor)

# Matrix multiplication
matrix_mul_tensor = torch.mm(A,B)
print("matrix_multiplication : ", matrix_mul_tensor)

# Sigmoid
sigmoid_tensor = torch.sigmoid(A)
print("sigmoid_tensor : ",sigmoid_tensor)

# Summation
sum_tensor = torch.sum(A)
print("sum_tensor : ",sum_tensor)

# Mean, standard diviation
print("Mean : ",torch.mean(A), "std :", torch.std(A))

Original A :  
-1.7592 -0.4082
-0.4311 -0.5325
[torch.FloatTensor of size 2x2]

Original B :  
-1.4949  0.0968
 1.1076  0.5714
[torch.FloatTensor of size 2x2]

Added tensor :  
-3.2540 -0.3114
 0.6764  0.0390
[torch.FloatTensor of size 2x2]

clamp_tensor :  
-0.5000 -0.4082
-0.4311 -0.5000
[torch.FloatTensor of size 2x2]

divide_by_const_tensor :  
-0.8796 -0.2041
-0.2156 -0.2662
[torch.FloatTensor of size 2x2]

divide_by_tensor :  
 1.1768 -4.2175
-0.3893 -0.9318
[torch.FloatTensor of size 2x2]

mul_by_const_tensor :  
-17.5916  -4.0818
 -4.3114  -5.3247
[torch.FloatTensor of size 2x2]

mul_by_tensor :  
 2.6297 -0.0395
-0.4775 -0.3043
[torch.FloatTensor of size 2x2]

matrix_multiplication :  
 2.1776 -0.4035
 0.0547 -0.3460
[torch.FloatTensor of size 2x2]

sigmoid_tensor :  
 0.1469  0.3993
 0.3939  0.3699
[torch.FloatTensor of size 2x2]

sum_tensor :  -3.1309470534324646
Mean :  -0.7827367633581161 std : 0.6531836624473548


이외에도 많은 텐서 연산 함수가 정의되어 있습니다. 어떤 함수가 정의되어 있는지 한 번씩 훑어본다면 나중에 도움이 될 수 있습니다. 

(참고 : http://pytorch.org/docs/master/torch.html?highlight=randn#math-operations)


### Q1.

임의의 행렬 $$ \

$$c = \sqrt{a^2 + b^2}$$
