## 넘파이로 텐서 만들기(벡터와 행렬 만들기)

In [1]:
import numpy as np

Numpy로 텐서 만드는 방법은 간단한데 [숫자, 숫자, 숫자]와 같은 형식으로 만들고 이를 np.array()로 감싸주면 됨. 

### 1) 1D with Numpy

Numpy로 1차원 벡터 만들기

In [2]:
t = np.array([0., 1., 2., 3., 4., 5., 6.])
# 파이썬으로 설명하자면 List를 생성해서 np.array로 1차원 array로 변환. 
print(t)

[0. 1. 2. 3. 4. 5. 6.]


In [3]:
print('Rank of t : ', t.ndim) # 1차원 벡터의 차원 출력
print('Shape of t : ', t.shape) # 1차원 벡터의 크기 출력

Rank of t :  1
Shape of t :  (7,)


- .ndim : 몇 차원인지. 1차원은 벡터, 2차원은 행렬, 3차원은 3차원 텐서
- .shape : 크기. (7,)는 (1, 7)을 의미. 다시 말해 (1 x 7)의 크기를 가지는 벡터

#### 1-1) Numpy 기초 이해하기
이제 Numpy에서 각 벡터의 원소에 접근하는 방법을 알아보자.   
Numpy에서 인덱스는 0부터 시작.

In [5]:
print('t[0] t[1] t[-1] = ', t[0], t[1], t[-1]) # 인덱스를 통한 접근

t[0] t[1] t[-1] =  0.0 1.0 6.0


범위 지정으로도 원소 불러올 수 있음. => 슬라이싱(Slicing)

### 2) 2D with Numpy

In [6]:
t = np.array([[1., 2., 3.], [4., 5., 6.], [7., 8., 9.], [10., 11., 12.]])
print(t)

[[ 1.  2.  3.]
 [ 4.  5.  6.]
 [ 7.  8.  9.]
 [10. 11. 12.]]


In [7]:
print('Rank of t : ', t.ndim)
print('Shape of t : ', t.shape)

Rank of t :  2
Shape of t :  (4, 3)


## 3. 파이토치 텐서 선언하기 (PyTorch Tensor Allocation)
파이토치는 Numpy와 매우 유사. 하지만 더 낫다!! 

In [8]:
import torch

### 1) 1D with PyTorch
파이토치로 1차원 벡터 만들기

In [9]:
t = torch.FloatTensor([0., 1., 2., 3., 4., 5., 6.])
print(t)

tensor([0., 1., 2., 3., 4., 5., 6.])


In [11]:
print(t.dim()) # rank
#print(t.shape()) 
print(t.size())

1
torch.Size([7])


1차원 텐서이며, 원소는 7개.  
인덱스와 슬라이싱으로 접근해보기 

In [12]:
print(t[0], t[1], t[-1])
print(t[2:5], t[4:-1])

tensor(0.) tensor(1.) tensor(6.)
tensor([2., 3., 4.]) tensor([4., 5.])


### 2) 2D with PyTorch

In [17]:
t = torch.FloatTensor([[1., 2., 3.],
                       [4., 5., 6.],
                       [7., 8., 9.],
                       [10., 11., 12.]
                       ])
print(t)

tensor([[ 1.,  2.,  3.],
        [ 4.,  5.,  6.],
        [ 7.,  8.,  9.],
        [10., 11., 12.]])


In [18]:
print(t.dim())
print(t.size())

2
torch.Size([4, 3])


In [19]:
print(t[:, 1]) # 첫번째 차원을 전체 선택한 상황에서 두번째 차원의 첫번째 것ㅁ나 가져온다.
print(t[:, 1].size()) # 위의 경우 크기

tensor([ 2.,  5.,  8., 11.])
torch.Size([4])


즉, 첫번재 차원을 전체 선택한 후, 그 중 두번째 차원의 1번 인덱스 값만을 가져온 경우를 말함.  
다시 말해 텐서에서 두번재 열에 있는 모든 값을 가져온 것.  

### 3) 브로드캐스팅(Broadcasting)
두 행렬 A, B가 있을 때, 행렬의 덧셈과 뺄셈 시에는 두 행렬 A, B의 크기가 같아야 함.  
또한 곱셈 시에는 A의 마지막 차원과 B의 첫번째 차원이 일치해야 함.  

물론, 이런 규칙들이 있으나 딥 러닝에서는 불가피하게 크기가 다른 행렬 또는 텐서에 대해 사칙 연산을 해야할 상황이 생김.  
이를 위해 파이토치에서는 자동으로 크기를 맞춰서 연살 할 수 있게 도와주는 **브로드캐스팅** 이라는 기능을 제공.  

우선 같은 크기일 때 연산을 해보자. 

In [20]:
m1 = torch.FloatTensor([[3, 3]])
m2 = torch.FloatTensor([[2, 2]])
print(m1 + m2)

tensor([[5., 5.]])


이번에는 크기가 다른 텐서들 간의 연산을 보자.  
벡터와 슼라라가 덧셈 연산 시 수학적으로는 안되나 파이토치에서는 브로드캐스팅을 통해 이를 연산

In [22]:
# Vector + scala
m1 = torch.FloatTensor([[1, 2]])
m2 = torch.FloatTensor([3]) # -> [3, 3]
print(m1 + m2)

tensor([[4., 5.]])


m1의 크기는 (1, 2)이며 m2의 크기는 (1,)이다.  
그런데 파이토치는 m2의 크기를 (1, 2)로 변경하여 연산을 수행한다.  

이번에는 벡터 간 연산에서 브로드캐스팅이 적용되는 경우를 살펴보자. 

In [23]:
# 2 x 1 Vector + 1 x 2 Vector
m1 = torch.FloatTensor([[1, 2]])
m2 = torch.FloatTensor([[3], [4]])
print(m1 + m2)

tensor([[4., 5.],
        [5., 6.]])


m1의 크기는 (1, 2), m1의 크기는 (2, 1).  
그러나 파이토치는 두 벡터의 크기를 (2, 2)로 변경하여 수행하였음.  

[1, 2]
==> [[1, 2],
     [1, 2]]
[3]
[4]
==> [[3, 3],
     [4, 4]]

브로드캐스팅은 편리하나 자동으로 실행되는 기능이므로 매우 주의해야 함.  
두 텐서의 크기가 달라 에러가 나면 사용자는 연산이 잘못되었음을 바로 알 수 있으나 브로드캐스팅은 자동으로 수행되므로 사용자는 나중에 원하는 결과가 나오지 않아도 어디서 문제가 발생하였는지 찾기 매우 어려움. 