# PyTorch Tensor Shape Convention

**1.1 2D Tensor(Typical Computer Vision)**

|t| = (batchsize, dim) # 세로, 가로

**1.2 3D Tensor(Typical Computer Vision)**

|t| = (batchsize, width, height) # 세로, 가로, 깊이

**1.3 3D Tensor(Typical Natural Language Processing)**

|t| = (batch size, length, dim) # 세로, 가로, 깊이 

자연어의 경우 : 가로 x 깊이 의 넓이만큼 문장이 존재함

In [1]:
import numpy as np
import torch

## Numpy VS PyTorch Tensor

### 1D Array

#### Numpy

In [2]:
t = np.array([0., 1., 2., 3., 4., 5., 6.])

# ndim : 차원 확인
print('Rank of t : ', t.ndim)

# shape : 형태 확인
print('Shape of t : ', t.shape)

# [] : element 추출
print('t[0] t[1] t[-1] = ', t[0], t[1], t[-1]) 

# [:] : slicing하여 1개 이상의 원소 추출
print('t[2:5] t[4:-1]  = ', t[2:5], t[4:-1])   
print('t[:2] t[3:]     = ', t[:2], t[3:])   

Rank of t :  1
Shape of t :  (7,)
t[0] t[1] t[-1] =  0.0 1.0 6.0
t[2:5] t[4:-1]  =  [2. 3. 4.] [4. 5.]
t[:2] t[3:]     =  [0. 1.] [3. 4. 5. 6.]


#### PyTorch Tensor

In [3]:
t = torch.FloatTensor([0., 1., 2., 3., 4., 5., 6.])
print(t)

# dim : rank
print(t.dim())

# shape, size는 같은 역할
print(t.shape)  
print(t.size()) 

# 데이터 추출
print(t[0], t[1], t[-1])  # Element
print(t[2:5], t[4:-1])    # Slicing
print(t[:2], t[3:])       # Slicing

tensor([0., 1., 2., 3., 4., 5., 6.])
1
torch.Size([7])
torch.Size([7])
tensor(0.) tensor(1.) tensor(6.)
tensor([2., 3., 4.]) tensor([4., 5.])
tensor([0., 1.]) tensor([3., 4., 5., 6.])


### 2D Array

#### Numpy

In [4]:
t = np.array([[1., 2., 3.], [4., 5., 6.], [7., 8., 9.], [10., 11., 12.]])
print(t)

# ndim : 차원 확인
print('Rank  of t: ', t.ndim)

# shape : 형태 확인
print('Shape of t: ', t.shape)

[[ 1.  2.  3.]
 [ 4.  5.  6.]
 [ 7.  8.  9.]
 [10. 11. 12.]]
Rank  of t:  2
Shape of t:  (4, 3)


#### PyTorch Tensor

In [5]:
t = torch.FloatTensor([[1., 2., 3.],
                       [4., 5., 6.],
                       [7., 8., 9.],
                       [10., 11., 12.]
                      ])
print(t)

# rank
print(t.dim())  

# shape, size는 같은 역할
print(t.shape)
print(t.size())

# 데이터 추출
print(t[:, 1])
print(t[:, 1].size())
print(t[:, :-1])

tensor([[ 1.,  2.,  3.],
        [ 4.,  5.,  6.],
        [ 7.,  8.,  9.],
        [10., 11., 12.]])
2
torch.Size([4, 3])
torch.Size([4, 3])
tensor([ 2.,  5.,  8., 11.])
torch.Size([4])
tensor([[ 1.,  2.],
        [ 4.,  5.],
        [ 7.,  8.],
        [10., 11.]])


# Frequently Used Operations in PyTorch

## Broadcasting

In [6]:
# 설명

In [8]:
# same shape
m1 = torch.FloatTensor([[3, 3]])
m2 = torch.FloatTensor([[2, 2]])
print(m1 + m2)

# vector + scalar
m1 = torch.FloatTensor([[1, 2]])
m2 = torch.FloatTensor([3]) # 3 -> [[3, 3]]
print(m1 + m2)

# 2 x 1 vector + 1 x 2 vector
m1 = torch.FloatTensor([[1, 2]])
m2 = torch.FloatTensor([[3],
                        [4]])
print(m1 + m2)

tensor([[5., 5.]])
tensor([[4., 5.]])
tensor([[4., 5.],
        [5., 6.]])


## mul VS matmul

1 ) mul 은 * 와 같은 연산을 한다. broadcasting이 일어나면서 각각의 element끼리 곱해진다.

2 ) matmul은 일반행렬곱과 같다. 행렬곱이 불가능한 상태일때는 수행되지 않는다.

In [9]:
m1 = torch.FloatTensor([[1, 2],
                        [3, 4]]) # 2 x 2

m2 = torch.FloatTensor([[1],
                        [2]])  # 2 x 1

print('shape of Matrix 1 : ' , m1.shape)
print('shape of Matrix 2 : ' , m2.shape)

print(m1.matmul(m2)) # 2 x 2 * 2 x 1 =  2 x 1

# broadcasting이 일어나면서 각각의 element끼리 곱해진다
print(m1 * m2) # 2 x 2
print(m1.mul(m2))

shape of Matrix 1 :  torch.Size([2, 2])
shape of Matrix 2 :  torch.Size([2, 1])
tensor([[ 5.],
        [11.]])
tensor([[1., 2.],
        [6., 8.]])
tensor([[1., 2.],
        [6., 8.]])


### matmu 연산이 불가능한 경우

In [10]:
m1 = torch.FloatTensor([[1, 2],
                        [3, 4]]) # 2 x 2

m2 = torch.FloatTensor([[1, 2]])  # 1 x 2

print(m1.matmul(m2))

RuntimeError: size mismatch, m1: [2 x 2], m2: [1 x 2] at ..\aten\src\TH/generic/THTensorMath.cpp:41

## mean

tensor가 float일 때는 연산이 가능하지만, 정수일 때는 연산이 불가능하다.

In [12]:
t = torch.FloatTensor([2, 4])
print(t.mean())

tensor(3.)


### mean 연산이 불가능한 경우

In [15]:
t = torch.LongTensor([2, 4])
try :
    print(t.mean())
except Exception as exc :
    print(exc)

Can only calculate the mean of floating types. Got Long instead.


### dim에 따른 mean값 구하기

In [18]:
t = torch.FloatTensor([[1, 2],
                       [3, 4]])
print(t)
print('t의 평균 : ', t.mean())



# 각 차원에 대한 평균 구하기
print(t.mean(dim=0)) # 열 평균
print(t.mean(dim=1)) # 행 평균
print(t.mean(dim=-1))

tensor([[1., 2.],
        [3., 4.]])
t의 평균 :  tensor(2.5000)
tensor([2., 3.])
tensor([1.5000, 3.5000])
tensor([1.5000, 3.5000])


## sum

sum은 mean과 다르게 LongTensor로 정의되었어도 연산이 가능하다.

In [20]:
t = torch.FloatTensor([[1, 2],
                       [3, 4]])
print(t)

print(t.sum())

# 차원에 대한 합 구하기
print(t.sum(dim=0)) # 1 + 3, 2 + 4 # 각 열의 합
print(t.sum(dim=1)) # 1 + 2, 3 + 4 # 각 행의 합
print(t.sum(dim=-1)) # 1 + 2, 3 + 4

tensor([[1., 2.],
        [3., 4.]])
tensor(10.)
tensor([4., 6.])
tensor([3., 7.])
tensor([3., 7.])


## max, argmax

max : 최대값 추출

argmax : 최대값이 있는 index 추출

In [26]:
t = torch.FloatTensor([[1, 2],
                       [3, 4]])
print(t)

# 데이터 전체 중 최대값
print('데이터 최댓값 : ', t.max())

tensor([[1., 2.],
        [3., 4.]])
데이터 최댓값 :  tensor(4.)


In [27]:
# 각 차원 중 최대 값
print(t.max(dim=0)) # output : 최대값과 index가 나온다
print(t.max(dim=1))

torch.return_types.max(
values=tensor([3., 4.]),
indices=tensor([1, 1]))
torch.return_types.max(
values=tensor([2., 4.]),
indices=tensor([1, 1]))


In [29]:
# max, argmax
print('Max: ', t.max(dim=0)[0])
print('Argmax: ', t.max(dim=0)[1])

print()
print(t.max(dim=1))
print(t.max(dim=-1))

Max:  tensor([3., 4.])
Argmax:  tensor([1, 1])

torch.return_types.max(
values=tensor([2., 4.]),
indices=tensor([1, 1]))
torch.return_types.max(
values=tensor([2., 4.]),
indices=tensor([1, 1]))


## View, Reshape

In [30]:
t = np.array([[[0, 1, 2],
               [3, 4, 5]],
             [[6, 7, 8],
              [9, 10, 11]]])

ft = torch.FloatTensor(t)
print(ft.shape)

torch.Size([2, 2, 3])


In [31]:
# -1을 제외한 shape에 기준을 둔다.
# 3은 고정값이므로 아래와같이 연산
# ( 2, 2, 3) = ( 2 x 2, 3) = (4 , 3)
print(ft.view([-1, 3]))
print(ft.view([-1, 3]).shape)
# 3개의 열을 무조건 가지고 => 나머지 tensor를 알아서 배열합니다.

tensor([[ 0.,  1.,  2.],
        [ 3.,  4.,  5.],
        [ 6.,  7.,  8.],
        [ 9., 10., 11.]])
torch.Size([4, 3])


In [32]:
print(ft.view([-1, 1, 3]))
print(ft.view([-1, 1, 3]).shape)

tensor([[[ 0.,  1.,  2.]],

        [[ 3.,  4.,  5.]],

        [[ 6.,  7.,  8.]],

        [[ 9., 10., 11.]]])
torch.Size([4, 1, 3])


## Squeeze

squeeze : 한 차원 낮춰준다

어떤 경우에 사용할까 ? 

In [33]:
ft = torch.FloatTensor([[0], [1], [2]])
print(ft)
print(ft.shape)

tensor([[0.],
        [1.],
        [2.]])
torch.Size([3, 1])


In [34]:
print(ft.squeeze(dim = 0))
print(ft.squeeze().shape)
# [ 3, 1 ] => [3]

tensor([[0.],
        [1.],
        [2.]])
torch.Size([3])


In [35]:
print(ft.squeeze(dim = 1))
print(ft.squeeze().shape)
# [ 3, 1 ] => [3]
# shape은 같지만 결과가 다르다.
# squeeze에 dim을 설정하지 않으면 defualt=1로 수행한다.

tensor([0., 1., 2.])
torch.Size([3])


## Unsqueeze

unsqueeze : 한 차원 올려준다.

dim을 반드시 설정해야 한다.

In [36]:
ft = torch.Tensor([0, 1, 2])
print(ft.shape)

torch.Size([3])


In [37]:
print(ft.unsqueeze(0))
print(ft.unsqueeze(0).shape)

tensor([[0., 1., 2.]])
torch.Size([1, 3])


In [38]:
print(ft.unsqueeze(1))
print(ft.unsqueeze(1).shape)

tensor([[0.],
        [1.],
        [2.]])
torch.Size([3, 1])


## Casting

자료형을 변환한다

In [41]:
lt = torch.LongTensor([1, 2, 3, 4])
print(lt)
print(lt.float())

tensor([1, 2, 3, 4])
tensor([1., 2., 3., 4.])


In [42]:
bt = torch.ByteTensor([True, False, False, True])
print(bt)
print(bt.long())
print(bt.float())

tensor([1, 0, 0, 1], dtype=torch.uint8)
tensor([1, 0, 0, 1])
tensor([1., 0., 0., 1.])


## Concatenation

In [43]:
x = torch.FloatTensor([[1, 2],
                       [3, 4]])
y = torch.FloatTensor([[5, 6],
                       [7, 8]])

print(torch.cat([x, y], dim=0)) # 행으로 병합
print(torch.cat([x, y], dim=1)) # 열로 병합

tensor([[1., 2.],
        [3., 4.],
        [5., 6.],
        [7., 8.]])
tensor([[1., 2., 5., 6.],
        [3., 4., 7., 8.]])


## Stacking

In [44]:
x = torch.FloatTensor([1, 4])
y = torch.FloatTensor([2, 5])
z = torch.FloatTensor([3, 6])

In [45]:
# stack default dim = 0
# concat과 다르게 새로운 차원 안에 데이터를 쌓아요
print(torch.stack([x, y, z])) 
print(torch.stack([x, y, z], dim=1))

tensor([[1., 4.],
        [2., 5.],
        [3., 6.]])
tensor([[1., 2., 3.],
        [4., 5., 6.]])


### torch.cat과 비교

In [48]:
torch.cat([x, y, z])

tensor([1., 4., 2., 5., 3., 6.])

In [53]:
# cat으로 stack과 같은 연산을 하기 위해서 unsqueeze를 활용해보자
print(torch.cat([x.unsqueeze(0), y.unsqueeze(0), z.unsqueeze(0)], dim=0))

tensor([[1., 4.],
        [2., 5.],
        [3., 6.]])


## Onew and Zeros

In [54]:
x = torch.FloatTensor([[0, 1, 2],
                       [2, 1, 0]])

# x와 같은 shape이면서 1 또는 0의 값을 갖는 tensor가 생성됩니다
print(torch.ones_like(x))
print(torch.zeros_like(x))

tensor([[1., 1., 1.],
        [1., 1., 1.]])
tensor([[0., 0., 0.],
        [0., 0., 0.]])


## In-place Operation

In [55]:
x = torch.FloatTensor([[1, 2],
                       [3, 4]])
print(x.mul(2.))
print(x)

# x.mul에 _를 붙이면 메모리에 새롭게 선언하지 않고 결과값을 tensor에 넣게된다
# pandas의 dataframe 변경 시, inplace=True와 같은 역할
print(x.mul_(2.))
print(x)

tensor([[2., 4.],
        [6., 8.]])
tensor([[1., 2.],
        [3., 4.]])
tensor([[2., 4.],
        [6., 8.]])
tensor([[2., 4.],
        [6., 8.]])


## zip

동시에 여러개의 리스트를 순환할 수 있다

In [56]:
for x, y in zip([1, 2, 3], [4, 5, 6]):
    print(x, y)
    
for x, y, z in zip([1, 2, 3], [4, 5, 6], [7, 8, 9]):
    print(x, y, z)

1 4
2 5
3 6
1 4 7
2 5 8
3 6 9
