# Tensor Manipulation

- Scalar: 우리가 흔히 알고 있는 상수, 하나의 값을 표현. Rank = 0
- Vector: 여러 개의 값을 가진 1차원 데이터. Rank = 1
- Matrix: 행렬, 행과 열로 이루어진 2차원 데이터. Rank = 2
- Tensor: n 차원의 행렬 형태로 표현. scalar는 0차원, vector는 1차원, matrix는 2차원 텐서라고 할 수 있음. Rank = n
- e.g.: 가로, 세로 사이즈가 100인 컬러 이미지(RGB) 1장은 [3, 100, 100]의 3-d tensor로 저장.
    - 만약 위 사진과 같은 사이즈의 이미지가 5장이 있다면, [5, 3, 100, 100]의 4-d tensor로 저장.

In [1]:
import numpy as np
import torch

# 1. Create a Tensor

## 1.1. torch.tensor()

In [2]:
torch.tensor(5) # 0-d tensor = scalar

tensor(5)

In [3]:
torch.tensor([1, 2, 3, 4, 5]) # 1-d tensor = vector

tensor([1, 2, 3, 4, 5])

In [8]:
torch.tensor([[1, 2, 3], [4, 5, 6]]) # 2-d tensor = matrix

tensor([[1, 2, 3],
        [4, 5, 6]])

In [5]:
torch.tensor([[1], [2], [3], [4], [5]]) # 5-d tensor

tensor([[1],
        [2],
        [3],
        [4],
        [5]])

In [6]:
temp_list = [1, 2, 3, 4, 5]
torch.tensor(temp_list) # 1-d tensor = vector

tensor([1, 2, 3, 4, 5])

In [7]:
temp_set = {1, 2, 3, 4, 5}
torch.tensor(temp_list) # 5-d tensor

tensor([1, 2, 3, 4, 5])

In [9]:
temp_tuple = (1, 2, 3, 4, 5)
torch.tensor(temp_tuple) # 5-d tensor

tensor([1, 2, 3, 4, 5])

In [11]:
temp_np_array = np.array(temp_list)
torch.tensor(temp_np_array)

tensor([1, 2, 3, 4, 5])

In [12]:
torch.from_numpy(temp_np_array)

tensor([1, 2, 3, 4, 5])

## 1.2. torch.ones()

In [13]:
torch.ones(3)

tensor([1., 1., 1.])

In [24]:
torch.ones([4, 3])

tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]])

In [23]:
torch.ones([2, 4, 3])

tensor([[[1., 1., 1.],
         [1., 1., 1.],
         [1., 1., 1.],
         [1., 1., 1.]],

        [[1., 1., 1.],
         [1., 1., 1.],
         [1., 1., 1.],
         [1., 1., 1.]]])

## 1.3. torch.zeros()

In [16]:
torch.zeros(3)

tensor([0., 0., 0.])

In [17]:
torch.zeros([3, 3])

tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]])

In [21]:
torch.zeros([3, 4, 5])

tensor([[[0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.]],

        [[0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.]],

        [[0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.]]])

In [28]:
torch.zeros([5, 3, 1, 4])

tensor([[[[0., 0., 0., 0.]],

         [[0., 0., 0., 0.]],

         [[0., 0., 0., 0.]]],


        [[[0., 0., 0., 0.]],

         [[0., 0., 0., 0.]],

         [[0., 0., 0., 0.]]],


        [[[0., 0., 0., 0.]],

         [[0., 0., 0., 0.]],

         [[0., 0., 0., 0.]]],


        [[[0., 0., 0., 0.]],

         [[0., 0., 0., 0.]],

         [[0., 0., 0., 0.]]],


        [[[0., 0., 0., 0.]],

         [[0., 0., 0., 0.]],

         [[0., 0., 0., 0.]]]])

## 1.3. torch.arange()

In [25]:
torch.arange(1, 10)

tensor([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [26]:
torch.arange(22, 10, -1)

tensor([22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11])

In [32]:
torch.arange(10, 22, 2)

tensor([10, 12, 14, 16, 18, 20])

## 1.4. torch.rand()

In [29]:
torch.rand(5)

tensor([0.1522, 0.1697, 0.2454, 0.1852, 0.4975])

In [30]:
torch.rand([5, 5])

tensor([[0.0317, 0.5140, 0.2283, 0.5707, 0.4012],
        [0.6782, 0.3302, 0.7862, 0.8646, 0.0300],
        [0.3528, 0.9690, 0.1262, 0.8522, 0.0647],
        [0.8909, 0.0543, 0.2557, 0.8402, 0.7074],
        [0.7058, 0.0457, 0.3413, 0.3127, 0.7692]])

## 1.5. torch.xxx_like()

In [34]:
a = torch.zeros(5)
torch.ones_like(a)

tensor([1., 1., 1., 1., 1.])

In [35]:
torch.zeros_like(a)

tensor([0., 0., 0., 0., 0.])

In [36]:
torch.rand_like(a)

tensor([0.3496, 0.8052, 0.5345, 0.8157, 0.8720])

# 2. Attribute: shape, dtype, device

## 2.1. Tensor.shape

In [41]:
a = torch.tensor([1, 2, 3, 4, 5])
a.shape

torch.Size([5])

In [42]:
b = torch.tensor(5)
b.shape

torch.Size([])

## 2.2. Tensor.dtype

In [38]:
a.dtype

torch.int64

In [47]:
# pytorch data type
float_tensor = torch.ones([3, 5, 5], dtype = torch.float64)
double_tensor = torch.ones(1, dtype = torch.double)
complex_float_tensor = torch.ones(1, dtype = torch.complex64)
complex_double_tensor = torch.ones(1, dtype = torch.complex128)
int_tensor = torch.ones(1, dtype = torch.int)
long_tensor = torch.ones(1, dtype = torch.long)
uint_tensor = torch.ones(1, dtype = torch.uint8)
bool_tensor = torch.ones(1, dtype = torch.bool)

float_tensor.dtype

torch.float64

In [48]:
float_tensor

tensor([[[1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.]],

        [[1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.]],

        [[1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1.]]], dtype=torch.float64)

## 2.3. Tensor.device

In [46]:
a = torch.arange(1, 6)
a

tensor([1, 2, 3, 4, 5])

In [49]:
a.device

device(type='cpu')

In [51]:
torch.cuda.is_available() # GPU가 NVIDA일 때
# a = torch.arange(1, 6).to('cuda')
# a = torch.arange(1, 6).cuda()

False

In [53]:
# 맥북
print(f"MPS 장치를 지원하도록 build가 되었는가? {torch.backends.mps.is_built()}")
print(f"MPS 장치가 사용 가능한가? {torch.backends.mps.is_available()}") 

MPS 장치를 지원하도록 build가 되었는가? True
MPS 장치가 사용 가능한가? True


In [54]:
device = torch.device('mps:0' if torch.backends.mps.is_available() else 'cpu')

In [66]:
a = torch.arange(1, 6).to('mps')

In [67]:
a.device

device(type='mps', index=0)

# 3. Tensor Aggregation: element wise 연산, min, max, mean

## 3.1. element wise 연산: tensor의 같은 자리 원소들끼리 산술 연산

In [69]:
a = torch.tensor([[1, 2], [3, 4]])
b = torch.tensor([[5, 6], [7, 8]])

print(a + b)
print(a - b)
print(a * b)
print(a / b)

tensor([[ 6,  8],
        [10, 12]])
tensor([[-4, -4],
        [-4, -4]])
tensor([[ 5, 12],
        [21, 32]])
tensor([[0.2000, 0.3333],
        [0.4286, 0.5000]])


In [70]:
print(a.add(b))
print(a.sub(b))
print(a.mul(b))
print(a.div(b))

tensor([[ 6,  8],
        [10, 12]])
tensor([[-4, -4],
        [-4, -4]])
tensor([[ 5, 12],
        [21, 32]])
tensor([[0.2000, 0.3333],
        [0.4286, 0.5000]])


## 3.2. inplace 연산
- 함수 뒤에 _를 붙이면 자기 자신의 값을 바꾸게 됨
- 연산 결과를 반환하면서 동시에 자기 자신의 데이터를 고침

In [71]:
print(a.add(b))
print(a)
print(a.add_(b))
print(a)

tensor([[ 6,  8],
        [10, 12]])
tensor([[1, 2],
        [3, 4]])
tensor([[ 6,  8],
        [10, 12]])
tensor([[ 6,  8],
        [10, 12]])


## 3.3. Tensor.min()
- 가장 작은 값을 반환해줌
- argument로 차원을 넣어주면 해당 차원에서 각각 가장 작은 값들과, 그 값들의 위치를 함께 반환

In [72]:
a = torch.tensor([[3, 1, 4], [2, 4, 5]])
print(a.shape)
print(a.min())
print(a.min(dim = 0))
print(a.min(dim = 1))

torch.Size([2, 3])
tensor(1)
torch.return_types.min(
values=tensor([2, 1, 4]),
indices=tensor([1, 0, 0]))
torch.return_types.min(
values=tensor([1, 2]),
indices=tensor([1, 0]))


## 3.4. Tensor.max()
- 가장 큰 값을 반환해줌
- argument로 차원을 넣어주면 해당 차원에서 각각 가장 작은 값들과, 그 값들의 위치를 함께 반환

In [73]:
a = torch.tensor([[3, 1, 4], [2, 4, 5]])
print(a.shape)
print(a.max())
print(a.max(dim = 0))
print(a.max(dim = 1))

torch.Size([2, 3])
tensor(5)
torch.return_types.max(
values=tensor([3, 4, 5]),
indices=tensor([0, 1, 1]))
torch.return_types.max(
values=tensor([4, 5]),
indices=tensor([2, 2]))


## 3.5. Tensor.mean()

In [76]:
a = torch.FloatTensor([[3, 1, 4], [2, 4, 5]])
print(a.shape)
print(a.mean())
print(a.mean(dim = 0))
print(a.mean(dim = 1))

torch.Size([2, 3])
tensor(3.1667)
tensor([2.5000, 2.5000, 4.5000])
tensor([2.6667, 3.6667])


# 4. Indexing
- 원하는 원소나 영역을 index를 이용하여 선택
- 기존의 numpy, pandas의 indexing과 유사

In [77]:
a = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
a

tensor([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]])

In [78]:
a.shape

torch.Size([3, 3])

In [79]:
a[1][2]

tensor(6)

In [82]:
b = torch.rand([3, 3, 3])
b

tensor([[[0.2845, 0.8323, 0.9317],
         [0.9081, 0.8582, 0.1096],
         [0.8266, 0.6839, 0.2767]],

        [[0.9714, 0.6811, 0.1872],
         [0.6765, 0.9967, 0.8931],
         [0.3137, 0.8512, 0.7679]],

        [[0.9372, 0.5523, 0.9614],
         [0.4622, 0.2742, 0.6311],
         [0.9235, 0.1793, 0.2057]]])

In [85]:
b[0][2][1]

tensor(0.6839)

In [94]:
b[0][1:]

tensor([[0.9081, 0.8582, 0.1096],
        [0.8266, 0.6839, 0.2767]])

# 5. Shaping Operation: reshape, squeeze/unsqueeze, stack, cat
- tensor의 shape, dimension을 조절하는 방법
- 여러 개의 tensor를 합치는 방법

## 5.1. Tensor.reshape()
- 모양을 변경할 수 있음
- 원래 사이즈를 구성하는 각 차원 별 길이 곱으로 표현 가능하다면 변경 가능
- Tensor.shape이 [x, y]라면, 총 input size인 x*y의 값으로 표현할 수 있는 차원의 조합이면 가능

In [96]:
a = torch.rand(2, 4)
a

tensor([[0.0699, 0.6413, 0.7628, 0.3425],
        [0.5178, 0.2197, 0.4988, 0.7831]])

In [97]:
a.shape

torch.Size([2, 4])

In [101]:
a.reshape(8)

tensor([0.0699, 0.6413, 0.7628, 0.3425, 0.5178, 0.2197, 0.4988, 0.7831])

In [99]:
a.reshape(4, 2)

tensor([[0.0699, 0.6413],
        [0.7628, 0.3425],
        [0.5178, 0.2197],
        [0.4988, 0.7831]])

In [100]:
a.reshape(1, 2, 4)

tensor([[[0.0699, 0.6413, 0.7628, 0.3425],
         [0.5178, 0.2197, 0.4988, 0.7831]]])

In [102]:
a.reshape(2, 2, 2)

tensor([[[0.0699, 0.6413],
         [0.7628, 0.3425]],

        [[0.5178, 0.2197],
         [0.4988, 0.7831]]])

In [108]:
a.reshape(-1, 2)

tensor([[0.0699, 0.6413],
        [0.7628, 0.3425],
        [0.5178, 0.2197],
        [0.4988, 0.7831]])

In [109]:
a.reshape(3, 4) # invalid for input size

RuntimeError: shape '[3, 4]' is invalid for input of size 8

## 5.2. Tensor.squeeze()
- 차원의 값이 1인 차원을 제거
- 차원의 값이 1인 차원이 여러 개인 경우, 차원을 지정하면 해당 차원만 제거

In [111]:
a = torch.rand(3, 1, 3)
a

tensor([[[0.4915, 0.6032, 0.6091]],

        [[0.6605, 0.4787, 0.3942]],

        [[0.5514, 0.2440, 0.6173]]])

In [112]:
a.shape

torch.Size([3, 1, 3])

In [116]:
a.squeeze()

tensor([[0.4915, 0.6032, 0.6091],
        [0.6605, 0.4787, 0.3942],
        [0.5514, 0.2440, 0.6173]])

In [115]:
a.squeeze().shape

torch.Size([3, 3])

In [117]:
a = torch.rand(1, 1, 20, 128)
a

tensor([[[[0.4088, 0.2255, 0.2108,  ..., 0.5865, 0.6355, 0.9367],
          [0.5337, 0.3506, 0.4377,  ..., 0.3138, 0.3703, 0.3260],
          [0.8042, 0.5026, 0.2633,  ..., 0.2075, 0.8194, 0.2238],
          ...,
          [0.7065, 0.9733, 0.1617,  ..., 0.4127, 0.4599, 0.4814],
          [0.5030, 0.0991, 0.1068,  ..., 0.4339, 0.4563, 0.6023],
          [0.9391, 0.0638, 0.4760,  ..., 0.5886, 0.6571, 0.5102]]]])

In [118]:
a.shape

torch.Size([1, 1, 20, 128])

In [119]:
a.squeeze()

tensor([[0.4088, 0.2255, 0.2108,  ..., 0.5865, 0.6355, 0.9367],
        [0.5337, 0.3506, 0.4377,  ..., 0.3138, 0.3703, 0.3260],
        [0.8042, 0.5026, 0.2633,  ..., 0.2075, 0.8194, 0.2238],
        ...,
        [0.7065, 0.9733, 0.1617,  ..., 0.4127, 0.4599, 0.4814],
        [0.5030, 0.0991, 0.1068,  ..., 0.4339, 0.4563, 0.6023],
        [0.9391, 0.0638, 0.4760,  ..., 0.5886, 0.6571, 0.5102]])

In [120]:
a.squeeze().shape

torch.Size([20, 128])

In [121]:
b = torch.rand(1, 1, 20, 128)
b.shape

torch.Size([1, 1, 20, 128])

In [129]:
b.squeeze(dim=[1]).shape

torch.Size([1, 20, 128])

## 5.3. Tensor.unsqueeze()
- squeeze() 함수와 반대로 차원의 값이 1인 차원을 추가
- 그래서 어느 차원에 1인 차원을 생성할 지 꼭 명시해야 함

In [131]:
a = torch.arange(1, 13).reshape(3, 4)
a

tensor([[ 1,  2,  3,  4],
        [ 5,  6,  7,  8],
        [ 9, 10, 11, 12]])

In [132]:
a.shape

torch.Size([3, 4])

In [134]:
print(a.unsqueeze(dim = 0))
print(a.unsqueeze(dim = 0).shape)

tensor([[[ 1,  2,  3,  4],
         [ 5,  6,  7,  8],
         [ 9, 10, 11, 12]]])
torch.Size([1, 3, 4])


In [135]:
print(a.unsqueeze(dim = 1))
print(a.unsqueeze(dim = 1).shape)

tensor([[[ 1,  2,  3,  4]],

        [[ 5,  6,  7,  8]],

        [[ 9, 10, 11, 12]]])
torch.Size([3, 1, 4])


In [136]:
print(a.unsqueeze(dim = 2))
print(a.unsqueeze(dim = 2).shape)

tensor([[[ 1],
         [ 2],
         [ 3],
         [ 4]],

        [[ 5],
         [ 6],
         [ 7],
         [ 8]],

        [[ 9],
         [10],
         [11],
         [12]]])
torch.Size([3, 4, 1])


## 5.4. torch.cat()
- 차원의 갯수는 유지되고 해당 차원값이 늘어남
- 합치려는 차원을 제외한 나머지 차원의 경우 두 텐서의 모양이 같아야 함
![image.png](attachment:image.png)

In [137]:
a = torch.rand(5, 24, 50)
b = torch.rand(5, 24, 50)

output1 = torch.cat([a, b], dim = 0) # [M+M, N, K]
print(output1.shape)
output2 = torch.cat([a, b], dim = 1) # [M, N+N, K]
print(output2.shape)
output3 = torch.cat([a, b], dim = 2) # [M, N, K+K]
print(output3.shape)

torch.Size([10, 24, 50])
torch.Size([5, 48, 50])
torch.Size([5, 24, 100])


In [138]:
a = torch.rand(2, 24, 50)
b = torch.rand(5, 24, 50)

output1 = torch.cat([a, b], dim = 0) # [M+M, N, K]
print(output1.shape)
output2 = torch.cat([a, b], dim = 1) # 합치려는 곳은 차원이 달라도 되지만, 아닌 경우 같아야 함
print(output2.shape)

torch.Size([7, 24, 50])


RuntimeError: Sizes of tensors must match except in dimension 1. Expected size 2 but got size 5 for tensor number 1 in the list.

## 5.5. torch.stack()
- tensor를 쌓는 방식으로, 지정하는 차원에 새로운 차원이 생김 = 차원의 갯수가 증가함
- 합치려는 텐서들의 모든 차원의 모양이 같아야 함
![image.png](attachment:image.png)

In [139]:
a = torch.rand(3, 20, 50)
b = torch.rand(3, 20, 50)

output = torch.stack([a, b], dim = 0)
print(output.shape)

torch.Size([2, 3, 20, 50])


In [141]:
print(output)

tensor([[[[0.6502, 0.1173, 0.0638,  ..., 0.4859, 0.3688, 0.6799],
          [0.1973, 0.2569, 0.9042,  ..., 0.0479, 0.6685, 0.6961],
          [0.5073, 0.8196, 0.1054,  ..., 0.7402, 0.8488, 0.2174],
          ...,
          [0.9985, 0.6165, 0.9197,  ..., 0.7664, 0.6399, 0.4976],
          [0.7512, 0.0281, 0.3406,  ..., 0.2123, 0.3064, 0.7544],
          [0.1704, 0.7785, 0.8046,  ..., 0.0668, 0.4242, 0.2553]],

         [[0.7234, 0.6656, 0.1275,  ..., 0.8952, 0.9046, 0.4614],
          [0.3142, 0.0433, 0.3461,  ..., 0.8896, 0.3872, 0.6622],
          [0.5714, 0.8481, 0.7006,  ..., 0.7958, 0.1745, 0.9605],
          ...,
          [0.5783, 0.5347, 0.4352,  ..., 0.7751, 0.8773, 0.9754],
          [0.8755, 0.5032, 0.6635,  ..., 0.2142, 0.8017, 0.2451],
          [0.8379, 0.9539, 0.5524,  ..., 0.2987, 0.0559, 0.9433]],

         [[0.7767, 0.7284, 0.9415,  ..., 0.5199, 0.5083, 0.5449],
          [0.1802, 0.7153, 0.4547,  ..., 0.3512, 0.0676, 0.3826],
          [0.9975, 0.1603, 0.0748,  ..., 0

In [142]:
a = torch.rand(3, 20, 50)
b = torch.rand(3, 20, 50)

output = torch.stack([a, b], dim = 2)
print(output.shape)

torch.Size([3, 20, 2, 50])
