![torchman](imgs/torchman.jpg)

이번 차례에는 머신러닝 파이프라인을 살펴보고 데이터를 어떻게 텐서를 통해 표현하는지 살펴보겠습니다  

# Deep learning pipeline

![dlpl](imgs/pipelin.png)

In [1]:
import torch as th

저희가 지금까지 배운 수 체계에는 스칼라, 벡터, 행렬, 텐서가 있었습니다.  
그리고 많은 머신러닝 책에서는 아래와 같이 표기합니다.  
여러 모듈과 메소드를 통해 파이토치에서 어떻게 텐서를 조작하는지 알아보겠습니다  

$${스칼라 : x\quad 0 \ (0차원) \\ 
벡터 : \mathbf x \quad n \ (1차원) \\ 
행렬 : \mathbf X \quad m \times n \ (2차원) \\
텐서 : \mathcal {X} \quad l \times m \times n \times \dots \  (3차원 이상) }$$

먼저 들어가기 앞서서 프로그래밍 초반에 배우는 데이터의 타입을 떠올려보겠습니다.  
대표적으로 다음과 같습니다. 
1. Int  
2. Double  
3. Float  

일반적으로 torch의 여러가지 텐서모듈을 통해 위의 데이터타입을 가지는 텐서를 생성할 수 있습니다 

In [2]:
from torch import tensor
from torch import FloatTensor as ftensor
from torch import DoubleTensor as dtensor

텐서 객체는 다음과 같은 형태로 할당하게 됩니다.  
tensor = tensor(data, dtype=float32, device='cpu')  
텐서 객체를 생성하기 위한 파라미터와 인자는 data, dtype, device가 있습니다.  


## 1. 스칼라

dtype과 device를 지정하지 않으면 자동으로 dtype을 식별하고 device는 cpu로 할당하게 됩니다.   

In [6]:
scalar = tensor(3)
print(scalar)
print(scalar.dtype)
print(scalar.device)

scalar2 = tensor(99.99, dtype=float)
print(scalar2)
print(scalar.dtype)
print(scalar.device)

# 텐서 오브젝트의 dtype과 device는 모두  통일 시켜야한다!
# 즉, 입력 인풋의 데이터 타입과 모델 가중치의 데이터 타입이 같아야 한다.
# 또한, 입력 인풋과 모델 가중치의 계산 장치가 같아야 한다.

tensor(3)
torch.int64
cpu
tensor(99.9900, dtype=torch.float64)
torch.int64
cpu


In [7]:
print(scalar2.item())

# Loss를 plotting 할 떄 많이 사용합니다.

99.99


.item()을 통하여 텐서 객체 내의 단일 스칼라 값을 뽑아낼 수 있습니다. item 메소드는 반드시 스칼라 텐서에서 호출해야 합니다

## 2. 벡터

In [8]:
import numpy as np

In [9]:
# 벡터, 텐서
# numpy 에서 시퀀스 데이터 (리스트, 튜플)을 넣어서 벡터나 텐서를 표현함.
vec = np.array([1, 2, 3, 4])
print(vec)

[1 2 3 4]


data에 들어갈 수 있는 컨테이너는 List, Tuple, Numpy array입니다.  
파이토치에서 텐서 객체를 만드는 방법은 기존의 numpy와 매우 유사합니다.  

In [11]:
vec1 = ftensor([1.0, -1.1, 3.9]) # list input
vec2 = dtensor((1.0, -1.1, 3.9)) # tuple data
vec3 = tensor(np.array([1, 2, 3, 4])) # numpy array input
vec4 = tensor([1.0, -1.1, 3.9], dtype=int)

print(vec1)
print(vec1.dtype)
print(vec2)
print(vec3)
print(vec4)

tensor([ 1.0000, -1.1000,  3.9000])
torch.float32
tensor([ 1.0000, -1.1000,  3.9000], dtype=torch.float64)
tensor([1, 2, 3, 4])
tensor([ 1, -1,  3])


## 3. 행렬

이제 행렬 텐서를 만들어보겠습니다.  
데이터타입을 행렬로 다루기 시작한다면 device를 gpu로 지정하는게 좋습니다.  
이제 데이터를 일일히 생성하기 힘드므로 rand를 사용하겠습니다.  
rand를 잘 활용하기 위해 시드를 고정하겠습니다.  

In [14]:
th.manual_seed(1) # torch.manual_seed(seed) 랜덤 생성 시드를 seed로 고정한다.
mat = th.rand([2, 2], device='cuda:0')
# mat = th.rand([2, 2], device='cpu')
print(mat)
print(mat.device)

# 라인에서 ctrl + c 복사
# ctrl + shift + left  단어검색

tensor([[0.8903, 0.0275],
        [0.9031, 0.5386]], device='cuda:0')
cuda:0


![tensor](imgs/tensor.png)

## 4. 텐서  
이제 3차원 이상의 텐서를 만들어보겠습니다.  

In [25]:
th.manual_seed(2)

# 라인에서 ctrl + / 주석처리
T = th.rand([64, 64, 3], device='cuda:0')
# T = th.rand([64, 64, 3], device='cpu')
T = T * 256
# to() : 텐서 내의 메소드로 원하는 데이터 타입, 원하는 디바이스의 텐서를 반환해준다.
T = T.to(int)
print(T)
print(T.dtype)

# 퀴즈 : T 텐서의 디바이스를 cuda로 변경해서 device를 출력하세요.
T = T.to(device='cuda:0')

tensor([[[108, 212,  86],
         [175, 145, 170],
         [ 10, 227, 245],
         ...,
         [188,   0,  30],
         [207,  70,  78],
         [144, 123,  50]],

        [[218, 141, 185],
         [141, 183, 114],
         [ 52, 164, 160],
         ...,
         [129, 183, 105],
         [234,  67, 211],
         [ 67,  81, 203]],

        [[ 15, 179,  43],
         [114,  60, 197],
         [148, 126,  65],
         ...,
         [ 68, 232,  22],
         [ 16, 235, 169],
         [ 75,  30, 199]],

        ...,

        [[207,  32, 185],
         [212,  29,  94],
         [ 80, 243,  27],
         ...,
         [139, 243,  87],
         [ 88, 131, 156],
         [  1, 125,  34]],

        [[183, 243, 178],
         [100, 254,  53],
         [212, 115, 209],
         ...,
         [150, 250, 103],
         [106, 128, 136],
         [158, 247, 110]],

        [[109,  54, 248],
         [215, 170, 121],
         [156, 129, 136],
         ...,
         [154,  60, 107],
        

# 퀴즈 (Easy)  
1) !nvidia-smi 를 통해 현재 gpu의 메모리 사용량을 확인하세요
2) 크기가 (100, 100, 100)인 3차원 랜덤 텐서를 gpu 메모리에 할당하세요
3) 다시 !nvidia-smi를 통해 gpu 메모리 사용량이 얼마나 늘었는지 계산해보세요

In [17]:
!nvidia-smi

Fri Oct 29 05:16:19 2021       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.73.01    Driver Version: 460.73.01    CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|   0  Tesla K80           On   | 00000000:00:1E.0 Off |                    0 |
| N/A   64C    P0    68W / 149W |    859MiB / 11441MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+---------------------------------------------------------------------------

In [18]:
# 아래의 코드를 치면 하면 gpu를 알 수 있습니다
th.cuda.is_available()
th.cuda.get_device_name(0)

'Tesla K80'

In [22]:
th.manual_seed(2)
T = th.rand([100, 100, 100], device='cuda:0')
# T = th.rand([100, 100, 100], device='cpu')

# 퀴즈! 리스트 컴프리헨션으로 100개의 텐서를 리스트에 넣으세요.
# a = []
# for i in range(100):
#     a.append(T)

a = [th.rand([100, 100, 100], device='cpu') for i in range(200)]

In [23]:
a

[tensor([[[0.6147, 0.3810, 0.6371,  ..., 0.1884, 0.1580, 0.3393],
          [0.3173, 0.4194, 0.0163,  ..., 0.2290, 0.7030, 0.8824],
          [0.1701, 0.1881, 0.2923,  ..., 0.7434, 0.3846, 0.6771],
          ...,
          [0.7768, 0.4471, 0.5403,  ..., 0.0568, 0.2901, 0.4884],
          [0.5162, 0.4743, 0.8506,  ..., 0.6927, 0.0072, 0.7748],
          [0.3817, 0.2500, 0.9313,  ..., 0.4209, 0.8733, 0.2753]],
 
         [[0.2569, 0.1401, 0.8685,  ..., 0.9951, 0.8415, 0.9686],
          [0.6143, 0.3073, 0.9007,  ..., 0.5686, 0.2400, 0.7583],
          [0.9038, 0.1870, 0.3481,  ..., 0.2863, 0.4457, 0.1544],
          ...,
          [0.9716, 0.6627, 0.7946,  ..., 0.9697, 0.3989, 0.5922],
          [0.4969, 0.0662, 0.5834,  ..., 0.4231, 0.2035, 0.5209],
          [0.2005, 0.6369, 0.5223,  ..., 0.5853, 0.3580, 0.2340]],
 
         [[0.5736, 0.2327, 0.7737,  ..., 0.2778, 0.0203, 0.7147],
          [0.9550, 0.4341, 0.4158,  ..., 0.6765, 0.5589, 0.2580],
          [0.7581, 0.4183, 0.6897,  ...,

In [24]:
!nvidia-smi

Fri Oct 29 05:27:46 2021       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.73.01    Driver Version: 460.73.01    CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|   0  Tesla K80           On   | 00000000:00:1E.0 Off |                    0 |
| N/A   81C    P0    80W / 149W |    879MiB / 11441MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+---------------------------------------------------------------------------

# 오늘의 세미나 목표 텐서를 자유자재로 조작하기

but, 나 빼고..ㅠ