# 3. 텐서 구조체

## 3.1 부동소수점 수의 세계

- 신경망 안에서의 정보 처리는 결국 부동소수점 수로 나타냄
- 그렇기에 실세계의 데이터를 신경망이 연산 가능하도록 인코딩 해야 함
- 또 연산 후 사람이 이해할 수 있게 디코딩해야함

신경망의 중간 단계는 입력값의 특징을 잡고 부동소수점 수의 모음인 동시에 신경망에서 입력이 최종적으로 출력으로 표현되는 방법을 기술하기 위한 수단으로 데이터 구조를 잡아낸다.\
중간 표현값은 부동소수점 수로 이루어져 있고 입력을 특징짓는 동시에 데이터 구조를 잡아내어 신경망 출력과 어떻게 매핑되는지를 설명하는 데 중요한 역할을 한다.

중간 표현값은 입력과 이전 층의 뉴런이 가진 가중치를 조합한 결과임

파이토치에서는 데이터 처리와 저장을 위해 텐서(tensor)라는 기본 자료구조를 제공함\
또는 다차원 배열(multidimensional array)라고도 부른다.

넘파이 배열과 다른점은 GPU 성능 최적화나 분산 실행, 연산 그래프 추적등의 기능을 추가적으로 제공한다.

부동소수점이란 : https://hellvelopment.tistory.com/66

이번장에서 다룰 내용
- 파이토치 텐서 라이브러리(텐서API)
- 텐서 조작 방법
- 데이터가 저장되는 메모리
- 엄청 큰 텐서에 대해 특정 연산을 어떻게 상수 시간안에 수행하는지
- 넘파이와 연동
- GPU 가속 기능

## 3.2 텐서: 다차원 배열

### 3.2.1 파이썬 리스트에서 파이토치 텐서로
- 파이썬 리스트를 이용해 배열을 만들 수 있음
- 리스트 인덱싱, 슬라이싱으로 특정 값을 가져올 수 있음
- 리스트보다 텐서를 이용하는게 이미지, 시계열 데이터, 시퀀스데이터 다룰 때 더 효율적임

In [2]:
a = [1.0, 2.0, 1.0]
a[0]

1.0

### 3.2.2 첫 텐서 만들어보기

In [3]:
import torch

In [5]:
# 값이 1인 크기3인 텐서 생성
a = torch.ones(3)
a

tensor([1., 1., 1.])

In [6]:
# 텐서 인덱싱
a[1]

tensor(1.)

In [8]:
# 인덱스로 텐서 값 변경
a[2] = 3
a

tensor([1., 1., 3.])

겉으로 보기엔 리스트와 동일하나 내부 동작은 완전 다르다.

### 3.2.3 텐서의 핵심

리스트, 튜플 같은 파이썬 객체는 각 요소들을 따로따로 메모리에 할당한다.\
토치텐서, 넘파이배열은 파이썬 객체가 아닌 unboxing된 C언어의 숫자 타입을 포함한 연속적인 메모리가 할당되고 이에 대한 뷰를 제공한다.

기본적으로는 float32 타입

예를 들어 100만개의 float타입 숫자를 1차원 텐서에 넣는다면 400만 바이트의 연속적인 공간과 메타데이터 공간을 조금 더 차지함

## 3.3 텐서 인덱싱

일단 리스트의 인덱싱, 슬라이싱과 동일한 기능을 제공

In [33]:
ts = torch.tensor([1,2,3,4,])

In [34]:
ts.shape

torch.Size([4])

In [35]:
# unsqueeze와 동일함. 1차원을 추가해줌
ts = ts[None]

In [36]:
ts.shape

torch.Size([1, 4])

chapter 4에서 파이토치의 고급 인덱싱(advanced indexing)을 더 알아볼 것이다.

## 3.4 이름이 있는 텐서
**이름 지정해주는 건 아직 실험중인 단계라 정식으로 사용하기는 무리가 있다. 정식 출시를 기다리라는데 언제...?**

img_t 3차원 이미지  텐서를 생각해보자. \
이미지 데이터를 흑백으로 변환한다고 하면 여러 색상별 가중치를 보고 하나의 밝기 값을 뽑는 과정이 된다.

In [38]:
# 이미지 텐서
img_t = torch.randn(3, 5, 5) # channel, row, column
# 가중치 텐서
weights = torch.tensor([0.2126, 0.7152, 0.0722])
# 배치 텐서
batch_t = torch.randn(2, 3, 5, 5)

In [48]:
img_t

tensor([[[-0.3883, -1.0083,  1.3245,  0.2293,  0.3178],
         [ 0.5003, -1.4504,  0.1546, -1.3273,  0.3341],
         [-0.9918,  0.8049,  0.5150,  0.4946,  1.4373],
         [ 0.8230,  2.1907, -0.9102,  0.2400,  0.0719],
         [ 0.3621,  0.9015, -0.0172, -0.7824,  2.0650]],

        [[ 0.1006, -0.5752, -0.6353, -1.1582, -2.1753],
         [ 1.9616, -0.2886,  0.6062, -0.4683,  0.9523],
         [ 0.3351,  0.6980, -0.8549,  0.0943, -0.5400],
         [ 0.0685,  0.4749,  0.2053, -0.2325, -0.7056],
         [-0.4542, -0.1584, -1.5266,  0.1898,  0.6956]],

        [[-0.9123, -0.3582,  0.5612,  0.5559, -1.3900],
         [ 2.0849, -1.3065, -0.0174, -1.3082,  0.2484],
         [-0.0049,  0.1084, -1.2007, -0.1550,  1.1284],
         [ 2.3679,  1.4098, -1.1287,  0.1188, -0.6370],
         [ 0.5963, -1.0513,  0.9985,  0.7952,  0.2859]]])

dimension\
(3, 5, 5)차원이면
- dim=0 : 1번째 차원 (3)   == dim=-3
- dim=1 : 2번째 차원 (5)  == dim=-2
- dim=2 : 3번째 차원 (5)  == dim=-1

In [51]:
img_gray_naive = img_t.mean(-3)
batch_gray_naive = batch_t.mean(-3)
img_gray_naive.shape, batch_gray_naive.shape

(torch.Size([5, 5]), torch.Size([2, 5, 5]))

In [55]:
unsqueezed_weights = weights.unsqueeze(-1).unsqueeze_(-1)
img_weights = (img_t * unsqueezed_weights)
batch_weights = (batch_t * unsqueezed_weights)
img_gray_weighted = img_weights.sum(-3)
batch_gray_weighted = batch_weights.sum(-3)
batch_weights.shape, batch_t.shape, unsqueezed_weights.shape

(torch.Size([2, 3, 5, 5]), torch.Size([2, 3, 5, 5]), torch.Size([3, 1, 1]))

einsum() 함수
- 차원별로 이름을 부여해주는 함수
- 파이썬에서는 점 세 개(...)로 변수명 없이 합을 구하는 브로드캐스팅을 사용함
- 인수가 복잡함

결론은 텐서가 많아지고 연산을 통해 또 다른 텐서가 생기고 하다보면 차원이랑 텐서명하고 막 헷갈려 미쳐돌아가기 시작함\
--> 이름을 부여해주자

tensor, rand같은 텐서 팩토리 함수에 이름으로 사용할 문자열 리스트를 names 인자로 전달할 수 있다.\
https://pytorch.org/docs/stable/named_tensor.html

In [74]:
# names 키워드인자를 지정가능 (torch 1.3이상부터)
weights_named = torch.tensor([0.2126, 0.7152, 0.0722], names=['channels'])
weights_named

tensor([0.2126, 0.7152, 0.0722], names=('channels',))

- 텐서를 먼저 만들고 나중에 이름을 지정하려면 `refine_names`함수 사용
- 텐서 접근 시 인덱싱하듯이 생략 부호 ...을 사용하면 다른 차원은 건드리지 않는다.
- rename함수로도 이름 변경 가능, 이름 지울려면 None을 준다.

In [80]:
img_named = img_t.refine_names(..., 'channels', 'rows', 'columns')
batch_named = batch_t.refine_names(..., 'channels', 'rows', 'columns')
print('img named: ', img_named.shape, img_named.names)
print('batch named: ', batch_named.shape, batch_named.names)

img named:  torch.Size([3, 5, 5]) ('channels', 'rows', 'columns')
batch named:  torch.Size([2, 3, 5, 5]) (None, 'channels', 'rows', 'columns')


텐서 연산을 하기위해서는 텐서간 차원이 같거나 혹은 한쪽이 1차원이라서 브로드캐스팅 될 수 있는지 따져봐야한다.\
이때 이름을 지정해주면 파이토치가 알아서 판단해서 체크해준다.\
차원을 자동으로 정렬해주니는 않아서 align_as 함수를 써서 빠진 차원은 채워주고, 존재하는 차원은 올바른 순서로 바꿔줘야한다.

In [81]:
weights_aligned = weights_named.align_as(img_named)

In [82]:
weights_aligned.shape, weights_aligned.names

(torch.Size([3, 1, 1]), ('channels', 'rows', 'columns'))

차원에 이름을 지정해주었기때문에 dim인자가 있는 함수들에도 차원 이름을 넣어줄 수 있다.

In [86]:
gray_named = (img_named * weights_aligned).sum(dim='channels')
gray_named.shape, gray_named.names

(torch.Size([5, 5]), ('rows', 'columns'))

In [99]:
# 이름이 다른 차원을 결합하려면 오류가 발생
gray_named = (img_named[..., :3] * weights_named).sum('channels')

RuntimeError: Error when attempting to broadcast dims ['channels', 'rows', 'columns'] and dims ['channels']: dim 'columns' and dim 'channels' are at the same position from the right but do not match.

이름 삭제도 가능하다.

In [104]:
gray_named.names

('rows', 'columns')

In [106]:
gray_plain = gray_named.rename(None)
gray_plain.shape, gray_plain.names

(torch.Size([5, 5]), (None, None))

In [107]:
gray_plain

tensor([[-7.6493e-02, -6.5160e-01, -1.3227e-01, -7.3948e-01, -1.5886e+00],
        [ 1.6598e+00, -6.0908e-01,  4.6519e-01, -7.1159e-01,  7.7004e-01],
        [ 2.8466e-02,  6.7819e-01, -5.8859e-01,  1.6137e-01,  8.1711e-04],
        [ 3.9495e-01,  9.0721e-01, -1.2816e-01, -1.0667e-01, -5.3537e-01],
        [-2.0479e-01,  2.4347e-03, -1.0234e+00,  2.6836e-02,  9.5717e-01]])

## 3.5 텐서 요소 타입

파이썬의 데이터 타입은 텐서의 타입으로는 좋지 않다.

- 파이썬의 숫자는 객체이다.
    - 보통 32비트 부동소수점을 쓰는데 파이썬은 참조 카운터까지 만들어 부동소수점 수를 완전한 파이썬 객체로 반환한다.
    - boxing이라 부르는 이 연산은 수를 소량만 저장하는 경우라면 큰 문제가 없지만, 수백만 개가 넘어가면 상당히 비효율적이다.
- 파이썬 리스트는 연속된 객체의 컬렉션이다.
- 파이썬 인터프리터는 최적화를 거치는 컴파일된 코드보다 느리다.
    - 다량의 숫자 데이터 모음에 대한 수학적 연산을 수행하는 일은 C같은 저수준 컴파일을 통해 최적화된 바이너리 코드가 훨씬 빠르다.

넘파이나 토치 텐서같은 전용 데이터 구조를 만든 후 숫자 데이터 연산은 저수준 언어로 효율을 높이도록 구현하고 동시에 고차원 API로 이런 구현을 래핑하여 편리성을 더한다.

성능 최적화를 위해 텐서 내의 모든 객체는 같은 타입의 숫자여야 하고 파이토치는 실행 중 이런 숫자 타입을 계속 추적하고 있어야 한다.

### 3.5.1 dtype으로 숫자 타입 지정하기

텐서를 만들 때 키워드 인자로 dtype을 지정해 줄 수 있다.

| 타입 | 설명 |
| :-- | :-- |
| torch.float32 or torch.float | 32비트 단정밀도 부동소수점 |
| torch.float64 or torch.double | 64비트 배정밀도 부동소수점 |
| torch.float16 or torch.half | 16비트 반정밀도 부동소수점 |
| torch.int8 | 부호 있는 8비트 정수 |
| torch.uint8 | 부호 없는 8비트 정수 |
| torch.int16 or torch.short | 부호 있는 16비트 정수 |
| torch.int32 or torch.int | 부호 있는 32비트 정수 |
| torch.int64 or torch.long | 부호 있는 64비트 정수 | 
| torch.bool | 불리언 |

텐서의 default dtype은 float32 또는 int64이다.

### 3.5.2 모든 경우에 사용하는 dtype

신경망 연산은 대부분 float32를 쓴다.\
float64를 써봐야 모델 정확도 개선도 미미하고, 더 많은 메모리와 시간만 낭비한다.\
반정밀도는 표준 CPU 구현은 찾기 힘들지만 최신 GPU에는 내부에 구현되어 있다. 필요하다면 약간의 정확도를 희생해서 정밀도를 반으로 떨어뜨려 신경망이 차지하는 공간을 줄이는 방식도 가능하다.

### 3.5.3 텐서의 dtype 속성 관리

dtype지정해 텐서 만들기

In [114]:
double_points = torch.ones(10, 2, dtype=torch.double)
short_points = torch.tensor([[1,2], [3,4]], dtype=torch.short)

In [115]:
double_points, double_points.shape, double_points.dtype

(tensor([[1., 1.],
         [1., 1.],
         [1., 1.],
         [1., 1.],
         [1., 1.],
         [1., 1.],
         [1., 1.],
         [1., 1.],
         [1., 1.],
         [1., 1.]], dtype=torch.float64),
 torch.Size([10, 2]),
 torch.float64)

In [116]:
short_points, short_points.shape, short_points.dtype

(tensor([[1, 2],
         [3, 4]], dtype=torch.int16),
 torch.Size([2, 2]),
 torch.int16)

형변환 (캐스팅 메소드 사용)

In [117]:
double_points = torch.zeros(10, 2).double()
short_points = torch.ones(10, 2).short()

In [118]:
double_points, double_points.shape, double_points.dtype

(tensor([[0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.],
         [0., 0.]], dtype=torch.float64),
 torch.Size([10, 2]),
 torch.float64)

In [119]:
short_points, short_points.shape, short_points.dtype

(tensor([[1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1],
         [1, 1]], dtype=torch.int16),
 torch.Size([10, 2]),
 torch.int16)

to메소드를 이용한 형변환
- to메소드를 이용하면 타입 외에도 추가적인 인자를 지정할 수 있다.

In [122]:
double_points = torch.zeros(10, 2).to(torch.double)
short_points = torch.ones(10, 2).to(dtype=torch.short)

여러가지 타입끼리 연산되면 가장 큰 타입으로 자동으로 형변환되어 만들어진다.\
16비트 정수와 64비트 부동소수점끼리하면 float64로 바뀜

# 3.6 텐서 API

대부분의 텐서 연산들은 torch모듈에 있음\
대부분이 텐서 객체의 메소드처럼 호출 할 수 있다.

torch모듈의 메소드로 쓸 수도 있고 tensor객체의 메소드로도 쓸 수 있고

https://pytorch.org/docs/stable/index.html

## 3.7 텐서를 저장소 관점에서 머릿속에 그려보기

텐서 내부 값은 실제로는 torch.Storage 인스턴스로 관리하며 연속적인 메모리 조각으로 할당된 상태다.\
저장 공간을 나타내는 Storage객체의 뷰 역할을 하는게 tensor객체

### 3.7.1 저장 공간 인덱싱
`.storage` 프로퍼티로 접근가능

In [125]:
points = torch.tensor([[4.0, 1.0], [5.0, 3.0], [2.0, 1.0]])
points.storage()

 4.0
 1.0
 5.0
 3.0
 2.0
 1.0
[torch.storage.TypedStorage(dtype=torch.float32, device=cpu) of size 6]

3x2 텐서를 만들었지만 실제로는 크기6인 배열 공간임. 텐서는 주어진 차원 쌍이 실제로 어느 공간에 해당하는지를 알 뿐

### 3.7.2 저장된 값을 수정하기: 텐서 내부 연산

zero_() : 텐서의 모든 요소를 0으로 바꿈

---

method_() : `_`이 붙으면 연산의 결과로 새 텐서가 넘어오는 대신 기존 텐서의 내용이 바뀌는 연산\
밑줄이 없는 메소드들은 원래 텐서는 그대로 두고 새로운 텐서를 만들어 넘겨준다.

In [129]:
a = torch.ones(2,3)
a

tensor([[1., 1., 1.],
        [1., 1., 1.]])

In [127]:
a.zero_()

tensor([[0., 0., 0.],
        [0., 0., 0.]])

In [128]:
a

tensor([[0., 0., 0.],
        [0., 0., 0.]])

## 3.8 텐서 메타데이터: 사이즈, 오프셋, 스트라이드

저장 공간을 인덱스로 접근하기 위해 텐서는 저장 공간에 포함된 몇 가지 명확한 정보, 즉 사이즈(size), 오프셋(offset), 스트라이드(stride)에 의존한다.