# 3장 텐서 구조체 이해하기

- 파이토치 기본 자료구조인 텐서를 이해한다.
- 
텐서를 인덱스로 접근해서 연산한다
- 
다차원 배열 넘파이와 연계해서 다
- 기
성능 개선을 위해 GPU로 연산 처리하기

> 딥러닝 프로세스는 입력을 부동소수점 수로 변환하는 것부터 시작한다. 3장에서는 응용을 들어가기 전에 텐서 를 사용하여 파이토치가 부동소수점 수를 어떻게 다루는지를 알아보자

`-` 부동 소수점 방식이란?

실수는 보통 정수부와 소수부로 나누지만, 가수부와 지수부로 나누어 표현할 수 있다. 부동 소수점 방식은 이렇게 하나의 실수를 가수부와 지수부로 나누어 표현하는 방식이다. 앞서 살펴본 고정 소수점 방식은 제한된 자릿수로 인해 표현할 수 있는 범위가 매우 작다. 하지만 부동 소수점 방식은 다음 수식을 이용하여 매우 큰 실수까지도 표현할 수 있게 된다.

## 부동소수점

- 심층 신경망(deep neural network)은 보통 여러 단계를 거쳐 데이터 변환을 학습한다.
- 중간 단계는 입력값의 특징을 잡아내는 부동소수점 수의 모음인 동시에 신경망에서 입력이 최종적으로 출력으로 표현되는 방법을 기술하기 위한 수단이다.
- 즉, 중간 표현값은 입력과 이전 층의 뉴런이 가진 가중치를 조합한 결과라는 점이다. 중간 단계의 개별 표현은 자신만의 방식으로 앞 단계에서 넘어온 입력을 반환한다.

## 텐서 : 다차원 배열

> 텐서는 일종의 배열이다. 즉, 한개나 여러개의 인덱스를 사용하여 개별적으로 값에 접근할 수 있는 형태의 숫자 모음을 저장하는 자료구조이다.

`-` 텐서의 핵심
- 텐서는 자료구조를 사용해 이미지와 시계열 데이터 혹은 문장들을 나타내는 것이 일반 파이썬 리스트보다 더 효율적이다.

In [2]:
import torch

In [3]:
t = torch.FloatTensor([0., 1., 2., 3., 4., 5., 6.])
print(t) #	1차원 텐서인 벡터를 만든다.

print(t.dim())  # rank. 즉, 차원
print(t.shape)  # shape
print(t.size()) # shape

tensor([0., 1., 2., 3., 4., 5., 6.])
1
torch.Size([7])
torch.Size([7])


- 고급 인덱싱이 가능

In [6]:
print(t[0], t[1], t[-1])  # 인덱스로 접근
print(t[2:5], t[4:-1])    # 슬라이싱
print(t[:2], t[3:])       # 슬라이싱

tensor(0.) tensor(1.) tensor(6.)
tensor([2., 3., 4.]) tensor([4., 5.])
tensor([0., 1.]) tensor([3., 4., 5., 6.])


## 텐서 API

- 텐서끼리의 연산 대부분은 torch모듈 에 존재하며 대부분이 텐서 객체에 대해 메소드처럼 호출할 수 있다.

## 텐서를 저장소 관점으로 생각해보기

- 텐서의 내부 값은 실제로는 torch.Storage인스턴스 로 관리하며 연속적인 메모리 조각으로 할당된 상태이다.
- 저장 공간은 숫자 데이터를 가진 1차원 배열이다.

`-` 여기서 중요한 점은 서로 다른 방식으로 구성된 텐서가 동일한 메모리 공간을 가리키고 있을 수 있으나, 동일한 데이터에 대해 다른 텐서 뷰를 만드는 작업은 Storage 객체가 관리하는 데이터 크기에 상관없이 빠르게 수행된다는 점이다.

- 텐서의 저장공간 접근 확인을 위한 간단한 코드

In [13]:
#텐서 저장 공간 접근
points = torch.tensor([[4.0, 1.0], [5.0, 3.0], [2.0, 1.0]])
points.storage()

 4.0
 1.0
 5.0
 3.0
 2.0
 1.0
[torch.storage.TypedStorage(dtype=torch.float32, device=cpu) of size 6]

In [14]:
#텐서를 거치지 않고 저장 공간을 직접 접근하는 방법 

points_storage = points.storage()
points_storage[0]

4.0

## 텐서 메타데이터 : 사이즈, 오프셋, 스트라이드

> 저장 공간을 인덱스로 접근하기 위해 텐서는 저장 공간에 포함된 몇 가지 명확한 정보, 즉 사이즈(size), 오프셋(offset), 스트라이드(stride) 에 의존한다.

- 사이즈(size) : 텐서의 각 차원 별로 들어가는 요소의 수를 표시한 튜플
- 오프셋(offset) : 텐서의 첫 번째 요소를 가리키는 색인 값과 동일
- 스트라이드(stride) : 각 차원에서 다음 요소를 가리키고 싶을 때 실제 저장 공간상에서 몇 개의 요소를 건너뛰어야하는지를 알려주는 요소

## 텐서 전치하기

In [15]:
points = torch.tensor([[4.0, 1.0], [5.0, 3.0], [2.0, 1.0]])
points

tensor([[4., 1.],
        [5., 3.],
        [2., 1.]])

In [16]:
points.t()

tensor([[4., 5., 2.],
        [1., 3., 1.]])

In [18]:
points.transpose(0,1)

tensor([[4., 5., 2.],
        [1., 3., 1.]])

In [20]:
torch.transpose(points,0,1)

tensor([[4., 5., 2.],
        [1., 3., 1.]])

> 더 높은 차원에서의 전치

In [23]:
# 0과 2 의 차원이 바뀐다
s = torch.ones(2,4,7)
tt = s.transpose(0,2)
tt.shape

torch.Size([7, 4, 2])

## 인접한 텐서

In [25]:
points = torch.tensor([[4.0, 1.0], [5.0, 3.0], [2.0, 1.0]])
points_t = points.t()
points.is_contiguous()

True

In [26]:
points_t.is_contiguous()

False

In [29]:
points

tensor([[4., 1.],
        [5., 3.],
        [2., 1.]])

In [27]:
points.storage()

 4.0
 1.0
 5.0
 3.0
 2.0
 1.0
[torch.storage.TypedStorage(dtype=torch.float32, device=cpu) of size 6]

In [30]:
points_t

tensor([[4., 5., 2.],
        [1., 3., 1.]])

In [31]:
# 인접하지 않은 텐서가 나오는 것을 볼 수 있다
points_t.storage()

 4.0
 1.0
 5.0
 3.0
 2.0
 1.0
[torch.storage.TypedStorage(dtype=torch.float32, device=cpu) of size 6]

In [34]:
ptc = points_t.contiguous()
ptc

tensor([[4., 5., 2.],
        [1., 3., 1.]])

In [35]:
ptc.storage()

 4.0
 5.0
 2.0
 1.0
 3.0
 1.0
[torch.storage.TypedStorage(dtype=torch.float32, device=cpu) of size 6]