In [0]:
!pip install http://download.pytorch.org/whl/cu90/torch-1.0.0-cp36-cp36m-linux_x86_64.whl
!pip install torchvision
!pip install tqdm


In [2]:
import numpy as np
import torch

# 중첩 list를 지정
t = torch.tensor([[1, 2], [3, 4.]])

# device를 지정하면 GPU로 Tensor를 만들 수 있다
t = torch.tensor([[1, 2], [3, 4.]], device="cuda:0")

# dtype을 사용해 데이터형을 지정해 Tensor를 만들 수 있다
t = torch.tensor([[1, 2], [3, 4.]], dtype=torch.float64)

# 0부터 9까지의 수치로 초기화된 1차원 Tensor
t = torch.arange(0, 10)

#모든 값이 0인 100 x 10 의 Tensor를
#작성해서 to메서드로 GPU에 전송
t = torch.zeros(100, 10).to("cuda:0")

# 정규 난수로 100 x 10의 Tensor를 작성
t = torch.randn(100, 10)

# Tensor의 shape은 size 메서드로 취득 가능
t.size()

torch.Size([100, 10])

In [0]:
# numpy 메서드를 사용해 ndarray로 변환
t = torch.tensor([[1, 2], [3, 4.]])
x = t.numpy()

# GPU上상의 Tensor는 cpu메서드로,
# CPU의 Tensor로 이동(변환)할 필요가 있다
t = torch.tensor([[1, 2], [3, 4.]], device="cuda:0")
x = t.to("cpu").numpy()

In [0]:
t = torch.tensor([[1,2,3], [4,5,6.]])

# 스칼라 첨자 지정
t[0, 2]

# 슬라이스로 지정
t[:, :2]

# 리스트로 지정
t[:, [1,2]]

# 마스크 배열을 시용해서 3보다 큰 부분만 선택
t[t > 3]

# [0, 1]의 요소를 100으로 설정
t[0, 1] = 100

# 슬라이스를 사용한 일괄 대입
t[:, 1] = 200

# 마스크 배열을 사용해서 특정 조건의 요소만 치환
t[t > 10] = 20

In [0]:
# 길이 3인 벡터
v = torch.tensor([1, 2, 3.])
w = torch.tensor([0, 10, 20.])

# 2 × 3의 행렬
m = torch.tensor([[0, 1, 2], [100, 200, 300.]])

# 벡터와 스칼라의 덧셈
v2 = v + 10
# 자승도 같은 방식
v2 = v ** 2
# 동일 길이의 벡터 간 뺄쎔
z = v - w
# 여러 가지 조합
u = 2 * v - w / 10 + 6.0

# 행렬과 스칼라
m2 = m * 2.0
# 행렬과 벡터
#(2, 3)인 행렬과 (3,)인 벡터이므로 브로드 캐스트가 작동
m3 = m + v
# 행렬 간 처리
m4 = m + m

In [0]:
# 100 × 10의 테스트 데이터 생성
X = torch.randn(100, 10)

# 수학 함수를 포함하는 수식
y = X * 2 + torch.abs(X)
# 평균치 구하기
m = torch.mean(X)
# 함수가 아닌 메서드로도 사용할 수 있다
m = X.mean()
# 집계 결과는 0차원의 Tensor로 item 메서드를 사용해서
# 값을 추출할 수 있다
m_value = m.item()
# 집계는 차원을 지정할 수도 있다. 다음은 행 방향으로 집계해서,
# 열 단위로 평균값을 계산한다
m2 = X.mean(0)

In [0]:
x1 = torch.tensor([[1, 2], [3, 4.]]) # 2×2
x2 = torch.tensor([[10, 20, 30], [40, 50, 60.]]) # 2×3

# 2×2를 4×1로 보여준다
x1.view(4, 1)
# -1는 나머지 차원을 나타내며 한 번만 사용할 수 있다
# 아래 예에선 -1을 사용하면 자동으로 4가 된다
x1.view(1, -1)

# 2×3을 전치해서 3×2로 만든다
x2.t()

# dim=1로 결합하면 2×5의 Tensor를 만든다
torch.cat([x1, x2], dim=1)

# HWC을 CHW로 변환
# 64×32×3의 데이터가 100개
hwc_img_data = torch.rand(100, 64, 32, 3)
chw_img_data = hwc_img_data.transpose(1, 2).transpose(1, 3)

In [0]:
m = torch.randn(100, 10)
v = torch.randn(10)

# 내적
d = torch.dot(v, v)

# 100 × 10의 행렬과 길이 10인 벡터의 곱
# 결과는 길이 100인 벡터
v2 = torch.mv(m, v)

# 행렬곱
m2 = torch.mm(m.t(), m)

# 특이값 분해
u, s, v = torch.svd(m)

In [10]:
x = torch.randn(100, 3)
# 미분의 변수로 사용하는 경우는 requires_grad를 True로 설정
a = torch.tensor([1, 2, 3.], requires_grad=True)

# 계산을 통해 자동으로 계산 그래프가 구축된다
y = torch.mv(x, a)
o = y.sum()

# 미분을 실행
o.backward()
# 분석 답과 비교
a.grad != x.sum(0)

tensor([0, 0, 0], dtype=torch.uint8)

In [11]:
# x는 requires_grad가 False이므로 미분이 계산되지 않는다
x.grad is None

True