In [1]:
import torch

# Tensor モジュール
前述したようにテンソルは概念的には NumPy の配列に似ています．テンソルは $n$ 次元の配列で，その上で数学関数を操作したり，GPU を使って計算を高速化したりすることができます．また，テンソルは深層学習に不可欠な計算グラフやグラデーションを追跡するためにも使用できます．GPU でテンソルを実行するためには，テンソルを特定のデータ型にキャストする必要があります．

In [3]:
# テンソルの定義
points = torch.tensor([1.0, 4.0, 2.0, 1.0, 3.0, 5.0])

# 最初の要素を取得
float(points[0])

# テンソルの次元 (shape) を確認
points.shape

torch.Size([6])

PyTorch では，テンソルはメモリの連続したチャンクに格納された数値データの1次元配列に対するビューとして実装されています．これらの配列はストレージインスタンス (記憶域インスタンス，storage instance) と呼ばれます．すべての PyTorch テンソルには ```storage``` 属性があり，以下の例のようにテンソルの基礎となるストレージインスタンスを出力することができます．

In [4]:
points = torch.tensor([[1.0, 4.0], [2.0, 1.0], [3.0, 5.0]])
points.storage()

 1.0
 4.0
 2.0
 1.0
 3.0
 5.0
[torch.FloatStorage of size 6]

テンソルがストレージインスタンスのビューであるというとき，テンソルはビューを実装するために

- Size
- Storage
- Offset
- Stride

という4つの情報を使用します．先ほどのテンソルで，これらの情報の意味を調べてみましょう．

In [5]:
points.size()

torch.Size([3, 2])

このように，```size```は NumPy の ```shape``` 属性と似ており，各次元の要素数を教えてくれます．これらの数値を掛け合わせると，基礎となるストレージインスタンスの長さ (この場合は6) になります．  
オフセットは次のようになります．

In [6]:
points.storage_offset()

0

ここでのオフセットは，記憶域配列 (storage array) 内のテンソルの最初の要素のインデックスを表しています．出力は0なので，テンソルの最初の要素が記憶域配列の最初の要素であることを意味しています．

In [7]:
points[1].storage_offset()

2

```points[1]``` は $[2.0, 1.0]$ であり，記憶域配列は $[1.0, 4.0, 2.0, 1.0, 3.0, 5.0]$ なので，テンソル $[2.0, 1.0]$ の最初の要素，すなわち， $2.0$ は記憶配列のインデックス2にあります．
最後に ```stride``` を見てみましょう．

In [8]:
points.stride()

(2, 1)

ここまで見てきた通り，```stride``` には各次元ごとに，テンソルの次の要素にアクセスするために，スキップする要素数が含まれています．つまり，この例では第1の次元において最初の要素（1.0）の次の要素にアクセスするためには，2つの要素（つまり，1.0 と 4.0）を飛ばして，次の要素（2.0）にアクセスする必要があります．同様に，2番目の次元では，1.0 の次の要素，つまり 4.0 にアクセスするために，1つの要素をスキップする必要があります．このように，これらの属性を利用して，連続した1次元の記憶配列からテンソルを導き出すことができます．  
テンソルに含まれるデータは数値型で，具体的に PyTorch は以下のデータ型をテンソルに含めることができます．

- ```torch.float32``` or ```torch.float``` ：32ビット (単精度) 浮動小数点数
- ```torch.float64``` or ```torch.double```：64ビット (倍精度) 浮動小数点数
- ```torch.float16``` or ```torch.half```  ：16ビット (半精度) 浮動小数点数  
- ```torch.int8``` ：8ビット符号付き整数
- ```torch.uint8```：8ビット符号なし整数  
- ```torch.int16``` or ```torch.shor```：16ビット符号付き整数  
- ```torch.int32``` or ```torch.int``` ：32ビット符号付き整数  
- ```torch.int64``` or ```torch.long```：64ビット符号付き整数

テンソルに使用するデータ型は次のように指定します．

In [10]:
points = torch.tensor([[1.0, 2.0], [3.0, 4.0]], dtype=torch.float32)

PyTorch のテンソルには，データ型の他にテンソルを格納するデバイスの指定が必要です．デバイスはインスタンスとして指定できます．

In [11]:
points = torch.tensor([[1.0, 2.0], [3.0, 4.0]], dtype=torch.float32, device='cpu')

あるいは，目的のデバイスにテンソルのコピーを作成することもできます．

In [12]:
points_2 = points.to(device='cuda')

このように，テンソルを CPU に割り当てる（```device='cpu'```を使用）こともできるし，テンソルを GPU に割り当てる（```device='cuda'```を使用）こともできます．GPUにテンソルを配置すると計算を高速化可能で，CPU でも GPU でもほとんど同じテンソル API を利用可能なので，デバイス間でテンソルを移動したり，計算を実行したり，データを書き戻したりが簡単にできるようになっています．  
同じ種類のデバイスが複数ある場合，つまり，複数の GPU が使えるときには，次のようにデバイスのインデックスを指定することで，テンソルを配置するデバイスを指定できます．

In [13]:
points_3 = points.to(device='cuda:0')

PyTorch-CUDA について，詳しくは[ここを参照](https://pytorch.org/docs/stable/notes/cuda.html)してください．より一般的な CUDA については，[こちらのページ](https://developer.nvidia.com/about-cuda)が参考になります．