# テンソルについて
テンソルとは、配列や行列に似たデータ構造の一つ。  
pytorchにおいては、モデルの入出力やパラメータの表現などに用いられる。  
numpyのndarrayとの違いは、自動微分に最適化されていること、GPUなどでの使用が可能なこと  

In [None]:
# numpyとpytorchのimport 
import numpy as np
import torch

## テンソルの初期化 (作成)

テンソルの作成にはいくつかの方法がある。
1. データから直接テンソル化する方法 : `torch.tensor`の利用
2. numpy arrayのテンソル化 : `torch.from_numpy`の利用
3. 他のテンソルからの作成 : `torch.*_like`の利用
    > 他のテンソルから新規のテンソルを作成する場合、明示的に上書きすることを示さない限り、  
    > **引数のテンソルのプロパティ(形状やデータ型)を保持** する
4. ランダム値や定数でのテンソルの作成 : `torch.rand` `torch.ones` `torch.zeros`の利用

In [None]:
# データから直接テンソル化
data = [[1,2], [3,4]] # 元データをリストで作成
x_data = torch.tensor(data)
print(type(x_data))
x_data

In [None]:
# numpy arrayからテンソル生成
np_array = np.array(data)
print(type(np_array))
print(np_array)
print("*" * 30)
x_np = torch.from_numpy(np_array)
print(type(x_np))
print(x_np)

In [None]:
# 他のテンソルからの生成
x_ones = torch.ones_like(x_data) # x_dataの特性（プロパティ）を維持
print(f"Ones Tensor: \n {x_ones} \n")

x_rand = torch.rand_like(x_data, dtype=torch.float) # x_dataのdatatypeを上書き更新
print(f"Random Tensor: \n {x_rand} \n")

In [None]:
# 新規作成するときは明示的に形状を指定
shape = (2, 3)
rand_tensor = torch.rand(shape)
ones_tensor = torch.ones(shape)
zeros_tensor = torch.zeros(shape)

print(f"Random Tensor : \n {rand_tensor} \n")
print(f"Ones Tensor : \n {ones_tensor} \n")
print(f"Zeros Tensor : \n {zeros_tensor} \n")


# テンソルの属性について
属性には3種類存在し、**形状(shape)**, **データ型(dtype)**, **保存されているデバイス(device)** がある。

In [None]:
# 属性の確認
tensor = torch.rand(3,4)

print(f"Shape of Tensor : {tensor.shape}")
print(f"Datatype of Tensor : {tensor.dtype}")
print(f"Device tensor is stored on : {tensor.device}")

# テンソルの操作について
pytorch上では、テンソルに対して、100を越える様々なテンソル演算が可能。  
詳細は[pytoechでの様々な演算](https://pytorch.org/docs/stable/torch.html)こちら  

さらに、  
デフォルトでは、テンソルはCPU上で作成される。  
そのため、GPUを使用する場合には、明示的に`.to`メソッドを用いて、テンソルをGPU上へ移動させる。  
ただしこのとき、大きなテンソルをデバイス間でコピーすると、時間とメモリの面でコストがかかることに注意


In [None]:
# GPUが使用可能であれば、以下のようにしてテンソルを移動させる
if torch.cuda.is_available():
    tensor = tensor.to('cuda')


In [None]:
# numpyのようなtensorに操作
tensor = torch.ones(4,4)
print("First row : ", tensor[0])
print("First column : ", tensor[:, 0])
print("Last column", tensor[..., -1])
tensor[:, 1] = 0
print(tensor)

# テンソルの結合
`torch.cat`を使用することで、テンソルを特定の次元に沿って結合させることができる。  
`torch.stack`も確認しておく。詳細はこちら[torch.stackについて](https://pytorch.org/docs/stable/generated/torch.stack.html)

In [None]:
# torch.cat
t1 = torch.cat([tensor, tensor , tensor], dim=1)
print(t1)

In [None]:
# 算術演算について
# 2つのテンソルの行列の掛け算。y1~y3は同じ結果となる
y1 = tensor @ tensor.T
y2 = tensor.matmul(tensor.T)
y3 = torch.rand_like(tensor)
torch.matmul(tensor, tensor.T, out=y3)

# 一方以下のzは要素ごとの積 ; z1~z3は同じ値
z1 = tensor * tensor 
z2 = tensor.mul(tensor)
z3 = torch.rand_like(tensor)
torch.mul(tensor, tensor, out=z3)

## 1要素のテンソルの値の抽出
1要素のテンソルを扱う場合には、`.item()`でpythonの数値型に変換が可能

In [None]:
agg = tensor.sum()
agg_item = agg.item()
print(agg_item, type(agg_item))

## インプレース操作
演算をオペランドに格納する演算をインプレースという。  
メソッドの最後、接頭辞として操作名に`_`がつく  
例) `x.copy_(x)` , `x.t_()`など  

<注意>  
インプレース操作は、メモリの節約になるが、**演算履歴が失われるため、びぶんを計算する際に問題になる**。このため、微分を計算するときは使用するのを控えた方がよい

In [None]:
print(tensor, "\n")
tensor.add_(5)
print(tensor)

# Numpyとの変換
CPU上のテンソルとnumpy arrayは同じメモリを共有することができ、相互変換が容易  
1. Tensor -> Numpy : `.numpy()`  
2. numpy -> tensor : `torch.from_numpy()` 
 
<注意>  
どちらも共に、変換を変化させると同時に元も変換する

In [None]:
# Tensor -> Numpy
t = torch.ones(5)
print(f"t: {t}")
n = t.numpy()
print(f"n: {n}")

t.add_(1)
print(f"t: {t}")
print(f"n: {n}")

In [None]:
# Numpy -> Tensor
n = np.ones(5)
t = torch.from_numpy(n)

np.add(n, 1, out=n)
print(f"t: {t}")
print(f"n: {n}")