# Julia on AMD GPU
## AMD製のGPUを用いたインスタンス（amd1dlなど）からJuliaをGPUで駆動させてみましょう！

In [15]:
## N個の一様分布に基づく乱数値(a, b)同士の足し算を行います
## コードはほとんどhttps://juliagpu.gitlab.io/AMDGPU.jl/quickstart/ からのパクリです
## ドキュメントの充実ぶりも好きですJulia
N = 64
a = rand(Float64, N)  # N個の乱数(0 <= n < 1)を生成（配列）
b = rand(Float64, N)
c_cpu = a + b  # c = a + b
println("乱数値同士の和（CPU）: ", c_cpu, "\n")

## 以下では上記と同じ計算をGPUベースで行います。右側のrocm-smiからも目を離さないようにしましょう。
using AMDGPU  # パッケージのimport, 最初は時間かかります

a_d = ROCArray(a)  # GPU演算用の配列に変換
b_d = ROCArray(b)
c_d = similar(a_d)  # a+b演算後の結果を格納するGPU用配列を定義（a_dから）

## 以下の関数では配列の値をスレッド上に配置し、a(a_d)とb(b_d)の値を”一斉に”和演算する
function vadd!(c, a, b)  # 関数の定義はFortranに似てます
    i = workitemIdx().x  # 今回は横方向にのみ値をアサイン
    c[i] = a[i] + b[i]
    return
end

@roc groupsize=N vadd!(c_d, a_d, b_d)
wait(@roc groupsize=N vadd!(c_d, a_d, b_d))

c_gpu = Array(c_d)  # 通常の配列に戻す
println("乱数値同士の和（GPU）: ", c_gpu, "\n")

println("err: ", c_gpu - c_cpu)

乱数値同士の和（CPU）: [1.0743548247390264, 1.8550864579636062, 1.58316647611717, 0.8155354333119345, 0.5876162986913995, 0.7434262994296656, 0.9060538145399202, 0.442964241794791, 0.8261872854315258, 1.6477239950166915, 1.020312416914011, 0.9014359598440707, 0.26795732745441647, 1.3915577203895135, 1.4775791792504351, 1.225221224309515, 0.9627047070227195, 0.7285784655884948, 1.4355654808158267, 0.6532392237588878, 1.0708079040231528, 0.8544218308586822, 0.1278752336277753, 0.7354453678338744, 0.8720324095649945, 0.04804583434823795, 1.0950828427010961, 0.5944759587771473, 0.5519877476133606, 0.6192567292224134, 0.8787923915359364, 0.996890278636366, 1.1075081948125687, 1.1684601724549504, 0.9698313500182043, 0.6340078214968881, 0.7493426977124382, 1.2721546399363175, 0.5908101979338636, 0.7181796134428156, 0.7156457272983427, 1.2135346783557386, 1.3139236893948274, 1.1183851804289402, 1.6376099149750307, 0.6525863499088294, 0.9507294465936518, 0.2432979885331501, 0.9947784552755952, 1.3939833