# Numo::NArrayについて

Numo::NArrayはRubyにおけるnumpyと言えるgemです。
概要は作者の[Masahiro TANAKA](https://github.com/masa16)さんによる[ドキュメント](https://github.com/ruby-numo/narray/wiki/Numo::NArray%E6%A6%82%E8%A6%81)によるとして、ここではその実例を紹介します。


## 基本的な使い方
### オブジェクトの作り方
まずNumo::NArray のオブジェクトを作ってみましょう

In [1]:
require 'numo/narray'

true

In [2]:
x1 = Numo::NArray[1,3,5,7,9]

Numo::Int32#shape=[5]
[1, 3, 5, 7, 9]

これでオブジェクト`x1`ができました。Pythonのnumpyは型付のlistですのでNArrayにも型が付いているか確認しましょう。

In [3]:
x1.class

Numo::Int32

ここでは`Int32`型になっていることがわかります。次に下記のように新たなオブジェクトとその型を確認してみましょう。

In [4]:
y1 = Numo::NArray[1.0, 3.0, 5.0, 7.0, 9.0]

Numo::DFloat#shape=[5]
[1, 3, 5, 7, 9]

In [5]:
y1.class

Numo::DFloat

こんどは`DFloat`型になっていることがわかります。次に乱数生成によりオブジェクトを作ってみましょう。型は新たに`Int64`を使ってみましょう。

In [6]:
Numo::NArray.srand(123) # 生成する乱数を再現可能にするにはseedを設定します
x2 = Numo::Int64.new(6).rand(10)

Numo::Int64#shape=[6]
[3, 0, 3, 6, 8, 1]

ここでは10を上限にし、配列長6の乱数を生成しました。試しに生成する乱数の値の上限を上げてみましょう。

In [7]:
x3 = Numo::Int64.new(6).rand(1000)

Numo::Int64#shape=[6]
[592, 507, 510, 528, 501, 13]

次は2次元、3次元の配列を作ってみましょう。

In [8]:
x4 = Numo::Int64.new(3,4).rand(10)

Numo::Int64#shape=[3,4]
[[6, 1, 9, 8], 
 [0, 6, 6, 0], 
 [6, 4, 3, 9]]

In [9]:
x5 = Numo::Int64.new(3,4,5).rand(10)

Numo::Int64#shape=[3,4,5]
[[[1, 4, 0, 4, 8], 
  [5, 9, 9, 2, 6], 
  [2, 0, 5, 1, 2], 
  [4, 5, 2, 2, 4]], 
 [[0, 6, 6, 6, 3], 
  [4, 7, 0, 8, 1], 
  [7, 9, 5, 4, 9], 
  [8, 5, 3, 4, 0]], 
 [[9, 7, 6, 9, 9], 
  [7, 3, 9, 4, 9], 
  [3, 8, 6, 0, 3], 
  [0, 6, 6, 1, 2]]]

最後に配列のサイズなどを確認してみましょう。

In [10]:
x5.ndim

3

In [11]:
x5.shape

[3, 4, 5]

In [12]:
x5.size

60

基本的なオブジェクトの作成方法を見てきました。次に要素にアクセスする方法を見ていきましょう。

### インデキシング

ここでは配列の要素をインデックスを指定することにより取得する方法を示します。

In [13]:
x1

Numo::Int32#shape=[5]
[1, 3, 5, 7, 9]

In [14]:
x1[0]

1

In [15]:
x1[2]

5

配列の最後からのインデックスには `-` を使います。

In [16]:
x1[-1]

9

In [17]:
x1[-3]

5

多次元配列ではコンマで区切ったインデックスを使って要素にアクセスできます。

In [18]:
x4

Numo::Int64#shape=[3,4]
[[6, 1, 9, 8], 
 [0, 6, 6, 0], 
 [6, 4, 3, 9]]

In [19]:
x4[0,0]

6

In [20]:
x4[1,0]

0

In [21]:
x4[2,-1]

9

インデックスを使って要素の値を変更することもできます。

In [22]:
x4[0,0] = 12

12

In [23]:
x4

Numo::Int64#shape=[3,4]
[[12, 1, 9, 8], 
 [0, 6, 6, 0], 
 [6, 4, 3, 9]]

Numo::NArrayの配列は固定した型を持っているので浮動小数点の値を整数の配列に代入すると小数点以下は切り捨てられます。

In [24]:
x1[0] = 1.23

1.23

In [25]:
x1

Numo::Int32#shape=[5]
[1, 3, 5, 7, 9]

### スライシング

スライシングとは配列から部分配列を切り出すことです。
ここではスライシングのための構文を示します。

In [26]:
x1[2..4]

Numo::Int32(view)#shape=[3]
[5, 7, 9]

末尾からのインデックスはマイナスを使うことで実現できます。

In [27]:
x1[2..-1]

Numo::Int32(view)#shape=[3]
[5, 7, 9]

`step`メソッドを使うとステップつきスライスや逆順の配列を得たりできます。

In [28]:
x1[(0..-1).step(2)]

Numo::Int32(view)#shape=[3]
[1, 5, 9]

In [29]:
x1[(-1..3).step(-1)]

Numo::Int32(view)#shape=[2]
[9, 7]

#### 多次元配列のスライシング

In [30]:
x4

Numo::Int64#shape=[3,4]
[[12, 1, 9, 8], 
 [0, 6, 6, 0], 
 [6, 4, 3, 9]]

多次元配列のスライス範囲の指定はコンマでつなぐことで可能です。

In [31]:
x4[0..1, 0..2]

Numo::Int64(view)#shape=[2,3]
[[12, 1, 9], 
 [0, 6, 6]]

一行，一列をスライスしたいことはよくあります。それには`true`を使います。

In [32]:
x4[2, true]

Numo::Int64(view)#shape=[4]
[6, 4, 3, 9]

In [33]:
x4[true, 3]

Numo::Int64(view)#shape=[3]
[8, 0, 9]

複数行もしくは複数列をスライスしたい場合は下記になります。

In [34]:
x4[1..2, true]

Numo::Int64(view)#shape=[2,4]
[[0, 6, 6, 0], 
 [6, 4, 3, 9]]

In [35]:
x4[true, 0..1]

Numo::Int64(view)#shape=[3,2]
[[12, 1], 
 [0, 6], 
 [6, 4]]

### コピーではないスライス評価

numpyやnarrayで有用なことの1つは、配列データのコピーではないビューを返すことです。
この機能は他で紹介するデータフレームライブラリにとって非常に重要です。
実例によりそれを理解しましょう。


In [36]:
x4

Numo::Int64#shape=[3,4]
[[12, 1, 9, 8], 
 [0, 6, 6, 0], 
 [6, 4, 3, 9]]

まず部分行列をスライスにより取得します。

In [37]:
x4sub = x4[0..1, 0..1]

Numo::Int64(view)#shape=[2,2]
[[12, 1], 
 [0, 6]]

次にスライスした行列へ要素の変更を行ってみましょう。

In [38]:
x4sub[0,0] = 999

999

In [39]:
x4sub

Numo::Int64(view)#shape=[2,2]
[[999, 1], 
 [0, 6]]

スライス元の行列を確認してみましょう。

In [40]:
x4

Numo::Int64#shape=[3,4]
[[999, 1, 9, 8], 
 [0, 6, 6, 0], 
 [6, 4, 3, 9]]

スライス元の行列の要素も変更が行われていることが確認できました。
この振る舞いは非常に重要ですが現状Rubyで最も使われているデータフレームgemであるdaruではこの機能がサポートされていません。
それはこれまで我々が型付配列gemの決定版とも言えるものを明確に定めることができなかったことに起因しています。
今後我々はNumo::NArrayを使ったdaruのリライトを行いこの問題を解決する予定です。

### 配列の再形成
reshapeメソッドを使うことで配列から行列を作ることが可能です。

In [41]:
mat = Numo::Int32[1..9].reshape(3,3)

Numo::Int32#shape=[3,3]
[[1, 2, 3], 
 [4, 5, 6], 
 [7, 8, 9]]

In [42]:
x = Numo::Int32[1,2,3]

Numo::Int32#shape=[3]
[1, 2, 3]

In [43]:
x.reshape(3,1)

Numo::Int32#shape=[3,1]
[[1], 
 [2], 
 [3]]

## 配列の結合と分割

### 配列の結合
結合にはconcatenateメソッドを使います。

In [44]:
x = Numo::NArray[1,2,3]

Numo::Int32#shape=[3]
[1, 2, 3]

In [45]:
y = Numo::NArray[3,2,1]

Numo::Int32#shape=[3]
[3, 2, 1]

In [46]:
x.class

Numo::Int32

In [47]:
x.concatenate(y)

Numo::Int32#shape=[6]
[1, 2, 3, 3, 2, 1]

一度に複数の配列を結合することも可能です。

In [48]:
z = [10,20,30]

[10, 20, 30]

In [49]:
zz = [100,200,300]

[100, 200, 300]

In [50]:
x.concatenate(y,z,zz)

Numo::Int32#shape=[12]
[1, 2, 3, 3, 2, 1, 10, 20, 30, 100, 200, 300]

行列も結合可能です。`axis`を指定することで行方向に結合するか列方向に結合するか選べます。

In [51]:
mat.concatenate(mat, axis:0)

Numo::Int32#shape=[6,3]
[[1, 2, 3], 
 [4, 5, 6], 
 [7, 8, 9], 
 [1, 2, 3], 
 [4, 5, 6], 
 [7, 8, 9]]

In [52]:
mat.concatenate(mat, axis:1)

Numo::Int32#shape=[3,6]
[[1, 2, 3, 1, 2, 3], 
 [4, 5, 6, 4, 5, 6], 
 [7, 8, 9, 7, 8, 9]]

次元の異なる配列を結合するには `vstack` か `hstack` を使います。

In [70]:
x

Numo::Int32#shape=[3]
[1, 2, 3]

In [54]:
grid = Numo::NArray[[9,8,7],[6,5,4]]

Numo::Int32#shape=[2,3]
[[9, 8, 7], 
 [6, 5, 4]]

In [71]:
Numo::NArray.vstack([x,grid])

Numo::NArray::ShapeError: shape1[0](=3) != shape2[0](=2)

In [72]:
Numo::NArray.vstack([x.reshape(1,3),grid])

Numo::Int32#shape=[2,2,3]
[[[1, 2, 3], 
  [1, 2, 3]], 
 [[9, 8, 7], 
  [6, 5, 4]]]

In [73]:
Numo::NArray.vstack([x.reshape(1,3),grid]).shape

[2, 2, 3]

### 配列の分割
分割にはsplit, hsplit, vsplitメソッドを使います。引数には分割するポイントのインデックスを与えます。

In [74]:
x = Numo::NArray[1,2,3,99,99,3,2,1]

Numo::Int32#shape=[8]
[1, 2, 3, 99, 99, 3, 2, 1]

In [77]:
x1,x2,x3 = x.split([3,5])

[Numo::Int32(view)#shape=[3]
[1, 2, 3], Numo::Int32(view)#shape=[2]
[99, 99], Numo::Int32(view)#shape=[3]
[3, 2, 1]]

In [78]:
x1

Numo::Int32(view)#shape=[3]
[1, 2, 3]

In [79]:
x2

Numo::Int32(view)#shape=[2]
[99, 99]

In [80]:
x3

Numo::Int32(view)#shape=[3]
[3, 2, 1]

行や列で分割したい場合，hsplitもしくはvsplitを使います。引数は何行，何列毎に分割するかを表しています。

In [96]:
grid = Numo::NArray[0..15].reshape(4,4)

Numo::Int32#shape=[4,4]
[[0, 1, 2, 3], 
 [4, 5, 6, 7], 
 [8, 9, 10, 11], 
 [12, 13, 14, 15]]

In [97]:
upper, lower = grid.vsplit(2)

[Numo::Int32(view)#shape=[2,4]
[[0, 1, 2, 3], 
 [4, 5, 6, 7]], Numo::Int32(view)#shape=[2,4]
[[8, 9, 10, 11], 
 [12, 13, 14, 15]]]

In [98]:
upper

Numo::Int32(view)#shape=[2,4]
[[0, 1, 2, 3], 
 [4, 5, 6, 7]]

In [99]:
lower

Numo::Int32(view)#shape=[2,4]
[[8, 9, 10, 11], 
 [12, 13, 14, 15]]

In [101]:
grid.vsplit(1)

[Numo::Int32(view)#shape=[4,4]
[[0, 1, 2, 3], 
 [4, 5, 6, 7], 
 [8, 9, 10, 11], 
 [12, 13, 14, 15]]]

In [100]:
grid.hsplit(1)

[Numo::Int32(view)#shape=[4,4]
[[0, 1, 2, 3], 
 [4, 5, 6, 7], 
 [8, 9, 10, 11], 
 [12, 13, 14, 15]]]

In [92]:
left, right = grid.hsplit(2)

[Numo::Int32(view)#shape=[4,2]
[[0, 1], 
 [4, 5], 
 [8, 9], 
 [12, 13]], Numo::Int32(view)#shape=[4,2]
[[2, 3], 
 [6, 7], 
 [10, 11], 
 [14, 15]]]

In [93]:
left

Numo::Int32(view)#shape=[4,2]
[[0, 1], 
 [4, 5], 
 [8, 9], 
 [12, 13]]

In [94]:
right

Numo::Int32(view)#shape=[4,2]
[[2, 3], 
 [6, 7], 
 [10, 11], 
 [14, 15]]