# Introduction to Data Science with Julia

<img src="http://julialang.org/images/logo_hires.png" alt="Julia Logo" width="300"></img>

# 目次
- [配列操作](#配列操作)
 - [要素を抜き出す](#要素を抜き出す)
 - [値の更新](#値の更新)
 - [配列演算](#配列演算)
 - [要素の比較](#要素の比較)
 - [配列を扱う上での注意](#配列を扱う上での注意)
- [練習問題](#練習問題)

# 配列操作

今回は配列操作について学びます。
データ分析をする際には配列単位で操作をすることが多くなるのでしっかりと身につけてください。


まず初めに復習として、配列は [ ] で配列の要素にしたいものを囲んで作るのでした。

In [None]:
x = [1, 2, 3, 4, 5]

今度は、2次元配列 (行列) を作ってみます。2次元配列を作るには各行の要素を**スペース区切り**で書き、行の終わりをセミコロン ; で区切ります。

In [None]:
[1 2 3; 4 5 6 ; 7 8 9]

各行の区切りは改行でも大丈夫です。改行を使って書くとより行列に近い形に書けるので見やすくなります。

In [None]:
[1 2 3
4 5 6
7 8 9]

要素を 0 に初期化した $M \times N$ 行列を作るときは zeros を使うと便利です。

In [None]:
M = 5
N = 3
zeros(M, N) # zeros(Int, M, N) とすると Int 型になる

全要素を 1 に初期化する場合は ones を使います。

In [None]:
ones(M, N) # ones(Int, M, N) とすると Int 型になる

任意の数字や文字列で初期化した配列を作るには fill を使います。

In [None]:
fill(3, 5, 2)

In [None]:
fill("hoge", 5, 2)

複数の配列を [ ] で囲むことで配列を結合することが出来ます。

In [None]:
x = [1, 2, 3]
y = [4, 5, 6]
[x y] # 縦ベクトル２つを結合。hcat 関数を使っても同様のことが出来る

In [None]:
x = [1 2 3]
y = [4 5 6]
[x y] # 横ベクトル２つを結合

In [None]:
x = [1,2,3]
y = [4,5,6]
[x; y] # vcat 関数を使っても同様のことが出来る

push! を使うと一次元配列の末尾に要素を追加することが出来ます。

In [None]:
x = [1,2,3]
@show x
push!(x, 10) # push!(x, 10, 11) などとすれば複数の要素を一度についかできる
@show x

push! とは逆に末尾の要素を取り出すには pop! を使います

In [None]:
@show x
pop!(x)
@show x

unshift! を使うと先頭に要素を追加することが出来ます

In [None]:
unshift!(x, 5) # 複数の要素を一度に追加も出来る

shift! を使うと先頭に要素を取り出すことが出来ます

In [None]:
@show x
shift!(x)
@show x

2次元配列の $(i,j)$ 成分へのアクセスは $A[i,j]$ のように指定します。

In [None]:
A = [1 2 3
    4 5 6
    7 8 9]
A[1, 3]

3次元以上は 
```julia
    Array{Any}(3,3,3) # 3 x 3 x 3 配列
```
と雛形を作ってから、後で値を代入する必要が有ります。ただし、3次元以上の配列はあまり使うことはないでしょう。

In [None]:
X = Array{Int}(3,3,3) # 初期値はコンピュータが勝手に決める

[目次に戻る](#目次)

## 要素を抜き出す

配列の要素をある区間抜き出すには range を使います。range とは for 文のところでも使っていた 1:10 などです。

range の書き方は
```julia
    start:step:stop
```
の様に書きます。step を省略すると 1 刻みになります。


この range を使って
```julia
    x = [1, 2, 3, 4, 5]
```
から奇数番目の要素だけを抜き出す場合には以下のようにします。

In [None]:
x = [1, 2, 3, 4, 5]
x[1:2:5] # 1 〜 5 までの数を2刻み

添字に : を使うと全要素という意味になります。

In [None]:
x[:]

end を使うと要素の最後までを表すことが出来ます。

In [None]:
x[1:2:end]

末端 -1 の要素までなどとする場合は end -1 とすれば大丈夫です。

In [None]:
x[1:2:end-1]

この書き方は行列に関しても同じです。

3 x 3 行列から1列目を抜き出す

In [None]:
A = [1 2 3
    4 5 6
    7 8 9]
A[:, 1]

3 x 3 行列から1行目を抜き出す

In [None]:
A[1,:]

3 x 3 行列から 2 x 2 行列を抜き出す

In [None]:
A[1:2, 1:2]

要素の指定には true, false も使うことが出来ます。抜き出す必要のあるところを true 、抜き出す必要のないところを false にした配列を添え字として使うと、true に対応した要素だけを抜き出すことが出来ます。

In [None]:
x = collect(1:5) # collect は range を配列に変換する
truth = [true, false, true, true, false]
x[truth]

多次元配列に関しても同様にできます。

In [None]:
x = [1 2
    3 4]
truth = [true false
        false true]
x[truth]

[目次に戻る](#目次)

## 値の更新

上記の要素を抜き出し方を覚えると、配列の要素を一度に更新することが出来ます。例として配列の奇数番目の要素を全て 100 にするには以下のようにします。

In [None]:
x = collect(1:5)
x[1:2:end] = 100
x

奇数番目の数だけ 10 倍にするには次のようになります。

In [None]:
x = collect(1:5)
x[1:2:end] *= 10
x

要素を抜き出して出来た配列と同じサイズの配列を代入すると対応する要素を更新することが出来ます。

In [None]:
x = collect(1:5)
x[1:2:end] = [100, 200, 300]
x

[目次に戻る](#目次)

## 配列演算

配列演算ではある2つの配列の対応する要素ごとに計算が行われます。配列演算をするにはいままで使ってきた演算子にドットをつけるだけです。

In [None]:
x = [1, 2, 3];
y = [4, 5, 6];

$\begin{bmatrix}a_1 \\a_2 \end{bmatrix} .+ \begin{bmatrix}b_1 \\b_2 \end{bmatrix} = \begin{bmatrix}a_1 + b_1 \\a_2 + b_2 \end{bmatrix}$

In [None]:
x .+ y # 加算と減算ではドットはつけてもつけなくてもどちらでも構いません。

$\begin{bmatrix}a_1 \\a_2 \end{bmatrix} .- \begin{bmatrix}b_1 \\b_2 \end{bmatrix} = \begin{bmatrix}a_1 - b_1 \\a_2 - b_2 \end{bmatrix}$

In [None]:
x .- y

$\begin{bmatrix}a_1 \\a_2 \end{bmatrix} .* \begin{bmatrix}b_1 \\b_2 \end{bmatrix} = \begin{bmatrix}a_1 * b_1 \\a_2 * b_2 \end{bmatrix}$

In [None]:
x .* y

$\begin{bmatrix}a_1 \\a_2 \end{bmatrix} ./ \begin{bmatrix}b_1 \\b_2 \end{bmatrix} = \begin{bmatrix}a_1 / b_1 \\a_2 / b_2 \end{bmatrix}$

In [None]:
x ./ y

$\begin{bmatrix}a_1 \\a_2 \end{bmatrix}. \text{^} n = \begin{bmatrix}a_1^n \\a_2^n \end{bmatrix}$

In [None]:
x.^2 # x の各要素を2乗

大きさが違いものどうしでは配列演算は出来ません。

In [None]:
[1, 2, 3] + [4, 5, 6, 7]

しかし、定数を加減乗除することは出来ます。

In [None]:
x = [1, 2, 3]
x + 1

In [None]:
x - 1

In [None]:
x * 10

In [None]:
x / 10

定数 / 配列 のときはドットをつけないとエラーが出ます。ドットをつけ忘れないように気をつけましょう。

In [None]:
10 / x # エラーが出る

In [None]:
10 ./ x

このドット " . " を使った演算は四則演算だけに限りません。関数に関しても
````julia
    関数名.(collection) # collection: 配列や Tuple など
```
と関数とカッコの間にドットを入れることで collection の各要素に関数を作用させる意味になります。得られる結果としては map 関数を使った時と同じです。

In [None]:
x = linspace(0, 2π, 100) # linspace(a,b,n):  a:(b-a)/n:b となる range。n を指定しない場合は 50 分割になる。
y = sin.(x)

In [None]:
map(sin, x) # map(func, collection): collection の各要素に func を作用させる

[目次に戻る](#目次)

## 要素の比較

配列の要素同士を比較する場合もドットを使って .< などとします。返り値として true, false が入った配列が返ってきます。

In [None]:
x = [1, 2, 3]
x .<= 2

In [None]:
x = [1, 2, 3]
y = [1, 100, 3]
x .== y

In [None]:
x .< y

返り値のtrue, false が入った配列を元の配列の添字として使うことで、ある条件を満たす要素を抜き出すことが出来ます。

In [None]:
# 1 〜 10 が入った配列から 5 未満の数を抜き出す。
x = collect(1:10)
x[x .< 5]

```julia
    x = [67,57,69,64,54,13,78,26,29,37]
```
という配列の中から奇数を抜き出すには
```julia
    x[x .% 2 .!= 0]
```
と書くことも出来ますが、引数が奇数か否かを判定する関数 isodd を使うことで次のようにも書けます。

In [None]:
x = [67,57,69,64,54,13,78,26,29,37]
x[isodd.(x)]

次のように1列目に学生の名前、2, 3列目に試験の点数が入った配列を考えます。
```julia
score = [
    "九州太郎" 60 88
    "九州花子" 70 43
    "博多勉" 90 37
]
```
この配列から 九州花子 の行を抜き出すには以下のようになります。

score[:,1] .== "九州花子" で抜き出す行を指定し、: で列全体を抜き出しています。

In [None]:
score = [
    "九州太郎" 60 88
    "九州花子" 70 43
    "博多勉" 90 37
]
score[score[:,1] .== "九州花子", :]

[目次に戻る](#目次)

## 配列を扱う上での注意

配列をコピーする際には次のように注意が必要です。

In [None]:
x = [1, 2, 3]
y = x
x[1] = 10
@show x, y

上の例では
1. 変数 x に配列 [1, 2, 3] を代入する
1. y という変数に x を代入
1. 配列 x の第1要素を更新

という流れになっていますが、x の値だけを更新したはずなのに、何故か y の値までの変わってしまっています。

y に影響を与えないようにするには、y へ x をコピーするときに
```julia
    y = x[:]
```
とするか、または
```julia
    y = copy(x)
    
    or
    
    y = deepcopy(x)
```
とします。

In [None]:
x = [1, 2, 3]
y = copy(x)
x[1] = 10
@show x, y

copy と deepcopy は引数の配列の中身が数値だけの時はどちらも動作としては変わりませんが、配列の中に配列を含んでいるような場合では動作が異なります。

In [None]:
x = [[1, 2, 3], 4, 5]
y = copy(x)
y[1][1] = 100
@show x, y

In [None]:
x = [[1, 2, 3], 4, 5]
y = deepcopy(x)
y[1][1] = 100
@show x, y

[目次に戻る](#目次)

# 練習問題

## 1.

ビンゴカードを作成せよ。ここで各列の数字は以下の規則に従う<br>
1列目: 1〜15<br>
2列目: 16〜30<br>
3列目: 31〜45<br>
4列目: 46〜60<br>
5列目: 61〜75

中央は 0 をする。

ヒント: shuffle 関数


出力例
```
  7  20  34  59  64 
  4  23  43  60  74 
  2  25   0  46  62 
  1  22  39  49  70 
 13  30  31  50  75 
```

## 2.

配列
```julia
    x = collect(1:100)
```
から3の倍数番目の要素を抜き出せ。

## 3.

配列
```julia
    x = collect(Float64, 1:100)
```
の奇数番目の項を 100 倍に、偶数番目の項を 1/100 倍に更新せよ。

## 4.

配列
```julia
    srand(1) # 乱数のシード
    x = rand(10)
```
から値が 0.5 未満の項を抜き出せ。

[目次に戻る](#目次)