In [1]:
srand(1234);

## ベクトル(リスト)の処理

### ベクトルを作る

In [2]:
x = []  # 何でも入るリスト

0-element Array{Any,1}

In [3]:
x = Int[]  # Int型のみのリスト

0-element Array{Int64,1}

In [4]:
x = Vector{Int}()  #　Int[]と同じ

0-element Array{Int64,1}

In [5]:
x = [1,2,3]  # 3要素からなるリスト

3-element Array{Int64,1}:
 1
 2
 3

### すべて同じ値のベクトルを作る

In [6]:
fill(42, 10)

10-element Array{Int64,1}:
 42
 42
 42
 42
 42
 42
 42
 42
 42
 42

In [7]:
fill("foo", 4)

4-element Array{String,1}:
 "foo"
 "foo"
 "foo"
 "foo"

### ベクトルに要素を追加する

In [8]:
x = [1,2,3]

3-element Array{Int64,1}:
 1
 2
 3

In [9]:
push!(x, 4) # 右に追加

4-element Array{Int64,1}:
 1
 2
 3
 4

In [10]:
unshift!(x, 0)  # 左に追加

5-element Array{Int64,1}:
 0
 1
 2
 3
 4

In [11]:
append!(x, [5,6,7])  # 別のベクトルを追加

8-element Array{Int64,1}:
 0
 1
 2
 3
 4
 5
 6
 7

### ベクトルの要素を削除する

In [12]:
x = [1,2,3,4,5]

5-element Array{Int64,1}:
 1
 2
 3
 4
 5

In [13]:
pop!(x)  # 右端を削除

5

In [14]:
x

4-element Array{Int64,1}:
 1
 2
 3
 4

In [15]:
shift!(x)  # 左端を削除

1

In [16]:
x

3-element Array{Int64,1}:
 2
 3
 4

In [17]:
deleteat!(x, 2)  # 特定の場所の要素を削除

2-element Array{Int64,1}:
 2
 4

### ベクトルがソート済みかを判定する

In [18]:
issorted([1,2,3,4])

true

In [19]:
issorted([1,3,2,4])

false

### ベクトルをソートする

In [20]:
x = [1,5,4,3,7,6,2]

7-element Array{Int64,1}:
 1
 5
 4
 3
 7
 6
 2

In [21]:
sort(x)  # ベクトルを新しく作る

7-element Array{Int64,1}:
 1
 2
 3
 4
 5
 6
 7

In [22]:
sort(x, rev=true)  # 逆順でソート

7-element Array{Int64,1}:
 7
 6
 5
 4
 3
 2
 1

In [23]:
sort!(x)  # ベクトルを上書きする

7-element Array{Int64,1}:
 1
 2
 3
 4
 5
 6
 7

### ベクトルの要素を逆順にする

In [24]:
x = [1,2,3,4]

4-element Array{Int64,1}:
 1
 2
 3
 4

In [25]:
reverse(x)  # ベクトルを新しく作る

4-element Array{Int64,1}:
 4
 3
 2
 1

In [26]:
x == [1,2,3,4]

true

In [27]:
reverse!(x)  # ベクトルを上書きする

4-element Array{Int64,1}:
 4
 3
 2
 1

In [28]:
x == [1,2,3,4]

false

### ベクトルをシャッフルする

In [29]:
x = [1,2,3,4,5,6]

6-element Array{Int64,1}:
 1
 2
 3
 4
 5
 6

In [30]:
shuffle(x)  # ベクトルを新しく作る

6-element Array{Int64,1}:
 2
 1
 3
 6
 4
 5

In [31]:
x == [1,2,3,4,5,6]

true

In [32]:
shuffle!(x)  # ベクトルを上書きする

6-element Array{Int64,1}:
 6
 1
 5
 2
 3
 4

In [33]:
x == [1,2,3,4,5,6]

false

### ベクトルを結合する

In [34]:
vcat([1,2,3], [4,5,6])  # 縦方向 => ベクトル

6-element Array{Int64,1}:
 1
 2
 3
 4
 5
 6

In [35]:
hcat([1,2,3], [4,5,6])  # 横方向 => 行列

3×2 Array{Int64,2}:
 1  4
 2  5
 3  6

## 辞書

### 辞書を作る

In [36]:
Dict()  # 何でも入る空の辞書

Dict{Any,Any} with 0 entries

In [37]:
Dict{String,Int}()  # Stringがキー、Intが値の空の辞書

Dict{String,Int64} with 0 entries

In [38]:
Dict("one" => 1, "two" => 2)  # 初期値のある辞書

Dict{String,Int64} with 2 entries:
  "two" => 2
  "one" => 1

### 辞書があるキーを持つか判定する

In [39]:
haskey(Dict("one" => 1, "two" => 2), "two")

true

In [40]:
haskey(Dict("one" => 1), "two")

false

### 辞書の値を取り出す

In [41]:
d = Dict("one" => 1, "two" => 2)

Dict{String,Int64} with 2 entries:
  "two" => 2
  "one" => 1

In [42]:
d["one"]

1

In [43]:
d["three"]  # キーがなければエラー

LoadError: [91mKeyError: key "three" not found[39m

### デフォルト値を設定して辞書の値を取り出す

In [44]:
d = Dict("one" => 1, "two" => 2)

Dict{String,Int64} with 2 entries:
  "two" => 2
  "one" => 1

In [45]:
get(d, "one", 0)  # 第三引数がデフォルト値

1

In [46]:
get(d, "three", 0)

0

### 辞書に値を代入する

In [47]:
d = Dict("one" => 1, "two" => 2)

Dict{String,Int64} with 2 entries:
  "two" => 2
  "one" => 1

In [48]:
d["three"] = 3

3

In [49]:
d

Dict{String,Int64} with 3 entries:
  "two"   => 2
  "one"   => 1
  "three" => 3

### 辞書のキー・値を取り出す

In [50]:
d = Dict("one" => 1, "two" => 2)

Dict{String,Int64} with 2 entries:
  "two" => 2
  "one" => 1

In [51]:
keys(d)  # イテレータとして取り出す

Base.KeyIterator for a Dict{String,Int64} with 2 entries. Keys:
  "two"
  "one"

In [52]:
collect(keys(d))  # ベクトルとして取り出す

2-element Array{String,1}:
 "two"
 "one"

In [53]:
values(d)

Base.ValueIterator for a Dict{String,Int64} with 2 entries. Values:
  2
  1

In [54]:
collect(values(d))

2-element Array{Int64,1}:
 2
 1

## 文字列処理

### 文字数をカウントする

In [55]:
length("foo")

3

In [56]:
length("αβγ")

3

### 文字のバイト数を得る

In [57]:
sizeof("foo")

3

In [58]:
sizeof("αβγ")

6

### 文字列をUTF-8のバイト列に変換する

In [59]:
convert(Vector{UInt8}, "foo")

3-element Array{UInt8,1}:
 0x66
 0x6f
 0x6f

In [60]:
convert(Vector{UInt8}, "αβγ")

6-element Array{UInt8,1}:
 0xce
 0xb1
 0xce
 0xb2
 0xce
 0xb3

In [61]:
Vector{UInt8}("foo")  # これもOK

3-element Array{UInt8,1}:
 0x66
 0x6f
 0x6f

### UTF-8のバイト列を文字列に変換する

In [62]:
convert(String, [0x66, 0x6f, 0x6f])

"foo"

In [63]:
convert(String, [0xce, 0xb1, 0xce, 0xb2, 0xce, 0xb3])

"αβγ"

In [64]:
String([0x66, 0x6f, 0x6f])  # これもOK

"foo"

### 特定のパターンを置換する

In [65]:
replace("hello, world", "world", "there")

"hello, there"

In [66]:
replace("a5b4ra221ca1d856ab86r7a7", r"\d+", "")

"abracadabra"

### 文字列を文字の配列に分割する

In [67]:
collect("foo")

3-element Array{Char,1}:
 'f'
 'o'
 'o'

In [68]:
collect("αβγ")

3-element Array{Char,1}:
 'α'
 'β'
 'γ'

### 文字列を連結する

In [69]:
"foo" * "bar"

"foobar"

In [70]:
string("foo", 123)

"foo123"

In [71]:
join(["foo", "bar", "baz"], ",")

"foo,bar,baz"

### 文字列を分割する

In [72]:
split("foo,bar,baz", ",")

3-element Array{SubString{String},1}:
 "foo"
 "bar"
 "baz"

In [73]:
split("123 45   567", r"\s+")

3-element Array{SubString{String},1}:
 "123"
 "45" 
 "567"

### 特定の幅で左詰め・右詰めする

In [74]:
rpad(123, 5)

"123  "

In [75]:
lpad(123, 5)

"  123"

In [76]:
println(" left aligned: ", rpad(123, 5))
println("right aligned: ", lpad(123, 5))

 left aligned: 123  
right aligned:   123


In [77]:
@sprintf("%5d", 123)

"  123"

### 末尾の改行を除く

In [78]:
chomp("foo bar\n")

"foo bar"

In [79]:
chomp("foo bar\r\n")

"foo bar"

### 左右の空白を除く

In [80]:
strip(" foo bar ")   # 両側

"foo bar"

In [81]:
lstrip(" foo bar ")  # 左のみ

"foo bar "

In [82]:
rstrip(" foo bar ")  # 右のみ

" foo bar"

### 大文字・小文字に変換する

In [83]:
uppercase("foo")

"FOO"

In [84]:
lowercase("FOO")

"foo"

## 関数型プログラミング

### 条件を満たす要素を残す

In [85]:
filter(isodd, [1,2,3,4,5])

3-element Array{Int64,1}:
 1
 3
 5

In [86]:
filter(x->x>2, [1,2,3,4,5])

3-element Array{Int64,1}:
 3
 4
 5

### 条件を満たす要素があるか確認する

In [87]:
any(isodd, [1,2,3,4])

true

In [88]:
any(isodd, [2,4,6,8])

false

### すべての要素が条件を満たすかを確認する

In [89]:
all(isodd, [1,2,3,4])

false

In [90]:
all(isodd, [1,3,5,7])

true

### 全要素に同じ関数を適用する

In [91]:
map(sin, [0.0, 1.0, 2.0, 3.0])

4-element Array{Float64,1}:
 0.0     
 0.841471
 0.909297
 0.14112 

In [92]:
sin.([0.0, 1.0, 2.0, 3.0])

4-element Array{Float64,1}:
 0.0     
 0.841471
 0.909297
 0.14112 

### 関数を適用して畳み込みをする

In [93]:
foldl(+, 0, [1,2,3])  # 総和の計算

6

In [94]:
foldl(+, [1,2,3])  # 第二引数は省略可

6

In [95]:
# 分岐する式の作成
foldr((x, r)->:(if x == $(x); print($(x)); else; $(r); end), :(nothing), [1,2,3])

:(if x == 1 # In[95], line 2:
        print(1)
    else  # In[95], line 2:
        if x == 2 # In[95], line 2:
            print(2)
        else  # In[95], line 2:
            if x == 3 # In[95], line 2:
                print(3)
            else  # In[95], line 2:
                nothing
            end
        end
    end)

## ベンチマーク・プロファイル

### 関数の実行時間を測定する

In [96]:
sort(randn(100000))  # コンパイルのため測定前に一度実行する
@elapsed sort(randn(100000))  # 単位は秒

0.010941264

In [97]:
[@elapsed sort(randn(100000)) for _ in 1:10]

10-element Array{Float64,1}:
 0.00958475
 0.00884135
 0.00977262
 0.00866914
 0.00899267
 0.0166521 
 0.00805569
 0.00970961
 0.00885354
 0.00868196

### 関数のメモリ割り付けを測定する

In [98]:
sort(randn(100000))  # コンパイルのため測定前に一度実行する
@allocated sort(randn(100000))  # 単位はバイト

1600240

In [99]:
[@allocated sort(randn(100000)) for _ in 1:10]

10-element Array{Int64,1}:
 1600240
 1600240
 1600240
 1600240
 1600240
 1600240
 1600240
 1600240
 1600240
 1600240

### 関数の実行時間とメモリ割り付けを同時に測定する

In [100]:
sort(randn(100000))  # コンパイルのため測定前に一度実行する
@time sort(randn(100000));

  0.009056 seconds (9 allocations: 1.526 MiB)


In [101]:
for _ in 1:10
    @time sort(randn(100000))
end

  0.008051 seconds (5 allocations: 1.526 MiB)
  0.007958 seconds (5 allocations: 1.526 MiB)
  0.012615 seconds (5 allocations: 1.526 MiB, 34.97% gc time)
  0.009797 seconds (5 allocations: 1.526 MiB)
  0.008131 seconds (5 allocations: 1.526 MiB)
  0.008013 seconds (5 allocations: 1.526 MiB)
  0.009082 seconds (5 allocations: 1.526 MiB)
  0.008280 seconds (5 allocations: 1.526 MiB)
  0.007803 seconds (5 allocations: 1.526 MiB)
  0.007833 seconds (5 allocations: 1.526 MiB)


In [102]:
100000 * sizeof(Float64) * 2 / 1024^2  # 100000要素の倍精度浮動小数点数のメモリ割り当て量 (MiB)

1.52587890625

### 詳細なベンチマークを行う

In [103]:
using BenchmarkTools  # https://github.com/JuliaCI/BenchmarkTools.jl

In [104]:
@benchmark sort(randn(100000))

BenchmarkTools.Trial: 
  memory estimate:  1.53 MiB
  allocs estimate:  5
  --------------
  minimum time:     7.282 ms (0.00% GC)
  median time:      8.360 ms (0.00% GC)
  mean time:        8.612 ms (1.25% GC)
  maximum time:     15.986 ms (0.00% GC)
  --------------
  samples:          580
  evals/sample:     1

In [105]:
@benchmark sort(randn(10))

BenchmarkTools.Trial: 
  memory estimate:  400 bytes
  allocs estimate:  3
  --------------
  minimum time:     415.905 ns (0.00% GC)
  median time:      455.945 ns (0.00% GC)
  mean time:        521.888 ns (3.35% GC)
  maximum time:     8.069 μs (86.41% GC)
  --------------
  samples:          10000
  evals/sample:     199

### プロファイルを取る

In [106]:
function bubblesort(x)
    x = copy(x)
    swapped = true
    while swapped
        swapped = false
        for i in 1:endof(x)-1
            if x[i+1] < x[i]
                x[i+1], x[i] = x[i], x[i+1]
                swapped = true
            end
        end
    end
    return x
end

bubblesort (generic function with 1 method)

In [107]:
bubblesort(randn(10))

10-element Array{Float64,1}:
 -1.40278 
 -1.25995 
 -0.831225
 -0.756807
 -0.665953
 -0.22288 
  0.12063 
  0.434085
  1.06686 
  1.09387 

In [108]:
x = randn(10000)
Profile.clear()
@profile bubblesort(x);

In [109]:
Profile.print()

215 ./task.jl:335; (::IJulia.##11#14)()
 1   ...Julia/src/eventloop.jl:5; eventloop(::ZMQ.Socket)
  1 ...v0.6/IJulia/src/msg.jl:87; recv_ipython(::ZMQ.Socket)
   1 ....6/JSON/src/Parser.jl:375; #parse#1(::Type{Dict{String,Any}}...
    1 ....6/JSON/src/Parser.jl:158; parse_value(::JSON.Parser.Memory...
     1 ....6/JSON/src/Parser.jl:217; parse_object(::JSON.Parser.Memor...
 214 ...Julia/src/eventloop.jl:8; eventloop(::ZMQ.Socket)
  214 ...rc/execute_request.jl:160; execute_request(::ZMQ.Socket, ::...
   214 ./loading.jl:515; include_string(::String, ::String)
    214 ./<missing>:?; anonymous
     214 ./profile.jl:23; macro expansion
      75  ./In[106]:6; bubblesort(::Array{Float64,1})
      109 ./In[106]:7; bubblesort(::Array{Float64,1})
      28  ./In[106]:8; bubblesort(::Array{Float64,1})
      2   ./In[106]:9; bubblesort(::Array{Float64,1})


## 数値の計算

### 奇数・偶数を判定する

In [110]:
isodd(41)   # 奇数

true

In [111]:
iseven(42)  # 偶数

true

### 素数判定する

In [112]:
using Primes  # https://github.com/JuliaMath/Primes.jl

In [113]:
isprime(42)

false

In [114]:
isprime(43)

true

### 素数列を生成する

In [115]:
using Primes  # https://github.com/JuliaMath/Primes.jl

In [116]:
primes(50)

15-element Array{Int64,1}:
  2
  3
  5
  7
 11
 13
 17
 19
 23
 29
 31
 37
 41
 43
 47

### 商を計算する

In [117]:
div(42, 5)

8

In [118]:
42 / 5  # 整数 / 整数 = 浮動小数点数 になるので注意

8.4

### 剰余を計算する

In [119]:
42 % 5

2

In [120]:
rem(42, 5)  # 上と同じ

2

### 絶対値を計算する

In [121]:
abs(-42)

42

In [122]:
abs(42)

42

### 排他的論理和を計算する

In [123]:
xor(42, 35)

9

In [124]:
42 ⊻ 35  # 上と同じ(\xor)

9

## 線形代数

### ベクトルの和を計算する

In [125]:
x = [1.0, 2.0, 3.0]
y = [-1.0, 3.0, 0.0]

3-element Array{Float64,1}:
 -1.0
  3.0
  0.0

In [126]:
x + y

3-element Array{Float64,1}:
 0.0
 5.0
 3.0

In [127]:
x - y

3-element Array{Float64,1}:
  2.0
 -1.0
  3.0

### ベクトルのスカラー倍を計算する

In [128]:
3.2x

3-element Array{Float64,1}:
 3.2
 6.4
 9.6

### 行ベクトルを作る

In [129]:
x'

1×3 RowVector{Float64,Array{Float64,1}}:
 1.0  2.0  3.0

In [130]:
x''  # 2回でもとに戻る

3-element Array{Float64,1}:
 1.0
 2.0
 3.0

### 内積を計算する

In [131]:
dot(x, x)

14.0

In [132]:
x ⋅ x  # 上と同じ (\cdot)

14.0

In [133]:
x'x

14.0

### 直積を計算する

In [134]:
x * x'

3×3 Array{Float64,2}:
 1.0  2.0  3.0
 2.0  4.0  6.0
 3.0  6.0  9.0

### 対角行列を作る

In [135]:
diagm([1.0, 2.0, 3.0])  # 通常の行列の型

3×3 Array{Float64,2}:
 1.0  0.0  0.0
 0.0  2.0  0.0
 0.0  0.0  3.0

In [136]:
Diagonal([1.0, 2.0, 3.0])  # 対角行列の型

3×3 Diagonal{Float64}:
 1.0   ⋅    ⋅ 
  ⋅   2.0   ⋅ 
  ⋅    ⋅   3.0

### 行列積を計算する

In [137]:
A = randn(3, 3)
B = randn(3, 3)

3×3 Array{Float64,2}:
 -0.727977  -0.483721  -0.127781  
 -1.8243     0.431853   0.799537  
 -0.787278  -0.633619   0.00258101

In [138]:
A * B  # 通常の行列積

3×3 Array{Float64,2}:
 -2.41282   0.683661   1.27365 
  3.02053   1.04691   -0.355339
  2.02998  -3.1516    -2.18032 

In [139]:
At_mul_B(A, B)  # Aを転置して掛ける

3×3 Array{Float64,2}:
  2.37028   -0.749559  -0.948334
  2.17825    0.653092  -0.714479
 -0.441095  -2.32586   -0.933326

In [140]:
A'B  # 上と同じ

3×3 Array{Float64,2}:
  2.37028   -0.749559  -0.948334
  2.17825    0.653092  -0.714479
 -0.441095  -2.32586   -0.933326

In [141]:
A_mul_Bt(A, B)  # Bを転置して掛ける

3×3 Array{Float64,2}:
 -0.0637681   2.92191  -0.136515
  1.43406     1.31478   1.47247 
  0.194443   -1.00289   0.839033

In [142]:
A * B'  # 上と同じ

3×3 Array{Float64,2}:
 -0.0637681   2.92191  -0.136515
  1.43406     1.31478   1.47247 
  0.194443   -1.00289   0.839033

In [143]:
At_mul_Bt(A, B)  # AもBも転置して掛ける

3×3 Array{Float64,2}:
  1.23421    2.01469    1.62607 
 -0.398116  -4.95736   -0.720256
 -0.264437   0.314871   0.176922

In [144]:
A'B'  # 上と同じ

3×3 Array{Float64,2}:
  1.23421    2.01469    1.62607 
 -0.398116  -4.95736   -0.720256
 -0.264437   0.314871   0.176922

### 行列の最大値・最小値を取る

In [145]:
A = randn(5, 3)

5×3 Array{Float64,2}:
 -0.40864    0.474016  -0.834758
  1.46988   -1.31477   -1.13746 
  1.52971    0.212882  -0.318815
  0.165323  -0.148553   0.211672
 -2.31138    1.32248    1.95498 

In [146]:
maximum(A)  # 全要素の最大値 (最小値はminimum)

1.9549845786747073

In [147]:
maximum(A, 2)  # 行最大

5×1 Array{Float64,2}:
 0.474016
 1.46988 
 1.52971 
 0.211672
 1.95498 

In [148]:
maximum(A, 1)  # 列最大

1×3 Array{Float64,2}:
 1.52971  1.32248  1.95498

### 行列から平均を引く

In [149]:
A = randn(5, 3) + 10

5×3 Array{Float64,2}:
  8.82811  10.6461    8.90412
 10.0017   10.6616   10.9627 
 10.4102    8.24049  10.0199 
  9.21111   8.35879   9.46516
  9.71045  10.0419   11.4829 

In [150]:
A .- mean(A, 2)  # 行平均を引く

5×3 Array{Float64,2}:
 -0.631315   1.18663   -0.555311
 -0.540299   0.119604   0.420694
  0.853344  -1.3164     0.463051
  0.199425  -0.652897   0.453473
 -0.701313  -0.369868   1.07118 

In [151]:
A .- mean(A, 1)  # 列平均を引く

5×3 Array{Float64,2}:
 -0.804214    1.05628   -1.26286 
  0.369401    1.07186    0.795745
  0.777903   -1.34928   -0.14704 
 -0.421214   -1.23098   -0.701816
  0.0781236   0.452123   1.31597 

### 線型方程式系を解く

In [152]:
A = [3.0  2.0 -1.0
     2.0 -2.0  4.0
    -1.0  0.5 -1.0]
b = [1.0, -2.0, 0.0]

3-element Array{Float64,1}:
  1.0
 -2.0
  0.0

In [153]:
x = A \ b  # A x = b の解

3-element Array{Float64,1}:
  1.0
 -2.0
 -2.0

In [154]:
A * x ≈ b  # 解の確認

true

### 最小二乗法を行う

In [155]:
X = randn(20, 4)
b = [-1.0, 1.0, 2.0, 3.0]

4-element Array{Float64,1}:
 -1.0
  1.0
  2.0
  3.0

In [156]:
y = X * b + randn(20) * 0.1

20-element Array{Float64,1}:
 -3.97036 
 -3.77337 
 -1.29299 
 -4.22401 
  8.02587 
 -2.51347 
 -0.464203
  2.73479 
  9.67945 
  1.03392 
 -0.956689
  3.42512 
 -0.792167
  4.21561 
  2.92341 
  4.66892 
 -1.86681 
  3.93998 
  6.67452 
 -6.14165 

正規方程式 $(X'X)\beta = X'y$ の解

In [157]:
(X'X)\X'*y

4-element Array{Float64,1}:
 -1.006  
  1.01149
  1.99776
  3.01467

また、$X=QR$と分解すると、$X$が最大列階数のとき正規方程式は


\begin{align}
(X'X)\beta &= X'y \\
(QR)'(QR)\beta &= (QR)'y \\
R'(Q'Q)R\beta &= R'Q'y \\
R\beta &= Q'y
\end{align}

なので次のようにも計算できる

In [158]:
Q, R = qr(X)
R\(Q'y)

4-element Array{Float64,1}:
 -1.006  
  1.01149
  1.99776
  3.01467