<a href="https://colab.research.google.com/github/sugaya-findex/platform-ex/blob/main/R%E3%81%AB%E3%82%88%E3%82%8B%E7%B5%B1%E8%A8%88%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0%E5%85%A5%E9%96%80_08_%E7%B9%B0%E3%82%8A%E8%BF%94%E3%81%97%E5%87%A6%E7%90%86.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# １. 繰り返し処理
何らかの特定の処理を連続的に繰り返し行うプログラムの書き方を学んでいきます。以前の講義では同一処理をまとめておく方法のひとつとして「関数」をご紹介しましたが、関数は必要に応じてその処理を実行するのに対し、ここでは処理を「連続的に」繰り返し行う場面を想定しています。

## １.１. for文
繰り返し処理の1番簡単なプログラミング方法は、`for`文を利用することでしょう。`for`文では変数の値を変えながら、特定の処理を繰り返し行います。

```
# for文の構文 

for(変数 in ベクトル){
  処理
}
```

以前の講義で作成した数値の偶奇を判定する関数`h`を再度利用して、繰り返し処理を実行してみましょう。`for`の変数を1から5まで動かして、それぞれの数値の偶奇を調べてみます。

In [None]:
# 関数hの定義
h = function(x){
 if(x%%2 == 1){                   # %%は剰余を計算する演算子
   print(paste(x, "is odd"))
 }else{
   print(paste(x, "is even"))
 }
}


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
for(i in 1:5){
 h(i)
}
```


処理を途中で中止し、文の先頭に戻って次の処理に進みたい場合には、`next`を利用します。上記の例において偶数の場合のみ関数`h`を実行したいとき、`next`を使うと以下のように記述することができます。





```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
for(i in 1:5){
  if(i%%2 == 1){
    next
  }
  h(i)
}
```


## １.２. while文
ある条件が満たされる限り繰り返し処理を継続したいときときには、`while`文を利用します。

```
# while文の構文

while(論理式){
  処理
}
```

例えば先ほどの`for`文は、`while`文を使うと以下のように書き直すことができます。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
i = 1
while(i <= 5){
  h(i)
  i = i+1
}
```


あるいは、繰り返し処理から抜ける`break`を用いると、以下のように記述することもできます。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
i = 1
while(T){
  h(i)
  if(i == 5){
    break
  }
  i = i+1
}
```


# ２. 繰り返し計算の効率化

ここまでは繰り返し処理のプログラミング方法として`for`文と`while`文をご紹介しましたが、逐次計算の計算対象がベクトルであった場合、Rでこれらの手法を用いると大変非効率になってしまうことがあります。以前の講義でも触れたように、Rはベクトルを基本に設計されているため、ベクトル演算を意識したプログラミングを行うと効率的に計算することができます。実際に処理時間を計測しながら、ベクトル演算の効率性を確かめてみたいと思います。


1からNまでの数値に対して対数を取り、その結果を足し合わる処理を考えてみます。以下は`for`文を利用した計算例になります。`N=10^7`として、処理時間を関数`system.time`を利用して計測してみます。


```R
##############################################################
# コードセルを追加し、以下のコマンドに入力、実行してください #
##############################################################
# 繰り返し数の定義
N = 10^7

# for文を利用して計算
result = 0
system.time(for(i in 1:N){
    result = result + log(i)
})
```


Rはベクトルを基本に設計されているため、逐次的に`log`を呼び出さなくても関数の引数にベクトルを与えれば、一度にまとめて計算を実行することができます。その結果を`sum`で足し合わせれば、`for`文を利用しなくても同じ計算結果を得ることができます。




```R
##############################################################
# コードセルを追加し、以下のコマンドに入力、実行してください #
##############################################################
system.time(result2 <- sum(log(1:10^7)))
```


後者の計算の方が処理時間が短くなっていることが確認できると思います。
念のため、計算結果が一致していることを確認しておきましょう。


```R
##############################################################
# コードセルを追加し、以下のコマンドに入力、実行してください #
##############################################################
result
result2
```


また、別の例としてモンテカルロ積分を取り上げて処理時間を比較してみましょう。一様乱数を発生させ、単位円内の点の個数の数え上げることで円の面積の近似値を計算します。ここでは簡単のため第一象限に対象を絞り、単位円の面積の1/4の近似値を計算してみることにします。点の数え上げ部分を`for`文を利用して計算するプログラムは、以下のように記述することができます。


```R
##############################################################
# コードセルを追加し、以下のコマンドに入力、実行してください #
##############################################################
# 乱数のシードを固定
set.seed(1)

# 10^7個の一様乱数（0から1までの一様乱数）を発生させる
N = 10^7
x = runif(N)
y = runif(N)

# 円の内部の点の数を数え上げる
inside = 0
system.time(for(i in 1:N){
  flag = x[i]^2 + y[i]^2 <= 1
  inside = inside + flag
})
```


同じ処理をベクトル演算を意識して書くと、以下のようになります。


```R
##############################################################
# コードセルを追加し、以下のコマンドに入力、実行してください #
##############################################################
system.time(inside2 <- sum(x^2 + y^2 <= 1))
```


先ほどと同様に、後者の計算の方が処理時間が短いと思います。
また、ここで計算した面積が同じであることと、単位円の1/4の近似値になっていることを確認しておきましょう。まず、単位円の面積の1/4は以下の通りです。


```R
##############################################################
# コードセルを追加し、以下のコマンドに入力、実行してください #
##############################################################
pi / 4
```


2つの手法で計算した結果は一致しており、単位円の面積の1/4の近似値になっていることを確認してみます。


```R
##############################################################
# コードセルを追加し、以下のコマンドに入力、実行してください #
##############################################################
inside / N
inside2 / N
```


# ３. 関数`apply`
行列、あるいはデータフレームが計算対象である場合、`apply`という関数を利用すると高速に計算することができます。例えば、100行、10^5列の数値のデータ行列に対して、列ごとに5数要約を計算してみましょう。`for`文を利用すると、以下のようにプログラムすることができます。




```R
##############################################################
# コードセルを追加し、以下のコマンドに入力、実行してください #
##############################################################
# 乱数のシードを固定
set.seed(1)

# 計算対象の行列を定義
mat = matrix(rnorm(100*10^5), 100, 10^5)

# for文を使って五数要約を計算
result = NULL
system.time(for(i in 1:ncol(mat)){
  result = cbind(result, quantile(mat[, i]))
})
```


同じ処理を`apply`を使って記述すると以下のようになります。`apply`に与える1番目の引数は、行列またはデータフレームです。2番目の引数は計算対象を表し、行を計算対象にする場合には`1`を、列を計算対象にする場合には`2`を指定します。3番目の引数は、2番目の引数で指定した計算対象に対して適用する関数を記述します。


```R
##############################################################
# コードセルを追加し、以下のコマンドに入力、実行してください #
##############################################################
system.time(result2 <- apply(mat, 2, quantile))
```


計算結果が同じになっていることを確認しておきます。


```R
##############################################################
# コードセルを追加し、以下のコマンドに入力、実行してください #
##############################################################
identical(result, result2)
```
