<a href="https://colab.research.google.com/github/sugaya-findex/platform-ex/blob/main/R%E3%81%AB%E3%82%88%E3%82%8B%E7%B5%B1%E8%A8%88%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0%E5%85%A5%E9%96%80_07_%E9%96%A2%E6%95%B0%E3%81%AE%E4%BD%9C%E6%88%90.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# １. 関数の作成


## １.１. 関数定義の基本
ある特定の処理を何度も繰り返し行うことがわかっている場合には、その一連の処理を関数のかたちにまとめておくと便利です。例えば、テキストファイルをRに読み込む関数`read.table`は読み込みたいファイルの名前やセパレータ等の細かな設定の違いはあっても、それらの引数パラメータを定めた後の処理には共通性があることから、関数のかたちにまとめることができています。




関数は自分で作成することもでき、ここではまず簡単な例として、数学の関数
$$
f(x)=x^2-x-1
$$
をRの関数として定義してみましょう。関数名は`f`、引数は`x`であり、引数として受け取った`x`に対して`x^2-x-1`を計算する部分が関数の処理本体になります。Rの関数は`function`で定義を始め、引数は`()`中に、処理内容は`{}`の中に記述します。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
f = function(x){
 x^2-x-1 
}
```


関数の実行は、
```
f(3)
```
のように行います。





```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
f(3)
```


返り値を明示したい場合には、`return`の中に記述します。関数内に`return`がない場合には、関数定義の最終行が関数の返り値になります。以下の関数`f2`と`f3`は、関数`f`と全く同じ処理を行います。計算結果が同じになるか、いくつかの引数を例に試してみてください。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
# 関数f2の定義（returnを使用）
f2 = function(x){
 out = x^2-x-1 
 return(out)
}

# 関数f3の定義（returnを使用しない）
f3 = function(x){
 out = x^2-x-1 
 out 
}

# 関数の実行
f2(3)
f3(3)
```


## １.２. 関数の引数



### １.２.１. 複数個の引数
引数が複数個の関数を定義することもできます。以下の関数`g`を定義し、実行してみましょう。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
# 関数gの定義
g = function(x, y){
 x^2 + y^2
}

# 関数gの実行
g(1,2)
```


### １.２.２. 不定個の引数
不定個の引数とは、関数定義時点では明確にその名前や処理内容を決めておかずに、何らかの引数を受け取る可能性だけを残した箱であると理解していただければ十分で、関数定義内では`...`というふうに記述します。
例えば、以下の関数`g2`を定義してみてください。この関数は、関数`plot`を利用して`x`と`y`の散布図を描く関数ですが、不定個の引数を受け取れるように定義されています。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
g2 = function(x, y, ...){
 plot(x, y, ...) 
}
```


ここで、`plot`の関数定義を確認してみましょう。以下のように、この関数はいくつもの引数を受け取ることができる関数です。

In [None]:
str(getS3method("plot", "default"))

function (x, y = NULL, type = "p", xlim = NULL, ylim = NULL, log = "", 
    main = NULL, sub = NULL, xlab = NULL, ylab = NULL, ann = par("ann"), 
    axes = TRUE, frame.plot = axes, panel.first = NULL, panel.last = NULL, 
    asp = NA, xgap.axis = NA, ygap.axis = NA, ...)  


`plot`に渡したい引数のすべてを`g2`の関数定義に記述することもできますが、記述がとても煩雑になってしまいます。そこで`g2`では複数の引数を受け取れる枠だけを確保しておき、`g2`の実行時に`x`と`y`以外の引数を受け取った場合には、それらをそのまま`plot`に引き渡すように定義しています。これが不定個の引数`...`の役割になります。

以下のように関数`g2`を実行してみてください。１番目の例では色を変更する`col`と図のタイトルを指定する`main`が、２番目の例ではさらに図の描画タイプを指定する`type`が関数`g2`に与えられます。これらの引数は不定個の引数として受け取り、そのまま`plot`に引き渡されています。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
# xとyの定義
# yは、関数fを使ってx^2-x-1として生成
x = 1:10
y = f(1:10)
y

# 関数g2の実行
g2(x, y, col="red", main=expression(x^2-x-1))
g2(x, y, col="blue", main=expression(x^2-x-1), type="l")
```


### １.２.３. 引数のデフォルト値
関数の引数は、デフォルト値を設定しておくこともできます。例えば色のデフォルトを赤に設定しておけば、`col`を省略しても赤色の図が作成できます。色を赤から変更したい場合には、明示的に`col`を指定して色を変更します。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
# 関数g3の定義
g3 = function(x, y, col="red", ...){
 plot(x, y, col=col, ...) 
}

# 関数g3の実行
g3(x, y, main=expression(x^2-x-1))
g3(x, y, col="blue", main=expression(x^2-x-1))
```


### １.２.４. 【参考】ジェネリック関数

ジェネリック関数とは、引数のクラスに応じてそのクラスに合ったメソッドを自分自身で選び出し実行する関数のことで、先ほどの`plot`も実はジェネリック関数の一種になっています。`plot`という関数をひとつ覚えておけば、引数オブジェクトのクラスによってRが自動的に処理内容を変えてくれるため、複数の描画用の関数を覚えておく必要がなく非常に便利です。

散布図を作成する`plot`の関数定義を確認する際に、わざわざ`getS3method("plot", "default")`と入力していたのはそのためで、単に`plot`と入力しただけではRはどのメソッドの関数であるのかわからず関数定義を表示できないため、`default`メソッドであることを指定して定義内容を表示させていました。

例えば、線形モデルの結果に付与される`lm`クラスをもつオブジェクトを`plot`に与えれば、モデルの当てはめ結果の診断に利用される4枚の図が自動的に作成されます。これは`x`と`y`の散布図を描いていた先ほどの`plot`の挙動とは明らかに異なります。これは引数オブジェクトのクラスが`lm`であることをRが内部的に確認し、`plot.lm`が自動的に呼び出されているためです。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
lm.result = lm(y~x)
class(lm.result)
plot(lm.result)
```


## １.４. 条件分岐

関数の処理において、ある条件のときには処理１を、それ以外のときには処理２を行いたい、といったことがあります。このようなときは、if文を使って処理を分岐するようにします。例えば、入力として与えられた数値の偶奇を判定する関数は、以下のように定義することができます。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
# 関数hの定義
h = function(x){
 if(x%%2 == 1){                   # %%は剰余を計算する演算子
   print(paste(x, "is odd"))
 }else{
   print(paste(x, "is even"))
 }
}

# 関数hの実行
h(1)
h(2)
```


もしも分岐したい条件が３つ以上に増える場合には、`else if`を複数回使用するようにします。
```
function(x){
 if(条件1){
   処理1
 }else if(条件2){{
   処理2
 }else{
   処理3
 }
}
```

## １.５. 比較演算子と論理演算子
条件分岐の「条件」の箇所には論理式が入り、評価結果が`TRUE`または`FALSE`の論理値である必要があります。あるいは、論理値が返ってくる関数呼び出しでも構いません。データ型の自動変換を応用するならば、0または1を条件部分に記述することもできます。

例えば、数値の大小比較を利用する場合には、以前の講義でも紹介した比較演算子を利用します。

`==`、`!=`、`<=`、`>=`、`<`、`>`

また、論理演算子を利用することもできます。論理積や論理和は、複数論理式の統合結果を分岐条件に利用したい場合に利用します。

|論理演算子|説明|
|---|---|
|`!`|否定|
|`&`|論理積|
|`\|`|論理和|
|`&&`|条件付き論理積。`（論理式1）&&（論理式2）`のとき、`（論理式1）=FALSE`であれば`（論理式2）`は評価されない|
|`\|\|`|条件付き論理和。`（論理式1）\|\|（論理式2）`のとき、`（論理式1）=TRUE`であれば`（論理式2）`は評価されない|

条件付きの論理演算子は、例えば以下のような場面で活躍します。

先ほど定義した関数`h`に文字列`a`を与えて関数を実行してみましょう。2で割った余りを計算することができませんので、はじめの条件分岐のところでエラーになり、処理が止まってしまいます。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
h("a")
```


エラー箇所の修正は、例えば、あらかじめ引数が数値であるかどうかを判定し、数値あれば2で割った余りを計算して偶奇を判定する処理内容に書き換えればうまくいきそうです。この処理を論理積を使って記述すると以下のようになります。関数`h2`はうまく実行できるでしょうか。確かめてみてください。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
# 関数h2の定義
h2 = function(x){
 if(is.numeric(x) & x%%2 == 1){
   print(paste(x, "is odd"))
 }else if (is.numeric(x) & x%%2 == 0){
   print(paste(x, "is even"))
 }else if (is.character(x)){
   print(paste(x, "is character"))
 }else{
   print(paste(x, "is neither numeric nor character"))
 }
}

# 関数h2の実行
h2("a")
```


この関数定義でもやはりエラーなってしまうと思います。問題は初めの条件分岐の部分`is.numeric(x) & x%%2 == 1`にあります。「論理積」は2つの論理式をそれぞれ判定してから全体の評価を下すため、`x%%2 == 1`を文字列`a`に対しても評価してしまいエラーが起こってしまいます。

このようなときに活躍するのが「条件付き論理積」の考え方になります。`is.numeric(x)`の評価結果が`F`であれば全体の評価が`T`になることはありませんから、`x%%2 == 1`の処理は行わず全体の評価結果として`F`が返ってきます。このように「条件付き論理積」は、はじめの評価結果に基づいて2番目の評価を行うかどうか場合分けしたいような場面で利用すると便利です。「条件付き論理和」についても活躍する場面は同じです。

実際に処理を条件付き論理積を使って関数を書き換えてみましょう。関数`h3`ではうまく実行できるようになっているはずです。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
# 関数h3の定義
h3 = function(x){
 if(is.numeric(x) && x%%2 == 1){
   print(paste(x, "is odd"))
 }else if (is.numeric(x) && x%%2 == 0){
   print(paste(x, "is even"))
 }else if (is.character(x)){
   print(paste(x, "is character"))
 }else{
   print(paste(x, "is neither numeric nor character"))
 }
}

# 関数h3の実行
h3("a")
```


すべての論理式が`TRUE`であるかどうかを評価する関数`all`と、いずれかの論理式が`TRUE`であるかどうかを評価する関数`any`も条件分岐でよく利用するので、覚えておくとよいでしょう。いずれの関数も論理式をコンマ区切りで並べて使用します。
```
all(論理式1, 論理式2, ...)
any(論理式1, 論理式2, ...)
```

## １.６. 関数のデバッグ
関数を自分で定義したとき、一度目で完璧な関数が出来上がっていることは稀でしょう。何らかの書き間違いをおかしていたり、予期せぬ動作が原因で処理が途中で止まってしまうことの方が多いと思います。

エラーのないコードを書けることはもちろん重要なスキルですが、出力されたエラーコードを頼りに適切にデバッグする力も非常に重要です。一般的には、

* 関数の途中に`print`を挿入し、中間生成されたオブジェクトの中身を標準出力して計算の状況を確認する
* 関数`browser`で処理を中断し、インタラクティブに原因を追究する

といった作業を通して問題個所を特定しコードを修正していくことになりますが、Colabでは`browser`を利用することができませんので、`print`の出力結果とエラーコードを頼りにデバッグしていくことになると思います。ここでは簡単な例を通して、デバックの方法を学んでいきましょう。

以下の関数`testfun`の定義を見てみてください。一見すると、どこにも問題がなさそうな単純な関数です。



```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
testfun = function(x){
  if(is.na(x)){
    print("x is NA")
  } else if(is.null(x)){
    print("x is NULL")
  } else {
    print(paste("x is",x))
  }
}
```


それでは、この関数を実行してみましょう。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
testfun(1)
testfun("a")
testfun(NA)
testfun(NULL)
```


`NULL`を引数にして関数を実行したとき、エラーを起こして処理が止まってしまっていると思います。
エラーの内容を見ると、最初の条件分岐の論理式`is.na(x)`の箇所に問題がありそうですので、この評価結果を`print`で表示して状況を探ってみることにしましょう。
念のため、引数`x`の中身も出力させておくことにします。以下のように関数を定義し直して、
再度、引数`NULL`に対して関数を実行してみてください。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
# 関数testfunの定義
testfun = function(x){
　print(x)
  print(is.na(x))
  if(is.na(x)){
    print("x is NA")
  } else if(is.null(x)){
    print("x is NULL")
  } else {
    print(paste("x is",x))
  }
}

# 関数testfunの実行
testfun(NULL)
```


`is.na(x)`の出力結果を見ると、
`logical(0)`が出力されていて、条件分岐の評価に必要な論理値が計算できていないことがわかります。
実は`NULL`は空のデータであるため、`is.na`によって`NA`であるかどうかの評価をすることができません。

ひとつの解決策は、条件分岐の順序を替えることです。先にNULLであるかと評価してしまい、`is.na`の箇所に`NULL`が渡らないように修正します。もちろんそのほかの解決策もあります。各自解決策を考えて、うまく実行できるか確かめてみてください。


```R
############################################################
# 以下のコマンドをコードセルに入力し、実行してみてください #
############################################################
# 関数testfunの定義
testfun = function(x){
  if(is.null(x)){
    print("x is NULL")
  } else if(is.na(x)){
    print("x is NA")
  } else {
    print(paste("x is",x))
  }
}

# 関数testfunの実行
testfun(NULL)
```
