このノートブックでは、R言語のによるプログラミングの基礎をカバーします。

ノートブックはJupyter Notebookで書かれています。
Jupyter Notebookはコードと文章の入り混じった文書を作るのに適した形式です。
ノートブックの各箱のことを「**セル**」と呼びますが、セルの中で「Shift+Enter」あるいは「Ctrl+Enter」を同時押し、もしくは上部の「Run」ボタンをクリックすると、セルの中身が実行されます。

セルが「**Code**」タイプの場合、中身はプログラミングコードとして実行され、その結果が下に表示されます。
セルが「**Markdown**」タイプの場合、中身はMarkdownのコードとして解釈され、文章に変換されます。
セルのタイプは上部のセレクトボックスから変更可能です。
![buttons](images/buttons.png)

まずは、次のセルを実行し、きちんと結果が表示されることを確認してください。「Welcome!」と表示されれば成功です。

In [None]:
cat("Welcome!\n")

# R言語の基礎

## 数理演算

まずは数学で通常使う演算を実行してみましょう。加減乗除の四則演算は `+`, `-`, `*`, `/` で表現できます。カッコの使って演算の順序を指定することもできます。

In [23]:
1 + 1

In [22]:
(1 + 1/9) * 9

Rでは通常数は実数として扱われます。そのため、整数と実数型の違いに注意する必要は通常ありません。

In [26]:
1 / 3

累乗は `^` で表現します。

In [27]:
2^11

`%%` は剰余（割り算の余り）を計算します。

In [29]:
35 %% 6

## 論理（Boolean）型

事象の真偽を表す論理型（Boolean型）は、Rでは `TRUE`, `FALSE` で表現します。すべて大文字である必要があります。
値が等しいことは `==`, 大小比較には `<`, `>`, `<=`, `>=` を用います。

In [34]:
2 * 3 == 6

In [36]:
3.14 < 3

## 文字列型

Rでは文字列を `""` もしくは `''` で定義し、両者に違いはありません。

In [30]:
"hello"

In [32]:
"hello" == 'hello'

日本語を用いることも可能です。

In [31]:
'Rの基礎'

## 変数

変数を定義してそこに値を格納することが可能です。
変数の定義には `<-` を用います。`=` を使うことも可能ですが、習慣として `<-` が推奨されることが多いです。

変数名は通常アルファベットで始まります。`.` や `_`から始めることも可能ですが、これらの名前は特別な場合に使われることが多いです。変数名の途中に数字を使うことは可能です。

定義された変数は後の演算に用いることが可能です。

In [42]:
x <- 5
x * 3

In [44]:
tenki <- "sunny"

## ベクトル

ベクトルは、複数の同じタイプの値の列を表します。ベクトルは `c`関数（`combine`の略）で作成できます。

In [45]:
v <- c(1, 3, 5)
u <- c(2, 4, 6)

v
u

ベクトル同士の演算は原則として要素ごとに行われ、一方のサイズが他方より小さい場合、自動的に拡張されます。

In [47]:
u + v

2 * u

ベクトルの要素を取り出すには、`[]`を用いて要素のインデックスを指定します。インデックスは1始まりです。

In [65]:
u[1]
v[3]

インデックスとしてベクトルを指定することで対応するベクトルを取り出すことも可能です。同じインデックスを繰り返しても大丈夫です。

In [66]:
u[c(3,2,1)]
v[c(1,1,2,2,3,3)]

## ループ

繰り返し処理にはループを用います。ループの1つ目は、`for`文で、`for (i in ...)` の形で定義されます。ここで `i` はループ対象の値を格納する変数で、`...` 部分にはループ対象となる列（ベクトル）が入ります。
下の例では、1から10までの自然数の和を計算しています。

In [51]:
s <- 0
for (i in 1:10) {
  s <- s + i
}
s

もう1つのループ表現として `while` が存在します。これは、ある条件が満たされる間、操作を繰り返します。
下の例は、`while`を使って自然数の和を計算します。

In [54]:
s <- 0
i <- 1
while (i <= 10) {
  s <- s + i
  i <- i + 1
}
s

## 条件分岐

条件に応じて操作を変えるには、`if () ... else if (...) else ...` 文を利用します。

下の例は、xの値が8である場合にメッセージを表示します。`cat`は文字列を表示する関数です（関数については次節で扱います）。

In [60]:
x <- 8
if (x == 8) {
  cat("x is 8!\n")
}

x is 8!


下の文は何も出力しません。`x`が8でないため、行われるべき操作が定義されていないためです。

In [56]:
x <- 7
if (x == 8) {
  cat("x is 8!\n")
}

次のように記述すると、`x == 8` に合わない場合にも情報が出力されます。

In [58]:
x <- 7
if (x == 8) {
  cat("x is 8!\n")
} else {
  cat("x is not 8...\n")  
}

x is not 8...


## 関数

関数は、ある入力に対し特定のルールにしたがって答えを出力する箱のようなものです。たとえば、$f(x) = 3x + 2$ という関数は、実数$x$に対して、$3x + 2$を返します。プログラミングでは、数値以外のさまざまな入力値・出力値を持つ関数を定義し、利用します。
関数は、主に繰り返し行われる処理について定義されることが多いです。その処理部分を切り分けることで、コード全体が見やすくなるというメリットがあります。

関数は `function(<引数１>, <引数2>, ...)` という形で定義します。ここで引数とは入力値と同義です。関数は変数として、名前をつけて格納することができます。そうすることで、同じ関数を繰り返し利用することが可能になります。

下の例では、入力値 `x`が10未満であるかどうかを判定する関数を定義しています。

In [63]:
less_than_10 <- function(x) {
  x < 10  
}

less_than_10(5)
less_than_10(13)
less_than_10(10)

## 外部ライブラリの利用

Rの標準機能は分析機能としては不十分であるケースが多いため、通常外部ライブラリを利用します。ライブラリの読み込みには `library`関数を利用します。下の例では、`readr`ライブラリを読み込み、`read_csv`関数が使えるようになったことを確認しています。

In [75]:
library(readr)
read_csv