#**R入門（その1）**

---

**このノートブックについて**<br>
このColabのノートブック「R入門（その1）」では「Rの第一歩」を解説します。<br>
<br>
> 注：このノートブックは駒澤大学経済学部で開講している「経済統計a/b」で「Excel以外の手法を学ぶ意欲がある履修生向け」に**最低限の知識**を解説する**補助資料**です。
<br>
補足：最小限のことしか解説しないので、詳しく知りたい人はたとえば以下の書籍『R言語ではじめるプログラミングとデータ分析』を見てください（紹介した書籍以外にも素晴らしいRの入門書は多くありますので、探してみてください。）<br>https://www.amazon.co.jp/dp/4802612389/
<br>
https://cloud.r-project.org/doc/contrib/Torfs+Brauer-Short-R-Intro.pdf

**最初に呪文（全オブジェクトの削除）**<br>最初にちょっとした呪文を入れましょう。<br>（補足：以下の呪文rm(list=ls())は既にあるオブジェクトを全部削除するコマンドです。必須ではありませんが、場合によってはトラブルを避けるために役立つことがあります。）


In [None]:
rm(list=ls())

**四則演算から始めよう**<br>最初に四則演算から始めましょう。足し算は+、引き算は-、掛け算は*、割り算は/を使います。なお、入力する数字や記号はすべて半角英数字です。計算の結果見ると整数だけでなく、小数や負の数（マイナス）なども使えることがわかります。

In [None]:
1 + 3
1 - 2
1.3 * 2
5 / 2


次は少し難しいですが、べき乗です。たとえば「2の3乗は8」です。^を使います。

In [None]:
2^3

**変数への代入をしよう**<br>次に変数への代入を学びましょう。「変数？代入？」と思う人は早速やってみましょう！

In [None]:
a <- 1
a

「a <-1 」という部分は「変数aに数字1」を代入することを意味します。そのあとの単に「a」とあるのはその中身を表示するためで、下に「1」と表示されるため、「aに1が代入されている」ことがわかります。次に足し算をやってみましょう。

In [None]:

b <- 2.1
a + b

「b <- 2.1」は「変数bに数字2.1」を代入することを意味し、「a + b」は「aとbを足す」を意味します。見た通りですね。今、aとbにはそれぞれ1と2.1が入っています。これらの数字をスカラーと言います。

**ちょっと寄り道**
<br>他のプログラム言語を知っている人の中には「代入に<-を使うなんて変だなぁ」と思う人がいるかもしれません。実はRは代入に「=」を使うことができ、その機能は（厳密には違うものの）、「<-」とほぼ同じです。なので、多くの場合は個人的な好みで使い分けてください（矢野個人は代入に「<-」を使います）。<br>
それとちょっと面白い機能として「->」という代入も可能です。下の例を見てください。

In [None]:
c = 112
c
321 -> d
d

**TRUEとFALSEを覚えよう！**
<br>
最初は「何に役立つのかわからない！」と思うかもしれませんが、<br>Rでは「真をTRUE」、「偽をFALSE」と表します。

> 場合によってはTRUEを単にT、FALSEを単にFと略すことができる場合もあります。

<br>
たとえば、「x <- 11, y <- 11, z <- 22」と代入したとき、「x = y」は真、「x = z」は偽ですね。<br>ただし、Rでは「x = y」のように2つの値が等しいことを表すときに==を使います。

In [None]:
x <- 11
y <- 11
z <- 22
x == y
x == z

**ベクトルを作ろう**<br>次にベクトルを作りましょう。ベクトルはスカラーの組み合わせです。cと()と,を使います。変数の名前はvecのように複数の半角英数字を組み合わせて作ることができます。



In [None]:
vec <- c(1, -2.1, 5.6, 4)
vec

一つ上で作ったベクトルvecの中で左から1番目の要素（数）は1、左からから3番目の要素は5.6です。それを取り出してみましょう。また、取り出すときには[]を使います。

In [None]:
vec[1]
vec[3]

**文字列を使う**
<br>
文字列（文字や文章）を変数にすることもできます。この場合、二重引用符""を使います。

In [None]:
mojiretsu <- "今日の天気は晴れです"
mojiretsu

mojiretsuという変数の中に「今日の天気は晴れです」と文字列（文章）が入っていることがわかります。文字列のベクトルを作ることもできます。

In [None]:
mojivec <- c("今日の天気は晴れです", "昨日の天気は雨でした", "明日の天気は予報では雪です")
mojivec

文字列のベクトルの2番目の要素は"昨日の天気は雨でした"です。それを取り出してみましょう。この場合も[]を使います。

In [None]:
mojivec[2]

文字列に関するちょっと寄り道
<br>ここで少し寄り道してみましょう。Pythonには文字列を掛け算をしたり、足し算をしたりする

**関数（すでに組み込まれた関数）を使う**
<br>
次に関数という機能を使ってみましょう。たとえば、平均（平均値）を計算することを考えましょう。Rではmean()という関数を使います（半角文字のmeanに括弧()を使います）。また、mean()の括弧に入る変数を引数といいます。
<br>
最初から組み込まれているので組み込み関数などと呼ばれます。組み込み関数は多いので、最初から全部覚える必要はありません。

In [None]:
#最初に元となるデータのベクトルを作ります。
motodata <- c(1, 2, 3, 4, 5)
mean(motodata)
# mean()の結果を変数に入れることもできます。
heikinvec <- mean(motodata)
heikinvec

上のコードを見て、「あれ？#ってなんのマーク？」と思った人がいるかもしれません。#は「ここから左はコメントである」ことを意味します。プログラムにメモなどを書きたいときに使います。

それ以外にも平方根を計算するsqrt()という関数などもあります。4の平方根は2ですね。実際にやってみましょう。

In [None]:
sqrt(4)

**欠損値を知ろう**
<br>データの一部が「（記録ミス・紛失等の理由で）値がない」場合、欠損値（missing values）といいます。たとえば、一郎・花子・二郎の国語のテストをしたとき、二郎のテストの点数がわからなくなった場合、「二郎の点数が欠損値」です。
<br>Rでは欠損値をNAと表します。（なお、NAは「Not Available=利用できない/入手できない」の頭文字に由来すると言われています。）

> 「え？欠損値って重要なの？それをNAで表すことって大切なことなの？」と思う人もいるかも知れませんが、現実の世界では「データを取り損ねる（もしくはデータは取ったけどなくなってしまった）」ということはよくあり、「欠損値をどう表すか」を知っておくことは大切です。

以下の例を見て使い方を知っておいてください。

In [None]:
kokugoTensu <- c(85, 92, NA) # 一郎が85点、花子が92点、二郎が欠損値
# この平均値は？
mean(kokugoTensu)

二郎の点数がNA（欠損値）なので、平均もNAになってしまいました。こういうときのやり方として「NA（欠損値）を取り除く」という方法が考えられます。na.omit()という関数があります。

> ただし、「NA（欠損値）を取り除く」という方法がいつでも望ましいわけではありません。「NAを取り除くというやり方ではうまくいかない」場合もあります。興味があったら調べてみてください。



In [None]:
# 第1の方法
na.omit(kokugoTensu)
mean(na.omit(kokugoTensu))
# 第2の方法
mean(kokugoTensu, na.rm=TRUE)

**ライブラリを呼び出そう（この説明は将来より適切な場所に移動する）**
<br>
Rはそれだけでも多機能なプログラム言語ですが、多くの便利な機能がライブラリという単位でまとめれています。ライブラリはlibrary()もしくはrequire()というコマンドでRに読み込んでから使います。


**お疲れさまでした**<br>
皆さんお疲れさまでした。今日の「Rの第一歩」はこれで終わりです。
<br>
「案外かんたんだった」、「いや、難しかった」、人によっていろいろな感想があると思いますが、「Excelを使った回帰分析以外の方法」を勉強してみたいという人はぜひ「[Rを使った単回帰](https://colab.research.google.com/github/koiti-yano/colab/blob/main/経済統計_R入門_2_lm.ipynb)」にもチャレンジしてみてください。