# Python基礎

この講座ではPythonというプログラミング言語を使ってデータ分析を行います。その準備として、このChapterではPythonの基礎文法を学んでいきます。プログラミング未経験者・初心者の人は、このChapterを通してプログラミングというものに少しずつ慣れていきましょう。

### 目次

**[0.1 プログラミング入門](#1.1-プログラミング入門)**  
> [0.1.1 概論](#0.1.1-概論)  
> [0.1.2 プログラミングの進め方](#0.1.2-プログラミングの進め方)  
> [0.1.3 コメント](#0.1.3-コメント)  
> [0.1.4 エラーへの対処方法](#0.1.4-エラーへの対処方法)  

**[0.2 Python文法(基礎)](#1.2-Python文法(基礎))**  
> [0.2.1 演算](#0.2.1-演算)  
> [0.2.2 変数](#0.2.2-変数)  
> [0.2.3 プログラムの評価](#0.2.3-プログラムの評価)  
> [0.2.4 条件分岐](#0.2.4-条件分岐)  
> [0.2.5 ループ](#0.2.5-ループ)  
> [0.2.6 関数](#0.2.6-関数)  
> [0.2.7 データ型](#0.2.7-データ型)  
> [0.2.8 練習問題](#0.2.8-練習問題)  


**[0.3 Python文法(発展)](#0.3-Python文法(発展))**
> [0.3.1 クラス](#0.3.1-クラス)  
> [0.3.2 モジュール・ライブラリ](#0.3.2-モジュール・ライブラリ)  

**[0.4 総合問題](#0.4-総合問題)**

## 0.1 プログラミング入門

### 0.1.1 概論

**プログラミング**とは、「ある目的のためにプログラム(コンピュータに対する命令を並べたもの)を設計・構築する」プロセスのことを言います。もう少し簡単に言えば、「ある計算を行う手順を記述する」のがプログラミングです。

例えば、2と3の和を求めるとき、下のようなプログラムを書いて実行することでその答えを知ることができます。単純な例ですが、これも立派なプログラムです。

```python
2 + 3
```

より複雑な例として、1から10までの和を求めるプログラムを以下に示します。(詳細については以降の節で学びます。)

```python
s = 0
for n in range(1,11):
    s = s + n
s
```

プログラミングをするときには何らかの**プログラミング言語**を使用します。プログラミング言語には「Aというプログラムを書くとBという処理が行われる」というような規則が定められています。これを**文法**と言いますが、文法は使用するプログラミング言語によって異なります。プログラミングの学習は、この文法を知ることから始まります。

データ分析・機械学習のためのツールが豊富に揃っているという理由で、この講座ではPythonという言語を使ってプログラミングをしていきます。実際、その領域でPythonを使っている人はとても多いです。またPythonはプログラミング初学者にとって比較的わかりやすい言語であり、学習コストが低いのも魅力の1つです。ということで、このChapterではPythonの基礎文法を学んでいきます。

### 0.1.2 プログラミングの進め方

これから実際にPythonでプログラミングをしていきますが、その進め方について簡単に説明します。
このファイルを読むために**Jupyter Notebook**(やそれに類するツール)を利用していると思います。Jupyter NotebookはPythonの実行環境を提供しており、**セル**と呼ばれるボックスにPythonプログラムを書いてShift + Enterを押すことで実行することができます。

セルにはいくつかの種類がありますが、そのうちプログラムを実行するためのセルが**Codeセル**です。コードセルの左側には`In[n]`といった表示が出ています。プログラムを書いて実行すると`Out[n]`といった表示の横にその実行結果が表示されます。

ノートブックにはメモを残すこともできます。そのためのセルが**Markdownセル(Textセル)**です。Markdown記法を用いることで見栄えの良いテキストを作成することができます。

では、先ほどのプログラムを実行してみましょう。正しい実行結果が返ってきたらOKです。

In [None]:
2 + 3

In [None]:
s = 0
for n in range(1,11):
    s = s + n
s

### 0.1.3 コメント

Jupyter Notebook以外にも、Pythonの実行環境は様々あります。例えばPythonのインタラクティブシェルは入力されたプログラムに対してその実行結果を返しますが、基本的に入力プログラムや出力結果を保存しないため、シェルを閉じると内容が消えてしまいます。それに対してJupyter Notebookはプログラムとその実行結果をともに保存しておけるので、ノートブックを閉じても問題ありません。

しかし、プログラムが残っていたとしてもその意味がわからなくなることがあるかもしれません。プログラムを書く際には適度にメモを残していくことで、後で見返したときに役立ちます。多くのプログラミング言語ではプログラムに**コメント**をつけることができ、コメントとして書いた部分はプログラム実行のときに無視されるようになっています。

Pythonでは`#`の右側部分がコメントとみなされます。例で確認してみましょう。

In [None]:
# コメント
2 + 3 # コメント
# コメント

### 0.1.4 エラーへの対処方法

プログラミングには**エラー**がつきものです。文法に則らないプログラムを書いたり、何らかの不正な処理をしたりしたときにエラーが発生します。エラーが発生すると、その場所でプログラムの実行が停止し、どの部分でどのような原因でエラーが生じたかがエラーメッセージとして表示されます。これからたくさんのエラーに遭遇すると思いますが、まずはエラーメッセージを解読するよう努めましょう。もしその意味が分からなければ、インターネットで検索してみましょう。同様のエラーで苦しんだ人が必ずいるはずです。

## 0.2 Python文法(基礎)

### 0.2.1 演算

まずは算術演算から始めましょう。加算、減算については数学の記号と同様ですが、乗算、除算についてはプログラミング言語に特有な記号を使います。(これは多くの言語で共通しています。)

In [None]:
# 加算
6 + 3

In [None]:
# 減算
6 - 3

In [None]:
# 乗算
6 * 3

In [None]:
# 除算(商)
6 / 3

In [None]:
# 除算(剰余)
6 % 3

In [None]:
# 冪乗
6 ** 3

算術演算を組み合わせて、より複雑な計算を行うこともできます。このとき、演算子の結合強度は **冪乗 > 乗算・除算 > 加算・減算** となっています。括弧がある場合、その内部の計算を優先します。

In [None]:
(1 + 2) * 3 + 4**2

In [None]:
2 + 3 * 4

In [None]:
(2 + 3) * 4

In [None]:
2 ** 3 * 4

In [None]:
2 ** (3 * 4) 

比較演算も見てみましょう。以下に示すように、比較のパターンは6種類あります。「等しい」「等しくない」を表す記号は数学のそれとは異なります。

In [None]:
# (左)が(右)より大きい
2 > 3

In [None]:
# (左)が(右)より小さい
2 < 3

In [None]:
# (左)が(右)以上である
2 >= 3

In [None]:
# (左)が(右)以下である
2 <= 3

In [None]:
# (左)が(右)と等しい
2 == 3

In [None]:
# (左)が(右)と等しくない
2 != 3

ここで、`True`および`False`は**真偽値**といいます。`True`は真(成立)である、`False`は偽(不成立)であることを表します。

ここからは論理演算(真偽値に関する計算)を見ていきます。Pythonでは論理積`and`、論理和`or`、否定`not`がサポートされています。

In [None]:
True and False

In [None]:
True or False

In [None]:
not True

### 0.2.2 変数

次に**変数**について説明します。変数とは、式の計算結果を保存しておく箱のようなものです。変数に値を保存することを**代入**と言い、その値を取り出して利用することを**参照**と言います。

In [None]:
# xに1を代入し、xを参照する
x = 1
x

1

上の例では`x`が変数です。プログラミング言語において`=`は「等しい」という意味ではなく「代入する」という意味で使います。

一度保存した値は何度でも利用することができ、上書きされるまで残り続けます。変数の値を上書きすることを**再代入**ということもあります。再代入のときも代入と同様に書くことができます。

In [None]:
# xに2を再代入する
x = 1
x = 2
x

In [None]:
# x+1をxに再代入する
x = 1
x = x + 1
x

直前の例の2行目について説明します。これは右辺の`x+1`を計算し、その結果を左辺の`x`に代入する、という処理を行います。右辺の計算をする時点で`x`の値は1なので、右辺の計算結果が2となり、`x`に2が代入されます。このように、変数の値を更新しながら計算を進めていくというのはよくあることです。

### 0.2.3 プログラムの評価

ここでプログラミングにおける**評価**について少し触れておきます。
コンピュータに対する命令を並べたものをプログラムと言いましたが、その1つ1つの命令に対応するものを**式**と言います。プログラムを実行するというのは、命令列を順に処理していき、プログラム全体としての処理結果を得ることです。

式(に対応する命令)を処理すると、基本的に何らかの値が返ってきます。このように式を処理して値を得ることを式の評価、結果として得られる値を評価値と言います。式が複数並んでいる場合には、その最後の式の評価結果が全体の評価結果になります。例えば

```python
2 + 3
```

という式の評価結果は`5`になりますし、

```python
2 + 3
3 + 4
```

という複数の式の評価結果は`7`になります。プログラムは複数の式の並びなので、その評価値はプログラム中の最後の式の評価値ということになります。Jupyter Notebook上ではプログラムの評価値が`Out[n]`の右側に出ることになっています。

評価値がないような式もあります。代表的な例としては出力関数が挙げられます。(関数については後で学びます。)これはプログラム中にある式の評価値を表示するような命令です。

In [None]:
# 出力関数
print(2 + 3)
3 + 4

上のプログラムを実行すると、その評価値として`7`が得られますが、その上に`5`と表示されます。この`5`は`print(...)`の中の式`2 + 3`の評価値に対応しています。`print`関数を使うことで、プログラムの途中式の計算結果を見ることができます。プログラムにエラーがあったとき、その原因を探るための常套手段としてよく用いられます。

この`print`をプログラムの最後に書くと下のような結果となります。

In [None]:
# 出力関数の評価値
print(2 + 3)
print(3 + 4)

実行しても`Out[n]`の表示が現れません。このように、プログラムの評価値がない場合には`Out[n]`の表示が省略されることに注意しましょう。
もう少し調べてみましょう。代入式

```
<変数> = <式>
```

ではまず右辺の式が評価され、その値が左辺の変数に代入されます。では、右辺の式の評価値がない場合にはどうなるでしょうか。実際に試してみましょう。

In [None]:
# 右辺の式の評価値がない場合の代入式
x = print(2 + 3)
print(x)

Pythonでは値が存在しないことを表すデータとして`None`というものが用意されています。`None`に対する演算は限られていますが、例えばあるデータがNoneかどうか判定するには`is`演算子を用いて下のようにします。

In [None]:
# is演算子
x = print(2 + 3)
x is None

### 0.2.4 条件分岐

プログラムの基本的な処理の1つに**条件分岐**があります。これは条件によって実行する処理を変えるというものです。
早速ですが、条件分岐に関する文法を見ていきましょう。Pythonでよく使われるのは`if`文です。フォーマットを以下に示します。

```python
if <条件式0>:
    <(条件式0がTrueのときに実行する)処理>
elif <条件式1>:
    <(条件式0がFalse、条件式1がTrueのときに実行する)処理>
else:
    <(すべての条件式がFalseのときに実行する)処理>
```

`if`文は、条件式が`True`ならば処理を実行します。条件式が`False`のときに実行する処理を`else`節として`if`文に加えることもできます。また、条件を複数指定したい場合には`elif`節を合わせて使うことがあります。`elif`節は任意の数だけ繰り返すことができます。

注意すべきなのは、(条件式がTrue/Falseとなったときに実行される)処理の前に**空白(スペース)を4つ入れなければならない**ということです。Pythonではこれを**インデント**と呼んでいます。適切にインデントが挿入されていないとエラーとなります。

それでは例を見てみましょう。下の例では変数`x`の絶対値を計算し、その結果を`y`に格納しています。

In [None]:
x = -1
if (x < 0):
    y = - x
else:
    y = x
y

1

上では明示的に書きませんでしたが、複数の連続する処理を実行させることもできます。このとき、その処理すべての前にインデントを挿入する必要があります。プログラミングにおいて処理のまとまりのことを一般に**ブロック**と言いますが、Pythonではインデントが挿入されている部分をブロックとみなして処理しています。

下の2つの例は似ているようですが全く異なるコードです。インデントに注目して動作を確認してみてください。

In [None]:
# 例1
x = 1
if (x < 0):
    x = - x
    x = - x
x

1

In [None]:
# 例2
x = 1
if (x < 0):
    x = - x
x = - x
x

-1

### 0.2.5 ループ

プログラムにおいて、同じような処理を繰り返し実行したい、ということはよくあります。例として1から10までの和を求めることを考えましょう。ここまでに学んだことを使って書けば下のようになります。

In [None]:
# 1から10までの和
x = 0
x = x + 1
x = x + 2
x = x + 3
x = x + 4
x = x + 5
x = x + 6
x = x + 7
x = x + 8
x = x + 9
x = x + 10
x

55

確かに求めることはできますが、プログラムが長くなってしまいます。こういう場合には**ループ**を利用することで効率的にプログラミングをすることができます。では、ループを使ったプログラムを見てみましょう。

In [None]:
# 1から10までの和
x = 0
for n in range(1,11):
    x = x + n
x

55

ループを利用することによって、共通する部分の処理は1回だけ書けば良いことになります。

では、ループに関する文法を紹介します。Pythonでよく使われるループは2種類あり、`for`文と`while`文があります。フォーマットは以下の通りです。

- `for`文

```python
for <変数> in <イテレータ>:
    <処理>
```

- `while`文

```python
while <条件式>:
    <(条件式がTrueの間だけ実行する)処理>
```

イテレータ(※)とは何らかのデータ系列を生成するようなものです。上の例で用いた`range(1,11)`は1, 2, ..., 10を生成しています。
`for`文ではイテレータが生成するデータを順に変数に代入して処理を行う、ということを繰り返していきます。そして最後のデータまで処理したら`for`文を抜けます。上の例では、まず`n`に1を代入して`x = x + n`を計算し、次に`n`に2を代入して......最後に`n`に10を代入して計算したら`for`文を抜けます。

※正確にはPythonにおける「反復可能オブジェクト」であればループを利用して要素を取り出すことができます。ここでは一般的な「イテレータ」を想定して説明しています。

`while`文は条件式が`True`ならば処理を行い、`False`ならば(`while`文を)抜ける、という挙動をします。
上の例を`while`文を使って書けば下のようになります。

In [None]:
x = 0
n = 1
while (n <= 10):
    x = x + n
    n = n + 1
x

55

`while`文の処理を1回行うたびに`n`が1ずつ増えていくので、このループはちょうど10回まわることが確認できるでしょう。

これら`for`文と`while`文は本質的に同じものです。すなわち、`for`文で実現できることは`while`文でも実現でき、逆もそうであるということです。とはいえ書きやすさは状況によって異なるので、それに応じて使いやすい方を使うのが良いと思います。

ところで、`for`文・`while`文もインデントによってブロックを認識します。`if`文と同様インデントに注意しましょう。

ループは条件分岐と組み合わせて使うことがよくあります。例として1から10までの偶数の和を求めるプログラムを示します。偶数は2で割った剰余が0になることに注意してください。

In [None]:
# 1から10までの偶数の和を求めるプログラム
x = 0
n = 1
while (n <= 10):
    if (n % 2 == 0):
        x = x + n
    n = n + 1
x

30

### 0.2.6 関数

プログラムを作成していると、以前作成したものを再度利用したいと思うことがあるかもしれません。**関数**を利用することで、その処理の流れに名前をつけて保存し、必要になったら呼び出すことができるようになります。

フォーマットは以下の通りです。

- 関数定義

```python
def <関数名>(<引数>, ...):
    <関数内部の処理>
```

- 関数呼び出し

```python
<関数名>(<引数>, ...)
```

関数を呼び出すとき、0個以上の**引数**を渡します。関数内の処理ではこの引数の値を利用することができます。これだけでは理解しづらいと思うので、絶対値を求めるプログラムを例にとって具体的に説明します。

ある`x`が与えられたとき、その絶対値`y`は下のプログラムを利用して求めることができます。これは以前作成したものと全く同じものです。

In [None]:
# 絶対値を求めるプログラム
x = -1
if (x < 0):
    y = - x
else:
    y = x
y

1

この処理の流れを関数にしたいと思います。関数を利用するためには、まず関数を**定義**する必要があります。関数定義は下のようにします。

In [None]:
# 絶対値を求める関数の定義
def absolute(x):
    if (x < 0):
        y = - x
    else:
        y = x
    return y

ここで関数名は絶対値(absolute value)を意味する`absolute`としています。この関数を呼び出す(利用する)ときにはこの名前を使います。

この`absolute`関数を呼び出してみます。関数を呼び出すときには引数を与える必要がありますが、これは定義したときと同じ個数である必要があります。

In [None]:
# 絶対値を求める関数の呼び出し
absolute(-1)

1

関数内の処理では引数の値を利用することができると言いましたが、より詳しく言えば「関数呼び出しのときに与えた引数が、関数定義のときに与えた引数のところにコピーされる」ということです。上の例では、関数呼び出しのときに-1を引数として与えていますが、それは関数定義したときに与えた引数`x`にコピーされています。

プログラミングの用語では、関数定義のときに与えた引数のことを**仮引数**、関数呼び出しのときに与えた引数のことを**実引数**と呼んでいます。

関数の評価値は、関数内部で`return`した値になります。これを**返り値**と言います。上の例では`y`が返り値となりますが、これが`x`の絶対値になっていることが確認できると思います。なお、`return`されない場合には関数の返り値は`None`になります。

なお、複数の引数を持つ関数を定義することもできます。ただし、実引数の順は仮引数のそれに対応していることに注意してください。

In [None]:
# べき乗を求める関数
def power(x, y):
    return x ** y

In [None]:
power(2, 3)

8

In [None]:
power(3, 2)

9

仮引数と実引数の対応を明示的に指定する場合には、`<仮引数>=<実引数>`という形式で指定します。この形式で渡す引数を**キーワード引数**と言います。それに対して、明示的には指定しない(実引数の順が仮引数のそれに対応していると仮定する)場合の引数を**位置引数**と呼ぶことがあります。

In [None]:
power(y=2, x=3)

9

さらに、引数(の一部)に既定値を与えておき、その引数を省略可能とすることもできます。これを**デフォルト引数**と言います。関数呼び出しの際にその引数が省略された場合、既定値が使用されます。

In [None]:
def power(x=1, y=1):
    return x ** y

In [None]:
power(x=3)

3

### 0.2.7 データ型

これまでは整数および真偽値を扱ってきましたが、それ以外にも様々なデータの種類があります。プログラミング言語におけるデータの種類のことを**データ型**と言います。Pythonでよく使われるデータ型は以下の通りです。

- int型(整数)
- float型(小数)
- bool型(真偽値)
- str型(文字列)
- list型(リスト)
- tuple型(タプル)
- dict型(辞書)

この節では`int`型および`bool`型以外のデータ型について簡単に説明します。

#### float型(小数)

float型はint型(整数)とほぼ同様の操作を行うことができます。

In [None]:
# 加算
4.0 + 3.0

In [None]:
# 減算
4.0 - 3.0

In [None]:
# 乗算
4.0 * 3.0

In [None]:
# 除算(商)
4.0 / 3.0

In [None]:
# 除算(剰余)
4.0 % 3.0

In [None]:
# 冪乗
4.0 ** 3.0

int型・float型の値が混ざった式を計算することもできます。このとき、int型はfloat型に変換され、float型で計算されます。

In [None]:
# int型・float型が混ざった式
4 + 3.0

7.0

(浮動)小数の計算では、その性質上、誤差が発生することがあります。興味がある人は調べてみると良いでしょう。

#### str型(文字列)

**文字列**はその名の通り、文字が並んだもののことです。Pythonでは`'...'`(シングルクオーテーション)または`"..."`(ダブルクオーテーション)で囲んだ部分が文字列となります。`'...'`で囲んだものと`"..."`で囲んだものは同じ文字列ですが、囲うことができる文字に違いがあります。(その違いについてはこの資料では扱いません。)

In [None]:
# 文字列
"abc"

'abc'

文字列に対する操作を見ていきましょう。
まずは文字列の結合です。int型の加算と同じ記号`+`で文字列を結合することができます。

In [None]:
# 文字列の結合
"abc" + 'def'

'abcdef'

文字列に含まれる文字の数を(文字列の)長さと言いますが、これを求める関数として`len`が用意されています。

In [None]:
# 文字列の長さ
len("abc")

3

#### list型(リスト)

**リスト**は、複数の要素を集めたものです。他のプログラミング言語では**配列**と呼ばれることが多いです。Pythonでは`[<要素>, ...]`(角括弧)という形式でリストを作ることができます。

In [None]:
# リスト
[1, 2, 3]

[1, 2, 3]

リストに対する操作を見ていきましょう。
リストの各要素には`<リスト名>[要素番号]`という形式でアクセスすることができます。この要素番号のことを**インデックス**と言い、**0から数え始めます**。

In [None]:
# 要素の参照
x = [1, 2, 3]
x[0]

1

要素を参照するだけではなく、新しい要素を代入することもできます。

In [None]:
# 要素の代入
x = [1, 2, 3]
x[0] = 10
x

[10, 2, 3]

一度に複数要素アクセスすることもできます。Pythonではこれを**スライス**と呼んでいます。`<リスト名>[開始位置:終了位置:増分]`という形式でアクセスします。デフォルトの開始位置は先頭、終了位置は末尾(の後ろ)、増分は1となっており、省略するとデフォルト値が使われます。スライスでアクセスしたとき、**終了位置は含まれない**ことに注意してください。

In [None]:
# スライス(参照)
x = [1, 2, 3, 4, 5]
x[2:4:1]

[3, 4]

スライスに対して代入を行うこともできます。このとき、代入式の右辺はリストにするようにしてください。

In [None]:
# スライス(代入)
x = [1, 2, 3, 4, 5]
x[2:4:1] = [10, 20, 30]
x

[1, 2, 10, 20, 30, 5]

リストに含まれる要素の数を(リストの)長さと言いますが、これを求める関数として`len`が用意されています。

In [None]:
# リストの長さ
len([1, 2, 3])

3

リストを操作するにあたって`for`文などのループを利用することが多いです。例えばリストのすべての要素を2乗するプログラムは下のように書くことができます。

In [None]:
# すべての要素を2乗するプログラム
x = [1, 2, 3, 4, 5]
for i in range(len(x)):
    x[i] = x[i] ** 2
x

[1, 4, 9, 16, 25]

#### tuple型(タプル)

タプルもリスト同様複数の要素を集めたもので、他のプログラミング言語では**組**と呼ばれています。Pythonでは`(<要素>, ...)`(丸括弧)という形式でタプルを作ることができます。

In [None]:
# タプル
(1, 2, 3)

(1, 2, 3)

リストが**同じ種類のデータをまとめる**のに対して、タプルは**異なる種類のデータをまとめる**ことが多いです。データの構造が似ているため、リストと同じような操作を行うことができますが、微妙に異なる部分もあります。以下ではリストとの共通点と相違点を比較しながらタプルを学んでいきます。

タプルではリスト同様に、インデックスを用いて要素にアクセスすることができます。

In [None]:
# 要素の参照
x = (1, 2.0, "3")
x[0]

1

In [None]:
# スライス(参照)
x = (1, 2.0, "3")
x[0:2]

(1, 2.0)

しかし、タプルに要素を代入することはできません。要素を追加したり削除したりすることも認められていません。リストは変更可能である(**mutable**である)のに対し、タプルは変更不能である(**immutable**である)ことに注意しましょう。

実はタプルを生成するのに丸括弧を省略することができます。よって下の2つの例は同じコードとみなすことができます。

In [None]:
# 例1
(x, y, z) = (1, 2.0, "3")
x

1

In [None]:
# 例2
x, y, z = 1, 2.0, "3"
x

1

例2は複数の値を複数の変数にそれぞれ代入していると考えることもできます。これを**多重代入**と言います。関連する用語に**パック**や**アンパック**というものがありますが、ここでは用語の紹介に留めておきます。より発展的な内容を学びたい人は調べてみると良いでしょう。

#### dict型(辞書)

辞書はリストの各要素に**キー**と呼ばれるラベルをつけたもので、他のプログラミング言語では**連想配列**と呼ばれています。Pythonでは`{ <キー>: <値>, ...}`という形式で辞書を作ることができます。

In [None]:
# 辞書
{"a": 1, "b": 2, "c": 3}

{'a': 1, 'b': 2, 'c': 3}

リストではインデックスによって各要素にアクセスしていたのに対し、辞書ではキーを使って値にアクセスします。リストと同様に、要素の参照および代入を行うことができます。

In [None]:
# 要素の参照
x = {"a": 1, "b": 2, "c": 3}
x["a"]

1

In [None]:
# 要素の代入
x = {"a": 1, "b": 2, "c": 3}
x["b"] = 10
x

{'a': 1, 'b': 10, 'c': 3}

なお、辞書にないキーに対して代入を行うと、それが新しいキーとして登録されます。

In [None]:
# 要素の代入
x = {"a": 1, "b": 2, "c": 3}
x["d"] = 4
x

{'a': 1, 'b': 2, 'c': 3, 'd': 4}

辞書からキー全体を取得したり、要素全体を取得したりするための手段も用意されています。辞書の`keys`メソッドおよび`values`メソッドを利用します。(メソッドについては次項のクラスのところで学びます。)

In [None]:
# キーの取得
x = {"a": 1, "b": 2, "c": 3}
x.keys()

dict_keys(['a', 'b', 'c'])

In [None]:
# 要素の取得
x = {"a": 1, "b": 2, "c": 3}
x.values()

dict_values([1, 2, 3])

### 0.2.8 練習問題

(1) 変数`x`に整数が格納されているとします。`x`が偶数ならば0、奇数ならば1を返すプログラムを作成してください。

In [None]:
# 入力例
x = 1

In [None]:
# write me!

(2) 要素がすべて整数値であって、長さが1以上のリストが変数`x`に格納されているとします。`x`の要素の中で最も大きい要素を返すプログラムを作成してください。ただし、`max`関数などは使用せず、ループで実現してください。

In [None]:
# 入力例
x = [1, 2, 3]

In [None]:
# write me!

(3) 長さが1以上の文字列を引数`x`とし、`x`の最後の1文字を返す関数`f`を定義してください。

In [None]:
# write me!

(4) 辞書を引数`x`とし、`x`に格納されているキーの数を返す関数`f`を定義してください。

In [None]:
# write me!

(5) リストを引数`x`とし、`x`の要素を逆順に並べたリストを返す関数`f`を定義してください。ただし、`reversed`関数などは使用せず、ループやリストのスライスで実現してください。

In [None]:
# write me!

## 0.3 Python文法(発展)

### 0.3.1 クラス

Pythonでプログラミングをする上で知っておきたいのが**オブジェクト指向**の概念です。オブジェクト指向について理解するために、まずはオブジェクトという言葉の定義を見てみましょう。以下はPythonドキュメントからの引用です。

> Python における オブジェクト (object) とは、データを抽象的に表したものです。Python プログラムにおけるデータは全て、オブジェクトまたはオブジェクト間の関係として表されます。(ある意味では、プログラムコードもまたオブジェクトとして表されます。これはフォン・ノイマン: Von Neumann の "プログラム記憶方式コンピュータ: stored program computer" のモデルに適合します。)
<br><br>
https://docs.python.org/ja/3.8/reference/datamodel.html

すべてのオブジェクトには**型**が定義されており、それがオブジェクトに対して実行可能な操作を決めています。例えば`len`関数はリストに対しては実行可能ですが、数値に対しては実行可能ではありません。型はオブジェクトが生成されてから破壊されるまで変更することはできません。

また、オブジェクトは**属性**と**メソッド**というものを持っています。属性はそのオブジェクトに固有な性質で、メソッドはそのオブジェクトに対する操作です。同じ型のオブジェクトではメソッドは共通していますが、属性はそれぞれ異なっています。
オブジェクトについて考えるとき、現実世界の例を挙げると理解しやすいでしょう。例えば、「人間」をオブジェクトとして見たとき、「名前」「年齢」は属性であり、「歩く」「考える」という動作はメソッドであると考えることができます。

オブジェクト指向とは、その名の通り「プログラムをオブジェクト中心に考える」というものです。オブジェクトに定義されたメソッドを通してオブジェクトを操作し、プログラムを構成していくものです。一口に「オブジェクト中心に考える」と言っても、その背景には**カプセル化**、**継承**、**ポリモーフィズム**といった概念があります。少し難しい内容が含まれているのでここでは説明しませんが、参考になる記事はたくさんあるので調べてみるといいと思います。

それでは、オブジェクト指向の中心となる**クラス**の機能について見ていきましょう。

クラスは新しいデータ型を定義するための設計図のようなものです。この設計図にはデータ型(属性)に関する定義とそのデータに対する処理(メソッド)に関する定義が書かれています。そして、この設計図をもとにオブジェクトを生成することができます。そのオブジェクトはクラス(設計図)に書かれていた属性・メソッドを持ち、メソッドを呼び出すことで自身または他のオブジェクトに影響を与えます。Pythonではクラスから生成されたオブジェクトのことを**インスタンス**と呼んでいます。

クラス(設計図)の作り方は以下のようになります。

```python
class <クラス名>
    def <メソッド名>:
        <処理>
    ......
```

In [None]:
# クラス定義の例
class Klass:
    def __init__(self):
        self.attribute = None
    def method(self, argument):
        self.attribute = argument
#     def __del__(self):
#         print("delete")

In [None]:
class Student :

    def __init__ (self):
       self.name = ""

    def avg(self, math, english):
        print((math + english)/2)
        
a001 = Student()
a001.name = "佐藤"
a001.avg(12,13)

12.5


上のクラス定義を使って説明します。クラス`Klass`は1つの(インスタンス)属性と3つの(インスタンス)メソッドが定義されています。`def`によって定義されているのがインスタンスメソッドです。その中にある`self.<名前>`というものがインスタンス属性です。この`self`は生成されたインスタンス自身を指しており、インスタンスメソッドはこれを第1引数としてとることが要求されます。
`__init__`メソッドと`__del__`メソッドは特別な働きをするメソッドです。`__init__`メソッドはインスタンス生成時に実行されるメソッドで、**コンストラクタ**と呼ばれています。`__del__`メソッドはインスタンス破壊時に実行されるメソッドで、**デストラクタ**と呼ばれています。インスタンス属性を初期化するのにコンストラクタを利用するのが一般的です。それに対してデストラクタは定義しないことがほとんどです。

次に、定義したクラスの利用例を以下に示します。インスタンスメソッドを定義するときには第1引数に`self`を与えましたが、呼び出すときにはその必要はない(厳密には`<インスタンス名>.<メソッド名>`で指定したインスタンスが`self`として与えられている)ということに注意しましょう。

- インスタンスの生成　　　　　　　 `<クラス名>(<引数>......)`
- インスタンス属性へのアクセス　　 `<インスタンス名>.<属性名>`
- インスタンスメソッドへのアクセス `<インスタンス名>.<メソッド名>`

In [None]:
# クラスの利用例
instance_a = Klass()
instance_b = Klass()
print("instance_a : ", instance_a.attribute)
print("instance_b : ", instance_b.attribute)

instance_a.method(0)
print("instance_a : ", instance_a.attribute)
print("instance_b : ", instance_b.attribute)

instance_b.method(1)
print("instance_a : ", instance_a.attribute)
print("instance_b : ", instance_b.attribute)

instance_a :  None
instance_b :  None
instance_a :  0
instance_b :  None
instance_a :  0
instance_b :  1


利用例から、属性は各インスタンスで独立であり、あるインスタンス`instance_b`の属性に対する変更は他のインスタンス`instance_a`に影響していないことがわかります。なお、メソッドを呼び出す前の`attribute`属性の値はコンストラクタで初期化されたものになっています。

クラスの実用的な例としてカウンタを実装します。このように、内部状態を持つものについてはクラスで実装するのが良いでしょう。

In [None]:
class Counter:
    def __init__(self):
        self.cnt = 0
    def count(self):
        self.cnt = self.cnt + 1
    def get(self):
        return self.cnt
    def set(self, n):
        self.cnt = n

x = Counter()
x.count()
x.count()
x.get()

2

前節で紹介したデータ型のオブジェクトは、Pythonであらかじめ定義されているクラスから生成されたものです。そのため、それぞれのデータ型に特有なメソッドを利用することができます。以下にその例を示します。

In [None]:
# 部分文字列の検索
x = "abcdefg"
x.find("de")

3

In [None]:
# 文字列の結合
x = ["a", "b", "c"]
",".join(x)

'a,b,c'

In [None]:
# 文字列の分割
x = "a,b,c"
x.split(",")

['a', 'b', 'c']

In [None]:
# リストへの要素の追加
x = [1, 2, 3]
x.append(4)
x

[1, 2, 3, 4]

In [None]:
# リストのソート
x = [2, 4, 1, 3]
x.sort()
x

[1, 2, 3, 4]

In [None]:
# リストの反転
x = [1, 2, 3]
x.reverse()
x

[3, 2, 1]

In [None]:
# 辞書のキー・値のペアの取得
x = {"a": 1, "b": 2, "c": 3}
x.items()

dict_items([('a', 1), ('b', 2), ('c', 3)])

### 0.3.2 モジュール・ライブラリ

プログラムを開発していると、他のプログラムファイルで定義した関数やクラスを使いたい、ということがあります。Pythonではそれを**モジュール**として取り込むことができます。モジュールは部品という意味で、通常1つのプログラムファイルを表します。

モジュールを複数まとめたものを**パッケージ**と言い、さらにパッケージをまとめたものを**ライブラリ**と言います。この辺りの呼称は明確に決まっているわけではなく、モジュールやパッケージのことをライブラリと言うこともあるようです。以下では「モジュール」と「ライブラリ」という2つの用語を使いますが、それぞれ「1つのプログラムファイル」と「複数のプログラムファイルをまとめたもの」という意味であるとして読み進めてください。

Pythonでは`import`することでモジュールを読み込むことができます。(同じディレクトリ内に存在する)プログラムファイル名を`example.py`とすると、下のように書きます。

```python
import example
```

`import`すると、そのプログラムファイルで定義された関数やクラスを利用することができます。試しに`example.py`で定義されている関数`f`を呼び出してみましょう。この関数`f`は恒等関数で、1つの引数を受け取ってそれをそのまま返します。

```python
example.f(2)
```

開発が進んでプログラムのサイズが大きくなってくると、それを細かい部品に分割して管理することが重要になります。機能ごとに関数およびクラスをまとめて別のファイルに切り出すことで、プログラムの見通しがよくなることが多いです。大きな開発をする際には心がけると良いでしょう。

続いてライブラリの話題に移ります。Pythonでは標準ライブラリというものが用意されており、様々な機能を利用することができます。標準ライブラリに含まれるモジュールの1つに、数学関数をまとめた`math`モジュールがあります。ここではそれを取り上げて説明します。

`math`モジュールには指数関数、対数関数、三角関数などが定義されており、それを`import`することで利用できるようになります。実際に利用するときには`<モジュール名>.<変数名/関数名/クラス名>`とします。

In [None]:
import math

In [None]:
# 指数関数
math.exp(1.0)

2.718281828459045

In [None]:
# 対数関数
math.log(math.e)

1.0

`from <モジュール名> import <変数名/関数名/クラス名>`とすると、モジュール名なしに変数/関数/クラスを利用することができます。

In [None]:
from math import sin
from math import cos
from math import tan
from math import pi

In [None]:
# 三角関数
sin(pi)

1.2246467991473532e-16

In [None]:
# 三角関数
cos(pi)

-1.0

In [None]:
# 三角関数
tan(pi)

-1.2246467991473532e-16

Pythonが提供している標準ライブラリ以外にも、様々なライブラリが開発されて一般に公開されています。こうしたライブラリのことを(標準ライブラリと区別して)外部ライブラリと呼んでいます。Pythonは外部ライブラリが最も充実している言語の1つです。特に本講義で扱うデータ分析・機械学習のためのライブラリが充実しているため、機械学習を行うときに用いるプログラミング言語としてPythonを選ぶ人は多いです。外部ライブラリについては次以降のChapterで学習します。

## 0.4 総合問題

(1) 与えられた自然数`n`に対して、それが素数であれば`True`、合成数であれば`False`を返す関数`is_prime`を定義してください。

In [None]:
# write me!

(2) 与えられた自然数`n`以下の素数をリストとして返す関数`primes`を定義してください。(1)を利用しても構いません。

In [None]:
# write me!