# 1. Python入門
この資料は[Python3のドキュメント](https://docs.python.org/ja/3/index.html)に基づいています．また，この資料はPythonの基本的な使い方のうち，本演習で用いる可能性の高いもののみを紹介しています．

わからないことがあったらWeb上にたくさん情報があるので調べてみてください．


## 1.1 Pythonとは
Python（パイソン）は，汎用のプログラミング言語で，コードがシンプルで扱いやすく書けるように設計されており，C言語などに比べてさまざまなプログラムを分かりやすく，少ないコード行数で書けるといった特徴があります．標準のライブラリのほか，様々な領域に特化したサードパーティ製のライブラリ・ツール群が入手可能であり，使用目的に応じ自由に機能を拡張していくことができます．Pythonの適用範囲は，Webアプリケーションやデスクトップアプリケーションなどの開発はもとより，システム用の記述 (script) や，各種の自動処理，理工学や統計・解析など，幅広い領域に及んでいます．

Pythonはインタプリタ上で実行することを前提に設計されています．

### 1.1.1 インタプリタ

Pythonにおけるインタプリタとは，ソースコードを何らかの中間表現に逐次変換しながら，実行するプログラム言語処理系のことです．
コンパイル方式はソースコードを機械語等で記述されたファイルに翻訳してから実行しますが，それとは異なり，インタプリタはソースコードをそのまま解釈・実行します．

Pythonのインタプリタを使ってみましょう．コマンドプロンプト（端末）を新たに起動して次のようにPythonインタプリタを起動します．

```Python
$ python3
```

すると細部は違うかもしれませんが，以下のような出力が得られれば，無事Pythonのインタプリタが起動できています．

```Python
Python 3.8.10 (default, Mar 15 2022, 12:22:08)
[GCC 9.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>>
```

インタプリタはコマンドプロンプトから対話的に使うことができます．`Hello World!`を`print`文で出力してみましょう．

```Python
>>> print('Hello World!')
Hello World!
```

簡単な四則演算を行うことも可能です．

```Python
>>>  (6 * (3**2) - 5*6) / 4
6.0
```  

```Python
>>> 1.1 * 2 - 3
-0.7999999999999998
```  

インタプリタの対話モードを終了するには`exit()`， `quit()`を入力，またはctrl+Dです．

スクリプトが書かれたファイル`hoge.py`をインタプリタで実行するには

```Python
$ python3 hoge.py
```

とします．


### 1.1.2 Jupyter NotebookとGoogle Colabについて
Jupyter Notebookはブラウザ上でのPythonの実行環境であり，Pythonのコマンドラインでの対話モードを拡張したものになっています．Jupyter Notebookでは宣言した変数や関数の情報を同じノートブックで使いまわせることからプログラムを手軽に実行でき，機械学習・データサイエンスのツールとしてよく使われています．

Google ColabはGoogle社が提供するブラウザ上でのPythonの実行環境であり，Jupyter Notebookをベースとした環境です．Jupyter Notebookを用いるにはローカル(自分の端末など)で環境を構築する必要がありますが，Google ColabではColabの環境が用意されているためすぐにコードを実行できます．またGoogle Colabでは，制限付きではありますが無料でGPUやTPUが利用できます．

演習の説明とサンプルコード・実行環境をまとめて用意できるので，配布資料はJupyter Notebookで書かれています．

ではJupyter Notebookで`print`文や四則演算を実行してみましょう．**上の実行ボタン（Run）またはshift+enterで実行できます．**

`print`文の例

In [None]:
# print文サンプル
print('Hello World!')

Hello World!


四則演算の例

In [None]:
(6 * (3**2) - 5*6) / 4

6.0

In [None]:
2022 % 22

20

最後に実行した分の結果は，`print`文を使わない場合も表示されます．
下の例では，1行目の結果が出力されず，2行目の結果が出力されます．

In [None]:
(6 * (3**2) - 5*6) / 4
2022 % 22

20

このようにJupyter Notebookでは，ソースコードをセルに記述して実行します．課題に取り組む際は，新たにJupyter Notebookファイルを作り，そこにソースコードを記述し，実行していくことになります．
新たなJupyter Notebookファイルの作成は，画面左側のメニューの，左上の「+」によって行えます（Google Colabを用いている場合）．

では，実際に手を動かしながらPythonについて学んでいきましょう．

## 1.2 変数

### 1.2.1 数値型
整数は`int`型，小数部を持つ数は`float`型です．

以下のコードでは，`print`関数を用いて変数`c`，`y`の値と型を出力しています．

In [None]:
a = 1
b = 2
c = a + b
print(c)
print(type(c))

3
<class 'int'>


In [None]:
x = 0.1
y = a * x + b
print(y)
print(type(y))

2.1
<class 'float'>


変数の型のキャスト（変換）は以下のように行います．

In [None]:
x = 1.1
print(type(x)) # float型
y = int(x)
print(y)
print(type(y)) # int型

<class 'float'>
1
<class 'int'>


Pythonは**動的型付け**です．つまり変数の型が実行中に動的に変化します．あらかじめ変数の型を宣言する必要はなく，また変数に現在の型とは異なる値を代入することができます．

In [None]:
a = 2
b = 1
x = 0.5
y = a * x + b
print(y)
print(type(y)) # float型

x = 10
y = a * x + b
print(y)
print(type(y)) # int型

2.0
<class 'float'>
21
<class 'int'>


### 1.2.2 リスト
Pythonには複数の値をまとめるデータ構造が色々と用意されています．最も汎用性が高いのは リスト (list) で，コンマ区切りの値 (要素) の並びを角括弧で囲んだものとして書き表されます．リストは異なる型の要素を含むこともありますが，通常は同じ型の要素のみを持ちます．

In [None]:
sequence = [1, 4, 9, 16, 25, 36, 49]
print(sequence[2])

# 異なる型の要素を含む
hetero_seq  = [1, 4, 'nine', 16.0, 25] # 'nine'は文字列型（後述）
print(hetero_seq[2])
print(type(hetero_seq[2]))

9
nine
<class 'str'>


C言語の配列と異なり，Pythonのリストは要素に柔軟にアクセスすることが可能です．`:`を用いたアクセスはスライスと呼ばれ，リストを返します．

In [None]:
# 先頭の3つの要素 / インデックスが0から2の要素
print(sequence[:3])
print(sequence[0:3])

# インデックスが2から4の要素
print(sequence[2:5])

# インデックスが3の要素から末尾まで
print(sequence[3:])

# - (マイナス)を付けると後ろから数える
# 末尾の要素
# スライスではないので要素の値を返す
print(sequence[-1])
# 後ろから3番目の要素から末尾まで
print(sequence[-3:])

# インデックスが2の要素から末尾の一つ前まで
print(sequence[2:-1])

# インデックスが0から5まで，2つごとにアクセス
print(sequence[0:5:2])

# 逆順に表示
print(sequence[::-1])

[1, 4, 9]
[1, 4, 9]
[9, 16, 25]
[16, 25, 36, 49]
49
[25, 36, 49]
[9, 16, 25, 36]
[1, 9, 25]
[49, 36, 25, 16, 9, 4, 1]


リストの要素の変更は次のようにできます．

In [None]:
sequence[6] = 329
print(sequence)

sequence[2:5] = [27, 64, 125]
print(sequence)

[1, 4, 9, 16, 25, 36, 329]
[1, 4, 27, 64, 125, 36, 329]


リストは次のように連結することができます．

In [None]:
seq1 = [1, 4, 9]
seq2 = [16, 25]
seq3 = seq1 + seq2
seq3

[1, 4, 9, 16, 25]

`len()`関数でリストの長さが得られます．

In [None]:
len(seq3)

5

リストには次のようにいくつかのメソッドが用意されています．ここでは全てを紹介しないので，詳しくは
[リスト型に関するPythonチュートリアル](https://docs.python.org/ja/3/tutorial/datastructures.html#more-on-lists)
を参照してください．

In [None]:
# リストの末尾に値を追加する
seq1.append(16)
print(seq1)

# リストの指定した要素を削除し，その値を返す
# pop()は末尾の値
val = seq1.pop(2)
print(val)

[1, 4, 9, 16]
9


#### リストを扱う際の注意（やや発展的）
リストを扱う上で注意しなければならない点があります．典型的な例を示します．

In [None]:
a = [1, 2, 3]
b = a
b[0] = 0

ここで`print(a)`でリスト`a`の要素を確認しましょう．直感的には`[1, 2, 3]`が出力されると期待しますが，

In [None]:
print(a)

[0, 2, 3]


実際には`[0, 2, 3]`が出力されます．これはリスト`b`の要素なはずです．

なぜこのような現象が起きるのかというと，`b = a`の代入文で，`a`の識別値を代入しているからです．識別値とはC言語でいうところのポインタで，Pythonの全てのオブジェクトは識別値を持っています．識別値は`id()`を使って確認できます．

In [None]:
print(id(a))
print(id(b))

135141371855296
135141371855296


変数`a` `b`が同じ識別値を持っているのが確認できました．
C言語でいう「ポインタ渡し」のようになっていると理解できます：つまり，変数が表すオブジェクトがコピーされて渡されているのではなく，変数が表すオブジェクトへのポインタが渡されています．
実はPythonでは，**リストに限らず変数への代入は値渡しではなくポインタ渡しで行われます．**
以下の例がそれを示しています．

In [None]:
c = 123
d = c
print(id(c))
print(id(d))

135141800923184
135141800923184


`c`と`d`，どちらもint型のオブジェクトを表していますが，識別値はどちらも同じです．つまり，int型の場合もポインタ渡しになっています．

しかし，以下の例ではリストと異なる挙動をしています：`d`に再代入しても`c`の値は変わっていません．そして`d`の識別値が変わっています．

In [None]:
d = 234
print(c)
print(id(c))
print(id(d))

123
135141800923184
135141800926736


この挙動の違いはmutable（可変）なオブジェクトなのか，immutable（不可変）なオブジェクトなのか，にあります．

リストはmutableなオブジェクトであり，名前の通り変更可能なオブジェクトです．一度作られたオブジェクトの中身を変更・操作することができます．

一方，数値・文字列はimmutableなオブジェクトであり，変更が不可能なオブジェクトです．既に定義されたimmutableなオブジェクトのポインタを持つ変数に，再度同じ型の値を代入しようとすると，**新たにオブジェクトが作成**され，変数はそちらを指すようになります．つまり，`d=234`という式は，一見すると「変数`d`の中身を`234`に変える=変数`d`の指すオブジェクトの持つ値を`234`に変える」ように見えますが，実際は「`234`という値を持つオブジェクトをメモリ上のどこかに作成し，その識別値（ポインタ）を`d`に渡す」という処理になっています．
2年生のC言語を用いた計算機プログラミング演習では，「変数は箱」と教わったかもしれません．しかし，Pythonにおいては，**変数は箱というよりは「ラベル」**
と考えた方が良いでしょう．


よく分からないという人は，これは半分間違いですが，挙動としては「mutableなオブジェクト（リスト等）はポインタ渡し」「immutableなオブジェクト（数値型・文字列）は値渡し，immutableなオブジェクトでリストのようなものは再代入はできるが中身の変更はできない」と考えれば良いです．

int型の`c`と`d`の例のように，`b`に`a`が表すリストの値をコピーしたいときは，例えばスライスを用いて次のように書けます．
結果から分かるように，コピーが作成され代入されているため，`a`と`b`の識別値は異なり，異なるオブジェクトを指しています．そのため，`b`の中身を操作しても`a`の中身は変更されていません．

In [None]:
a = [1, 2, 3]
b = a[:]
print(id(a))
print(id(b))

b[0] = 0
print(a, b)
print(id(a))
print(id(b))

135141371862400
135141371862592
[1, 2, 3] [0, 2, 3]
135141371862400
135141371862592


リストのようなシーケンスを扱うデータ構造で，immutableなものがタプル（tuple）です．気になる人は調べてみてください．

細かい話はここまでにして，次は文字列型を紹介します．

### 1.2.3 文字列（string）

Pythonで文字列型（str型）を扱うには，`' '`か`" "`で囲みます．

In [None]:
hoge = 'hogehoge'
print(hoge)
print(type(hoge))

fuga = "fugafuga"
print(fuga)
print(type(fuga))

hogehoge
<class 'str'>
fugafuga
<class 'str'>


文字列はインデックスを指定して文字を取得できます．Pythonでは文字を表すデータ型は用意されておらず，文字は長さ1の文字列です．文字列の長さは`len()`関数で得られます．

In [None]:
print(hoge[3])
print(type(hoge[3]))
print(hoge[3:5])

# 文字列の長さ
print(len(hoge))

e
<class 'str'>
eh
8


次のようにint型からstr型にキャストできます．

In [None]:
num = 12345
print(type(num))

strnum = str(num)
print(type(strnum))

<class 'int'>
<class 'str'>


文字列はimmutableなオブジェクトです．そのため，オブジェクトの変更操作はできません．例えば，先ほど定義した文字列型の変数`hoge`の2番目の要素を変更しようとするとエラーとなります．

In [None]:
hoge[2] = 'a'

TypeError: 'str' object does not support item assignment

新たに文字列型の変数を代入すること自体は問題なくできます．その場合，オブジェクトの識別値（ポインタ）は変わります．

In [None]:
print(id(hoge))
hoge = 'fugafuga'
print(id(hoge))

135141350479088
135141350477104


Pythonの文字列型は非常に柔軟な演算をサポートしています．例えば，`+`で連結，`*`で繰り返し，`split`で分割，等があります．

In [None]:
hoge = 'hoge'
fuga = 'fuga'
hogefuga = hoge + fuga # hogeとfugaを連結
print(hogefuga)
hogehogehoge = hoge*3 # hogeを3回繰り返す
print(hogehogehoge)
hoge_fuga_hoge = 'hoge_fuga_hoge'
print(hoge_fuga_hoge.split('_')) # _ で分割

hogefuga
hogehogehoge
['hoge', 'fuga', 'hoge']


`print`文と合せて良く使われるものとして`format`メソッドがあります．`format`によって，変数と文字列を上手く連結させることができます．
`format`は，`文字列.format(変数0, 変数1, 変数2, ...)`というように使います．`文字列`の中に`{}`が含まれている場合，その位置に変数が順に挿入されます．`{番号}`とすることで，挿入する変数を指定することもできます．他にも（小数点の桁の指定等）機能はありますが，詳しくは調べてみてください．

In [None]:
print("1+1は"+str(2)+"，1+2は"+str(3))
print("1+1は{}，1+2は{}".format(2,3)) # 上と同じだがこちらの方が分かりやすく柔軟
print("1+2は{1}，1+1は{0}".format(2,3)) # 最初の{}には1番目の値=3を，二番目の{}には0番目の値=2を入れる

1+1は2，1+2は3
1+1は2，1+2は3
1+2は3，1+1は2


## 1.3 制御フローツール
Pythonでは**ifやforに続く行はインデントされてなければなりません．**
もっと一般には，**Pythonではインデントを用いてブロックが表現されます．**

### 1.3.1 if文
if文は次のように書きます．


In [None]:
x = 123

if x < 0:
    print('negative')
else:
    print('non negative')

non negative


In [None]:
n = 100

if n % 3 == 0 and n % 5 == 0: # and, orを使う
    print('fizzbuzz')
elif n % 3 == 0:
    print('fizz')
elif n % 5 == 0:
    print('buzz')
else:
    print('')

buzz


### 1.3.2 for文, while文

Pythonでのfor文を用いた反復は以下のように書きます．

In [None]:
for i in range(5):
    print(i)

0
1
2
3
4


In [None]:
for i in range(5,10):
    print(i)

5
6
7
8
9


Pythonのfor文は柔軟です．リスト，または文字列に渡って反復を行うこと（リストの中身を順に取り出すこと）も可能です．

In [None]:
hoge = 'hogefuga'
for w in hoge: # 'hogefuga'から一文字ずつ順に取り出す
    print(w)
# 以下のように書いても同じ
for i in range(len(w)):
    print(w[i])

h
o
g
e
f
u
g
a
a


In [None]:
seq = [1, 2, 3]
for s in seq:
    print(2 ** s)

2
4
8


他にも`zip`や`enumerate`という機能もあります．詳しくは調べてみてください．

n番目のフィボナッチ数を求めてみましょう．

In [None]:
n = 10 # nは2以上

fibo = [0, 1]
for i in range(n-1):
    fibo.append(fibo[i] + fibo[i+1])

print('fibonacci {}'.format(fibo)) # {}がformat()の引数に置き換えられます

fibonacci [0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55]


while文は条件式が`True`のときに反復します．
while文を使って $\log(x) = 0$ を解いてみましょう．

In [None]:
from math import log # mathモジュールからlog関数をimport(後で説明します）

epsilon = 0.00001
x1 = 0.01
x2 = 1000

# while文は条件がTrueのときに反復する
while abs(x1 - x2) > epsilon: # absは絶対値を返す関数
    x3 = (x1 + x2) / 2
    if log(x3) * log(x1) < 0:
        x2 = x3
    else:
        x1 = x3
print(x3)

1.0000008978694677


 ## 1.4 関数

関数は以下のように書きます．

In [None]:
def get_fibo(num):
    if num == 0:
        return 0
    elif num == 1:
        return 1
    else:
        return get_fibo(num - 1) + get_fibo(num - 2)

これはフィボナッチ数を再帰的に求める関数です．`def` は関数の 定義 (definition) を導くキーワードです． `def` の後には，関数名と仮引数を丸括弧で囲んだリストを続けます．関数の実体を構成する実行文は次の行から始め，インデントされていなければなりません．引数の型や関数の返り値の型は指定しません．関数は以下のように呼び出します．

In [None]:
print(get_fibo(10))

55


引数や`return`文を持たない関数も定義可能です．

可変個の引数を伴う関数を定義することもできます．もっとも便利なのは，一つ以上の引数に対してデフォルトの値を指定する形式です．この形式を使うと，定義されている引数より少ない個数の引数で呼び出せる関数を作成します．

In [None]:
def shop(kind, keeper='Bob', client='Alice'):
    print("-- Do you have any", kind, "?")
    print("-- I'm sorry, we're all out of", kind)
    print("-" * 40)
    print('shopkeeper: ', keeper)
    print('client: ', client)

例えば次のような関数呼び出しの仕方があります．

In [None]:
shop('food')

-- Do you have any food ?
-- I'm sorry, we're all out of food
----------------------------------------
shopkeeper:  Bob
client:  Alice


In [None]:
shop('food', keeper='John')

-- Do you have any food ?
-- I'm sorry, we're all out of food
----------------------------------------
shopkeeper:  John
client:  Alice


In [None]:
shop('food', client='Oyama')

-- Do you have any food ?
-- I'm sorry, we're all out of food
----------------------------------------
shopkeeper:  Bob
client:  Oyama


$\log(x) = a$ を解く処理を関数化し，`a`と`epsilon`を指定できるようにします．ただし`epsilon`はデフォルトの値が割り当てられています．

In [None]:
# solve log(x) = a
def solve_log(a, epsilon=0.01):
    x1 = 100000
    x2 = 0.0001
    while abs(x1 - x2) > epsilon:
        x3 = (x1 + x2) /2
        if (log(x3)-a) * (log(x1)-a) < 0:
            x2 = x3
        else:
            x1 = x3
    return x3

In [None]:
print(log(solve_log(2)))
print(log(solve_log(2, epsilon=0.0000001)))

1.99946655300203
1.9999999931040806


## 1.5 データ構造（辞書）


Pythonの有用なデータ構造，辞書型（dict型）を紹介します．
ある範囲の数でインデクス化されているシーケンス（リストなど）と異なり，**辞書は キー (key) でインデクス化されています**．つまり，リスト等では数字で要素にアクセスしますが，辞書では数字に限らず文字列等で要素にアクセスすることを可能にします．辞書は キー（key）: 値（value）のペアの集合であり，キーが（辞書の中で）一意でなければならない，と考えるとよいでしょう．波括弧（brace）のペア｛｝は空の辞書を生成します．カンマで区切られた key: value のペアを波括弧ペアの間に入れると，辞書の初期値となる key: value が追加されます．

辞書での主な操作は，ある値を何らかのキーを付けて記憶することと，キーを指定して値を取り出すことです．

In [None]:
tel_num = {'jack': 4098, 'sape': 4139}
print(tel_num)

tel_num['bob'] = 4087 # bobをkeyとして4087を記憶
print(tel_num)

print(tel_num['jack']) # keyを指定して値を取り出す

{'jack': 4098, 'sape': 4139}
{'jack': 4098, 'sape': 4139, 'bob': 4087}
4098


辞書オブジェクトに対し`list(d)`を実行すると，辞書で使われている全てのキーからなるリストをキーが挿入された順番で返します ．ある単一のキーが辞書にあるかどうか調べるには`in`キーワードを使います．

In [None]:
print(list(tel_num))

['jack', 'sape', 'bob']


In [None]:
'bob' in tel_num

True

In [None]:
'alice' in tel_num

False

辞書を使ってアルファベットの出現回数を数えてみましょう．

In [None]:
chars = 'akdnogkncdoksndfongdnjdsonfnanaakdokfniiewoq'
char_count = {}
for c in chars:
    if c not in char_count: # 比較演算子 in / not inはある要素がシーケンス（リストなど）に含まれるかを調べる
        char_count[c] = 1
    else:
        char_count[c] += 1

print(char_count)

{'a': 4, 'k': 5, 'd': 6, 'n': 9, 'o': 6, 'g': 2, 'c': 1, 's': 2, 'f': 3, 'j': 1, 'i': 2, 'e': 1, 'w': 1, 'q': 1}


## 1.6 モジュール・ライブラリ

モジュールは Python の関数・クラスの定義や文が入ったファイルです．ファイル名はモジュール名に接尾語`.py`がついたものになります．それを他のスクリプトやインタプリタの対話モード等に利用することができます．また，複数のモジュールで構成されたものをライブラリ（パッケージ）と呼びます．ここでは自作モジュールの作り方，使い方には触れず，モジュール・ライブラリの`import`の仕方を紹介します．

モジュールをインポートするには`import <module>`とします．モジュール内の関数・クラス等にアクセスするには`<module>.<関数>`とします．

In [None]:
import math

print(math.cos(1))
print(math.pi)

0.5403023058681398
3.141592653589793


`math`モジュールは，浮動小数点演算のための C 言語ライブラリ関数にアクセスする手段を提供しています．

モジュールの特定のクラスや関数のみを使いたい場合は`from`を使います．

In [None]:
from math import exp

exp(1)

2.718281828459045

別名をつけてインポートしたい場合は`as`を使います．

In [None]:
import math as mt

mt.pi

3.141592653589793

この演習では，科学技術計算ライブラリNumPy/SciPyと機械学習ライブラリscikit-learnを主に使うことになります．

## 1.7 クラス・オブジェクト

pythonはオブジェクト指向プログラミングをサポートしており，Javaのようなプログラミング言語と同様に**オブジェクト指向で記述することができます**．
ここではPythonでの**クラス**の定義の仕方を簡単に紹介します．

pythonにおけるクラスオブジェクト定義の基本的な構文は以下のようになります．`class`はクラスの定義を導きます．

In [None]:
class className():

    class_data = 2 # クラス変数

    def __init__(self, aug):
        self.data = aug # インスタンス変数

    def func(self, x):
        return x**self.class_data * self.data

メソッド（関数）`__init__()` は**コンストラクタ**です．クラスの新しいインスタンスを生成するとき`__init__()`が呼び出されます．多くの場合，変数や外部で定義された関数などをここで定義しておきます．`self`はJavaにおける`this`で，インスタンス自身を指すものです．

インスタンス変数はそれぞれのインスタンスについて固有のデータのためのもので，クラス変数はそのクラスのすべてのインスタンスによって共有される属性やメソッドのためのものです(なのでクラス変数ではmutableオブジェクトは避けるべきです)．


ではインスタンスを生成してみましょう．

In [None]:
a = className(100)
b = className(10)

クラスの変数やメソッドには次のようにアクセスできます．

In [None]:
print(a.data, b.data) # インスタンス変数なので異なる
print(a.class_data, b.class_data) # クラス変数なので同じ

100 10
2 2


In [None]:
a.func(100)

1000000