# 1. Python入門
この資料はPython3のドキュメントhttps://docs.python.org/ja/3/index.html に基づいています。また、この資料はPythonの基本的な使い方のうち、本演習で用いる可能性の高いもののみを紹介しています。

わからないことがあったらWeb上にたくさん情報があるので調べてみてください。


## 1.1 Pythonとは
Python（パイソン）は、汎用のプログラミング言語で、コードがシンプルで扱いやすく書けるように設計されており、C言語などに比べてさまざまなプログラムを分かりやすく、少ないコード行数で書けるといった特徴があります。標準のライブラリのほか、様々な領域に特化したサードパーティ製のライブラリ・ツール群が入手可能であり、使用目的に応じ自由に機能を拡張していくことができます。Pythonの適用範囲は、Webアプリケーションやデスクトップアプリケーションなどの開発はもとより、システム用の記述 (script) や、各種の自動処理、理工学や統計・解析など、幅広い領域に及んでいます。

Pythonはインタプリタ上で実行すること前提に設計されています。

### 1.1.1 インタプリタ

Pythonにおけるインタプリタとは、ソースコードを何らかの中間表現に逐次変換しながら、実行するプログラム言語処理系のことです。
コンパイル方式はソースコードを機械語等で記述されたファイルに翻訳してから実行しますが、それとは異なり、インタプリタはソースコードをそのまま解釈・実行します。

Pythonのインタプリタを使ってみましょう。コマンドプロンプト（端末）を新たに起動して（このノートブックを起動した際のコマンドプロンプトを落とさないように！）次のようにPythonインタプリタを起動します。

`$ python3`

すると細部は違うかもしれませんが、以下のような出力が得られれば、無事Pythonのインタプリタが起動できています。

`Python 3.6.7 (default, Oct 22 2018, 11:32:17)`   
`[GCC 8.2.0] on linux`  
`Type "help", "copyright", "credits" or "license" for more information.`  
`>>>`  

インタプリタはコマンドプロンプトから対話的に使うことができます。"Hello World!"をprint文で出力してみましょう

`>>> print('Hello World!')`  
`Hello World!`

簡単な四則演算を行うことも可能です。

`>>>  (6 * (3**2) - 5*6) / 4`  
`6.0`  

`>>> 1.1 * 2 - 3`  
`-0.7999999999999998`

インタプリタの対話モードを終了するにはexit()、 quit()を入力、またはctrl+Dです。

スクリプトが書かれたファイルをインタプリタで実行するには

`$ python3 hoge.py`

とします。


### 1.1.2 Jupyter Notebookとは
この演習ではJupyter NotebookというPythonのブラウザ上での実行環境を使います。Jupyter NotebookとはPythonのコマンドラインでの対話モードを拡張したものです。コードの出力結果やメモ等を記録しておくことができ(変数や関数を複数のセルに渡って使用することができます)、機械学習・データサイエンスのツールとしてよく使われています。

演習の説明とサンプルコード・実行環境をまとめて用意できるので、配布資料はJupyter Notebookで書かれています。

ではJupyter Notebookでprint文や四則演算を実行してみましょう。**上の実行ボタン（Run）またはshift+enterで実行できます。**

In [1]:
print('Hello Wolrd!')

Hello Wolrd!


In [2]:
(6 * (3**2) - 5*6) / 4 # 最後に実行した文の結果が出力される = print文を使わなくとも見れる

6.0

In [3]:
2019 % 19

5

このようにJupyter Notebookでは、ソースコードをセルに記述して実行します。課題に取り組む際は、新たにJupyter Notebookファイルを作り、そこにソースコードを記述し、実行していくことになります。
新たなJupyter Notebookファイルの作成は、画面左側のメニューの、左上の「+」によって行えます。

では、実際に手を（セルを）動かしながらPythonについて学んでいきましょう。

## 1.2 変数

### 1.2.1 数値型
整数はint型、小数部を持つ数はfloat型です。

In [4]:
a = 1
b = 2
c = a + b
print(c) # print関数に投げるだけで変数を出力できる

3


In [5]:
x = 0.1
y = a * x + b
print(y)
print(type(y))

2.1
<class 'float'>


変数の型のキャストは以下のように行います。

In [6]:
x = 1.1
y = int(x)
print(y)

print(float(y))

1
1.0


Pythonは**動的型付け**です。つまり変数の型が実行中に動的に変化します。あらかじめ変数の型を宣言する必要はなく、また変数に現在の型とは異なる値を代入することができます。

In [7]:
a = 2
b = 1
x = 0.5
y = a * x + b
print(y)
print(type(y))

x = 10
y = a * x + b
print(y)
print(type(y))

2.0
<class 'float'>
21
<class 'int'>


### 1.2.2 リスト
Pythonには複数の値をまとめるデータ構造が色々と用意されています。最も汎用性が高いのは リスト (list) で、コンマ区切りの値 (要素) の並びを角括弧で囲んだものとして書き表されます。リストは異なる型の要素を含むこともありますが、通常は同じ型の要素のみを持ちます。

In [8]:
sequence = [1, 4, 9, 16, 25, 36, 49]
print(sequence[2])

# 異なる型の要素を含む
hetero_seq  = [1, 4, 'nine', 16.0, 25] # 'nine'は文字列型（後述）
print(hetero_seq[2])
print(type(hetero_seq[2]))

9
nine
<class 'str'>


C言語の配列と異なり、Pythonのリストは要素に柔軟にアクセスすることが可能です。`:`を用いたアクセスはスライスと呼ばれ、リストを返します。

In [9]:
# 先頭の3つの要素 / インデックスが0から2の要素
print(sequence[:3])
print(sequence[0:3])

# インデックスが2から4の要素
print(sequence[2:5])

# インデックスが3の要素から末尾まで
print(sequence[3:])

# - (マイナス)を付けると後ろから数える
# 末尾の要素
# スライスではないので要素の値を返す
print(sequence[-1])
# 後ろから3番目の要素から末尾まで
print(sequence[-3:])

# インデックスが2の要素から末尾の一つ前まで
print(sequence[2:-1])

# インデックスが0から5まで，2つごとにアクセス
print(sequence[0:5:2])

# 逆順に表示
print(sequence[::-1])

[1, 4, 9]
[1, 4, 9]
[9, 16, 25]
[16, 25, 36, 49]
49
[25, 36, 49]
[9, 16, 25, 36]
[1, 9, 25]
[49, 36, 25, 16, 9, 4, 1]


次のようにリストの要素を変更します。

In [10]:
sequence[6] = 329
print(sequence)

sequence[2:5] = [27, 64, 125]
print(sequence)

[1, 4, 9, 16, 25, 36, 329]
[1, 4, 27, 64, 125, 36, 329]


リストは次のように連結することができます。

In [11]:
seq1 = [1, 4, 9]
seq2 = [16, 25]
seq3 = seq1 + seq2
seq3

[1, 4, 9, 16, 25]

`len()`関数でリストの長さが得られます。

In [12]:
len(seq3)

5

リストには次のようにいくつかのメソッドが用意されています。ここでは全てを紹介しないので、詳しくはhttps://docs.python.org/ja/3/tutorial/datastructures.html#more-on-lists
を参照してください。

In [13]:
# リストの末尾に値を追加する
seq1.append(16)
print(seq1)

# リストの指定した要素を削除し、その値を返す
# pop()は末尾の値
val = seq1.pop(2)
print(val)

[1, 4, 9, 16]
9


#### リストを扱う際の注意（やや発展的）
リストを扱う上で注意しなければならない点があります。典型的な例を示します。

In [14]:
a = [1, 2, 3]
b = a
b[0] = 0

ここで`print(a)`でリスト`a`の要素を確認しましょう。直感的には`[1, 2, 3]`が出力されると期待しますが、

In [15]:
print(a)

[0, 2, 3]


実際には`[0, 2, 3]`が出力されます。これはリスト`b`の要素なはずです。

なぜこのような現象が起きるのかというと、`b = a`の代入文で、`a`の識別値を代入しているからです。識別値とはC言語でいうところのポインタで、Pythonの全てのオブジェクトは識別値を持っています。識別値は`id()`を使って確認できます。

In [16]:
print(id(a))
print(id(b))

139975724707104
139975724707104


変数`a` `b`が同じ識別値を持っているのが確認できました。
C言語でいう「ポインタ渡し」のようになっていると理解できます：変数が表すオブジェクトがコピーされて渡されるのでなはなく、変数が表すオブジェクトへのポインタが渡されています。
実はPythonでは、**リストに限らず変数への代入は値渡しではなくポインタ渡しで行われます。**
以下の例がそれを示しています。

In [17]:
c = 123
d = c
print(id(c))
print(id(d))

139975900587488
139975900587488


`c`と`d`、どちらもint型のオブジェクトを表していますが、識別値はどちらも同じです。つまり，int型の場合もポインタ渡しになっています。

しかし、以下の例ではリストと異なる挙動をしています：`d`に再代入しても`c`の値は変わっていません。そして`d`の識別値が変わっています。

In [18]:
d = 234
print(c)
print(id(c))
print(id(d))

123
139975900587488
139975900591040


この挙動の違いはmutable（可変）なオブジェクトなのか、immutable（不可変）なオブジェクトなのか、にあります。

リストはmutable（可変な）オブジェクトであり、名前の通り変更可能なオブジェクトです。一度作られたオブジェクトの中身を変更・操作することができます。

一方、数値・文字列はimmutable（非可変な）オブジェクトであり、変更が不可能なオブジェクトです。既に定義されたimmutableなオブジェクトのポインタを持つ変数に、再度（同じ型の）値を代入しようとすると、新たにオブジェクトが作成され、変数はそちらを指すようになります。つまり、`d=234`という式は、一見すると「変数`d`の中身を`234`に変える=変数`d`の指すオブジェクトの持つ値を`234`に変える」ように見えますが、実際は「`234`という値を持つオブジェクトをメモリ上のどこかに作成し、その識別値（ポインタ）を`d`に渡す」という処理になっています。
2年生のC言語を用いた計算機プログラミング演習では、「変数は箱」と教わったかもしれません。しかし、Pythonにおいては、変数は箱というよりは「ラベル」と考えた方が良いでしょう（Java言語における参照型変数と同じです）。


よく分からないという人は、これは半分間違いですが、挙動としては「mutableなオブジェクト（リスト等）はポインタ渡し」「immutableなオブジェクト（数値型・文字列）は値渡し、immutableなオブジェクトでリストのようなものは再代入はできるが中身の変更はできない」と考えれば良いです。

int型の`c`と`d`の例のように、`b`に`a`が表すリストの値をコピーしたいときは、例えばスライスを用いて次のように書けます。
結果から分かるように、コピーが作成され代入されているため、`a`と`b`の識別値は異なり、異なるオブジェクトを指しています。そのため、`b`の中身を操作しても`a`の中身は変更されていません。

In [19]:
a = [1, 2, 3]
b = a[:]
print(id(a))
print(id(b))

b[0] = 0
print(a, b)
print(id(a))
print(id(b))

139975724757872
139975724757792
[1, 2, 3] [0, 2, 3]
139975724757872
139975724757792


リストのようなシーケンスを扱うデータ構造で、immutableなものがタプル(tuple)です。気になる人は調べてみてください。

細かい話はここまでにして、次は文字列型を紹介します。

### 1.2.3 文字列型(string)

Pythonで文字列(str型)を扱うには、`'`で囲むか`"`で囲みます。

In [20]:
hoge = 'hogehoge'
print(hoge)
print(type(hoge))

hogehoge
<class 'str'>


文字列はインデックスを指定して文字を取得できます。Pythonでは文字を表すデータ型は用意されておらず、文字は長さ1の文字列です。文字列の長さは`len()`関数で得られます。

In [21]:
print(hoge[3])
print(type(hoge[3]))
print(hoge[3:5])

# 文字列の長さ
print(len(hoge))

e
<class 'str'>
eh
8


次のようにint型からstr型にキャストできます。

In [22]:
num = 12345
print(type(num))

strnum = str(num)
print(type(strnum))

<class 'int'>
<class 'str'>


文字列はimmutableなオブジェクトです。そのため、オブジェクトの変更操作はできません。例えば、先ほど定義した文字列型の変数`hoge`の2番目の要素を変更しようとするとエラーとなります。

In [23]:
hoge[2] = 'a'

TypeError: 'str' object does not support item assignment

新たに文字列型の変数を代入すること自体は問題なくできます。その場合、オブジェクトの識別値（ポインタ）は変わります。

In [24]:
print(id(hoge))
hoge = 'fugafuga'
print(id(hoge))

139975724761584
139975724735920


Pythonの文字列型は非常に柔軟な演算をサポートしています。例えば、`+`で連結、`*`で繰り返し、`split`で分割、等があります。

In [25]:
hoge = 'hoge'
fuga = 'fuga'
hogefuga = hoge + fuga # hogeとfugaを連結
print(hogefuga)
hogehogehoge = hoge*3 # hogeを3回繰り返す
print(hogehogehoge)
hoge_fuga_hoge = 'hoge_fuga_hoge'
print(hoge_fuga_hoge.split('_')) # _ で分割

hogefuga
hogehogehoge
['hoge', 'fuga', 'hoge']


`print`文と合せて良く使われるものとして`format`メソッドがあります。`format`によって、変数と文字列を上手く連結させることができます。
`format`は、`文字列.format(変数0, 変数1, 変数2, ...)`というように使います。`文字列`の中に`{}`が含まれている場合、その位置に変数が順に挿入されます。`{番号}`とすることで、挿入する変数を指定することもできます。他にも機能はありあます（小数点の桁の指定等）が、詳しくは調べてみてください。

In [26]:
print("1+1は"+str(2)+"，1+2は"+str(3))
print("1+1は{}，1+2は{}".format(2,3)) # 上と同じだがこちらの方が分かりやすく柔軟
print("1+2は{1}，1+1は{0}".format(2,3)) # 最初の{}には1番目の値=3を、二番目の{}には0番目の値=2を入れる

1+1は2，1+2は3
1+1は2，1+2は3
1+2は3，1+1は2


## 1.3 制御フローツール
Pythonでは**ifやforに続く行はインデントされてなければなりません。**もっと一般には、**Pythonではインデントを用いてブロックが表現されます。**

### 1.3.1 if文
if文は次のように書きます。


In [27]:
x = 123

if x < 0:
    print('negative')
else:
    print('non negative')

non negative


In [28]:
n = 100

if n % 3 == 0 and n % 5 == 0: # and, orを使う
    print('fizzbuzz')
elif n % 3 == 0:
    print('fizz')
elif n % 5 == 0:
    print('buzz')
else:
    print('')

buzz


### 1.3.2 for文, while文

Pythonでのfor文を用いた反復は以下のように書きます。

In [29]:
for i in range(5):
    print(i)

0
1
2
3
4


In [30]:
for i in range(5,10):
    print(i)

5
6
7
8
9


Pythonのfor文は柔軟です。リスト、または文字列に渡って反復を行うこと（リストの中身を順に取り出すこと）も可能です。

In [32]:
hoge = 'hogefuga'
for w in hoge: # 'hogefuga'から一文字ずつ順に取り出す
    print(w)
# 以下のように書いても同じ
for i in range(len(w)):
    print(w[i])

h
o
g
e
f
u
g
a
a


In [33]:
seq = [1, 2, 3]
for s in seq:
    print(2 ** s)

2
4
8


他にも`zip`や`enumerate`という機能もあります。詳しくは調べてみてください。

n番目のフィボナッチ数を求めてみましょう。

In [34]:
n = 10 # nは2以上

fibo = [0, 1]
for i in range(n-1):
    fibo.append(fibo[i] + fibo[i+1])

print('fibonacci {}'.format(fibo)) # {}がformat()の引数に置き換えられます

fibonacci [0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55]


while文は条件式がTrueのときに反復します。
while文を使って\$\log(x) = 0\$を解いてみましょう。

In [35]:
from math import log # mathモジュールからlog関数をimport(後で説明します）

epsilon = 0.00001
x1 = 0.01
x2 = 1000

 # while文は条件がTrueのときに反復する
while abs(x1 - x2) > epsilon: # absは絶対値を返す関数
    x3 = (x1 + x2) / 2
    if log(x3) * log(x1) < 0:
        x2 = x3
    else:
        x1 = x3 
print(x3)

1.0000008978694677


 ## 1.4 関数

関数は以下のように書きます。

In [36]:
def get_fibo(num):
    if num == 0:
        return 0
    elif num == 1:
        return 1
    else:
        return get_fibo(num - 1) + get_fibo(num - 2)

これはフィボナッチ数を再帰的に求める関数です。`def` は関数の 定義 (definition) を導くキーワードです。 `def` の後には、関数名と仮引数を丸括弧で囲んだリストを続けます。関数の実体を構成する実行文は次の行から始め、インデントされていなければなりません。引数の型や関数の返り値の型は指定しません。関数は以下のように呼び出します。

In [37]:
print(get_fibo(10))

55


引数やreturn文を持たない関数も定義可能です。

可変個の引数を伴う関数を定義することもできます。もっとも便利なのは、一つ以上の引数に対してデフォルトの値を指定する形式です。この形式を使うと、定義されている引数より少ない個数の引数で呼び出せる関数を作成します。

In [38]:
def shop(kind, keeper='Bob', client='Alice'):
    print("-- Do you have any", kind, "?")
    print("-- I'm sorry, we're all out of", kind)
    print("-" * 40)
    print('shopkeeper: ', keeper)
    print('client: ', client)

例えば次のような関数呼び出しの仕方があります。

In [39]:
shop('food')

-- Do you have any food ?
-- I'm sorry, we're all out of food
----------------------------------------
shopkeeper:  Bob
client:  Alice


In [40]:
shop('food', keeper='John')

-- Do you have any food ?
-- I'm sorry, we're all out of food
----------------------------------------
shopkeeper:  John
client:  Alice


In [41]:
shop('food', client='Oyama')

-- Do you have any food ?
-- I'm sorry, we're all out of food
----------------------------------------
shopkeeper:  Bob
client:  Oyama


\$\log(x) = a\$を解く処理を関数化し、aとepsilonを指定できるようにします。ただしepsilonはデフォルトの値が割り当てられています。

In [42]:
# solve log(x) = a
def solve_log(a, epsilon=0.01):  
    x1 = 100000
    x2 = 0.0001
    while abs(x1 - x2) > epsilon:
        x3 = (x1 + x2) /2
        if (log(x3)-a) * (log(x1)-a) < 0:
            x2 = x3
        else:
            x1 = x3 
    return x3

In [43]:
print(log(solve_log(2)))
print(log(solve_log(2, epsilon=0.0000001)))

1.99946655300203
1.9999999931040806


## 1.5 データ構造（辞書）


Pythonの有用なデータ構造、辞書型 (dictionary)を紹介します。
ある範囲の数でインデクス化されているシーケンス（リストなど）と異なり、**辞書は キー (key) でインデクス化されています**。つまり、リスト等では数字で要素にアクセスしますが、辞書では数字に限らず文字列等で要素にアクセスすることを可能にします。辞書は キー(key): 値(value) のペアの集合であり、キーが (辞書の中で)一意でければならない、と考えるとよいでしょう。波括弧 (brace) のペア: {} は空の辞書を生成します。カンマで区切られた key: value のペアを波括弧ペアの間に入れると、辞書の初期値となる key: value が追加されます。

辞書での主な操作は、ある値を何らかのキーを付けて記憶することと、キーを指定して値を取り出すことです。 

In [44]:
tel_num = {'jack': 4098, 'sape': 4139}
print(tel_num)

tel_num['bob'] = 4087 # bobをkeyとして4087を記憶
print(tel_num)

print(tel_num['jack']) # keyを指定して値を取り出す

{'jack': 4098, 'sape': 4139}
{'jack': 4098, 'sape': 4139, 'bob': 4087}
4098


辞書オブジェクトに対し`list(d)`を実行すると、辞書で使われている全てのキーからなるリストをキーが挿入された順番で返します 。ある単一のキーが辞書にあるかどうか調べるには`in`キーワードを使います。

In [45]:
print(list(tel_num))

['jack', 'sape', 'bob']


In [46]:
'bob' in tel_num

True

In [47]:
'alice' in tel_num

False

辞書を使ってアルファベットの出現回数を数えてみましょう

In [48]:
chars = 'akdnogkncdoksndfongdnjdsonfnanaakdokfniiewoq'
char_count = {}
for c in chars:
    if c not in char_count: # 比較演算子 in / not inはある要素がシーケンス（リストなど）に含まれるかを調べる
        char_count[c] = 1
    else:
        char_count[c] += 1

print(char_count)

{'a': 4, 'k': 5, 'd': 6, 'n': 9, 'o': 6, 'g': 2, 'c': 1, 's': 2, 'f': 3, 'j': 1, 'i': 2, 'e': 1, 'w': 1, 'q': 1}


## 1.6 モジュール・ライブラリ

モジュールは Python の関数・クラスの定義や文が入ったファイルです。ファイル名はモジュール名に接尾語`.py`がついたものになります。それを他のスクリプトやインタプリタの対話モード等に利用することができます。また、複数のモジュールで構成されたものをライブラリ（パッケージ）と呼びます。ここでは自作モジュールの作り方、使い方には触れず、モジュール・ライブラリのimportの仕方を紹介します。

モジュールをインポートするには`import <module>`とします。モジュール内の関数・クラス等にアクセスするには`<module>.<関数>`とします。

In [49]:
import math

print(math.cos(1))
print(math.pi)

0.5403023058681398
3.141592653589793


`math`モジュールは、浮動小数点演算のための C 言語ライブラリ関数にアクセスする手段を提供しています。

モジュールの特定のクラスや関数のみを使いたい場合は`from`を使います。

In [50]:
from math import exp

exp(1)

2.718281828459045

別名をつけてインポートしたい場合は`as`を使います。

In [51]:
import math as mt

mt.pi

3.141592653589793

この演習では、科学技術計算ライブラリNumPy/SciPyと機械学習ライブラリscikit-learnを主に使うことになります。

## 1.7 クラス・オブジェクト

pythonはオブジェクト指向プログラミングをサポートしており、Javaのようなプログラミング言語と同様に**オブジェクト指向で記述することができます**。
ここではPythonでの**クラス**の定義の仕方を簡単に紹介します。

pythonにおけるクラスオブジェクト定義の基本的な構文は以下のようになります。`class`はクラスの定義を導きます。

In [52]:
class className():
    
    class_data = 2 # クラス変数 
    
    def __init__(self, aug): 
        self.data = aug # インスタンス変数
        
    def func(self, x):
        return x**self.class_data * self.data

メソッド(関数) `__init__()` は**コンストラクタ**です。クラスの新しいインスタンスを生成するとき`__init__()`が呼び出されます。多くの場合、変数や外部で定義された関数などをここで定義しておきます。`self`はJavaにおける`this`で、インスタンス自身を指すものです。

インスタンス変数はそれぞれのインスタンスについて固有のデータのためのもので、クラス変数はそのクラスのすべてのインスタンスによって共有される属性やメソッドのためのものです。(なのでクラス変数ではmutableオブジェクトは避けるべきです。)


ではインスタンスを生成してみましょう。

In [53]:
a = className(100)
b = className(10)

クラスの変数やメソッドには次のようにアクセスできます。

In [54]:
print(a.data, b.data) # インスタンス変数なので異なる
print(a.class_data, b.class_data) # クラス変数なので同じ

100 10
2 2


In [55]:
a.func(100)

1000000