# Pythonプログラミングの基礎（１０月８日、１５日）
本章では、Pythonプログラミングの文法を学ぶ。
<!-- 本ページのnotebookは [こちら](notebooks.rst#python) からダウンロードしてColabにアップロードしてください。 -->
下の"Open in Colab"アイコンをクリックして、本ページ内容のjupyter notebookをColab上で実行できるようにしよう。

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](http://colab.research.google.com/github/ymatumot/GSC/blob/main/basics.ipynb)

Colab上で実行しようとすると、最初に

![warning](./img/colab_warning.png)

のような警告が出る。問題ないので、「このまま実行」を選択する。以降は、同一セッション内ではこの警告はでない。


## 変数
その他のプログラム言語と同じく、整数、実数（単精度、倍精度）、文字列、などを扱うことが可能である。

### 動的変数割付け
Pythonは動的割付けなので、FortranやC言語のように予め変数を宣言してメモリを確保する必要がない。

In [1]:
a = 1.0
print(a)
a = 'b'
print(a)

1.0
b


### 変数名の付け方のルール
* 先頭の文字はアルファベット
* 予約語（and, orなど）は使えない。
* 大文字と小文字は区別される

In [2]:
4a = 1.0

SyntaxError: invalid syntax (4041883560.py, line 1)

In [3]:
and = 1.0

SyntaxError: invalid syntax (1940014085.py, line 1)

In [6]:
A = 1.0
a = 5.0
print(A,a)

1.0 5.0


### 型変換
文字列→実数

In [7]:
a = '1.0' #character
b = '3.0' #character
print(a+b,type(a+b))
print(float(a)+float(b),type(float(a)+float(b))) # to real number

1.03.0 <class 'str'>
4.0 <class 'float'>


実数→文字列

In [8]:
a = 1.0 # real number
b = 3.0 # real number
print(a+b,type(a+b))
print(str(a)+str(b),type(str(a)+str(b))) #to string


4.0 <class 'float'>
1.03.0 <class 'str'>


## 算術演算
算術演算子は通常通りの使い方である。

In [9]:
a = 11.0
b = 3.0
print('足し算・引き算')
print(a+b)
print(a-b)
print()
print('掛け算、割り算')
print(a*b)
print(a/b)
print()
print('べき乗')
print(a**b)
print()
print('剰余')
print(a % b)

足し算・引き算
14.0
8.0

掛け算、割り算
33.0
3.6666666666666665

べき乗
1331.0

剰余
2.0


その他、複合演算子を以下にまとめる。総和を計算するときなどに使う。

|演算子|説明|
|:--:|:--:|
| += | 足し算して代入する |
| -= | 引き算して代入する |
| *= | 掛け算して代入する |
| /= | 割り算して代入する |

FortranやC言語とは違って、$log$, $sin$, $cos$, $exp$ などはPythonの組み込み関数としては用意されていない。通常はライブラリをインポートして使う（後に説明）。

## 組み込みオブジェクト型
実数、整数、文字列に加え、Pythonには組み込みオブジェクト型というのが用意されている。

実数などの変数は数値のみを記憶する。また関数は定義された処理を返す役割がある。オブジェクトというのは、変数などのデータとそれに対する操作（関数）を一つにまとめた単位をいう。このようなデータと命令を一つにまとめてプログラムを組むことを**オブジェクト指向プログラミング**という。

オブジェクトのデータに対する操作をメソッドといい、以下のようにピリオドをつけて表現する。

```python
data.method(arg1, arg2, ,,,)
```

以下では、Pythonの組み込み型オブジェクトでよく使われる「リスト」、「タプル」、「辞書」を紹介する。

### リスト
リストとは複数のデータを並べて管理するデータ型である。FortranやC言語の配列に近い。

In [10]:
a = [0,1,2,3,4]
print(a)

[0, 1, 2, 3, 4]


FortranやC言語の配列と違うのは、違う型のデータも一緒に格納することができるのである。

In [11]:
b = [0,'a','2.3']
print(b)

[0, 'a', '2.3']


リストを連結して一つのリストにすることもできる。

In [12]:
c = a+b
print(c)

[0, 1, 2, 3, 4, 0, 'a', '2.3']


インデックスを指定して、リストの各要素へアクセスすることができる。Pythonでは、C言語と同じく（Fortranと違って）インデックスは0から始まる。

In [13]:
print(c[3])
c[3]='replaced'
print(c[3])

3
replaced


リストの長さを調べる組み込み関数に`len()`がある。

In [14]:
print(len(c))

8


多次元のリストも作ることができる。リストのリストみたいな形になっている。

In [15]:
dd = [ [2,3,5],
       [4,3,2]]
print(dd[0])
print(dd[1])

[2, 3, 5]
[4, 3, 2]


#### スライス
リスト（後に説明する配列でも同様）のある範囲を指定するのには、スライスを利用する。指定の仕方は、

```python
リスト名[最初の要素のインデックス:最後の要素のインデックス+1]
```

のように表記する。Fortran及びC言語に慣れた人は、最後の要素の指定の仕方（+1をする）で最初は混乱するかもしれないので、注意したい。

In [16]:
print(c)
print(c[4:7]) # specify indices 4-6

[0, 1, 2, 'replaced', 4, 0, 'a', '2.3']
[4, 0, 'a']


その他、いろいろなスライスの指定の仕方がある。

In [17]:
print(c[4:]) # index 4 and later
print(c[-1]) # can specify the last element without knowing the length of the list
print(c[-4:-1]) # specify the last four elements without the last one
print(c[0:5:2]) # specify every 2 elements

[4, 0, 'a', '2.3']
2.3
[4, 0, 'a']
[0, 2, 4]


#### メソッド
listはオブジェクト型なのでメソッドが用意されている。以下ではよく使用する（個人的経験）メソッドを紹介する。

* sort 要素を要素の値の小さい方から順に並べ替える

In [18]:
a = [5,2,71,3,4,20,111,3]
print(a)
a.sort()
print(a)

[5, 2, 71, 3, 4, 20, 111, 3]
[2, 3, 3, 4, 5, 20, 71, 111]


* append　リストに新たな要素を付け加える。

In [19]:
print(a)
a.append('appeneded text')
print(a)

[2, 3, 3, 4, 5, 20, 71, 111]
[2, 3, 3, 4, 5, 20, 71, 111, 'appeneded text']


最初に空のリストを作って、後からデータを付け加えることができる。

In [20]:
a = list()
print(a)
a.append(25.0)
print(a)

[]
[25.0]


* extend リストに新たな複数の要素を付け加える。

In [21]:
a.extend(['appended text again',5.0])
print(a)

[25.0, 'appended text again', 5.0]


### タプル
タプルはリストに似た構造を持つが、一度定義した内容を後から変更できないのがリストと違う。利用する場面は少ないように思うが、ディープラーニングの学習データを格納するのに使われるので、以下に簡単に説明する。

In [22]:
a = (3, 4.0, 'tuple',2,9)
print(a)
print(a[-3])
a[4] = 1.0 # cannot replace with a new value

(3, 4.0, 'tuple', 2, 9)
tuple


TypeError: 'tuple' object does not support item assignment

### 辞書
リストは複数のデータと一つにまとめて取り扱えるため便利である。しかし、リストの中身の数が大きくなると、どこにどのデータが入っているかわからなくなってくる。そこで便利なのが、辞書型のデータである。

リストでは各要素のインデックスを指定しないと値を取り出せないのに対して、辞書ではデータとキーを一対一に対応付けさせることで、キー（key）でデータ（value）を取り出すことが可能である。与え方は、

```python
変数 = {key1:value1, key2:value2, ...}
```

のようである。また、値を参照したいときは、 `変数['key2']` のようにして参照する。

In [23]:
ken = {'height':170, 'weight':60, 'gender':'male', 'name':'Ken'}
alice = {'height':165, 'weight':55, 'gender':'female', 'name':'Alice'}

print(ken['weight'])
print(alice['name'])

ken['weight'] = 70
print(ken['weight'])

60
Alice
70


#### メソッド
ディクショナリにもメソッドが用意されている。以下ではその仕様例を示す。

* keys 登録されているキーの一覧を返す。

In [24]:
print(ken.keys())

dict_keys(['height', 'weight', 'gender', 'name'])


* values 登録されている値の一覧を返す。

In [25]:
print(alice.values())

dict_values([165, 55, 'female', 'Alice'])


## ループ
### for文
繰り返し同じ作業を簡単に行うために、ループという仕組みを使う。FortranやC言語でいうところの、

Fortran:
```fortran
a=0
do i=1,n
   a = a+i
end do
```

C:
```c
a=0;
for(i=0;i<n,i++){
   a += i+1;
}
```

のような処理のことをループという。上記リストや辞書（や後に説明する配列）などと組み合わせて頻繁に利用する処理である。一定の回数繰り返す場合は`for`文を使う。書式は、

```python
for 繰り返し変数　in シーケンス:
(indent->) ループ内で処理するブロック
```

のようである。ここで、シーケンスとはリストや辞書などの複数の要素を持つデータ型である。for文の最後に":"をつける。改行した次の行以降は**インデント（４文字）を挿入する必要があるのがPythonでのお約束**である（jupyter notebook, colab, VSCodeなどのテキストエディタは":"の後に改行すると自動的にインデント入れてくれる）。インデントされた範囲をブロックといい、ブロックが繰り返し処理の対象となる。

以下では、シーケンスとしてリストや辞書を使った場合の具体例を見ていこう。

In [26]:
#Loop example with a list
list_example = [7,3,1,5,9,1]
a=0
for i in list_example:
    a += i
print(a)
print(sum(list_example)) #summation of list

26
26


辞書をシーケンスとする場合はキーが一つ一つ抜き出され繰り返し変数に格納される。それをキーとして値を取り出す。

In [27]:
#Loop example with a dictionary
dict_example = {'weight':60, 'height':170, 'gender':'Male', 'name':'Bob'}
for attrb in dict_example:
    print(dict_example[attrb])

60
170
Male
Bob


`range()`関数を使ったループの例を示す。上記FortranやC言語のループの利用例のように、インデックスを変えて一定回数ループを回す時に使う。`range()`関数は

``` python
range(始まり, 終わり+1, 刻み幅)
```

のように引数を渡す。「始まり」を与えなければ0から始まり、「刻み幅」を与えなければ、1づつ増える。

In [28]:
#Loop example with range() function
a=0
for i in range(1,11):
    a += i
    print(i)
print('sum:',a)

1
2
3
4
5
6
7
8
9
10
sum: 55


## 分岐処理
### if文
以下では、if文による分岐処理の使い方を説明する。全体的な構造は```for```文と同じで、":"以降をインデントを挿入して、ブロック内に分岐後の処理を記述する。

```python
if 条件式:
(indent->) 条件式を満たした場合の処理
```

ここで、条件式には比較演算や論理演算が含まれる。以下にそれらをまとめる。

|演算子|例|条件|
|:--:|:--:|:---|
| == | a == b | aとbが等しい |
| != | a != b | aはbと異なる |
| >  | a > b | aはbより大きい|
| <  | a < b | aはbより小さい|
| >= | a >= b | aはbと等しいか大きい|
| <= | a <= b | aはbと等しいか小さい|
| in | a in b | aという要素がb（シーケンス）に存在する|
| and | a==b and a > 0 | aとbが等しいかつaは正の値である|
| or | a==b or a > 0 | aとbが等しいまたはaは正の値である|
| not | not (a>0 or b>0) | aかつbが負の値である|

その他のプログラム言語同様、`if ... else`文

```python
if 条件式:
(indent->) 条件式を満たした場合の処理
else:
(indent->) 条件式を満たさない場合の処理
```

や`if .. else if`文のような使い方もできる。

```python
if 条件式１:
(indent->) 条件式１を満たした場合の処理
elif 条件式２:
(indent->) 条件式１を満たさないかつ条件式２を満たした場合の処理
```

以下では、これら具体例を紹介する。

In [29]:
a = 1.5
b = 3.2
if a > b:
    print('a is larger than b')
else:
    print('b is larger than a')

b is larger than a


In [30]:
a = [2,5,3,1,0,11,4]
b = 4
c = 9

if b in a:
    print(b,' is included in ',a)
if not (c in a):
    print(c, ' is not included in', a)

4  is included in  [2, 5, 3, 1, 0, 11, 4]
9  is not included in [2, 5, 3, 1, 0, 11, 4]


### while文
ループの一種であるが、`while`文を使うことで、ある一定の条件式を満たしている間はブロック内の処理を繰り返す。

```python
while 条件式:
(indent->) ループ内で処理するブロック
```

In [31]:
a = 0.0
while a < 10:
    a += 1
    print(a)
print('final valule:',a)

1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
final valule: 10.0


## ユーザー関数の定義
上記の`len`や`sum`のような関数は、自分でも作成することができる。

```python
def 関数の名前(引数1, 引数2, ...):
(indent->) ブロック
          
         　return 変数1, 変数2, ...
```

関数の名前は、その処理に合わせて名前をつける。引数とは、関数に渡す変数である。任意の数だけ並べる。引数はなくてもよい。最後の`return`文は関数が何らかの値を返す場合に最後に付け加える。以下では、リストを引数に渡して平均と分散を返す関数の例を紹介する。

In [32]:
def function_example(input_list):
    
    n = len(input_list)     #local variable
    ave = sum(input_list)/n #local variable
    var = 0.0               #local variable
    
    for i in range(n):
        var += (input_list[i]-ave)**2/n
    
    return ave, var

a = [4,2,1,5,3,2,19,2]

# receive in this manner when more than one variable is returned
a_ave, a_var = function_example(a) 
print('average of a: ',a_ave)
print('variance of a: ',a_var)

average of a:  4.75
variance of a:  30.4375


関数内部で定義される変数を局所変数という（上の例だと、n, ave, var）。これらは外部からは参照することができない。このように、変数を参照できる範囲を**スコープ**という。

In [33]:
print(n)

NameError: name 'n' is not defined

## ライブラリのインポート
自作した関数などは（例えば上記の関数）はその後も繰り返し使うことがしばしばある。その都度タイプするのは面倒なので、書いたコードをファイルに保存しておくことが一般的である。同じような機能を持つ複数の関数など一つにまとめたものを**モジュール**という。また複数のモジュールのまとまりを**パッケージ**という。モジュールやパッケージなどのコレクションを総じて**ライブラリ**という。以下ではPythonで予め用意されている標準ライブラリやその中に含まれるモジュールの使い方を紹介する。

モジュールの取り込み方は

```python
import モジュール名
```

のようにして行う。モジュールに含まれる関数などはこの一文によってすべて取り込まれる。また、大きなライブラリを利用する場合は

```python
import パッケージ名.モジュール名
```

のように行う場合がある。パッケージの実態はモジュールを格納するディレクトリで、OSのディレクトリを指定する"/"のように、ピリオド"."で階層を表している。

また、以下のようにしてモジュールに別名を充てることも可能である。

```python
import モジュール名 as 別名
```

または

```python
import パッケージ名.モジュール名 as 別名
```

のようにして、長いモジュール名に短く省略化した名前を充てることがしばしばある（後述するライブラリnumpyをnp、matplotlib.pyplotをpltなど）。

それでも少し長ったらしいと感じる場合は、

```python
from モジュール名 import クラス名や関数名
```

のようにしてインポートすると、直接関数名を指定して使うことができる。ただし、この場合は他のライブラリから同様にインポートした関数（やクラス）と名前が重ならないことを注意する必要がある。

このように、Pythonはそのままでは機能としては限られているが、必要な機能をその都度`import`することでパワーアップさせるような思想に基づいて設計されている。標準ライブラリに加え、多くの分野に渡ったライブラリが存在するため、Python言語をハブとして様々なことをソフトウェアとして実現できるのが特徴であると言えよう。いわば、**Pythonはソフトウェア開発におけるOS**のような役割を果たしていると言える。

以下では、Pythonの標準ライブラリのうち（たくさんある）、**math**モジュールを例に使い方を紹介する。

### math
数学関数を揃えたモジュール。Pythonの標準機能には対数などのちょっと高度な数学関数が備わっていないため、使用するためにはmathモジュールをインポートする必要がある（実際には、後述のnumpyライブラリをインポートすることが多い）。

In [34]:
import math

sq2 = math.sqrt(2.0) #２の平方根
print('sqrt(2):',sq2)
print('pi:',math.pi) #円周率

x = [i/10*2*math.pi for i in range(11)]
for angle in x:
    print('theta [rad]:',angle,' sin(theta):',math.sin(angle))

sqrt(2): 1.4142135623730951
pi: 3.141592653589793
theta [rad]: 0.0  sin(theta): 0.0
theta [rad]: 0.6283185307179586  sin(theta): 0.5877852522924731
theta [rad]: 1.2566370614359172  sin(theta): 0.9510565162951535
theta [rad]: 1.8849555921538759  sin(theta): 0.9510565162951536
theta [rad]: 2.5132741228718345  sin(theta): 0.5877852522924732
theta [rad]: 3.141592653589793  sin(theta): 1.2246467991473532e-16
theta [rad]: 3.7699111843077517  sin(theta): -0.587785252292473
theta [rad]: 4.39822971502571  sin(theta): -0.9510565162951535
theta [rad]: 5.026548245743669  sin(theta): -0.9510565162951536
theta [rad]: 5.654866776461628  sin(theta): -0.5877852522924734
theta [rad]: 6.283185307179586  sin(theta): -2.4492935982947064e-16


## 演習課題
フィボナッチ数列を求めるプロゴラムを書いてみよう。

フィボナッチ数列は、$f_0=0$, $f_1=1$が与えられた時、以下の漸化式

$$
f_n = f_{n-1}+f_{n-2}
$$

で与えられる数列で、$0,1,1,2,3,5,8,13,21,34,55$のようである。フィボナッチ数列の一般項$f_n$は、
  
$$
f_n = \frac{1}{\sqrt{5}}\left[ \left(\frac{1+\sqrt{5}}{2} \right)^n - \left(\frac{1-\sqrt{5}}{2} \right)^n \right]
$$
  
で与えられる。このフィボナッチ数列について、以下の２つの方法で計算してみよう。
    
1. ループを使って漸化式を表し、$f_1 \sim f_{20}$を求める。
2. 一般項を関数として定義して、その関数を使って$f_1 \sim f_{20}$を求める。

1., 2. ができたら、
  
3. 1、2の方法で求めた整数をリストに格納する
4. リストを`print()`で出力
    
もチャレンジしてみてほしい。
  
ただし、Pythonの組み込み関数として平方根は与えられていないので、
  
```python
import math
sqr2 = math.sqrt(2)
```
  
のようにして使ってください。

<div class="alert alert-info">
ヒント

最初なので、難しすぎるように感じる場合は以下を参考にしてください。プログラムの全体的な構造をヒントとして示しておきます。課題の目的に沿うように必要なプログラムを追加してください。
</div>

* 漸化式をループで表現する場合

In [None]:
#最初の２項の値を設定
fn1 = [0,1]

for i in range(2,21):
    #漸化式に従ってfn1に値を追加するプログラムを書く

print(fn1)

* 一般項を関数として定義する場合

In [None]:
import math

def fibonacci(n=0):

    sq5 = math.sqrt(5)
    
    # 一般項fnを返す関数をここで定義する

    return round(fn) #整数に丸める関数round()

fn2 = list()
for i in range(21):
    #ここで関数を読んで、リストであるfn2にデータを格納するプログラムを書く
    
print(fn2)