# 00：PythonプログラミングとNumPy

---
## 目的
Google ColaboratoryとPython，NumPyの基本的な使い方について学ぶ．


## Google Colaboratoryについて
Google Colaboratory (以下，Colab.) はGoogleが提供するクラウド型のJupyter Notebook環境です．Colab.は機械学習や画像認識に関する教育や研究を目的として開発されたサービスであり，無料で使用することができます．

### 計算機のOS確認
下記のコードを実行してOSを確認してみます．

In [None]:
!lsb_release -a

### ハードウェアの確認

#### CPU
下記のコードを実行してCPU情報を確認してみます．

In [None]:
!cat /proc/cpuinfo | grep 'model name' | uniq
!cat /proc/cpuinfo | grep 'processor' | uniq

#### メモリ
下記のコードを実行して，メモリの総量と使用可能量を確認します．
また，Colab.では，メモリの総容量と現在の使用状況はこのページの右上の「RAM」と表示されているアイコンにカーソルを重ねることで，確認することができます．

In [None]:
!cat /proc/meminfo | grep 'MemTotal'
!cat /proc/meminfo | grep 'MemAvailable'

#### GPU
下記のコードを実行してGPU情報を確認します．
GPUの確認を行うためには，**上部のメニューバーの「ランタイム」→「ランタイムのタイプを変更」からハードウェアアクセラレータをGPUにしてください．**

In [None]:
!nvidia-smi

***
## Pythonプログラムの実行方法
Pythonは近年，画像認識や機械学習等の人工知能研究分野で広く用いられているプログラミング言語です．

Pythonの特徴としては，

1. 基本的な文法が簡単で覚えやすい，書きやすい
2. ユニバーサルな言語で，どのようなOSでも同じように動作することが可能
3. 画像認識や機械学習，データ解析に役立つモジュールが豊富に開発されている

という特徴があります．
以下では，Pythonの基本的な文法をプログラムを交えて説明します．

### モジュール
モジュールとはPythonにおいて特定の計算を便利に行う，簡単に記述するためのプログラム群であり，C言語のライブラリに相当するものです．

代表的なツールとしては
* 行列演算など：numpy
* 科学技術計算など：scipy
* グラフの描画など：matplotlib
* 機械学習：scikit-learn
* ディープラーニング：pylearn2, caffe, chainer
* 画像処理：pillow, scikit-image, opencv
* シミュレーション：simpy
* 解析的な計算：theano
* インタラクティブシェル：ipython

などの様々なものが存在しています．


### print文
定義した変数などを表示するためにはprint関数（print文）を用います．
print関数の引数として複数の値を指定することで，一度に複数の情報を表示することができます．

In [None]:
print("Hello world!")
print(1)
print("abc", 123)

### Pythonの型

Pythonの代表的な変数の型としては，以下のものが挙げられます．

* 数値型：整数，浮動小数点数，複素数
  - C言語のようなint, floatなどの型宣言は必要ありません
* コンテナ：リスト，タプル，辞書，集合
  - 型の混在が可能で，基本的にどんな型のデータでも代入可能
* 文字列
  - シングルクォート (') またはダブルクォート (") で囲むことで文字列として表現
* 定数：真偽値(True, False)，None(C言語のNULLに相当)

以下では，本実習で使用する代表的な型とPythonの文法についてプログラムを交えて説明します．

In [None]:
# 整数，浮動小数点数
i = 10
f = 0.001

# コンテナ（リスト，タプル，辞書，集合）
l = [1, 0.01, "abcd"]
t = (3, -4.5, "defg")
d = {"a": 1.0, "b": 2.0, "c": 3.0}
s = {1, 2, 3}

# 真偽値
b1 = True
b2 = False

# None
n = None

### 文字列
文字列はダブルクォート「"」で囲むことで定義します．

#### 文字列の整形方法
C言語のprintf系関数のようなものです．
「%」演算子を利用します．
複数の変数を文字列に代入する場合は「(...)」を用います．
（下記プログラム参照）

In [None]:
# + 演算子で連結することが可能です
string1 = "abc" + "def"
print(string1)

# 文字列の整形方法
# 1. 一つの変数の場合
value = 10
string2 = "integer: %d" % value
print(string2)

# 2. 複数の場合
value1 = 10
float_val1 = 0.01
str1 = "abc"
string3 = "integer: %d, float value: %f, string: %s" % (value1, float_val1, str1)
print(string3)

#### 制御構文
PythonでもC言語と同様の制御構文が用意されています．

* if文
* while文
* for文

C言語の大きな特徴としてこれらの制御構文の対象範囲をインデント（スペース4つまたは2つ）で表現することが挙げられます．スペースの数はプログラム内で統一する必要があります．

In [None]:
# if文
a = 0.5
if a < 0:
    print("negative value")
elif a > 0:
    print("positive value")
else:
    print("zero")

# while文
print("==========")
b = 0
while b < 5:
    print(b)
    b += 1

# for文 1 
print("==========")
c = [0.1, 2.34, 5.6, 7.89]
for x in c:
    print(x)

#### 関数
Pythonの関数は「def」で定義を行います．
関数の定義でも上の制御構文と同様にインデントを用いて範囲を指定します．

In [None]:
# 関数定義
def sample_func1(x, y):
    z = x + y
    return z
  
# 関数の実行
a = 10
b = 20
c = sample_func1(a, b)
print(c)

#### 多重代入
C言語と異なり，複数の値を同時にreturnできる．

In [None]:
def sample_func2(x, y):
    x = a + 1
    y = b * 2
    return x, y
  
c, d = sample_func2(1, 2)
print(c, d)

#### モジュールのインポートと実行
モジュールは「import」を用いることでプログラム内で使用することが可能です．
ここでは，行列計算のモジュールである「Numpy」を使用してみます．

In [None]:
# 通常の読み込み
import numpy

# numpyという関数をnpという名前で使用できるように読み込む
import numpy as np

# numpy.linalgの中のnormという関数を読み込む（他は読み込まない）
from numpy.linalg import norm

***
## Numpyの基本的な使い方
本実習をはじめとする画像認識や機械学習のプログラムでは，Numpyを用いてデータの操作を行います．
以下では，Numpyの基本的な使い方をプログラムを通じて学びます．

### N次元配列：ndarray
Numpyでは上のリストやタプルとは異なり，型を統一する必要があります．

In [None]:
import numpy as np

a = np.array([[0, 0, 1], [0, 0, 2]], dtype=np.float32) # dtype=***で配列要素の型を決めています
b = np.array([[1, 2, 3], [4, 5, 6]], dtype=np.float32)
print(a)
print(b)

# 行列の演算（和・積）
c = a + b
d = a * b  # * は要素ごとの掛け算です
print(c)
print(d)

# （数学的な）行列の掛け算
e = np.dot(a, b.T)   # b.Tは行列bの転置を表しています
print(e)

### 行列の扱い方

#### 特定の要素を取り出す（インデキシング）

`a[i, j]`：行列aの`(i, j)`要素を取り出します．

####  特定の範囲を切り出す（スライシング）
範囲を指定する際にはコロン「:」を用います

`a[i,:]`：行列aの`i`行目（のベクトル）

`a[:,j]`：行列aの`j`列目（のベクトル）

`a[:,0:3]`：行列aの`0, 1, 2`列目の部分行列

#### ファンシーインデキシング

条件に合致する特定の要素のみを取り出します．
認識を失敗したデータだけを取り出す場合などに用いることができる便利な機能です．


In [None]:
# インデキシング
a_elem = a[0, 2]
print(a_elem)

# スライシング
a_slice1 = a[1, :]
a_slice2 = a[:, 2]
print(a_slice1)
print(a_slice2)

b_slice = b[1, 0:2]
print(b_slice)

# ファンシーインデキシング
a = np.array([1, 0, 1, 0, 0], dtype=np.int32)
b = np.array([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]], dtype=np.float32)
print(b[:, a == 1])

### Numpyの便利な関数
Numpyには行列を演算するための便利な関数が多数含まれています．
以下では，いくつかの関数を紹介します．
ここで全てを紹介することは難しいので，興味のある方は公式のreferenceページへアクセスして調べてみてください．

[Numpy Reference (関数一覧の公式ページ)](https://docs.scipy.org/doc/numpy/reference/)

In [None]:
a = np.array([0,1,2], dtype=np.float32)

# exp(指数関数を要素ごとに計算)
print(np.exp(a))
# power(累乗)
print(np.power(a, 2))


# 集計用の関数(非ゼロの要素数を計算)
b = np.array([1, 0, 1, 0, 0], dtype=np.int32)
print(np.count_nonzero(b))