# 01 プログラミング言語 - Python 基礎 -

機械学習で現在よく用いられているプログラミング言語は `python` と呼ばれる言語です．
特徴として

* 誰でもとっかかりやすい汎用言語
* 開発と周辺に人がいっぱいいる（ので使いやすい）

が挙げられます．
特に機械学習や深層学習といったカテゴリーでは，数多の道具（パッケージとかライブラリとか呼ばれます）が用意されていて， **データ構造** と **制御構造** を学ぶことで，アプリケーションを理解することはできるので，初級者でもさっと作って遊べるといった利点があります．

ということで， Python の **さわり部分** を使ったハンズオンを交えて説明して行きたいと思います．

心得としては，文法とかは書いていけば基本的には学習できます．怖がらずに書いてみましょう．
ぶっちゃけて言えば，どんなプログラミング言語でも文法知識は **必要だけど，覚えるのがちょっとつらい** ものです．
でも一定のレベル以上覚えると計算機との対話が楽にできるようになります．
使っていれば，そのうち慣れます．使わないとなれないので使えないというループに陥るので try and error で行きましょう

構成としては，大きく分けると

* 変数（データ構造）
* 制御構造
* 関数
* パッケージの使い方(`numpy`, `scikit-learn`, `pytorch` など）

だけをフォーカスします．（多分これだけでとりあえずなんとかなるはず）．

他の要素は *OJT* でやっていきます．

## 1. 変数（データ構造）

変数とはデータを入れるための **モノ** です．
必要な理解としては，変数という箱にデータを出し入れ（参照と代入）ができるという事です．．

In [None]:
# この行はコメント（プログラムの動きには影響しない）です．
# 最初に a という箱に 数値の 2 を代入してみましょう

a = 2

これで a という変数に値を **代入** したことなるのですが，計算機からは何も反応がないため，どうなったかわかりにくいです．
ということで，確認してみましょう．確認には `print` 関数などを使います．

In [None]:
print(a)

`print` 関数は，変数（オブジェクトと呼ばれます）を適切な形で表示してくれます．

（実は `print` 関数を使わなくとも a とタイプするだけでも情報は得られます．）

*参照* は，変数の値を見ることができることです．現在，`a` という名前の箱に 2 という値が入っているわけですが，この箱を使って，様々な計算が出来ます．

In [None]:
# 変数 a の値を参照し，それを４倍したものを b という変数に入れ込む

b = 4 * a

# ついでに表示も行ってみる．(4 * a で，この場合は 8) が表示されていれば OK
print(b)

### 数値演算

変数などを使って四則演算もできます．

* 加算 '+'
* 減算 '-'
* 乗算 '*'
* 除算 '/'

その他にも

* 剰余 '%'
* 商 '//' (python 3以降)
* べき '**'

が使えます．
これらの演算結果を用いて，代入などで別の変数にいれることも可能です．

In [None]:
c = a / 5  # c という変数に a/5 の演算結果を代入
print('c の値は', c)

print('c+3 = ', c+3)
print(a-5)
print(a*c)
print(c**2)

In [None]:
# なお， = 演算は，右辺で計算した値を，左辺に代入するという操作なので，変数値の値を更新するとこんな感じ

print('a の値は', a)
a = a + 4
print('a の値は', a)

### 文字列

文字列は クォート文字 ' で囲われた表現です．

In [None]:
s = 'これは文字列です'
print('s の内容->', s)

In [None]:
# なお，文字列にも色々な演算が用意されていたりします

s * 10

### 変数の型

ここまで意識しなかったかと思いますが変数には **型** が存在します．数値や文字列には，対応する演算があります．数値に対する加減乗除などがそれに対応します．型を調べるためには `type`  演算を用います．

In [None]:
type('これは文字列です')

In [None]:
type(1+2)

In [None]:
type(3.0)

### 論理型

python では，数値以外の値も演算できます．
例えば，不等式などで評価される表記は，真(True) か 偽(False) となります．
これらの真偽値は論理(Bool)型と呼ばれ，制御構造などで用いられます．

In [None]:
print(2 < 3)
v = 4 < 3
print('v の値は', v)

以上のような型を基本的な型としてデータを格納，演算などを行います

## コンテナ

変数は一つのデータを入れるための箱として振る舞いましたが，複数のデータ集合をまとめて扱いたいときがあります．
これをコンテナと呼びます．
コンテナでよく使われるものとして *リスト* ， *タプル* ， *辞書* があります


### リスト
リストは， **複数のデータ** を入れておくための入れ物です．[ と ] で囲まれたものがリストで配列のようなものです．
リストの各要素へのアクセスは **添字** を用います．
なお，添字は 0 からカウントします．

In [None]:
# 1 〜 ５ の数値をまとめて lst として扱う

lst = [1, 2, 3, 4, 5]

# リスト全体を表示
print('リスト全体', lst)

# リストの 1 番目の要素を表示(添字のカウントは 0 からなので 2 が表示される）
print('lst の 1 番目', lst[1])  


### タプル
タプルはリストみたいなもので，( と ) で囲われたデータ構造です．
ただしリストとの違いは内容を変更させることが **できません** ．

In [None]:
tpl = (1, 2, 3, 4, 5)
print('1番目の要素', tpl[1]) # 要素の参照は普通に添字アクセスでOK

tpl[2] = 4 # ← タプルの要素への代入はできない（ので怒られる）

### 辞書

リストは複数のデータを添字で管理していましたが，辞書は **キー (key)** とそれに対応する **値(value)** で管理します．
例えば 果物の色のデータ管理をしたい場合，"りんごなら赤"，"バナナなら黄色”といったように，果物とその色の名前を対応表を作ります．

対応表は { と } とくくり，キーと値とをコロン ':' をつかって記述していきます．

In [None]:
# 辞書を定義
fruit = {'apple': 'red', 'banana':'yellow', 'peach':'pink', 'orange':'orange'}

# key 'apple' に対応する値を表示
print('apple に対応する値は', fruit['apple'])

In [None]:
# ちなみに空の辞書を作って追加していくことも可能

fruit = {}    # 空の辞書を作る

fruit['apple'] = 'red'
fruit['banana'] = 'yellow'
fruit['peach'] = 'pink'

print( fruit['banana'])

## 2. 制御構造

複雑なプログラムを記述する場合，**繰り返し処理** や，**条件分岐** によって動作を変える処理が必要となります．
ここでは

* 条件分岐(`if`)
* 繰り返し (`for`)

を解説します．

### 条件分岐

条件分岐は，値によって処理を分けたい場合を記述します．
構文としては

    if 条件文:
        条件が真のときに実行する文1
        条件が真のときに実行する文2
        
といった書き方になります．重要なことは

* 条件文（真偽値で評価されるもの）の後ろにコロンをわすれないこと
* コロンのあとはインデント(通常は４スペース）をとることで実行ブロックを記述すること

です．`python` ではインデントによって文を揃え条件分が成り立つときに実行するブロックを記述します．

また，派生形として次のような構文もあります．

    if 条件文:
        条件が真のときに実行するブロック
    else:
        条件が偽のときに実行するブロック


さらに複数の条件がある場合には

    if 条件文A:
        条件Aが真のときに実行するブロック
    elif 条件文B:
        条件Aが偽で条件Bが真のときに実行するブロック
    else:
        条件 A も B も偽の場合に実行するブロック
        
のような構文です．

なお，構文に関して推奨される書き方は [PEP8](https://pep8-ja.readthedocs.io/ja/latest/) あたりを参照してください．

以下では，変数 a の値が 正か負かで表示を変えてみます．

In [None]:
# a の値をいろいろ変えて実行してみよう
a = -1

if a > 0:
    print('a は正です')
else:
    print('a は負（または０）です')

In [None]:
# またインデントのブロックを中途半端にすると，構文エラーで怒られます
# エラーで怒られる記述をしているので，プログラムが途中で止まるのは正常な振る舞いです．

a = 10

if a > 0:
    print('a は正です')
    print('この文は a > 0 のときの実行ブロックです')
  print('インデントが不整合で怒られる文') # この行は怒られます，直すにはインデントをそろえる必要があります．

### 繰り返し

繰り返しは複数回の処理を行うための記述方法です．構文としては

    for 繰り返し変数 in リストなどの複数要素を含むオブジェクト:
        繰り返し実行ブロック
        
という形です．これだけだとなんのこっちゃかよくわからないので，
リストを例に繰り返しを書いてみましょう．

In [None]:
lst = [1, 2, 3, 4, 5, 6]

for item in lst:
    print('item の値は', item)

リストの値を順繰りに取り出して表示していることがわかるかと思います．条件分岐のとこと同じようにインデントでブロックを記述します．
きまった回数の繰り返しを行う場合は，リストを毎回定義するのは面倒なので `range` といったメソッドを用います．

In [None]:
# range の引数を適宜変えてみて実行してください．

for item in range(10):
    print('item の値は', item)

## 3. 関数

**関数** とは一定の処理をまとめて記述しておき，その関数を **呼び出す** ことで処理を実行するためのものです．
例えば，ここまでで使いまくっている `print` は，*与えられたデータを適切に表示する* 機能を持っているものです．
ここでは，さらに踏み込んで，自分で関数を作って使ってしまおうという話になります．

関数の定義は `def`  構文によって記述されます．
ここでは *２つのデータを受け取って，それらの値を加算した値を返してくれる関数* を考えます．

* 受け取るデータは **引数** と呼ばれ
* 返す値を **返り値** と呼ばれます

関数のおおよその形態は，下記のようになります．

    def 関数名(引数のリスト):
        関数処理
        return 処理して出てきた値
        
... うん，具体的に見ていったほうがわかりやすいですね．


In [None]:
# ２つの引数 a, b, を受け取り， それらの値を返す関数を定義してみる

def add_items(a, b):
    return a+b


定義しただけではなにも起こらないので，呼び出して使ってみます．

In [None]:
add_items(2, 3)

## 4. オブジェクト

Python は，所謂オブジェクト指向の言語です．ここでは深入りしませんが，オブジェクトとは

#### データと関数をひとまとめにした構造

みたいなものです．
変数のところで議論したものは実は全てオブジェクトです．
データを扱うためのパッケージなどでも使用されます．

ここでは特にその使い方について述べます．オブジェクトの内部には属性（アトリビュート）変数と呼ばれるデータと，
そのデータを取り扱うための関数（メソッド）があります．
オブジェクトの名前が ``a`` のような名前だった場合，その内部のアトリビュート変数やメソッドにアクセスするには，
(内部に ``hoge`` という属性変数や，``fuga`` というメソッドがあった場合)
``a.hoge`` や ``a.fuga()`` というように，ピリオドを使って表記します．

In [None]:
# 少し複雑な複素数型のオブジェクトをみていく

a = 3 + 2j   # 右辺が複素数なので a は複素数型のオブジェクト（変数）として設定される．

#複素数内部には real(実数部) と imag(虚数部) があるので，その各々にアクセスするには
#ピリオドを用いてアクセスします

print('a の属性')
print(a.real)
print(a.imag)

# 複素数の掛け算などは a.__mul__() といった関数が用意されています
b = 0 + 1j
c = a.__mul__(b)

print('__mul__ メソッドの結果')
print(c)

# ただし，__mul__ のようにアンダースコア2つに囲まれたメソッドは特殊メソッドと呼ばれ直接使うことは
# あまりありません．この __mul__ 関数は掛け算記号が表記された際に呼ばれる関数として振る舞います．

print('普通の掛け算表記')
print(a * b) # 通常はこっちを使う（が，内部的には a.__mul__(b) が呼ばれる)


## 5. パッケージ

パッケージとは，誤解を恐れずに言えば `python` を便利に使うための関数（オブジェクト）がいっぱい集まった道具たちで，用途に応じて様々なものが存在します．
この講義で使うと思われるものは

* `numpy` 行列を扱うためのパッケージ
* `scipy` 科学技術計算一般
* `matplotlib`データのグラフ描画用（みてくれを改善するために `seaborn` も使っている）
* `pandas` データをエクセルのようなひょうとして扱うパッケージ
* `scikit-learn` 機械学習一般用パッケージ
* `tensorflow` 深層学習用パッケージ
* `keras` `tensorflow` の外側に被せて可読性などを上げる

細かいことが多すぎて一度に全部説明すると大変なので使う都度説明することとして，基本的なところを， `numpy`, `matplotlib` で見ていきます．

In [None]:
# パッケージを使うためには，
# import します．

import numpy as np

上の例では，`numpy` というパッケージモジュールを `np` という名前で使うよといっています．
このようにすると， `numpy` の内部に’ある関数群は　np という名前でアクセス出来ます．

例えば， x という変数に 0 から 1 までの区間に１０等分割したデータを作成したいという場合は
以下のように　`numpy` 内部にある `linspace` という関数を使います．

In [None]:
N = 100
x = np.linspace(0, 1, N)

print(x)

リストのようなデータ構造ですが，これは `numpy` 固有のデータ構造である `ndarray`　というものを使っています．リストを使わない理由は，　*ｐｙthon 純正のリストでは，計算がとろい*  からです．　
このデータ　x に対して $y = \cos(2\pi x)$　を計算して見ましょう

In [None]:
y = np.cos(2 * np.pi * x)

print(y)

このままだとなんだかわからないのでグラフにしてみましょう.
グラフ化するには matplotlib を使います．

In [None]:
import matplotlib.pylab as plt
import seaborn as sns; sns.set()  # 見てくれを良くするためのものでなくてもOKです．

plt.plot(x, y)

汚いグラフですが，描けました．
きれいにするために， N を大きくしてまとめて書いてみてください．