# Python入門

## 第一部 Python文法1
変数からタプルまで

### 変数の型
Pythonの変数には**整数型**、**浮動小数点型**、**文字列型**、**ブーリアン型**などがあります。  
C言語のような型の宣言は不要で、代入された値から自動的に型の設定がされます。  
変数がどの型を持っているかは、``type``関数で調べることができます。  
また、変数の値そのものは ``print``関数で表示できます。

In [None]:
# 整数型の例

x1 = 2
print(x1)
print(type(x1))

In [None]:
# 浮動小数点型の例

x2 = 3.0
print(x2)
print(type(x2))

In [None]:
# 文字列型の例

x3 = 'abc'
print(x3)
print(type(x3))

In [None]:
# ブーリアン型(True/False)の例

x4 = True
print(x4)
print(type(x4))

### 演算

数値間の演算は他のプログラム言語同様 ``+, -, *, /`` 等を使います。  
文字列同士の連結にも ``+`` を使います。

In [None]:
# 整数同士の和

x1 = 2
y1 = 3
z1 = x1 + y1
print(z1, type(z1))

In [None]:
# 浮動小数点同士の和

x2 = 3.0
y2 = 2.0
z2 = x2 + y2
print(z2, type(z2)) 

In [None]:
# 文字列の連結

x3 = 'abc'
y3 = 'XYZ'
z3 = x3 + y3
print(z3, type(z3))

In [None]:
# 整数と浮動小数点間の演算
# 自動的に方が浮動小数点に合わせられる

y4 = x1 + y2
print(y4, type(y4))

#### 比較演算子
比較演算子は ``==`` です。

In [None]:
x1 = 2
y1 = 3
w1 = 2

print(w1 == x1)
print(w1 == y1)

#### 論理演算子

論理演算子は ``and``, ``or``, ``not``です。

In [None]:
t1 = True
t2 = True
f1 = False
f2 = False

In [None]:
# AND演算

p1 = t1 and t2
p2 = t1 and f2
print(p1, p2)

In [None]:
# OR演算

q1 = t1 or f1
q2 = f1 or f2
print(q1, q2)

In [None]:
# NOT演算

r1 = not t1
r2 = not f1
print(r1, r2)

### リスト

リストは``[x, y, ...]``のような形式で表現します。  
第一要素は``list[0]``, 第二要素は``list[1]``で参照します。  
リストの長さを知りたいときは``len``関数を使います。

In [None]:
# リストの定義

list1 = [2, 4, 6, 8, 10, 12, 14]

In [None]:
# 型は"list"

print(type(list1))

In [None]:
# print関数にかけると、全要素が表示される

print(list1)

In [None]:
# 第一要素の表示

print(list1[0])

In [None]:
# 第二要素の表示

print(list1[1])

In [None]:
# リストの長さはlen関数で取得

print(len(list1))

### 部分リスト

``list[0:3]``のような形式の参照も可能で、  
この式は第1要素から第3要素までを抜き出した部分リストとなります。  
**「0以上で3より前」**という読み方をするとわかりやすいです。

In [None]:
# list[0]から list[3]より前

print(list1[0:3])

#### 部分リストの参照パターン

``list``を元に部分リストを作る方法には、以下のようないろいろなバリエーションがあります。  
機械学習のコーディングでよく使われるテクニックなので、是非マスターして下さい。

In [None]:
# 最初からlist[2]より前
print(list1[0:2])

# 第一引数を省略すると"0"であるとみなされる
print(list1[:2])

In [None]:
# list[2]から最後まで

len1 = len(list1)
print(list1[2:len1])

# 第二引数を省略すると最終要素(len(list)))であるとみなされる
print(list1[2:])

In [None]:
# ':'' だけの場合は、元のリスト全体を表す

print(list1[:])

In [None]:
# 後ろから2つ

print(list1[-2:])

In [None]:
# 後ろの2つを取り除いたもの

print(list1[:-2])

In [None]:
# 普段は使わないのですが、listには3つめの引数もあり、これを使うとこんなことも可能です

# 一つおき

print(list1[::2])

In [None]:
# 第三引数に-1を指定すると「逆順」を意味します

print(list1[::-1])

#### 異なる要素の混在

リストの各要素は異なる型の混在もできます。

In [None]:
list2 = [1, 2.0, 'abc', False]
print(list2)

#### リストに要素の追加

リストに要素を追加したい場合は、``append``関数を使います。

In [None]:
# 空リストの定義
list3 = []

# 要素の追加
list3.append(1)
list3.append(2.0)
list3.append('abc')
print(list3)

#### リスト間の連結

リストとリストを連結したい場合は、``+``演算子を使います。

In [None]:
list4 = list2 + list3
print(list4)

### タプル

リストと似たデータ型として「タプル」があります。  
タプルは、値の変更不可能なリストであると考えて下さい。

In [None]:
# タプルの場合は[]でなく()で要素を囲みます

tap1 = (1,3,5,7)
print(tap1)
print(type(tap1))

In [None]:
# タプルの要素への参照はリスト同様[]で行います
print(tap1[0], tap1[1])

In [None]:
# 値を変更しようとすると 。。。
tap1[1] = 10

In [None]:
# リストの場合、上のこと(要素を後で変更する)は可能です

list7 = [2,4,6,8,10]
list7[2] = 9
print(list7)

## 第二部 Numpy入門1

### Numpyの特徴

numpy配列を使って、配列計算を行えます。  
NativeなPythonの機能と比較してNumpyを使うことにより次のメリットがあります。

* 処理速度が早くなる
* 配列の扱い方が柔軟
* コードがシンプルになる

より詳しい解説は例えば下記のリンク参照して下さい。  
[numpyの何がすごいのか？](https://to-kei.net/python/data-analysis/what-is-numpy/)


### 一次元配列

#### 宣言

In [None]:
# ライブラリのロード
import numpy as np

# 一次元配列の作成
# リスト配列を引数に、array関数でnumpy一次元配列を作ります。

list1 = list(range(2,12,2))
array1 = np.array(list1)

In [None]:
# print文による表示結果の比較
# 画面上はカンマのあるなしで区別します。

print('list配列: ', list1)
print('numpy配列: ', array1)
array1

In [None]:
# データ型(dtype)つき変数作成

# 個々の要素をデータ型付きで定義することも可能です。
# 型には、以下のようなものがあります。
#
# 符号付き整数: int8, int16, int32, int64
# 符号なし整数: unit8, uint16, uint32, uint64
# 浮動小数点: float16, float32, float64, float128

array2 = np.array([2, 4, 6, 8,10], dtype=np.int32)
print(array2)

array2

In [None]:
# 型は' numpy.ndarray' となります

print(type(array1))

In [None]:
# 配列の要素数は'shape'という属性で取得可能です
# 結果はtuppleで返されます

print(array1.shape)

#### 参照

In [None]:
# 要素の参照例

# 先頭
print(array1[0])

# 一番後ろの要素は-1で参照できます
print(array1[-1])

In [None]:
# 範囲付き参照
# このパターンはlist変数と同じです。

# 0以上2未満
print(array1[:2])

# 2以上
print(array1[2:])

# 全部
print(array1[:])

In [None]:
# こういうアクセス方法も可能です
# (これはlistではできない)

# array1の0番目、2番目、4番目
print(array1[[0,2,4]])

# array1の3番目、1番目
print(array1[[3,1]])

#### 計算

In [None]:
# 計算の例
# numpy配列を対象にすると計算を一気に行うことができます

array1 = np.array(list(range(2,12,2)))
array3 = np.array(list(range(5)))
print(array1)
print(array3)

In [None]:
# 足し算
# list変数だとループを回す必要があります

array4 = array1 + array3
print(array4)

#### ブロードキャスト機能

In [None]:
# ブロードキャスト機能
# サイズの異なる変数同士の演算では、サイズを自動的に合わせて計算します

array5 = array1 + 3
print(array5)

In [None]:
# 関数呼び出し
# numpy関数と組み合わせると、関数呼び出しも全要素分まとめて行えます

# 対数関数の呼出し
array6 = np.log(array1)
print(array6)

#### 特定の条件を満たす要素の抽出

In [None]:
# ブロードキャスト機能とindex機能を組み合わせてこんなことも可能です
# arr2 から偶数の要素だけを抜き出す

array3 = np.array(list(range(5)))
w = (array3 % 2) == 0
print(w)

In [None]:
array7 = array3[w]
print(array7)

In [None]:
# まとめて書くとこうなります

array8 = array3[(array3 % 2) == 0]
print(array8)

#### 内積

In [None]:
# 内積
# 記号 '@' を使って内積計算が可能です。

array1 = np.array(list(range(2,12,2)))
array3 = np.array(list(range(5)))
print(array1)
print(array3)

p = array1 @ array3
print(p)

### 二次元配列

numpyでは行列のような二次元配列も扱えます。  

#### 宣言

In [None]:
# 二次元配列の宣言
# この場合、引数はlistのlistとなります。

array8 = np.array([[1,2,3,4,5], [6,7,8,9,10],[11,12,13,14,15]])

In [None]:
# 二次元配列をprint関数にかけるとこのような表示になります

print(array8)

In [None]:
# 要素数の取得

print(array8.shape)

#### 参照

In [None]:
# 要素の参照例

# 先頭
print(array1[0])

# 一番後ろの要素は-1で参照できます
print(array1[-1])

In [None]:
# 範囲付き参照
# このパターンはlist変数と同じです。

# 0以上2未満
print(array1[:2])

# 2以上
print(array1[2:])

# 全部
print(array1[:])

In [None]:
# こういうアクセス方法も可能です
# (これはlistではできない)

# array1の0番目、2番目、4番目
print(array1[[0,2,4]])

# array1の3番目、1番目
print(array1[[3,1]])

#### 計算

In [None]:
# 計算の例
# numpy配列を対象にすると計算を一気に行うことができます

array1 = np.array(list(range(2,12,2)))
array3 = np.array(list(range(5)))
print(array1)
print(array3)

In [None]:
# 足し算
# list変数だとループを回す必要があります

array4 = array1 + array3
print(array4)

#### ブロードキャスト機能

In [None]:
# ブロードキャスト機能
# サイズの異なる変数同士の演算では、サイズを自動的に合わせて計算します

array5 = array1 + 3
print(array5)

In [None]:
# 関数呼び出し
# numpy関数と組み合わせると、関数呼び出しも全要素分まとめて行えます

# 対数関数の呼出し
array6 = np.log(array1)
print(array6)

#### 特定の条件を満たす要素の抽出

In [None]:
# ブロードキャスト機能とindex機能を組み合わせてこんなことも可能です
# arr2 から偶数の要素だけを抜き出す

array3 = np.array(list(range(5)))
w = (array3 % 2) == 0
print(w)

In [None]:
array7 = array3[w]
print(array7)

In [None]:
# まとめて書くとこうなります

array8 = array3[(array3 % 2) == 0]
print(array8)

#### 内積

In [None]:
# 内積
# 記号 '@' を使って内積計算が可能です。

array1 = np.array(list(range(2,12,2)))
array3 = np.array(list(range(5)))
print(array1)
print(array3)

p = array1 @ array3
print(p)

### 二次元配列

numpyでは行列のような二次元配列も扱えます。  

#### 宣言

In [None]:
# 二次元配列の宣言
# この場合、引数はlistのlistとなります。

array8 = np.array([[1,2,3,4,5], [6,7,8,9,10],[11,12,13,14,15]])

In [None]:
# 二次元配列をprint関数にかけるとこのような表示になります

print(array8)

In [None]:
# 要素数の取得

print(array8.shape)

#### 参照

In [None]:
# 要素の参照は「(第一次元引数),(第二次元引数)」の形式

print(array8[1,2])

In [None]:
# それぞれの次元に対して範囲指定で参照することも可能

print(array8[:2,2:])

#### 計算

In [None]:
# スカラー積

a = np.array([[1,2,3],[4,5,6]])
b = a * 3
print(b)

In [None]:
# スカラー和

a = np.array([[1,2,3],[4,5,6]])
c = a + 3
print(c)

In [None]:
# 行列同士の和

d = a + b
print(d)

In [None]:
# 行列と1次元配列の内積

a = np.array([[1,2,3],[4,5,6]])
x = np.array([3,2,1])
print(a)
print(x)

In [None]:
# '@'による内積
# 行列とベクトルの積になる

y = a @ x
print(y)

In [None]:
# * による積
# ブロードキャスト機能により要素間の積になる

z = a * x
print(z)

####  特別な配列の生成

In [None]:
# 要素数(2,3) すべての要素が0の配列

z23 = np.zeros((2,3))
print(z23)
print(z23.shape)

In [None]:
# 要素数(2,3) すべての要素が1の配列

o23 = np.ones((2,3))
print(o23)
print(o23.shape)

In [None]:
# 要素数(2,3) すべての要素が[0,1]間の一様乱数の配列

u23 = np.random.rand(2,3)
print(u23)
print(u23.shape)

In [None]:
# 要素数(2,3) すべての要素が平均0分散1の正規分布乱数の配列

s23 = np.random.randn(2,3)
print(s23)
print(s23.shape)

## 第3部 Matplotlib入門

### Matplotlibとは

PythonのJupyter Notebook環境でグラフ表示を行うためのライブラリです。  
NumpyやPandasとの連携を前提に設計されており、簡潔なコードで様々なグラフ表示を行うことができます。  
以下は7章の線形回帰の実習で出てくるMatplotlib呼出しコードの解説です。  
(書籍内では説明が省かれています)

#### データ準備
(解説はch00-13-numpy2.ipynbにあります)

In [None]:
# 必要ライブラリimport
import numpy as np
from sklearn.datasets import load_boston

boston = load_boston()
x_org, yt = boston.data, boston.target
feature_names = boston.feature_names

x_data = x_org[:,feature_names == 'RM']
x = np.insert(x_data, 0, 1.0, axis=1)

#### 散布図の表示

In [None]:
# 必要ライブラリimport
%matplotlib inline
import matplotlib.pyplot as plt

In [None]:
# 散布図の表示

# 散布図は scatter関数で表示します。
# 第一引数 xの値の配列 (例では x[:,1])
# 第二引数 yの値の配列 (例ではyt)
# s: 点の大きさ (オプション)
# c: 色指定 (オプション)
plt.scatter(x[:,1], yt, s=10, c='b')

# xlabel: x軸のラベル表示
plt.xlabel('ROOM', fontsize=14)

# ylabel: ｙ軸のラベル表示
plt.ylabel('PRICE', fontsize=14)

# 画面描画を明示的に指示
plt.show()

#### グラフ表示
7章では学習曲線の表示にplot関数が使われています。  
学習曲線の計算は大変なので、代わりに5章で出てくるシグモイド関数のグラフ表示コードを示します。

In [None]:
# シグモイド関数の定義
def sigmoid(x):
    return 1/(1 + np.exp(-x))

In [None]:
# xの配列作成
# linescapeは与えられた区間の間に等間隔の点を取る関数です。
# 下記の例では 区間[-5, 5]の間に101個の点を取ります。

x = np.linspace(-5, 5, 101)

In [None]:
# xの内容表示(一部)
print(x[:5])

In [None]:
# yの配列作成
y = sigmoid(x)

In [None]:
# yの内容表示(一部)
print(y[:5])

In [None]:
# グラフ表示

# グラフ表示はplot関数で描画する
# 第一引数: xの配列
# 第二引数: yの配列
# label: グラフのラベル指定(オプション)
plt.plot(x, y, label='sigmoid')

# グラフ上にグリッド表示を追加
plt.grid()

# グラフ上に凡例表示を追加
plt.legend()

# 画面描画を明示的に指示
plt.show()