# NICO2AI  第2回 Python入門 (6/17) 基礎演習
## 今日の目標
* 機械学習の目的及び種類とその評価方法を理解する。
* 第1回に引き続き、numpyで頻出する関数の使い方を実践的に理解する。
* k-NN法を理解し、それをnumpyを用いて実装できる。

## 目次
* 行列積・内積 (np.matmul, np.dot)
* 総和、平均、最大値、最小値(np.sum, np.mean, np.max, np.min)
* L2ノルム (np.linalg.norm)
* 数学関数 (np.sin, np.cos, np.tah, np.exp, np.log など)
* 乱数生成 (np.random.random, np.random.normal)
* ソート関連(np.sort, np.argsort)
* Advanced indexing
* ユークリッド類似度・コサイン類似度

# はじめに

* エラーがでたら落ち着いてエラーを読んでみましょう(エラーを恐れる必要はありません)
* エラーを読んでも理解できない場合は，エラー文をそのままググると解決法が見つかることが多いです
* 詰まったな，と思ったら気軽に質問して下さい
* numpyはドキュメントが充実しています．こんな計算出来ないだろうか，この関数の引数について知りたい，といった場合はドキュメントを見ると解決することが多いです
(https://docs.scipy.org/doc/)

# 1. Numpy入門 (2)

## ライブラリの使用 (import)(再掲)
ライブラリの機能を使うためには、そのライブラリをインポートする必要がある。  
numpyの機能は、ライブラリ名を前につけて、呼び出したいメソッドなどをドット(.)で繋いで呼び出す。
```
import hoge
hoge.foo.bar()
```
Numpyでは、いちいちnumpy.と呼び出すのが面倒であることから、慣習的にimport as文を用いてnp.とするのが一般的である。

In [93]:
import numpy as np  # numpyを'np'という名前でインポートする

## 行列積・内積 (np.matmul, np.dot) 

In [94]:
a = [[1, 0], [0, 1]]
b = [[4, 1], [2, 2]]
np.matmul(a, b)
# array([[4, 1],
#        [2, 2]])

In [95]:
np.dot(a, b)
# array([[4, 1],
#        [2, 2]])

## 総和、平均、最大値、最小値(np.sum, np.mean, np.max, np.min) 

In [96]:
c = [0.5, 0.7, 0.2, 1.5, 2.0]
np.sum(c)

In [97]:
np.mean(c)

In [98]:
np.max(c)

In [99]:
np.min(c)

### 応用
axisを指定して同じような計算をしてみましょう

In [72]:
d = [[1.3, 2.4, 4.5],
    [2.0, 1.3, 3.2],
    [2.7, 1.8, 0.5]]

In [100]:
np.sum(d)

In [101]:
np.sum(d, axis=0)

## L2ノルム (np.linalg.norm)

In [102]:
e = [-4, -3, -2, -1,  0,  1,  2,  3,  4]
np.linalg.norm(e)

## 数学関数 (np.sin, np.cos, np.tah, np.exp, np.log など)

In [103]:
np.sin(np.pi/2.0)

In [104]:
np.log([1, np.e, np.e**2, 0])
# errorが出ますが，log0を計算しているためなので気にしなくて大丈夫です

## 乱数生成 (np.random.random_sample(), np.random.normal)

np.rondom.random_sample() (np.random.random()) : 一様分布

np.random.normal : 正規分布

In [105]:
np.random.random_sample()

In [112]:
# もう一回実行してみる
np.random.random_sample()

In [107]:
# もう一度
np.random.random_sample()

In [108]:
np.random.normal()

In [109]:
# もう一回実行してみる
np.random.normal()

In [110]:
# もう一回
np.random.normal()

### 応用
1. 上記の関数の定義域，平均・分散などを変えて乱数を生成し直してみましょう(ドキュメントを見ましょう)
2. np.random.seedを使って乱数を生成してみましょう

## ソート関連(np.sort, np.argsort)

In [113]:
f = [1.0, 1.3, 1.2, 1.1, 1.5, 1.4]
np.sort(f)

In [114]:
np.argsort(f)

### 応用
 np.argsortを使用して，fの最大の数，上から2番目の数，最小の数を出力してみましょう

## Advanced indexing

In [115]:
g = np.array([1.2, 1.4, 1.6, 1.8, 2.0])
h = np.array([0, 2, 4])
g[h]

## ユークリッド類似度・コサイン類似度 

In [116]:
i = np.asarray([1, 1, 1])
j = np.asarray([1, -1, 1])

# ユークリッド距離
np.linalg.norm(i- j)

In [85]:
# コサイン距離
 
# 実装してみましょう