# Lecture 5 ライブラリの活用

## 数値演算ライブラリを使う

### numpyを使う

In [None]:
 # 数値演算ライブラリをインポート
import numpy as np

In [None]:
l = [1, 2, 3, 4]  # リストを定義
# リストから行列を作る
arr = np.array(l)

In [None]:
arr  # 確認

In [None]:
arr + 10  # 行列の足し算

In [None]:
arr * 10  # 行列のかけ算

### リストとarrayの実行速度比較

In [None]:
def array_add(l, n):
    # lのリストに対して行列の加算をする
    for n in range(len(l)):
        l[n] = l[n]+n
    return l

In [None]:
l = [0]*10000  # 1万の0を持つリスト

In [None]:
# 実行時間を計測
%timeit -n 1000 array_add(l, 10)

In [None]:
%timeit -n 1000 a = np.zeros(10000); a += 10

### 行列で音声を扱う

In [None]:
!pip install tdl_pybasic

In [None]:
from tdl_pybasic.array import load_sound, show_player, load_image, show_image

In [None]:
# サンプリング周波数とリストを得る
f, sl = load_sound()

In [None]:
sound_arr = np.array(sl)  # 行列に変換

In [None]:
sound_arr  # 確認

In [None]:
# 音を聞く
show_player(f, sound_arr)

In [None]:
# 画像をリストとして読み込む
l = load_image()

In [None]:
image_arr = np.array(l)  # 行列に変換

In [None]:
show_image(image_arr)  # 画像を表示

In [None]:
# ぼかしフィルタを作る
a3 = [[1]*9]*9
# データ型を指定してarrayを生成
blur_filter = np.array(a3, dtype="float64")
blur_filter *= 1/81

In [None]:
blur_filter  # フィルタの内容を確認

In [None]:
# 画像処理用のライブラリをインポート
from scipy import ndimage

In [None]:
# 畳み込み
r = ndimage.convolve(image_arr, blur_filter)
# 最大，最小を設定
r[r > 255] = 255
r[r < 0] = 0

In [None]:
# show_image()の中身
from io import BytesIO
from PIL import Image
import IPython

img_arr = np.array(r, 'uint8')  # 整数型に変換
# 画像オブジェクトを作る
im = Image.fromarray(img_arr)
 # データ書きだし用のオブジェクトを作る
buf = BytesIO()
im.save(buf,"PNG")  # 画像を保存
data = buf.getvalue()  # 画像データを取得
# 表示
IPython.display.display(IPython.display.Image(data))

### pandasを使う

In [None]:
# データ処理用のライブラリを読み込む
import pandas as pd
url = "https://raw.githubusercontent.com/shibats/minpy_samplecodes_4th/master/Chapter12/total_fertility_rate.csv"
df = pd.read_csv(url)   # 日本の出生率(合計特殊出生率)を読み込む

In [None]:
df  # 読み込んだデータを表示

In [None]:
df.T.plot()  # グラフを表示

In [None]:
# ある企業の10年間の株価データを読み込む
url = "https://raw.githubusercontent.com/shibats/tdl_python_basic/main/Lecture05/stock_chart.csv"
stockchart = pd.read_csv(url)

In [None]:
stockchart[:10] # データを表示(直近10件)

In [None]:
stockchart.describe() # 統計量を表示

In [None]:
stockchart['close'][-40:].plot()

#### 最小二乗法を使った多項式近似(線形回帰)

In [None]:
x = np.arange(40)  # 近似用にx軸の数(0から39まで)を作る
y = stockchart['close'][-40:]  # 近似するデータ

In [None]:
# 1次式で近似
cf1 = np.polyfit(x, y, 1)

<div style="font-size: 200%;">
$$
y = ax+b
$$
</div>

In [None]:
cf1  # 近似結果(係数と切片)を表示

In [None]:
from matplotlib import pyplot as plt

# 元のデータと，近似した結果をグラフ描画する
plt.plot(x, y, linestyle=':')
plt.plot(x, np.poly1d(cf1)(x))

In [None]:
# 近似式の次数を上げてためす
cf2 = np.polyfit(x, y, 2) # 2次
cf8 = np.polyfit(x, y, 8) # 8次

In [None]:
# 各次数の係数を確認する(指数表示)
cf8

In [None]:
# 元のデータと，近似した結果をグラフ描画する
plt.plot(x, y, linestyle=':')
plt.plot(x, np.poly1d(cf1)(x))
plt.plot(x, np.poly1d(cf2)(x))
plt.plot(x, np.poly1d(cf8)(x))

In [None]:
# 10件延長して，補間結果が正しいか確認する

xl = np.arange(50)
# 実際の株価(10件延長)
plt.plot(xl, stockchart['close'][-50:], linestyle=":")
# 次数8の補間式を使って先までグラフを描く
plt.plot(xl, np.poly1d(cf8)(xl))

※ スライドに戻ります