<a href="https://colab.research.google.com/github/tomonari-masada/course2025-intro2ml/blob/main/06_matplotlib.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# matplotlibの使い方
* グラフを描くときによく使う。（可視化）
* 類似のライブラリにseabornというものもある。
 * seabornの方がややキレイな図になる。
 * matplotlibを知っておけば。seabornを使うのは簡単。

* matplotlibの公式チートシート
https://github.com/matplotlib/cheatsheets


### インポートの仕方

In [None]:
import matplotlib.pyplot as plt

### 図の解像度を上げるための設定

In [None]:
%config InlineBackend.figure_format = 'retina'

### 散布図

In [None]:
import numpy as np

x = np.array([0.7, 1.8, 3.6])
y = np.array([3.3, 0.7, 4.8])

plt.scatter(x, y);

### 線グラフ

In [None]:
import numpy as np

In [None]:
x = np.linspace(-5, 5, 101)
print(x)

In [None]:
x ** 2

In [None]:
y = x ** 2
plt.plot(x, y);

In [None]:
x = np.linspace(-5, 5, 101)
y = np.sin(x)
plt.plot(x, y)


### 棒グラフ

In [None]:
items = ["apple", "orange", "banana", "peach"]
counts = [100, 200, 300, 400]
plt.bar(items, counts);

### 行列の可視化

In [None]:
X = np.random.randn(10, 10)
print(X)

In [None]:
plt.imshow(X)
plt.title("10x10 random matrix");

In [None]:
X_eye = np.eye(6) # 単位行列

In [None]:
print(X_eye)

In [None]:
plt.imshow(X_eye);

### 等高線
* 2変数の関数の値を可視化するときに使う
$$z=f(x, y)$$

In [None]:
delta = 1.0
x = np.arange(-3.0, 3.0, delta)
y = np.arange(-2.0, 2.0, delta)

In [None]:
print(x)
print(y)

* 格子点を作る関数

In [None]:
X, Y = np.meshgrid(x, y)

In [None]:
print(X)

In [None]:
print(Y)

* `X`と`Y`に同じインデックスでアクセスすると、格子点の座標が得られる。

In [None]:
print(X[0,0], Y[0,0])

In [None]:
print(X[1,0], Y[1,0])

In [None]:
print(X[2,3], Y[2,3])

* $z = x^2 + y^2$という関数の値の等高線を描く。

In [None]:
Z = X ** 2 + Y ** 2

In [None]:
print(Z)

In [None]:
plt.contour(X, Y, Z)

## 実践例
* 有名なiris datasetを可視化する。

* scikit-learnを使ってiris datasetを読み込む（ロードする）

In [None]:
from sklearn.datasets import load_iris
data = load_iris()

In [None]:
data

In [None]:
X = data.data

In [None]:
print(X)

In [None]:
print(data.feature_names)

In [None]:
X.shape

In [None]:
X[10,:]

In [None]:
plt.scatter(X[:,1], X[:,2]) # 2列目全てと、3列目すべて
plt.xlabel(data.feature_names[1])
plt.ylabel(data.feature_names[2]);

# 課題20250526
* NumPyやmatplotlibを使って・・・
  1. 一年分の終値の平均値と標準偏差、最大値、最小値を求める
  2. 一年分の終値の推移を、折れ線グラフで描く
  3. 横軸に終値、縦軸に次の日の終値をとって、散布図を描く
  4. 一年分の終値のヒストグラムを描く


### 課題の準備
* Google Spreadsheetsのサイトへ行く
  * https://docs.google.com/spreadsheets/
* GOOGL, AAPLなど適当な会社の2020年の毎日の終値を取得する
  * 方法は右のサポートページに書いてある→
https://support.google.com/docs/answer/3093281?hl=ja
  * 例えば、セルに「`=GOOGLEFINANCE("NASDAQ:GOOG", "price", DATE(2024,1,1), DATE(2024,12,31), "DAILY")`」と入力する。
  * 株価データの部分だけを別のシートにコピーしてから、「.csv」形式のファイルとしてダウンロードする。
* いまダウンロードしてきた「.csv」ファイルを、Google Colabに持ってきてから、読み込む。
  * 読み込むには、NumPyのgenfromtxt関数を使う。delimiter（区切り文字）はカンマを指定。

In [None]:
from google.colab import files
files.upload()

In [None]:
my_data = np.genfromtxt("/content/無題のスプレッドシート - シート2.csv", delimiter=',')

In [None]:
print(my_data)

In [None]:
type(my_data)

In [None]:
my_data[10]