# C0TB1060 蒲原紳乃輔

# 課題レポート
今回は多クラス分類が動く仕組みとそれをライブラリーを用いて実装する方法を学習した。更には、plotlyを用いたデータの可視化方法について学習した。今回のレポート課題はそれに関係した問題について扱ってみる。

## 課題２ 多クラス分類を用いたデータの分類
前回は様々な２クラスデータに対して、特徴量を２つ以上用いて分類を行うことに取り組んだ。２クラス分類の際はpredict関数は0.5を境目に0 1のデータに分割した。しかしこれらの手法は2値問題の時のみ有効であり、それ以上になると別の概念を導入する必要がある。scikit-learnの学習器では一対一分類器や一対他分類器などのアルゴリズムが採用されている。今回はその中でも一対一分類器を実装してみることにする。

### 概念の説明
digitsの場合で考える。irisデータのクラスは0 1 2 ...9の10クラスある。one to one 分類ではi=(0,1,2...10)に対して2値分類を繰り返して、それをクラスの組み合わせ分行い最後にその多数決を取る


### OVO分類器の実装

自作分類器だとdigitsデータにおいてあまり精度が出ないことは前に確認済みであるので、ここではscikit-learnのライブラリーに頼ることにする。その中でもovo functionをサポートしているサポートベクトルマシンを用いる。

In [44]:
from sklearn.datasets import load_digits
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn import svm 

# datasetを生成する
digits = load_digits()
X = digits.data 
y = digits.target 

#dataを分割する
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.3)

sklearnのsvmには一対一or一対他の関数を引数を指定する ことで設定可能である。\ `dicision_function_shape = 'ovo'`に設定する。

In [45]:
#scikit-learnの分類器を呼び出す
svm = svm.SVC(C=1.0,kernel='rbf',decision_function_shape='ovo')

svm.fit(X_train,y_train)
y_pred_train = svm.predict(X_train)
y_pred_test = svm.predict(X_test)

print("train score = ",(np.sum(y_train==y_pred_train))/y_train.shape[0] *100,'%')
print("test score = ",(np.sum(y_test==y_pred_test))/y_test.shape[0] *100,'%')
print("")
print("-------------train---------------------")
print("y_predicted = ",y_pred_train)
print("y_true = ",y_train)
print("")
print("-------------test----------------------")
print("y_predicted = ",y_pred_test)
print("y_true = ",y_test)

train score =  99.36356404136833 %
test score =  97.96296296296296 %

-------------train---------------------
y_predicted =  [0 4 0 ... 4 0 8]
y_true =  [0 4 0 ... 4 0 8]

-------------test----------------------
y_predicted =  [3 3 5 1 9 9 2 2 1 1 2 4 7 5 4 5 5 5 7 2 5 4 3 8 3 0 4 0 8 4 2 6 7 2 7 0 2
 1 1 8 3 4 0 7 7 7 1 7 5 4 2 6 6 5 1 0 0 7 3 4 2 0 8 1 8 5 1 0 1 0 9 9 9 8
 1 0 8 9 3 2 5 1 5 0 6 3 0 2 0 0 8 9 2 4 0 2 2 7 6 2 1 2 5 2 9 8 9 2 9 9 0
 7 0 8 0 3 7 3 4 3 6 9 4 3 0 8 8 9 5 4 6 8 9 1 2 1 9 6 8 8 1 5 2 7 7 6 5 3
 7 3 7 9 7 1 1 0 4 5 4 1 6 7 5 5 0 7 7 4 8 2 4 3 1 6 8 8 1 5 2 5 6 7 2 4 2
 8 0 3 5 4 3 8 4 2 6 6 4 9 3 2 0 8 6 8 8 0 5 0 5 8 6 9 2 9 1 7 7 6 6 8 4 0
 0 0 9 3 3 1 5 8 0 6 1 2 9 3 3 8 4 0 3 7 4 8 9 7 2 4 5 8 2 2 3 1 2 5 8 1 3
 0 3 2 6 1 6 4 5 0 0 4 9 2 8 9 1 5 9 2 5 8 5 5 2 0 2 9 9 8 8 9 9 7 1 7 5 7
 6 1 5 6 4 5 1 9 9 4 7 7 4 1 2 8 4 4 3 6 4 6 0 4 9 1 1 4 6 3 0 1 2 8 3 4 6
 9 3 1 8 6 6 5 0 1 3 1 9 8 6 4 4 9 2 6 3 0 7 2 2 6 8 1 5 7 2 5 7 3 7 0 7 7
 5 3 5 6 7 0 2 3 0 4 6 

## 課題2 plotlyのよる確率密度関数の可視化
数週間前に作成したレポートの中で、水素類似原子の球面調和関数の可視化を行った。その時は関数をmatplotlibを用いて可視化したのだが、今回はそれをplotlyを用いて可視化してみることにする。

### 量子力学(理論)
もう一つのトピックとして3次元データの可視化を行ってみる。ただ単にirisデータを3次元データに落とし込みプロットするのは、少々つまらないので、irisデータ以外を扱いたいと思う。筆者は現在学部二年の専門科目で量子力学を勉強している。量子力学と聞くと、有名な方程式であるシュレディンガー方程式が登場する。

\begin{equation}
  H \psi(r,t) = i\hbar\frac{\partial\psi(r,t)}{\partial t} 
\end{equation}

\begin{equation}
  H = -\frac{\hbar^2}{2m} \frac{\partial^2}{\partial r^2} + V(x)
\end{equation}

これは量子力学で登場する有名な二階偏微分方程式である。この方程式を解析的に解く方法を学習したが、それは単原子のみに限った。今回はその解析解から波動方程式の絶対値の2乗である確率密度関数を3次元平面にプロットしてみることにする。

波動関数の解は3つの量子数で定義されている。 \
n : 主要量子数(電子軌道をきめる量) \
l : 方位量子数(軌道運動の角運動量の定義 0...n-1まで取る) \
m : 磁気量子数(磁気を決める量　-l,-l+1,...l-1,lまで取る)

### 球面調和関数の可視化（実装）

In [None]:
import numpy as np
from scipy.special import sph_harm

#球面調和関数を計算するための関数(scipyの特殊関数を使用する)
def cordinate(l,m,theta,phi):
  r = np.abs(sph_harm(l,m,theta,phi))
  x = r*np.sin(theta)*np.cos(phi)
  y = r*np.sin(theta)*np.sin(phi)
  z = r*np.cos(theta)
  return x,y,z

l = int(input("input l "))
m = int(input("input m "))

theta = np.linspace(0,np.pi,30)
phi = np.linspace(0,2*np.pi,30)

X = []
Y = []
Z = []
for t in theta:
  for p in phi:
    x,y,z = cordinate(l,m,t,p)
    X.append(x)
    Y.append(y)
    Z.append(z)

X = np.array(X)
Y = np.array(Y)
Z = np.array(Z)

input l 0
input m 0


In [None]:
import plotly.graph_objects as go

colormap = ["gold", "blue", "green"]
tracelist = []

trace = go.Scatter3d(
    x=X, y=Y, z=Z, mode='markers',
    marker=dict(color=colormap[1], opacity=0.3), name="sph_func")

tracelist.append(trace)

layout = go.Layout(title=f"{l+1}s hydrogen atom harmonic function",scene=dict(aspectmode='data'))
fig = go.Figure(data=tracelist, layout=layout)

# fig.update_layout(
#     scene = dict(
#         xaxis = dict(nticks=4, range=[-0.5,0.5],),
#                      yaxis = dict(nticks=4, range=[-0.5,0.5],),
#                      zaxis = dict(nticks=4, range=[-0.5,0.5],),),
#     width=700,
#     margin=dict(r=20, l=10, b=10, t=10))

fig.show()

## 工夫点
今回は多クラス分類の手法に加えて、点をかっこよくplotするplotlyを導入した。今回は自分で一からコードを全部書くのではなくsklearnの分類器を用いたが、多クラス分類を非常に簡単に実装できるのだと実感することができた。その他、plotlyを用いて点をプロットしてみた。前の課題で球面調和関数の計算を行い、matplotlibで可視化した。これを今回plotlyで行ってみた。データの次元など考慮する点が以外にもあったので勉強になった。

