In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


## 設定目前程式資料夾路徑(務必自行更改)

In [None]:
folder="/content/drive/MyDrive/解密AI黑盒子分享/"

## 載入所需套件

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.font_manager as plt_font
twfont1=plt_font.FontProperties(fname=folder+"字型/kaiu.ttf")
from IPython import display

## 從檔案讀取資料集

In [None]:
data=np.loadtxt(folder+"資料集/iris_data.csv",delimiter=",")

## 只篩選出山鳶尾(label=0)和雜色鳶尾(label=1)

In [None]:
data=data[(data[:,4]==0) | (data[:,4]==1)]

### 整理鳶尾花特徵資料集和分類標示資料集

In [None]:
data_x=data[:,:2]
data_x=(data_x-data_x.mean(axis=0))/data_x.std(axis=0)
data_y=data[:,4]

## 可視化鳶尾花特徵分佈圖

In [None]:
plt.figure(figsize=(8,5))
plt.title("鳶尾花品種分佈圖",fontproperties=twfont1,fontsize=20) 
plt.xlabel("花萼長度",fontproperties=twfont1,fontsize=20) 
plt.ylabel("花萼寬度",fontproperties=twfont1,fontsize=20)
plt.scatter(data_x[0,0],data_x[0,1],c="b",s=40,label="山鳶尾")
plt.scatter(data_x[0,0],data_x[0,1],c="b",s=40,label="雜色鳶尾")
plt.scatter(data_x[:,0],data_x[:,1],c=["b" if i==0 else "r" for i in data_y],s=40)
plt.legend(prop=twfont1)
plt.show()

## 組合樣本資料的多次方特徵

## 分割訓練資料集和測試資料集的特徵矩陣X、標籤矩陣Y

In [None]:
Train_X=X[:70]
Train_Y=data_y[:70].reshape((-1,1))
Test_X=X[70:]
Test_Y=data_y[70:].reshape((-1,1))

## 定義激活函數

In [None]:
def Sigmoid(z):
  return 1/(1+np.exp(-z))

## 定義模型運算函數

In [None]:
def F(X):
  z=np.dot(X,W)+B
  return Sigmoid(z)

## 定義損失函數

In [None]:
def Loss(Yh,Y):
  return -np.sum(Y*np.log(Yh)+(1-Y)*np.log(1-Yh))

## 設定訓練模型的參數

In [None]:
B=np.random.randn(1).reshape((1,1))
W=np.random.randn( ).reshape((-1,1))
ETA=0.07
Step_W=[]
Step_B=[]
Step_L=[]

## 用迴圈訓練模型

In [None]:
for epoch in range(2500):
  Step_B.append(float(B))
  Step_W.append(W)
  Yh=F(Train_X)
  W=W-ETA*np.dot(Train_X.T,Yh-Train_Y)
  B=B-ETA*np.sum(Yh-Train_Y)
  loss=Loss(Yh,Train_Y)
  Step_L.append(loss)
  if epoch%5==4:
    print("訓練次數",epoch+1,"損失值",loss)
    display.clear_output(wait=True)

## 觀察訓練過程中的損失函數Loss變化

In [None]:
plt.figure(figsize=(9,6)) #設定繪圖區大小
#繪圖區的標題，設定用中文字體twfont1，字體大小20
plt.title("Loss變化",fontproperties=twfont1,fontsize=20)
#設定橫軸和縱軸的標題
plt.xlabel("訓練次數",fontproperties=twfont1,fontsize=20)
plt.ylabel("損失函數",fontproperties=twfont1,fontsize=20)
plt.plot(Step_L,"b.",label="Loss")
plt.legend(prop=twfont1)

## 觀察資料數據和模型函數

In [None]:
x1=np.linspace(-2,2,500)
plt.figure(figsize=(8,5))
plt.title("鳶尾花品種分佈圖",fontproperties=twfont1,fontsize=20) 
plt.xlabel("花萼長度",fontproperties=twfont1,fontsize=20) 
plt.ylabel("花萼寬度",fontproperties=twfont1,fontsize=20)
plt.scatter(data_x[0,0],data_x[0,1],c="b",s=40,label="山鳶尾")
plt.scatter(data_x[0,0],data_x[0,1],c="b",s=40,label="雜色鳶尾")
plt.scatter(Train_X[:,0],Train_X[:,2],c=["b" if i==0 else "r" for i in Train_Y],s=40,marker="o")
plt.scatter(Test_X[:,0],Test_X[:,2],c=["b" if i==0 else "r" for i in Test_Y],s=40,marker="s")
plt.plot(x1,-(W[1]/W[2])*x1**2-(W[0]/W[2])*x1-B[0]/W[2],"r:")
plt.legend(prop=twfont1)

## 測試資料集的準確度

In [None]:
TestYh=F(Test_X)
print("測試集的準確度",(np.around(TestYh)==Test_Y).sum()*100/len(Test_Y),"%")