In [None]:
"""
각각의 가중치가 다른 신경세포를 거쳐 값을 구한다. 최초의 퍼셉트론 방식이고 신경망의 형태이다.
단일층 퍼셉트론일 경우 일차식만 설명할 수 있다.
다층 퍼셉트론의 경우 모든 다항식을 설명할 수 있게 된다.
시그모이드 함수 - 모든 값들을 0~1사이의 수로 변환시킬 수 있다.
은닉층이 많아지면 딥러닝이 된다.

신경망의 학습. 신경망은 입력층, 은닉층, 출력층으로 구분이 된다.
가중치를 업데이트 하는 방법으로는 Gradient Descent 방법이 있다.
에포크 반복 횟수를 의미. 가중치를 몇 번 업데이트 할 것인가를 결정
"""

In [1]:
import pandas as pd

# Class를 예측해 보는 NN을 만들어보자
# Location of dataset
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

# Assign colum names to the dataset
names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'Class']

# Read dataset to pandas dataframe
irisdata = pd.read_csv(url, names=names)  

In [2]:
irisdata.head()

Unnamed: 0,sepal-length,sepal-width,petal-length,petal-width,Class
0,5.1,3.5,1.4,0.2,Iris-setosa
1,4.9,3.0,1.4,0.2,Iris-setosa
2,4.7,3.2,1.3,0.2,Iris-setosa
3,4.6,3.1,1.5,0.2,Iris-setosa
4,5.0,3.6,1.4,0.2,Iris-setosa


In [3]:
# Assign data from first four columns to X variable
X = irisdata.iloc[:, 0:4]

# Assign data from first fifth columns to y variable
y = irisdata.select_dtypes(include=[object])  

In [4]:
y.head()

Unnamed: 0,Class
0,Iris-setosa
1,Iris-setosa
2,Iris-setosa
3,Iris-setosa
4,Iris-setosa


In [5]:
X.head()

Unnamed: 0,sepal-length,sepal-width,petal-length,petal-width
0,5.1,3.5,1.4,0.2
1,4.9,3.0,1.4,0.2
2,4.7,3.2,1.3,0.2
3,4.6,3.1,1.5,0.2
4,5.0,3.6,1.4,0.2


In [7]:
y.Class.unique()  

array(['Iris-setosa', 'Iris-versicolor', 'Iris-virginica'], dtype=object)

In [7]:
from sklearn import preprocessing
# 클래스를 정수형 라벨값으로 변환해주는 코드 
le = preprocessing.LabelEncoder()

y = y.apply(le.fit_transform)
y

Unnamed: 0,Class
0,0
1,0
2,0
3,0
4,0
...,...
145,2
146,2
147,2
148,2


In [8]:
from sklearn.model_selection import train_test_split

# Train해줄 데이터와 Valuation해줄 데이터를 나눠주는 코드
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.20)  # test_size = 0.2 -> 20%의 Valuation data 생성

In [10]:
from sklearn.preprocessing import StandardScaler

# X_train 값 정규화
scaler = StandardScaler()  
scaler.fit(X_train)

X_train = scaler.transform(X_train)  
X_test = scaler.transform(X_test)  

In [19]:
X_train, y_train

(array([[ 1.26171875e-01,  2.89295682e-01,  6.36511811e-01,
          8.38391591e-01],
        [-5.04687499e-01,  7.20543904e-01, -1.21959038e+00,
         -1.00037848e+00],
        [ 1.26171875e+00, -5.73200762e-01,  6.36511811e-01,
          3.13028714e-01],
        [-1.00937500e+00, -1.65132132e+00, -2.07171002e-01,
         -2.12334163e-01],
        [-1.38789062e+00,  2.89295682e-01, -1.16334486e+00,
         -1.26305992e+00],
        [-8.83203124e-01,  9.36168015e-01, -1.27583590e+00,
         -1.26305992e+00],
        [-1.38789062e+00,  2.89295682e-01, -1.33208142e+00,
         -1.26305992e+00],
        [-3.78515625e-01, -1.22007309e+00,  1.86547644e-01,
          1.81687995e-01],
        [-1.26171875e-01,  2.87678501e+00, -1.21959038e+00,
         -1.00037848e+00],
        [-8.83203124e-01,  5.04919793e-01, -1.10709934e+00,
         -8.69037759e-01],
        [-1.13554687e+00,  7.36715713e-02, -1.21959038e+00,
         -1.39440064e+00],
        [ 3.78515625e-01, -5.73200762e-01, 

In [12]:
from sklearn.neural_network import MLPClassifier 

mlp = MLPClassifier(hidden_layer_sizes=(10, 10, 10), max_iter=1000)  # hidden layer sizes의 파라미터 갯수는 층의 갯수를 의미
mlp.fit(X_train, y_train.values.ravel())

In [15]:
y_train.values.ravel()

array([1, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 2, 1, 1, 2, 0, 2, 0, 1, 2,
       0, 1, 1, 2, 2, 0, 2, 0, 0, 0, 0, 2, 2, 2, 1, 2, 1, 2, 0, 1, 1, 1,
       2, 0, 1, 2, 1, 0, 2, 0, 2, 2, 0, 1, 2, 0, 2, 2, 1, 2, 1, 0, 2, 2,
       1, 2, 0, 1, 1, 1, 0, 0, 2, 2, 2, 2, 0, 1, 0, 1, 2, 1, 0, 0, 1, 0,
       1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 2, 2, 0, 2, 1, 0, 2, 1, 1, 2,
       2, 2, 0, 2, 1, 1, 1, 1, 2, 0], dtype=int64)

In [13]:
predictions = mlp.predict(X_test)  
predictions

array([2, 1, 2, 2, 1, 1, 1, 1, 2, 0, 1, 2, 0, 1, 1, 1, 1, 0, 1, 2, 2, 1,
       1, 0, 2, 0, 0, 2, 2, 0], dtype=int64)

In [14]:
from sklearn.metrics import classification_report, confusion_matrix  

# 모델 평가
print(confusion_matrix(y_test,predictions))  
print(classification_report(y_test,predictions))  

[[ 7  0  0]
 [ 0 11  0]
 [ 0  2 10]]
              precision    recall  f1-score   support

           0       1.00      1.00      1.00         7
           1       0.85      1.00      0.92        11
           2       1.00      0.83      0.91        12

    accuracy                           0.93        30
   macro avg       0.95      0.94      0.94        30
weighted avg       0.94      0.93      0.93        30

