In [7]:
import numpy as np

def sigmoid(x): 
    return 1 / (1+np.exp(-x))

In [11]:
# DNN 클래스 정의
class NeuralNetwork:
 # 생성자
    def __init__(self, input_nodes, hidden_nodes, output_nodes, learning_rate):
        # 각 층의 노드와 학습율 초기화 ①
        self.input_nodes = input_nodes
        self.hidden_nodes = hidden_nodes
        self.output_nodes = output_nodes
        self.learning_rate = learning_rate
        # Xavier/He 방법으로 가중치 / 바이이어스 초기화
        # 각 층으로 들어오는 입력노드 개수의 제곱근을 사용해 가중치를 초기화하는 방식
        self.W2 = np.random.randn(self.input_nodes, self.hidden_nodes)/np.sqrt(self.input_nodes/2)
        self.b2 = np.random.rand(self.hidden_nodes)
        
        self.W3 = np.random.randn(self.hidden_nodes, self.output_nodes)/np.sqrt(self.hidden_nodes/2)
        self.b3 = np.random.rand(self.output_nodes)
        
        # 출력층 선형회귀 값 z3, 출력값 a3
        self.Z3 = np.zeros([1,output_nodes])
        self.Z3 = np.zeros([1,output_nodes])
        self.A3 = np.zeros([1,output_nodes])

        # 은닉층 선형회귀 값 z3, 출력값 a3
        self.Z2 = np.zeros([1,hidden_nodes])        
        self.A2 = np.zeros([1,hidden_nodes])
        
        # 입력층 선형회귀 값 z3, 출력값 a3
        self.Z1 = np.zeros([1,input_nodes])
        self.A1 = np.zeros([1,input_nodes])

    def feed_forward(self ):
        delta = 1e-7 # log 무핚대 발산 방지
        
        # 입력층 선형회귀 값 Z1, 출력값 A1 계산
        self.Z1 = self.input_data
        self.A1 = self.input_data
        
        # 은닉층 선형회귀 값 Z2, 출력값 A2 계산
        self.Z2 = np.dot(self.A1, self.W2) + self.b2
        self.A2 = sigmoid(self.Z2)
        
        # 출력층 선형회귀 값 Z3, 출력값 A3 계산
        self.Z3 = np.dot(self.A2, self.W3) + self.b3
        y = self.A3 = sigmoid(self.Z3)
        return -np.sum( self.target_data*np.log(y+delta) + (1-self.target_data)*np.log((1 - y)+delta) )
 
    def loss_val(self ): # 손실 값 계산
        delta = 1e-7 # log 무핚대 발산 방지
        # 입력층 선형회귀 값 Z1, 출력값 A1 계산
        self.Z1 = self.input_data
        self.A1 = self.input_data
        # 은닉층 선형회귀 값 Z2, 출력값 A2 계산
        self.Z2 = np.dot(self.A1, self.W2) + self.b2
        self.A2 = sigmoid(self.Z2)
        # 출력층 선형회귀 값 Z3, 출력값 A3 계산
        self.Z3 = np.dot(self.A2, self.W3) + self.b3
        y = self.A3 = sigmoid(self.Z3)
        return -np.sum( self.target_data*np.log(y+delta) + (1-self.target_data)*np.log((1 - y)+delta) )
 
    def train(self, input_data, target_data): # 학습
        # 피드 포워드 수행
        self.input_data = input_data
        self.target_data = target_data
        loss_val = self.feed_forward() 
        
        # 출력층 loss 인 loss_3 구함
        loss_3 = (self.A3-self.target_data) * self.A3 * (1-self.A3)
        
        # 출력층 가중치 W3, 출력층 바이어스 b3 업데이트
        self.W3 = self.W3 - self.learning_rate * np.dot(self.A2.T, loss_3)
        self.b3 = self.b3 - self.learning_rate * loss_3
        
        # 은닉층 loss 인 loss_2 구함
        loss_2 = np.dot(loss_3, self.W3.T) * self.A2 * (1-self.A2)
        
        # 은닉층 가중치 W2, 은닉층 바이어스 b2 업데이트
        self.W2 = self.W2 - self.learning_rate * np.dot(self.A1.T, loss_2)
        self.b2 = self.b2 - self.learning_rate * loss_2
 
    def predict(self, input_data): # 예측
        Z2 = np.dot(input_data, self.W2) + self.b2
        A2 = sigmoid(Z2)
        Z3 = np.dot(A2, self.W3) + self.b3
        y = A3 = sigmoid(Z3)
        
        # Categorical일땐 argmax()로 최고 확률의 항목을 리턴
        # 0 또는 1 이 아닌 argmax() 를 통해 최대 인덱스를 넘겨주어야 함(원핫인코딩 기법)
        #predicted_num = np.argmax(y)
        #return predicted_num 
        
        # Binary 일때 0 or 1 리턴
        if y > 0.5:
            predicted_num = 1 
        else:
            predicted_num = 0 
        return predicted_num 

    def accuracy(self, test_input_data, test_target_data):
        matched_list = []
        not_matched_list = []
        for index in range(len(test_input_data)):
            label = int(test_target_data[index])
            #data = (test_input_data[index, :] / 255.0 * 0.99) + 0.01
            data = test_imout_data[index, :]
            
            predicted_num = self.predict(np.array(data, ndmin=2)) 
            if label == predicted_num:
                matched_list.append(index)
            else:
                not_matched_list.append(index)

        print("Current Accuracy = ", len(matched_list)/(len(test_input_data)) )
        return matched_list, not_matched_list


In [38]:
# NeuralNetwork 객체 생성 및 학습 (mnist.csv)
# training_data = np.loadtxt('./mnist_train.csv', delimiter=',', dtype=np.float32) 
# i_nodes = 784 # input nodes 개수
# h1_nodes = 100 # hidden nodes 개수.
# o_nodes = 10 # output nodes 개수
# lr = 0.1 # learning rate
# epochs = 1 # 반복횟수

# obj = NeuralNetwork (i_nodes, h1_nodes, o_nodes, lr) 
# for i in range(epochs): 
#     for step in range(len(training_data)):
#         input_data = ((training_data[step, 1:] / 255.0) * 0.99) + 0.01 
#         target_data = np.zeros(o_nodes) + 0.01
#         target_data[int(training_data[step, 0])] = 0.99
#         obj.train(np.array(input_data, ndmin=2), np.array(target_data, ndmin=2))
#         if (step % 1000 == 0):
#             print("epochs = ", i, ", step = ", step, ", loss value = ", obj.loss_val())

# diabetes.csv
data = np.loadtxt('../diabetes.csv', delimiter=',',  dtype=np.float32, skiprows=1)
#t_data = data['Outcome']
#df = data[:,:-1]

training_data = data[:-100, :]
test_data = data[-100:, :]

# target_data = data[:-100, -1]
# test_target_data = data[-100:, -1]

i_nodes = 8
h1_nodes = 100
o_nodes = 1
epochs = 2

obj = NeuralNetwork (i_nodes, h1_nodes, o_nodes, lr) 
for i in range(epochs): 
    for step in range(len(training_data)):
        print(step, len(training_data))
        input_data = ((training_data[step, :-1] / 255.0) * 0.99) + 0.01 
        target_data = np.zeros(o_nodes) + 0.01
        #target_data[int(training_data[step, -1])] = 0.99
        target_data = training_data[step, -1]

        obj.train(np.array(input_data, ndmin=2), np.array(target_data, ndmin=2))
        if (step % 1000 == 0):
            print("epochs = ", i, ", step = ", step, ", loss value = ", obj.loss_val())

AttributeError: module 'pandas' has no attribute 'loadtxt'

In [53]:
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler

i_nodes = 8
h1_nodes = 100
o_nodes = 1
epochs = 2

df = pd.read_csv('../diabetes.csv')

mm = MinMaxScaler()
df2 = mm.fit_transform(df)

X_train, X_test, y_train, y_test = train_test_split(df2[:,:-1], df2[:,-1], random_state=555)

# data = np.loadtxt('../diabetes.csv', delimiter=',',  dtype=np.float32, skiprows=1)
# #t_data = data['Outcome']
# #df = data[:,:-1]

# training_data = data[:-100, :]
# test_data = data[-100:, :]

# target_data = data[:-100, -1]
# test_target_data = data[-100:, -1]


In [54]:
obj = NeuralNetwork (i_nodes, h1_nodes, o_nodes, lr) 

for i in range(epochs): 
    for step in range(len(X_train)):
        input_data = X_train[step, :]
        target_data = np.array(np.zeros(o_nodes))
        target_data[0] = y_train[step]

        obj.train(np.array(input_data, ndmin=2), np.array(target_data))
        if (step % 100 == 0):
            print("epochs = ", i, ", step = ", step, ", loss value = ", obj.loss_val())

epochs =  0 , step =  0 , loss value =  0.06038267951263046
epochs =  0 , step =  100 , loss value =  0.7020619450405221
epochs =  0 , step =  200 , loss value =  0.1768671122625248
epochs =  0 , step =  300 , loss value =  0.3389235767601015
epochs =  0 , step =  400 , loss value =  1.102201682938971
epochs =  0 , step =  500 , loss value =  0.9718387089493098
epochs =  1 , step =  0 , loss value =  1.0264207746069824
epochs =  1 , step =  100 , loss value =  0.7486671770143576
epochs =  1 , step =  200 , loss value =  0.16750106106001567
epochs =  1 , step =  300 , loss value =  0.32083511751440147
epochs =  1 , step =  400 , loss value =  1.1855990485064896
epochs =  1 , step =  500 , loss value =  0.887203554144519


In [55]:
(true_list, false_list) = obj.accuracy(X_test, y_test)

Current Accuracy =  0.0


In [10]:
# 테스트 데이터로 검증
test_data = np.loadtxt('./mnist_test.csv', delimiter=',', dtype=np.float32)
test_input_data = test_data[ :, 1: ]
test_target_data = test_data[ :, 0 ]
(true_list, false_list) = obj.accuracy(test_input_data, test_target_data)

Current Accuracy =  0.9332
