# SLP (Single Layer Perceptron)
- 단층 퍼셉트론
- 간단한 구조지만 여러 고급 신경망 구조의 기본 요소
- 고급 신경망의 복합 구조를 이해하는데 도움이 되는 기본 구조

# 필요 개념

## 1. 모델 파라미터(Model Parameter)
- 학습 과정 중에 끊임없이 변경되어 가면서 퍼셉트론의 동작 특성을 결정하는 값들을 파라미터라고 한다.
- 딥러닝의 핵심이 파라미터를 구하는 것(가중치, 편향)
- 하이퍼파라미터와는 구분하자

## 2. 텐서(tensor)
- 다차원 숫자 배열

## 3. 미니배치(Mini batch)
- 딥러닝에서 신경망이 여러 데이터를 한꺼번에 처리하게 해주는 단위

## 4. 하이퍼 파라미터(Hyper Parameter)
- 에포크, 미니배치 크기처럼 학습 과정에서 변경되지 않으면서 신경망 구조나 학습 결과에 영향을 미치는 고려 요인들
- 문제 유형, 신경망 구조, 데이터양, 학습 결과 등을 종합적으로 보아 하이퍼 파라미터 값을 지정해줘야한다.
- 학습 결과에 큰 영향을 미침

## 5. MSE (Mean Squared Error)
- 평균 제곱 오차
- 회귀 분석에서 추정값이 얼마나 정확한지 평가할 때 쓰이는 지표
- 항상 0이상의 값을 가지며, 0에 가까워질 수록 오차가 적어 진다는 의미.
- 추정이 100프로면 0값을 가진다.

## 6. 경사하강법(Gradient Descent)
- 미니배치 입력 데이터에 대해 순전파와 역전파 과정을 번갈아 수행하는 과정을 반복하면서 신경망 파라미터들을 원하는 방향으로 바꾸는 알고리즘
- Forward propagation (순전파)
    - 입력 데이터에 대해 신경망 구조를 따라가면서 현재의 퍼라미터값들을 이용해 손실 함수값을 계산하는 과정
- Backward Propagation (역전파)
    - 순전파 계산 과정의 역순으로 거슬러올라가면서 손실 함수값에 직간접적으로 영향을 미친 모든 성분에 대해 손실 기울기를 계산하는 과정

# Memo
- 딥러닝 프로그램의 효율을 높이려면 최대한 반복문 사용을 피하고 텐서 연산을 이용해 처리하는 것이 중요하다는 점을 명심하자.
- 딥러닝은 기본적으로 가변 파라미터를 갖는 신경망 구조를 설정한 후 학습을 통해 파라미터값들을 조절하여 신경망이 원하는 동작을 수행하도록 만드는 인공지능 기법이다.

# SLP 구현
## 임포트

In [4]:
import numpy as np
import pandas as pd
import time
import csv

np.random.seed(1234) # 일단 시드값을 1234로 주고 시작
def randomize(): # 현재 시간을 난수발생 시드값으로 주는 함수
    np.random.seed(time.time())

## 하이퍼파리미터 정의
- RND_MEAN : 정규분포 난수의 평균
- RND_STD : 정규분포 난수의 표준편차
- LEARNING_RATE : 학습률

In [2]:
RND_MEAN = 0
RND_STD = 0.0030

LEARNING_RATE = 0.001

## 메인함수 정의

In [3]:
def abalone_exec(epoch_count=10, mb_size=10, report=1):
    load_abalone_dataset() # 데이터셋 로드
    init_model() # 파라미터 초기화
    train_and_test(epoch_count, mb_size, report) # 학습 및 평가 수행

## 데이터 적재 함수

In [25]:
def load_abalone_dataset():
    with open('../../data/concept/abalone.csv') as csvfile:
        csvreader = csv.reader(csvfile)
        next(csvreader, None) # csv파일의 헤더를 뛰어넘기위해서
        rows = []
        for row in csvreader:
            rows.append(row)
            
    global data, input_cnt, output_cnt
    input_cnt, output_cnt = 10, 1
    data = np.zeros([len(rows), input_cnt+output_cnt])
    
    for n, row in enumerate(rows):
        if row[0] == 'I' :
            data[n, 0] = 1
        if row[0] == 'M':
            data[n, 1] = 1
        if row[0] == 'F':
            data[n, 2] = 1
        data[n, 3:] = row[1:]

## 파라미터 초기화 함수

In [None]:
def init_model():
    global weight, bias, input_cnt, output_cnt
    weight = np.random.normal(RND_MEAN, RND_STD, [input_cnt, output_cnt])
    bias = np.zeros([output_cnt])

In [31]:
data[0]

array([ 0.    ,  1.    ,  0.    ,  0.455 ,  0.365 ,  0.095 ,  0.514 ,
        0.2245,  0.101 ,  0.15  , 15.    ])