In [None]:
"""
학습 데이터 : p1_training_data.csv(1 ~ 3차원 데이터(x1, x2, x3) = 입력 데이터, 4번째 데이터 = 클래스 y(1 / 0))
학습 파라미터 : w(3차원), b(1차원)
Activation function : Sigmoid function 사용
Population 수는 100 이하로 설정
유전 알고리즘 동작을 위한 모든 설계 조건은 자율적으로 설계
fitness, Selection, crossover, mutation, 유전자(학습 파라미터) 초기화 방법 및 알고리즘 종료 조건
1-1 : 1세대 유전자 초기화 및 유전자 초기화 방법 서술, Population 값
1-2 : 각 유전자에 대한 fitness 계산법 설계, 가장 fitness 높은 유전자 선별, fitness 계산 방법, 1세대에서 가장 fitness가 높은 상위 4개의 유전자에 대해 fitness score 필기, 분류 평면 고시화
1-3 : 선택된 유전자들에 대해 crossover, mutation 수행을 통해 2세대 유전자 생성(단, 생성된 자식세대의 population 수 = 1세대로 설계)
1-4 : 1-2, 1-3 과정 반복을 통해 2, 3세대에서 가장 fitness가 높은 상위 4개의 유전자에 대해 fitness score 필기, 분류 평면 도시화
1-5 : 유전 알고리즘에 의해 최종적으로 얻어진 유전자 중 가장 fitness가 높은 유전자에 대해 분류 평면 도시화, 어떤 조건으로 유전 알고리즘을 종료하였는지 작성
"""
%matplotlib inline
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
from matplotlib import cm
import numpy as np
import pandas as pd
from random import uniform


data = pd.read_csv("p1_training_data.csv") # 데이터 읽기
np_data = np.array(data)

fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')

## positive samples
x_1 = np_data[0:50,0]
y_1 = np_data[0:50,1]
z_1 = np_data[0:50,2]

## negative samples
x_0 = np_data[50:,0]
y_0 = np_data[50:,1]
z_0 = np_data[50:,2]

#sigmoid 함수
def sigmoid(arr):
    return 1 / (1 + np.exp(-arr))

#zeta 함수
def zeta(w1, w2, w3, x, y, z, b):
    z = np.zeros(len(x))
    z = w1 * x + w2 * y + w3 * z + b
    return z

#fitness 함수
def fitness(w, b):
    w1, w2, w3 = w
    fit = np.zeros(len(b))
    for i in range(len(b)):
        y1 = sigmoid(zeta(w1[i], w2[i], w3[i], x_1, y_1, z_1, b[i]))
        y0 = sigmoid(zeta(w1[i], w2[i], w3[i], x_0, y_0, z_0, b[i]))
        for j in range(len(x_1)):
            fit[i] += (1 - y1[j])**2 + y0[j] ** 2
    return fit
    
## Generation 1의 fittest gene
genes = [np.random.uniform(-1, 1, size=100) for _ in range(3)]
bias = np.random.uniform(-100, 100, size = 100)

rank_fit = np.zeros(4)
rank_idx = np.zeros(4)
rank_genes = np.zeros((4, 4))

#fitness가 가장 높은 rank1~4까지의 유전자 선택
def rank():
    fit = fitness(genes, bias)
    score = min(fit)
    for i in range(4):
        rank_idx[i] = fit.index(min(fit))
        rank_fit[i] = fit[rank_idx[i]]
        for j in range(4):
            rank_genes[i][j] = genes[j][rank_idx[i]]
        fit[rank_idx[i]] = 100000000
    return score

#다음 세대 함수
def next():
    #이전 세대에서 가장 우수한 개체 적용
    for i in range(4):
        for j in range(4):
            genes[0][i * 4 + j] = rank_genes[i][0]
            genes[1][i * 4 + j] = rank_genes[i][1]
            genes[2][i * 4 + j] = rank_genes[j][2]
            bias[i * 4 + j] = rank_genes[j][3]
    #개체들에 변이 적용
    for i in range(84):
        for j in range(3): genes[j][i + 16] = genes[j][i % 16] * uniform(0.5, 1.5)
        bias[i + 16] = bias[i % 16] * uniform(0.5, 1.5)

#그래프 표현
def show(i, j):
    fig = plt.figure()
    ax = fig.add_subplot(111, projection='3d')

    ax.plot(x_1, y_1, z_1, linestyle="none", marker="o", mfc="none", markeredgecolor="b") #샘플 출력
    ax.plot(x_0, y_0, z_0, linestyle="none", marker="o", mfc="none", markeredgecolor="r") #샘플 출력

    X = np.arange(0, 2, 0.1)*100
    Y = np.arange(0, 2, 0.1)*100
    X, Y = np.meshgrid(X, Y)
    Z = (-float(genes[0][rank_idx[j]]) / genes[2][rank_idx[j]] * X) + (-float(genes[1][rank_idx[j]]) / genes[2][rank_idx[j]] * Y) - float(bias[rank_idx[j]]) / genes[2][rank_idx[j]]

    
    plt.title("Generation " + str(i + 1) + ", Ranking" + str(j + 1) + '\n' + "Fitness score: " + str(rank_fit[j]), fontsize=18)
    ax.plot_surface(X, Y, Z, rstride=4, cstride=4, alpha=0.4, cmap=cm.Blues)  # Surface plot
    plt.show()

cnt = 0
while True:
    score = rank()
    for j in range(4):
        show(cnt, j)
    if score < 0.0000001: break
    next()
    cnt += 1
show(cnt, 0)

 