In [None]:
!pip install matplotlib

In [None]:
import numpy as np
import matplotlib.pyplot as plt


class Perceptron:
    def __init__(self, learning_rate=0.1, num_epochs=1000):
        self.learning_rate = learning_rate
        self.num_epochs = num_epochs
    
    def fit(self, X, y):
        # weight vector 초기화
        self.weights = np.zeros(X.shape[1])
        self.num_errors = []
    
        # 학습
        for epoch in range(self.num_epochs):
            num_errors = 0
            for xi, yi in zip(X, y):
                # feature vector normalization
                xi_norm = xi / np.linalg.norm(xi)
                # 예측값 계산
                y_pred = self.predict(xi_norm)
                # 가중치 업데이트
                self.weights += self.learning_rate * (yi - y_pred) * xi_norm
                # 분류 오류 개수 계산
                num_errors += int(yi != y_pred)
            self.num_errors.append(num_errors)
            # 0에서 30까지의 Iteration에 대해서 그래프로 나타냄
            if epoch+1 in range(1,31):
                plt.plot(range(1,epoch+2), self.num_errors)
                plt.xlabel('Iteration')
                plt.ylabel('Number of Errors')
                plt.title('Errors in Iterations 0 to 30')
                plt.show()
                
            if num_errors == 0:
                break

    def predict(self, X):
        # 결정 경계 함수
        dot_product = np.dot(X, self.weights)
        return 1 if dot_product > 0 else 0

# 데이터셋 로딩
train_data = np.loadtxt('synthetic_data_train.txt', delimiter=',')
test_data = np.loadtxt('synthetic_data_test.txt', delimiter=',')

# 특징벡터와 클래스 분리
X_train, y_train = train_data[:, :3], train_data[:, 3]
X_test, y_test = test_data[:, :3], test_data[:, 3]

# 모델 학습
model = Perceptron()
model.fit(X_train, y_train)



# 모델 평가
correct = 0
for xi, yi in zip(X_test, y_test):
    # feature vector normalization
    xi_norm = xi / np.linalg.norm(xi)
    # 예측값 계산
    y_pred = model.predict(xi_norm)
    if y_pred == yi:
        correct += 1

accuracy = correct / len(y_test)
print('Accuracy:', accuracy)


In [None]:
import numpy as np
import matplotlib.pyplot as plt

class Perceptron:
    def __init__(self, learning_rate=0.1, num_epochs=1000):
        self.learning_rate = learning_rate
        self.num_epochs = num_epochs
        self.num_errors = []

    def fit(self, X, y):
        # weight vector 초기화
        self.weights = np.zeros(X.shape[1])
        
        # 학습
        for epoch in range(self.num_epochs):
            errors = 0
            for xi, yi in zip(X, y):
                # feature vector normalization
                xi_norm = xi / np.linalg.norm(xi)
                # 예측값 계산
                y_pred = self.predict(xi_norm)
                # 가중치 업데이트
                self.weights += self.learning_rate * (yi - y_pred) * xi_norm
                # 분류 오류 개수 카운트
                errors += int(yi != y_pred)
            self.num_errors.append(errors)
            if epoch+1 in range(1,31):
                plt.plot(range(1,epoch+2), self.num_errors[:epoch+1], color='gray')
        
    def predict(self, X):
        # 결정 경계 함수
        dot_product = np.dot(X, self.weights)
        return 1 if dot_product > 0 else 0

# 데이터셋 로딩
train_data = np.loadtxt('synthetic_data_train.txt', delimiter=',')
test_data = np.loadtxt('synthetic_data_test.txt', delimiter=',')

# 특징벡터와 클래스 분리
X_train, y_train = train_data[:, :3], train_data[:, 3]
X_test, y_test = test_data[:, :3], test_data[:, 3]

# 모델 학습
model = Perceptron()
model.fit(X_train, y_train)

# 모델 평가
correct = 0
for xi, yi in zip(X_test, y_test):
    # feature vector normalization
    xi_norm = xi / np.linalg.norm(xi)
    # 예측값 계산
    y_pred = model.predict(xi_norm)
    if y_pred == yi:
        correct += 1

accuracy = correct / len(y_test)
print('Accuracy:', accuracy)

# 그래프 그리기
plt.plot(range(1,31), model.num_errors[:30], color='red')
plt.xlabel('Iteration')
plt.ylabel('Number of Errors')
plt.title('Errors in Iterations 0 to 30')
plt.grid()
plt.show()


In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.rcParams['font.family'] ='Malgun Gothic'
matplotlib.rcParams['axes.unicode_minus'] =False

class Perceptron:
    def __init__(self, learning_rate=0.1, num_epochs=1000):
        self.learning_rate = learning_rate
        self.num_epochs = num_epochs
        self.num_errors = []  # 각 Iteration에서 분류 오류의 개수를 저장할 리스트
    
    def fit(self, X, y):
        # weight vector 초기화
        self.weights = np.zeros(X.shape[1])
        
        # 학습
        for epoch in range(self.num_epochs):
            num_errors = 0  # 매 Iteration마다 분류 오류의 개수를 초기화
            for xi, yi in zip(X, y):
                # feature vector normalization
                xi_norm = xi / np.linalg.norm(xi)
                # 예측값 계산
                y_pred = self.predict(xi_norm)
                # 가중치 업데이트
                self.weights += self.learning_rate * (yi - y_pred) * xi_norm
                # 분류 오류 개수 계산
                if yi != y_pred:
                    num_errors += 1
            # 매 Iteration마다 분류 오류 개수를 업데이트
            self.num_errors.append(num_errors)
            
            if epoch+1 in range(1,31):
                plt.plot(range(1,epoch+2), self.num_errors[:epoch+1], marker='o')
                plt.xlabel('Iteration')
                plt.ylabel('제대로 분류되지 않은 데이터 개수')
                plt.title('')
                plt.xticks(range(1, epoch+2))
                plt.grid(True)
            plt.show()
    
    def predict(self, X):
        # 결정 경계 함수
        dot_product = np.dot(X, self.weights)
        return 1 if dot_product > 0 else 0

# 데이터셋 로딩
train_data = np.loadtxt('synthetic_data_train.txt', delimiter=',')
test_data = np.loadtxt('synthetic_data_test.txt', delimiter=',')

# 특징벡터와 클래스 분리
X_train, y_train = train_data[:, :3], train_data[:, 3]
X_test, y_test = test_data[:, :3], test_data[:, 3]

# 모델 학습
model = Perceptron()
model.fit(X_train, y_train)

# 모델 평가
correct = 0
for xi, yi in zip(X_test, y_test):
    # feature vector normalization
    xi_norm = xi / np.linalg.norm(xi)
    # 예측값 계산
    y_pred = model.predict(xi_norm)
    if y_pred == yi:
        correct += 1

accuracy = correct / len(y_test)
print('Accuracy:', accuracy)


In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.rcParams['font.family'] ='Malgun Gothic'
matplotlib.rcParams['axes.unicode_minus'] =False

class Perceptron:
    def __init__(self, learning_rate=0.1, num_epochs=1000):
        self.learning_rate = learning_rate
        self.num_epochs = num_epochs
        self.num_errors = []  # 각 Iteration에서 분류 오류의 개수를 저장할 리스트
    
    def fit(self, X, y):
        # weight vector 초기화
        self.weights = np.zeros(X.shape[1])
        
        # 학습
        for epoch in range(self.num_epochs):
            num_errors = 0  # 매 Iteration마다 분류 오류의 개수를 초기화ㄴ
            for xi, yi in zip(X, y):
                # feature vector normalization
                xi_norm = xi / np.linalg.norm(xi)
                # 예측값 계산
                y_pred = self.predict(xi_norm)
                # 가중치 업데이트
                self.weights += self.learning_rate * (yi - y_pred) * xi_norm
                # 분류 오류 개수 계산
                if yi != y_pred:
                    num_errors += 1
            # 매 Iteration마다 분류 오류 개수를 업데이트
            self.num_errors.append(num_errors)
            
            if epoch+1 in range(1,31):
                plt.plot(range(1,epoch+2), self.num_errors[:epoch+1], marker='o')
                plt.xlabel('Iteration')
                plt.ylabel('제대로 분류되지 않은 데이터 개수')
                plt.title('')
                plt.xticks(range(1, epoch+2))
                plt.grid(True)
                plt.show()
    
    def predict(self, X):
        # 결정 경계 함수
        dot_product = np.dot(X, self.weights)
        return 1 if dot_product > 0 else 0

# 데이터셋 로딩
train_data = np.loadtxt('synthetic_data_train.txt', delimiter=',')
test_data = np.loadtxt('synthetic_data_test.txt', delimiter=',')

# 특징벡터와 클래스 분리
X_train, y_train = train_data[:, :3], train_data[:, 3]
X_test, y_test = test_data[:, :3], test_data[:, 3]

# 모델 학습
model = Perceptron()
model.fit(X_train, y_train)

# 모델 평가
correct = 0
for xi, yi in zip(X_test, y_test):
    # feature vector normalization
    xi_norm = xi / np.linalg.norm(xi)
    # 예측값 계산
    y_pred = model.predict(xi_norm)
    if y_pred == yi:
        correct += 1

accuracy = correct / len(y_test)
print('Accuracy:', accuracy)


In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.rcParams['font.family'] ='Malgun Gothic'
matplotlib.rcParams['axes.unicode_minus'] =False


class Perceptron:
    def __init__(self, learning_rate=0.1, num_epochs=1000):
        self.learning_rate = learning_rate
        self.num_epochs = num_epochs
        self.num_errors = []  # 각 Iteration에서 분류 오류의 개수를 저장할 리스트
    
    def fit(self, X, y):
        # weight vector 초기화
        self.weights = np.random.random(X.shape[1])
        
        # 학습
        for epoch in range(self.num_epochs):
            num_errors = 0  # 매 Iteration마다 분류 오류의 개수를 초기화
            for xi, yi in zip(X, y):
                # feature vector normalization
                xi_norm = xi / np.linalg.norm(xi)
                # 예측값 계산
                y_pred = self.predict(xi_norm)
                # 가중치 업데이트
                self.weights += self.learning_rate * (yi - y_pred) * xi_norm
                # 분류 오류 개수 계산
                if yi != y_pred:
                    num_errors += 1
            # 매 Iteration마다 분류 오류 개수를 업데이트
            self.num_errors.append(num_errors)
            
            if epoch+1 in range(1,31):
                plt.plot(range(1,epoch+2), self.num_errors[:epoch+1], marker='o')
                plt.xlabel('Iteration')
                plt.ylabel('제대로 분류되지 않은 데이터 개수')
                plt.title('')
                plt.xticks(range(1, epoch+2))
                plt.grid(True)
                plt.show()
    
    def predict(self, X):
        # 결정 경계 함수
        dot_product = np.dot(X, self.weights)
        return 1 if dot_product > 0 else 0



# 데이터셋 로딩
train_data = np.loadtxt('synthetic_data_train.txt', delimiter=',')
test_data = np.loadtxt('synthetic_data_test.txt', delimiter=',')

# 특징벡터와 클래스 분리
X_train, y_train = train_data[:, :3], train_data[:, 3]
X_test, y_test = test_data[:, :3], test_data[:, 3]

# 모델 학습
model = Perceptron()
model.fit(X_train, y_train)

# 모델 평가
correct = 0
for xi, yi in zip(X_test, y_test):
    # feature vector normalization
    xi_norm = xi / np.linalg.norm(xi)
    # 예측값 계산
    y_pred = model.predict(xi_norm)
    if y_pred == yi:
        correct += 1

accuracy = correct / len(y_test)
print('Accuracy:', accuracy)


Normalization이 된 feature vector를 사용한 퍼셉트론은 각 feature들의 스케일을 맞추고 분산을 조절하는 효과가 있습니다. 이로 인해 특정 feature가 가지는 값이 크다고 해서 가중치 업데이트에 더 많은 영향을 주는 것을 방지할 수 있어서 모델이 더욱 안정적으로 학습할 수 있습니다.

하지만 여기서는 feature의 값이 크지 않은 데이터셋이므로 이점이 크게 나타나지 않았을 가능성이 있습니다. 또한 이 데이터셋에서는 클래스 간 경계가 선형이기 때문에 normalization이 큰 차이를 내지 못한 것일 수도 있습니다.

따라서 normalization이 큰 효과를 내지 않는 경우가 있을 수 있으며, 이 경우에는 normalization을 하지 않아도 됩니다.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.rcParams['font.family'] ='Malgun Gothic'
matplotlib.rcParams['axes.unicode_minus'] =False

class Perceptron:
    def __init__(self, num_epochs=1000):
        self.num_epochs = num_epochs
        self.num_errors = []  # 각 Iteration에서 분류 오류의 개수를 저장할 리스트
    
    def fit(self, X, y):
        # weight vector 초기화
        self.weights = np.zeros(X.shape[1])
        
        # 학습
        for epoch in range(self.num_epochs):
            num_errors = 0  # 매 Iteration마다 분류 오류의 개수를 초기화
            for xi, yi in zip(X, y):
                # feature vector normalization
                xi_norm = xi / np.linalg.norm(xi)
                # 예측값 계산
                y_pred = self.predict(xi_norm)
                # 가중치 업데이트
                self.weights += (yi - y_pred) * xi_norm
                # 분류 오류 개수 계산
                if yi != self.predict(xi_norm):
                    num_errors += 1
            # 매 Iteration마다 분류 오류 개수를 업데이트
            self.num_errors.append(num_errors)
            
            if epoch+1 in range(1,31):
                plt.plot(range(1,epoch+2), self.num_errors[:epoch+1], marker='o')
                plt.xlabel('Iteration')
                plt.ylabel('제대로 분류되지 않은 데이터 개수')
                plt.title('Iteration {} - Error Count'.format(epoch+1))
                plt.xticks(range(1, epoch+2))
                plt.grid(True)
        plt.show()
    
    def predict(self, X):
        # 결정 경계 함수
        dot_product = np.dot(X, self.weights)
        return 1 if dot_product >= 0 else 0

# 데이터셋 로딩
train_data = np.loadtxt('synthetic_data_train.txt', delimiter=',')
test_data = np.loadtxt('synthetic_data_test.txt', delimiter=',')

# 특징벡터와 클래스 분리
X_train, y_train = train_data[:, :3], train_data[:, 3]
X_test, y_test = test_data[:, :3], test_data[:, 3]

# 모델 학습
model = Perceptron()
model.fit(X_train, y_train)

# 모델 평가
correct = 0
for xi, yi in zip(X_test, y_test):
    # feature vector normalization
    xi_norm = xi / np.linalg.norm(xi)
    # 예측값 계산
    y_pred = model.predict(xi_norm)
    if y_pred == yi:
        correct += 1

accuracy = correct / len(y_test)
print('Accuracy:', accuracy)

train_correct = 0
for xi, yi in zip(X_train, y_train):
    # feature vector normalization
    xi_norm = xi / np.linalg.norm(xi)
    # 예측값 계산
    y_pred = model.predict(xi_norm)
    if y_pred == yi:
        train_correct += 1

train_accuracy = train_correct / 2000
print('Train Accuracy:', train_accuracy)




In [None]:
import numpy as np
import matplotlib
import matplotlib.pyplot as plt
matplotlib.rcParams['font.family'] ='Malgun Gothic'
matplotlib.rcParams['axes.unicode_minus'] =False

class Perceptron:
    def __init__(self, num_epochs=20):
        self.num_epochs = num_epochs
    
    def fit(self, X, y):
        # weight vector 초기화
        self.weights = np.zeros(X.shape[1])
        
        # 학습
        for epoch in range(self.num_epochs):
            # 분류 오류 개수 초기화
            num_errors = 0
            # M+에 대해 w 업데이트
            for xi, yi in zip(X[y == 1], y[y == 1]):
                xi_norm = xi / np.linalg.norm(xi)
                if np.dot(xi, self.weights) <= 0:
                    self.weights += xi_norm / abs(xi)
                    print(xi_norm / abs(xi))
                    num_errors += 1
            # M-에 대해 w 업데이트
            for xi, yi in zip(X[y == 0], y[y == 0]): 
                xi_norm = xi / np.linalg.norm(xi)
                if np.dot(xi, self.weights) > 0:
                    self.weights -= xi_norm / abs(xi)
                    num_errors += 1
            # 모든 데이터가 제대로 분류되면 학습 종료
            if num_errors == 0:
                break
        #print(f"Number of errors: {num_errors}")
        #print(f"Final weights: {self.weights}")

    def predict(self, X):
        # 결정 경계 함수
        dot_product = np.dot(X, self.weights)
        return 1 if dot_product > 0 else 0
    
    def score(self, X, y_true):
        y_pred = np.apply_along_axis(self.predict, 1, X)
        return np.mean(y_true == y_pred)
    
# 데이터셋 로딩
train_data = np.loadtxt('synthetic_data_train.txt', delimiter=',')
test_data = np.loadtxt('synthetic_data_test.txt', delimiter=',')

# 특징벡터와 클래스 분리
X_train, y_train = train_data[:, :3], train_data[:, 3]
X_test, y_test = test_data[:, :3], test_data[:, 3]

# 모델 학습

perceptron = Perceptron()
perceptron.fit(X_train, y_train)
accuracy = perceptron.score(X_train, y_train)
print(f"Accuracy: {accuracy:.2f}")

#accuracy = perceptron.score(X_test, y_test)
#print(f"Accuracy: {accuracy:.2f}")


# # 모델 평가
# correct = 0
# for xi, yi in zip(X_test, y_test):
#     xi_norm = xi / np.linalg.norm(xi)  # feature vector normalization
#     y_pred = Perceptron(xi_norm)
#     if y_pred == yi:
#         correct += 1

# accuracy = correct / len(y_test)
# print("Test accuracy:", accuracy)



# 모델 평가
# correct = 0
# for xi, yi in zip(X_test, y_test):
#     xi_norm = xi / abs(xi)  # feature vector normalization
#     y_pred = model.predict(xi_norm)
#     if y_pred == yi:
#         correct += 1
# accuracy = correct / len(y_test)
# print(f"Test accuracy: {accuracy}")





In [1]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.rcParams['font.family'] ='Malgun Gothic'
matplotlib.rcParams['axes.unicode_minus'] =False


class Perceptron():

    def __init__(self, n_iter=1000):
        self.n_iter = n_iter

    def perceptronLearning(self, x, w):
        check_break = 0
        self.w = w

        for i in range(2000) :
            X_normalized = x[i][:4] / np.linalg.norm(x[i][:4])
            check = np.dot(self.w, x[i][:4])

            if x[i, 4] == 1 :
                if check <= 0 :
                    self.w += X_normalized
                    check_break +=1

            elif x[i, 4] == 0 : 
                if check > 0 :
                    self.w -= X_normalized
                    check_break +=1

        return w, check_break

    def predict(self, x, w):
        pred_class_list = []

        for i in range(400):
            check = np.dot(x[i, :4], w)
        
            if check > 0 :
                pred_class = 1.0
                pred_class_list.append(float(pred_class))
                
            else :
                pred_class = 0.0
                pred_class_list.append(float(pred_class))

        return pred_class_list

    def accuracy(self, x, y):
        train_data = x
        test_data = y
        train_data = np.insert(train_data, 3, 1, axis=1)
        check_break_list = []
        w = np.random.random(4)

        for i in range (1000):
             
             w, check_break = self.perceptronLearning(train_data, w)

             if check_break == 0 :
                 break
             
             else :
                 if i < 30 : 
                    check_break_list.append(check_break)
                 check_break = 0
        #print(check_break_list)

        test_data = np.insert(test_data, 3, 1, axis=1)

        preds = self.predict(test_data, w)
        label = test_data[:, 4].tolist()


        accuracy_score = 0.0
        for i in range (400):
            if preds[i] == label[i]:
                accuracy_score +=1.0

        accuracy = accuracy_score / float(len(preds))
        return accuracy

train_data = np.loadtxt('synthetic_data_train.txt', delimiter=',')
test_data = np.loadtxt('synthetic_data_test.txt', delimiter=',')


test = Perceptron()

accuracy = test.accuracy(train_data, test_data)
print('Accuracy : ', accuracy)


[658, 345, 263, 226, 211, 191, 166, 155, 146, 140, 110, 123, 131, 145, 121, 99, 113, 107, 101, 102, 80, 99, 101, 97, 105, 98, 94, 100, 86, 84]
Accuracy :  0.9775
