In [1]:
import numpy as np
import pandas as pd

data = pd.read_csv('two_moons.csv')

data = data.drop("Unnamed: 0", axis=1)
print(data.shape)
data.head()

(1000, 3)


Unnamed: 0,x_1,x_2,y
0,2.06443,0.546069,1.0
1,1.762473,-0.062689,1.0
2,-0.24549,1.068868,0.0
3,-0.17463,0.183882,1.0
4,0.45211,-0.406512,1.0


In [2]:
def weightInitialization(n_features):
    w = np.zeros((1,n_features))
    w0 = 0
    return w,w0

def sigmoid(result):
    return 1/(1+np.exp(-result))

def cost_func(w, w0, X, Y):
    m = X.shape[0]
    
    # Função custo
    cost = (-1/m)*(np.sum((Y.T*np.log(sigmoid(np.dot(w,X.T)+w0))) + ((1-Y.T)*(np.log(1-sigmoid(np.dot(w,X.T)+w0))))))
    #
    
    # Gradientes
    dw = (1/m)*(np.dot(X.T, (sigmoid(np.dot(w,X.T)+w0)-Y.T).T))
    db = (1/m)*(np.sum(sigmoid(np.dot(w,X.T)+w0)-Y.T))
    
    grads = (dw, db)
    
    return grads, cost


def model_predict(w, w0, X, Y, alfa, num):
    costs = []
    for i in range(num):
        #
        grads, cost = cost_func(w,w0,X,Y)
        #
        dw = grads[0]
        db = grads[1]
        #weight update
        w = w - (alfa * (dw.T))
        w0 = w0 - (alfa * db)
        #
        
        if (i % 100 == 0):
            costs.append(cost)
            #print("Interação: ",i)
            #print("Valor do custo:",cost)
            
    
    #final parameters
    coeff = {"w": w, "w0": w0}
    gradient = {"dw": dw, "db": db}
    
    return coeff, gradient, costs

def predict(final_pred, m):
    y_pred = np.zeros((1,m))
    for i in range(final_pred.shape[1]):
        if final_pred[0][i] > 0.5:
            y_pred[0][i] = 1
    return y_pred


X = data.drop('y', axis=1)
y = data['y'].values
N =  X.shape[0] # Número de amostras
n = X.shape[1] # Número de features dos padrões

W, w0 = weightInitialization(n)

#W = np.zeros((1,n))
#w0 = 0

# Gradiente Descendente
coeff, gradient, costs = model_predict(W, w0, X, y, alfa=000.1,num=4500)

# Predição final
w = coeff["w"]
w0 = coeff["w0"]
print('Pesos ótimos:', w)
print('w0 (Intercepto) ótimo:', w0)

H = sigmoid(np.dot(w,X.T)+w0)

y_hat = predict(H, N)

Pesos ótimos: [[ 1.0632669  -7.15051749]]
w0 (Intercepto) ótimo: 2.607116012339959


In [3]:
import matplotlib.pyplot as plt

data_class_1 = data.loc[data['y'] == 1] # Dataframe dos padrões da classe 1
data_class_0 = data.loc[data['y'] == 0] # Dataframe dos padrões da classe 0
x = np.linspace(-1.5,2.5,2)
x2 = (-1/w[0][1]) * (w[0][0] * x + w0)

plt.figure(num=None, figsize=(10, 6), dpi=80, facecolor='w', edgecolor='k')
plt.plot(data_class_0['x_1'], data_class_0['x_2'], 'o', alpha=.6)
plt.plot(data_class_1['x_1'], data_class_1['x_2'], 'ro', alpha=.6)
plt.xlabel('$x_1$')
plt.ylabel('$x_2$')
plt.plot(x,x2, 'k--')
plt.show()

<Figure size 800x480 with 1 Axes>

In [4]:
np.mean(y_hat == y.flatten()) * 100

95.1

In [5]:
y

array([1., 1., 0., 1., 1., 1., 0., 0., 0., 1., 0., 1., 1., 0., 1., 0., 1.,
       0., 0., 0., 0., 0., 0., 0., 1., 1., 0., 0., 1., 0., 1., 1., 1., 1.,
       0., 1., 1., 0., 1., 0., 0., 1., 1., 1., 0., 1., 1., 0., 0., 1., 0.,
       0., 0., 0., 1., 1., 0., 0., 1., 0., 1., 1., 0., 0., 0., 0., 0., 1.,
       0., 1., 1., 0., 1., 0., 1., 0., 0., 1., 1., 1., 0., 0., 0., 1., 1.,
       1., 0., 1., 0., 1., 0., 0., 1., 0., 1., 0., 1., 0., 0., 1., 1., 1.,
       0., 1., 0., 1., 1., 1., 1., 0., 0., 1., 0., 1., 0., 0., 1., 0., 0.,
       1., 1., 1., 0., 1., 0., 1., 0., 0., 1., 1., 0., 1., 1., 1., 1., 1.,
       0., 0., 1., 1., 0., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       1., 1., 1., 0., 0., 1., 0., 1., 1., 1., 1., 1., 0., 0., 1., 0., 0.,
       1., 1., 0., 1., 0., 1., 0., 1., 1., 0., 1., 1., 0., 0., 1., 1., 1.,
       0., 1., 0., 1., 1., 0., 0., 1., 1., 1., 0., 1., 0., 1., 1., 0., 1.,
       1., 1., 1., 1., 1., 1., 0., 1., 0., 1., 1., 1., 0., 0., 0., 1., 1.,
       1., 1., 0., 0., 0.