In [1]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.utils import shuffle
from util import getBinaryData, sigmoid, sigmoid_cost, error_rate

In [2]:
class LogisticModel(object):
    def __init__(self):
        pass
    
    def fit(self, X, Y, learning_rate=10e-7, reg=0, epochs=120000, show_fig=False):
        X, Y = shuffle(X, Y)
        Xvalid, Yvalid = X[-1000:], Y[-1000:]
        X, Y = X[:-1000], Y[:-1000]
        
        N, D = X.shape
        self.W = np.random.randn(D) / np.sqrt(D)
        self.b = 0
        
        costs = []
        best_validation_error = 1
        for i in range(epochs):
            pY = self.forward(X)
            
            #gradient descent step
            self.W -= learning_rate*(X.T.dot(pY - Y) + reg*self.W)
            self.b -= learning_rate*((pY - Y).sum() + reg*self.b)
            
            if i % 20 == 0:
                pYvalid = self.forward(Xvalid)
                c = sigmoid_cost(Yvalid, pYvalid)
                costs.append(c)
                e = error_rate(Yvalid, np.round(pYvalid))
                print("i:", i, "cost:", c, "error:", e)
                if e < best_validation_error:
                    best_validation_error = e
        print("best_validation_error:", best_validation_error)
        
        if show_fig:
            plt.plot(costs)
            plt.show()
            
    def forward(self, X):
        return sigmoid(X.dot(self.W) + self.b)
    
    def predict(self, X):
        pY = self.forward(X)
        return np.round(pY)
    
    def score(self, X, Y):
        prediction = self.predict(X)
        return 1 - error_rate(Y, prediction)

In [None]:
X, Y = getBinaryData()
X0 = X[Y==0,:]
X1 = X[Y==1,:]
X1 = np.repeat(X1, 9, axis=0)
X = np.vstack([X0,X1])
Y = np.array([0]*len(X0) + [1]*len(X1))

model = LogisticModel()
model.fit(X, Y, show_fig=True)
model.score(X, Y)

i: 0 cost: 697.155744594 error: 0.486
i: 20 cost: 679.940198973 error: 0.408
i: 40 cost: 670.067447026 error: 0.393
i: 60 cost: 662.438939888 error: 0.369
i: 80 cost: 656.213188621 error: 0.358
i: 100 cost: 650.973086354 error: 0.352
i: 120 cost: 646.469925931 error: 0.341
i: 140 cost: 642.538583142 error: 0.332
i: 160 cost: 639.062345735 error: 0.334
i: 180 cost: 635.955329679 error: 0.338
i: 200 cost: 633.152498626 error: 0.337
i: 220 cost: 630.603514449 error: 0.33
i: 240 cost: 628.268728717 error: 0.328
i: 260 cost: 626.116458036 error: 0.326
i: 280 cost: 624.121070423 error: 0.327
i: 300 cost: 622.261605541 error: 0.325
i: 320 cost: 620.520758373 error: 0.327
i: 340 cost: 618.884117353 error: 0.326
i: 360 cost: 617.339584785 error: 0.33
i: 380 cost: 615.876930415 error: 0.33
i: 400 cost: 614.487443804 error: 0.327
i: 420 cost: 613.163661044 error: 0.325
i: 440 cost: 611.899148041 error: 0.323
i: 460 cost: 610.688327292 error: 0.323
i: 480 cost: 609.526338392 error: 0.324
i: 500 co

i: 4060 cost: 538.253255915 error: 0.261
i: 4080 cost: 538.057654221 error: 0.261
i: 4100 cost: 537.862984947 error: 0.261
i: 4120 cost: 537.66924035 error: 0.261
i: 4140 cost: 537.476412775 error: 0.261
i: 4160 cost: 537.284494651 error: 0.261
i: 4180 cost: 537.093478491 error: 0.261
i: 4200 cost: 536.90335689 error: 0.261
i: 4220 cost: 536.714122526 error: 0.261
i: 4240 cost: 536.525768155 error: 0.261
i: 4260 cost: 536.338286613 error: 0.261
i: 4280 cost: 536.151670814 error: 0.261
i: 4300 cost: 535.965913747 error: 0.261
i: 4320 cost: 535.78100848 error: 0.261
i: 4340 cost: 535.596948153 error: 0.261
i: 4360 cost: 535.413725981 error: 0.261
i: 4380 cost: 535.23133525 error: 0.261
i: 4400 cost: 535.049769319 error: 0.261
i: 4420 cost: 534.869021617 error: 0.261
i: 4440 cost: 534.689085644 error: 0.261
i: 4460 cost: 534.509954966 error: 0.261
i: 4480 cost: 534.331623219 error: 0.261
i: 4500 cost: 534.154084105 error: 0.261
i: 4520 cost: 533.977331393 error: 0.261
i: 4540 cost: 533.80

i: 8080 cost: 511.014603531 error: 0.263
i: 8100 cost: 510.918061656 error: 0.263
i: 8120 cost: 510.821767434 error: 0.263
i: 8140 cost: 510.725719579 error: 0.263
i: 8160 cost: 510.629916811 error: 0.263
i: 8180 cost: 510.534357862 error: 0.263
i: 8200 cost: 510.43904147 error: 0.263
i: 8220 cost: 510.343966387 error: 0.263
i: 8240 cost: 510.249131368 error: 0.263
i: 8260 cost: 510.154535183 error: 0.264
i: 8280 cost: 510.060176606 error: 0.264
i: 8300 cost: 509.966054423 error: 0.263
i: 8320 cost: 509.872167427 error: 0.263
i: 8340 cost: 509.77851442 error: 0.263
i: 8360 cost: 509.685094214 error: 0.262
i: 8380 cost: 509.591905628 error: 0.262
i: 8400 cost: 509.498947489 error: 0.262
i: 8420 cost: 509.406218634 error: 0.261
i: 8440 cost: 509.313717907 error: 0.261
i: 8460 cost: 509.221444161 error: 0.261
i: 8480 cost: 509.129396256 error: 0.261
i: 8500 cost: 509.037573062 error: 0.26
i: 8520 cost: 508.945973455 error: 0.259
i: 8540 cost: 508.854596319 error: 0.259
i: 8560 cost: 508.7

i: 12060 cost: 495.454815981 error: 0.242
i: 12080 cost: 495.39054249 error: 0.242
i: 12100 cost: 495.326373942 error: 0.242
i: 12120 cost: 495.262309964 error: 0.242
i: 12140 cost: 495.198350183 error: 0.242
i: 12160 cost: 495.13449423 error: 0.242
i: 12180 cost: 495.070741736 error: 0.242
i: 12200 cost: 495.007092335 error: 0.242
i: 12220 cost: 494.943545662 error: 0.242
i: 12240 cost: 494.880101354 error: 0.242
i: 12260 cost: 494.816759052 error: 0.242
i: 12280 cost: 494.753518396 error: 0.242
i: 12300 cost: 494.690379029 error: 0.242
i: 12320 cost: 494.627340596 error: 0.242
i: 12340 cost: 494.564402744 error: 0.242
i: 12360 cost: 494.501565121 error: 0.242
i: 12380 cost: 494.438827378 error: 0.242
i: 12400 cost: 494.376189168 error: 0.242
i: 12420 cost: 494.313650143 error: 0.242
i: 12440 cost: 494.25120996 error: 0.242
i: 12460 cost: 494.188868276 error: 0.241
i: 12480 cost: 494.12662475 error: 0.24
i: 12500 cost: 494.064479044 error: 0.239
i: 12520 cost: 494.002430819 error: 0.2

i: 15980 cost: 484.493216552 error: 0.237
i: 16000 cost: 484.444185901 error: 0.237
i: 16020 cost: 484.395212676 error: 0.237
i: 16040 cost: 484.346296723 error: 0.237
i: 16060 cost: 484.297437892 error: 0.237
i: 16080 cost: 484.248636031 error: 0.237
i: 16100 cost: 484.19989099 error: 0.237
i: 16120 cost: 484.151202619 error: 0.237
i: 16140 cost: 484.102570768 error: 0.237
i: 16160 cost: 484.05399529 error: 0.237
i: 16180 cost: 484.005476036 error: 0.237
i: 16200 cost: 483.957012859 error: 0.237
i: 16220 cost: 483.908605611 error: 0.237
i: 16240 cost: 483.860254147 error: 0.237
i: 16260 cost: 483.811958322 error: 0.237
i: 16280 cost: 483.763717988 error: 0.237
i: 16300 cost: 483.715533003 error: 0.237
i: 16320 cost: 483.667403223 error: 0.237
i: 16340 cost: 483.619328503 error: 0.237
i: 16360 cost: 483.571308701 error: 0.237
i: 16380 cost: 483.523343675 error: 0.237
i: 16400 cost: 483.475433282 error: 0.237
i: 16420 cost: 483.427577383 error: 0.237
i: 16440 cost: 483.379775836 error: 

i: 19920 cost: 475.782707536 error: 0.229
i: 19940 cost: 475.742660852 error: 0.229
i: 19960 cost: 475.702650342 error: 0.229
i: 19980 cost: 475.662675932 error: 0.229
i: 20000 cost: 475.622737547 error: 0.229
i: 20020 cost: 475.582835112 error: 0.229
i: 20040 cost: 475.542968554 error: 0.229
i: 20060 cost: 475.503137798 error: 0.229
i: 20080 cost: 475.463342771 error: 0.229
i: 20100 cost: 475.423583399 error: 0.229
i: 20120 cost: 475.383859609 error: 0.229
i: 20140 cost: 475.344171328 error: 0.229
i: 20160 cost: 475.304518483 error: 0.229
i: 20180 cost: 475.264901001 error: 0.229
i: 20200 cost: 475.225318811 error: 0.229
i: 20220 cost: 475.18577184 error: 0.229
i: 20240 cost: 475.146260015 error: 0.229
i: 20260 cost: 475.106783267 error: 0.229
i: 20280 cost: 475.067341523 error: 0.229
i: 20300 cost: 475.027934711 error: 0.229
i: 20320 cost: 474.988562762 error: 0.229
i: 20340 cost: 474.949225604 error: 0.229
i: 20360 cost: 474.909923167 error: 0.229
i: 20380 cost: 474.87065538 error: 

i: 23840 cost: 468.544670019 error: 0.229
i: 23860 cost: 468.510529774 error: 0.229
i: 23880 cost: 468.476414632 error: 0.229
i: 23900 cost: 468.442324552 error: 0.229
i: 23920 cost: 468.408259492 error: 0.229
i: 23940 cost: 468.37421941 error: 0.229
i: 23960 cost: 468.340204264 error: 0.229
i: 23980 cost: 468.306214013 error: 0.229
i: 24000 cost: 468.272248614 error: 0.229
i: 24020 cost: 468.238308028 error: 0.229
i: 24040 cost: 468.204392213 error: 0.229
i: 24060 cost: 468.170501127 error: 0.229
i: 24080 cost: 468.13663473 error: 0.229
i: 24100 cost: 468.10279298 error: 0.229
i: 24120 cost: 468.068975837 error: 0.229
i: 24140 cost: 468.035183261 error: 0.229
i: 24160 cost: 468.00141521 error: 0.229
i: 24180 cost: 467.967671644 error: 0.229
i: 24200 cost: 467.933952523 error: 0.229
i: 24220 cost: 467.900257807 error: 0.229
i: 24240 cost: 467.866587455 error: 0.229
i: 24260 cost: 467.832941428 error: 0.229
i: 24280 cost: 467.799319685 error: 0.229
i: 24300 cost: 467.765722186 error: 0.

i: 27760 cost: 462.286938397 error: 0.228
i: 27780 cost: 462.25703501 error: 0.228
i: 27800 cost: 462.227150246 error: 0.228
i: 27820 cost: 462.197284079 error: 0.228
i: 27840 cost: 462.167436483 error: 0.228
i: 27860 cost: 462.137607433 error: 0.228
i: 27880 cost: 462.107796903 error: 0.228
i: 27900 cost: 462.078004868 error: 0.228
i: 27920 cost: 462.048231302 error: 0.227
i: 27940 cost: 462.01847618 error: 0.227
i: 27960 cost: 461.988739476 error: 0.227
i: 27980 cost: 461.959021165 error: 0.227
i: 28000 cost: 461.929321222 error: 0.227
i: 28020 cost: 461.899639621 error: 0.227
i: 28040 cost: 461.869976338 error: 0.227
i: 28060 cost: 461.840331347 error: 0.227
i: 28080 cost: 461.810704623 error: 0.227
i: 28100 cost: 461.781096142 error: 0.227
i: 28120 cost: 461.751505878 error: 0.227
i: 28140 cost: 461.721933806 error: 0.227
i: 28160 cost: 461.692379903 error: 0.227
i: 28180 cost: 461.662844142 error: 0.227
i: 28200 cost: 461.6333265 error: 0.227
i: 28220 cost: 461.603826951 error: 0.

i: 31680 cost: 456.75305086 error: 0.223
i: 31700 cost: 456.726368463 error: 0.223
i: 31720 cost: 456.699700576 error: 0.223
i: 31740 cost: 456.673047181 error: 0.223
i: 31760 cost: 456.646408263 error: 0.223
i: 31780 cost: 456.619783802 error: 0.223
i: 31800 cost: 456.593173784 error: 0.223
i: 31820 cost: 456.566578191 error: 0.223
i: 31840 cost: 456.539997006 error: 0.223
i: 31860 cost: 456.513430213 error: 0.223
i: 31880 cost: 456.486877795 error: 0.223
i: 31900 cost: 456.460339734 error: 0.223
i: 31920 cost: 456.433816015 error: 0.223
i: 31940 cost: 456.407306621 error: 0.223
i: 31960 cost: 456.380811535 error: 0.223
i: 31980 cost: 456.35433074 error: 0.223
i: 32000 cost: 456.32786422 error: 0.223
i: 32020 cost: 456.301411959 error: 0.222
i: 32040 cost: 456.27497394 error: 0.221
i: 32060 cost: 456.248550146 error: 0.221
i: 32080 cost: 456.222140562 error: 0.221
i: 32100 cost: 456.19574517 error: 0.221
i: 32120 cost: 456.169363955 error: 0.221
i: 32140 cost: 456.1429969 error: 0.221