In [18]:
import pandas as pd
import numpy as np
from sklearn.model_selection import KFold, cross_val_score
from sklearn.neighbors import KNeighborsClassifier, KNeighborsRegressor
from sklearn.preprocessing import scale, StandardScaler
from sklearn.datasets import load_boston
from sklearn.linear_model import Perceptron
from sklearn.metrics import accuracy_score

In [36]:
train = pd.read_csv('perceptron-train.csv', header=None)

train

Unnamed: 0,0,1,2
0,-1.0,-0.024626,1174.600238
1,1.0,-0.978058,1083.198803
2,-1.0,0.314272,-1472.977609
3,-1.0,0.179752,231.017267
4,1.0,-1.262544,-778.271726
5,-1.0,0.249970,-52.801483
6,1.0,-1.870397,-324.235348
7,1.0,0.020419,-64.744951
8,1.0,0.065806,-421.684101
9,1.0,-0.638902,-405.843375


In [37]:
test = pd.read_csv('perceptron-test.csv', header=None)

test

Unnamed: 0,0,1,2
0,-1.0,1.651437,1337.453826
1,1.0,-0.866495,1191.232457
2,-1.0,0.789828,-475.647768
3,-1.0,0.179549,1959.095353
4,1.0,-0.434351,568.504207
5,1.0,-1.506295,929.584470
6,1.0,-1.253881,-448.391638
7,1.0,-0.393311,-1109.230943
8,1.0,0.474347,-149.290942
9,1.0,-0.882829,-1793.888921


In [38]:
X_train = train.loc[:,1:]

X_train

Unnamed: 0,1,2
0,-0.024626,1174.600238
1,-0.978058,1083.198803
2,0.314272,-1472.977609
3,0.179752,231.017267
4,-1.262544,-778.271726
5,0.249970,-52.801483
6,-1.870397,-324.235348
7,0.020419,-64.744951
8,0.065806,-421.684101
9,-0.638902,-405.843375


In [39]:
y_train = train[0]

y_train

0     -1.0
1      1.0
2     -1.0
3     -1.0
4      1.0
5     -1.0
6      1.0
7      1.0
8      1.0
9      1.0
10    -1.0
11     1.0
12     1.0
13     1.0
14    -1.0
15     1.0
16     1.0
17    -1.0
18    -1.0
19    -1.0
20     1.0
21     1.0
22     1.0
23    -1.0
24    -1.0
25     1.0
26    -1.0
27     1.0
28    -1.0
29     1.0
      ... 
270    1.0
271    1.0
272   -1.0
273    1.0
274    1.0
275    1.0
276   -1.0
277    1.0
278   -1.0
279    1.0
280    1.0
281   -1.0
282   -1.0
283   -1.0
284   -1.0
285   -1.0
286   -1.0
287   -1.0
288   -1.0
289   -1.0
290    1.0
291   -1.0
292    1.0
293    1.0
294    1.0
295   -1.0
296   -1.0
297    1.0
298    1.0
299    1.0
Name: 0, Length: 300, dtype: float64

In [40]:
X_test = test.loc[:,1:]

X_test

Unnamed: 0,1,2
0,1.651437,1337.453826
1,-0.866495,1191.232457
2,0.789828,-475.647768
3,0.179549,1959.095353
4,-0.434351,568.504207
5,-1.506295,929.584470
6,-1.253881,-448.391638
7,-0.393311,-1109.230943
8,0.474347,-149.290942
9,-0.882829,-1793.888921


In [41]:
y_test = test[0]

y_test

0     -1.0
1      1.0
2     -1.0
3     -1.0
4      1.0
5      1.0
6      1.0
7      1.0
8      1.0
9      1.0
10     1.0
11    -1.0
12    -1.0
13    -1.0
14    -1.0
15    -1.0
16     1.0
17     1.0
18     1.0
19     1.0
20    -1.0
21    -1.0
22     1.0
23    -1.0
24     1.0
25     1.0
26     1.0
27     1.0
28    -1.0
29    -1.0
      ... 
170    1.0
171    1.0
172    1.0
173    1.0
174   -1.0
175    1.0
176    1.0
177   -1.0
178   -1.0
179   -1.0
180    1.0
181   -1.0
182    1.0
183    1.0
184   -1.0
185   -1.0
186    1.0
187   -1.0
188    1.0
189   -1.0
190   -1.0
191   -1.0
192    1.0
193   -1.0
194    1.0
195   -1.0
196    1.0
197    1.0
198   -1.0
199    1.0
Name: 0, Length: 200, dtype: float64

In [42]:
clf = Perceptron(random_state=241)

clf.fit(X_train, y_train)

predictions = clf.predict(X_test)

predictions

array([-1., -1.,  1., -1., -1., -1.,  1.,  1.,  1.,  1., -1., -1., -1.,
       -1., -1., -1.,  1., -1., -1.,  1.,  1.,  1.,  1., -1.,  1., -1.,
        1.,  1., -1.,  1.,  1.,  1., -1.,  1., -1., -1., -1.,  1.,  1.,
        1.,  1., -1., -1.,  1., -1.,  1., -1., -1.,  1.,  1., -1.,  1.,
       -1.,  1., -1.,  1.,  1.,  1.,  1.,  1.,  1., -1.,  1.,  1.,  1.,
        1., -1., -1., -1.,  1.,  1.,  1., -1.,  1., -1., -1., -1.,  1.,
        1., -1., -1., -1.,  1., -1., -1.,  1., -1.,  1., -1., -1., -1.,
        1.,  1.,  1.,  1.,  1., -1.,  1.,  1.,  1., -1.,  1.,  1.,  1.,
        1.,  1., -1., -1.,  1.,  1.,  1., -1., -1.,  1., -1.,  1., -1.,
        1., -1., -1.,  1., -1., -1., -1., -1.,  1.,  1.,  1., -1., -1.,
        1., -1., -1., -1., -1., -1.,  1.,  1., -1.,  1.,  1.,  1.,  1.,
        1., -1.,  1.,  1.,  1.,  1.,  1., -1., -1., -1., -1., -1., -1.,
        1., -1.,  1.,  1., -1.,  1., -1., -1.,  1., -1.,  1., -1., -1.,
       -1., -1.,  1., -1.,  1.,  1., -1.,  1., -1., -1., -1., -1

In [43]:
a1 = accuracy_score(y_test, predictions)

a1

0.65500000000000003

In [44]:
scaler = StandardScaler()

X_train_scaled = scaler.fit_transform(X_train)

X_test_scaled = scaler.transform(X_test)

In [45]:
#clf = Perceptron(random_state=241)

clf.fit(X_train_scaled, y_train)

predictions_scaled = clf.predict(X_test_scaled)

predictions_scaled

array([-1.,  1., -1., -1.,  1.,  1.,  1.,  1., -1.,  1., -1., -1., -1.,
       -1., -1., -1.,  1.,  1.,  1.,  1., -1., -1.,  1., -1.,  1., -1.,
       -1.,  1.,  1., -1., -1.,  1., -1., -1., -1.,  1.,  1., -1., -1.,
       -1.,  1., -1.,  1., -1.,  1.,  1., -1.,  1.,  1.,  1., -1., -1.,
        1., -1., -1., -1.,  1., -1.,  1.,  1.,  1.,  1., -1.,  1., -1.,
        1., -1., -1.,  1.,  1.,  1., -1., -1., -1., -1.,  1., -1.,  1.,
        1., -1.,  1.,  1.,  1., -1.,  1.,  1., -1., -1., -1., -1.,  1.,
       -1., -1.,  1., -1., -1.,  1.,  1.,  1., -1., -1., -1., -1., -1.,
       -1.,  1., -1., -1.,  1., -1.,  1., -1.,  1., -1., -1., -1.,  1.,
        1.,  1.,  1.,  1., -1., -1., -1., -1.,  1., -1.,  1., -1., -1.,
       -1.,  1.,  1., -1.,  1.,  1.,  1., -1., -1.,  1.,  1.,  1.,  1.,
        1., -1.,  1.,  1.,  1.,  1.,  1., -1.,  1., -1.,  1., -1.,  1.,
        1., -1.,  1.,  1., -1.,  1.,  1., -1.,  1.,  1.,  1., -1.,  1.,
       -1.,  1.,  1.,  1.,  1.,  1.,  1.,  1., -1.,  1., -1., -1

In [46]:
a2 = accuracy_score(y_test, predictions_scaled)

a2

0.84499999999999997

In [47]:
a2 - a1

0.18999999999999995