# Задание 2.1 - Нейронные сети

В этом задании вы реализуете и натренируете настоящую нейроную сеть своими руками!

В некотором смысле это будет расширением прошлого задания - нам нужно просто составить несколько линейных классификаторов вместе!

<img src="https://i.redd.it/n9fgba8b0qr01.png" alt="Stack_more_layers" width="400px"/>

In [1]:
import numpy as np
import matplotlib.pyplot as plt

%matplotlib inline

%load_ext autoreload
%autoreload 2

In [38]:
from dataset import get_CIFAR10_data
from gradient_check import check_layer_gradient, check_layer_param_gradient, check_model_gradient
from layers import FullyConnectedLayer, ReLULayer
from model import TwoLayerNet
from trainer import Trainer, Dataset
from optim import SGD, MomentumSGD
from metrics import multiclass_accuracy

# Загружаем данные

И разделяем их на training и validation.

In [39]:
# Путь к папке с данными
cifar10_dir = '../data/cifar-10-batches-py'

# Очистим значения переменных, чтобы избежать проблем с излишним потреблением памяти
try:
   del X_train, y_train
   del X_test, y_test
   print('Clear previously loaded data.')
except:
   pass

data = get_CIFAR10_data(cifar10_dir)
train_X = data['X_train']
train_y = data['y_train']
test_X = data['X_test']
test_y = data['y_test']
val_X = data['X_val']
val_y = data['y_val']
# Проверим размер входных и выходных векторов.
print('Training data shape: ', train_X.shape)
print('Training labels shape: ', train_y.shape)
print('Validation data shape: ', val_X.shape)
print('Validation labels shape: ', val_y.shape)
print('Test data shape: ', test_X.shape)
print('Test labels shape: ', test_y.shape)

Training data shape:  (10000, 3, 32, 32)
Training labels shape:  (10000,)
Validation data shape:  (1000, 3, 32, 32)
Validation labels shape:  (1000,)
Test data shape:  (1000, 3, 32, 32)
Test labels shape:  (1000,)


# Как всегда, начинаем с кирпичиков

Мы будем реализовывать необходимые нам слои по очереди. Каждый слой должен реализовать:
- прямой проход (forward pass), который генерирует выход слоя по входу и запоминает необходимые данные
- обратный проход (backward pass), который получает градиент по выходу слоя и вычисляет градиент по входу и по параметрам

Начнем с ReLU, у которого параметров нет.

In [40]:
# TODO: Implement ReLULayer layer in layers.py
# Note: you'll need to copy implementation of the gradient_check function from the previous assignment

X = np.array([[1,-2,3],
              [-1, 2, 0.1]
              ])

assert check_layer_gradient(ReLULayer(), X)

-0.45678165486015265 -0.45678165485618644
0.0 0.0
1.135806311745537 1.1358063117583583
0.0 0.0
0.7468260476404139 0.7468260476262144
-0.3130288200412467 -0.31302882006478683
Gradient check passed!


А теперь реализуем полносвязный слой (fully connected layer), у которого будет два массива параметров: W (weights) и B (bias).

Все параметры наши слои будут использовать для параметров специальный класс `Param`, в котором будут храниться значения параметров и градиенты этих параметров, вычисляемые во время обратного прохода.

Это даст возможность аккумулировать (суммировать) градиенты из разных частей функции потерь, например, из cross-entropy loss и regularization loss.

In [41]:
# TODO: Implement FullyConnected layer forward and backward methods
assert check_layer_gradient(FullyConnectedLayer(3, 4), X)
# TODO: Implement storing gradients for W and B
assert check_layer_param_gradient(FullyConnectedLayer(3, 4), X, 'W')
assert check_layer_param_gradient(FullyConnectedLayer(3, 4), X, 'B')

0.00026151937783388537 0.0002615193778546243
-0.002627920793305167 -0.0026279207933008197
-0.0001213783421712449 -0.00012137834218620135
0.000273164868494859 0.0002731648685028176
0.0012757825245808486 0.0012757825245020282
0.0023081576254739234 0.00230815762553363
Gradient check passed!
0.6273457970505343 0.6273457970505051
1.321339389315126 1.3213393893151368
-0.8219491708228619 -0.8219491708228669
-0.1682275234311804 -0.16822752343112826
-1.2546915941010686 -1.2546915941010535
-2.642678778630252 -2.64267877863023
1.6438983416457238 1.6438983416457338
0.3364550468623608 0.33645504686234323
-4.217778991882712 -4.217778991882697
6.826665478305579 6.826665478305588
-0.3242772685074155 -0.3242772685073565
-0.9146961551541735 -0.914696155154132
Gradient check passed!
-0.782036747266011 -0.7820367472660119
-0.8472238157224282 -0.847223815722423
-0.21932612228583773 -0.21932612228583914
-0.9343802150676032 -0.9343802150676375
Gradient check passed!


## Создаем нейронную сеть

Теперь мы реализуем простейшую нейронную сеть с двумя полносвязным слоями и нелинейностью ReLU. Реализуйте функцию `compute_loss_and_gradients`, она должна запустить прямой и обратный проход через оба слоя для вычисления градиентов.

Не забудьте реализовать очистку градиентов в начале функции.

In [42]:
# TODO: In model.py, implement compute_loss_and_gradients function
model = TwoLayerNet(n_input = train_X.shape[1], n_output = 10, hidden_layer_size = 3, reg = 0)
loss = model.compute_loss_and_gradients(train_X[:2], train_y[:2])

# TODO Now implement backward pass and aggregate all of the params
check_model_gradient(model, train_X[:2], train_y[:2])

ValueError: matmul: Input operand 1 has a mismatch in its core dimension 0, with gufunc signature (n?,k),(k,m?)->(n?,m?) (size 3 is different from 32)

Теперь добавьте к модели регуляризацию - она должна прибавляться к loss и делать свой вклад в градиенты.

In [29]:
# TODO Now implement l2 regularization in the forward and backward pass
model_with_reg = TwoLayerNet(n_input = train_X.shape[1], n_output = 10, hidden_layer_size = 3, reg = 1e1)
loss_with_reg = model_with_reg.compute_loss_and_gradients(train_X[:2], train_y[:2])
assert loss_with_reg > loss and not np.isclose(loss_with_reg, loss), \
    "Loss with regularization (%2.4f) should be higher than without it (%2.4f)!" % (loss, loss_with_reg)

check_model_gradient(model_with_reg, train_X[:2], train_y[:2])

Checking gradient for W1
-0.02509459102993019 -0.02509459102739697
0.006206375417319005 0.0062063753913932365
-0.015205535734367415 -0.015205535741635854
-0.040807245255331456 -0.040807245249574464
0.010935166786153432 0.010935166794290295
0.0008678888471371107 0.000867888849676035
-0.024710349912703093 -0.02471034989959264
0.012287644346778337 0.012287644346464786
0.01530587825179924 0.015305878253712988
7.167742335245495e-06 7.167733073742965e-06
0.009073029817584987 0.00907302981634217
-0.026490581589912198 -0.026490581594984516
0.01354933892160761 0.013549338917506757
-0.0004472849601443179 -0.0004472849424175251
0.031149055997648747 0.031149055979007297
-0.03762519365560555 -0.037625193649581945
-0.005649496952516973 -0.005649496959136967
-0.02083098205171216 -0.020830982050412672
-0.012891807778631513 -0.012891807776860274
-0.002123060675535357 -0.0021230606828126497
-0.010233643127025904 -0.010233643132906423
-0.01733581319742719 -0.017335813184971016
-0.017206391606203835 -0.01

0.040431492372210796 0.04043149237631383
-0.041011707325996835 -0.04101170731907189
0.018070833026812425 0.018070833007755027
-0.01437215888949598 -0.014372158885223028
0.03200241063107691 0.03200241063261444
0.001506223798610945 0.0015062237901375395
-0.04400315793900728 -0.0440031579396205
0.005707319133870006 0.005707319150616285
0.011961955368312151 0.011961955359574004
0.0029522248368809927 0.0029522248423674564
0.026444254000112168 0.026444253986568352
0.02240531134197604 0.022405311361772814
0.0027411748733593647 0.0027411748870775905
-0.04116764265668875 -0.04116764267259043
0.004658830476971429 0.0046588304769557
-0.0040593578184274625 -0.004059357827657095
-0.002245001796495943 -0.0022450017844732884
-0.01167508783174721 -0.011675087807638816
-0.03397166903093134 -0.03397166903340576
-0.02177271675313829 -0.02177271674064229
0.019239610965168488 0.019239610948851293
0.02134739692021789 0.02134739691683762
0.0329231628401326 0.032923162840425846
-0.004739209946219687 -0.004739

-0.029249914095307354 -0.02924991409081201
0.0005771059044307424 0.0005771058964043618
0.009658285000168758 0.009658284993996347
0.011588283345762543 0.011588283355123961
0.01190949636119579 0.011909496344664204
-0.013852538466399875 -0.013852538449654615
0.013592254814722843 0.013592254810568248
-0.03754386650245918 -0.03754386650456354
0.007358128140073514 0.007358128151224718
-0.023102838662049284 -0.023102838664357247
0.02125206779588188 0.021252067816668326
0.00712708768625517 0.007127087697789135
-0.026759792177023307 -0.026759792182140526
0.0032845195554028588 0.003284519567436916
0.003898553309059348 0.003898553302406071
-0.004593797986279394 -0.004593797986451875
0.004142414275290037 0.004142414278263118
0.007329256848526856 0.007329256823673801
-0.012593447257285647 -0.012593447262787548
-0.024417407108257905 -0.02441740711844886
-0.02048558938998416 -0.020485589358187895
-0.0037592503566938585 -0.0037592503554506602
0.016505685107414438 0.01650568510758177
-0.018742057782585

0.013043449910858443 0.013043449920147053
0.01244135456890489 0.012441354568792915
-0.0018290315619685217 -0.0018290315706437352
0.015993485749459618 0.015993485735776858
0.023603764366088537 0.023603764365276444
0.0038848308073365077 0.003884830812594941
-0.02053117518164746 -0.020531175182192385
0.008563028876716236 0.008563028863761701
0.01303030149705602 0.013030301504457496
0.00670085112294856 0.006700851118424111
-0.015217638019134783 -0.015217638016373767
-0.010084397305322642 -0.010084397294995995
0.02420037328049674 0.02420037326089641
0.01646472786998585 0.016464727869980322
0.019114358360570013 0.019114358362770645
0.023839416124600034 0.023839416130044807
-0.016547562104240666 -0.016547562098345736
-0.028533029555017766 -0.028533029539090645
0.02068495916275203 0.02068495914553381
-0.0453293311437563 -0.04532933113310377
0.03730747289334192 0.03730747293317904
0.002505526692160692 0.0025055266750229066
-0.006406291644514097 -0.0064062916305118725
-0.008439687177070668 -0.00

-0.015335312681612338 -0.015335312686381995
0.024279798421342185 0.02427979841623795
-0.01631297904763774 -0.016312979056465338
-0.017269145189461342 -0.017269145180520695
0.03875922118721434 0.038759221188122694
-0.024989948674363726 -0.024989948665954383
0.010907574664833022 0.010907574665708351
-0.009091314854908989 -0.00909131485649084
0.012805725403488906 0.012805725413400635
0.028668561299874613 0.02866856130268047
0.014426389751499723 0.014426389749466749
-0.04091585528023918 -0.040915855281653535
0.02156861006393007 0.02156861005353505
0.02412916450422969 0.024129164510888753
0.0003626304665693236 0.0003626304589943174
0.006865220610412599 0.006865220614216127
-0.014688600902259995 -0.014688600891155089
-0.0074771741872545925 -0.007477174190917423
-0.026098938618567616 -0.02609893861027501
0.010773215199923775 0.010773215208814689
-0.0030423339644812426 -0.00304233396253295
0.0028327863198851144 0.002832786316631086
0.00598646649697032 0.005986466500296216
-0.021649265224971726

0.007912679742368055 0.007912679733657058
-0.0022203386873112436 -0.002220338690683832
-0.017059466181226512 -0.017059466173030557
0.017121921715380163 0.017121921702667464
0.03786176809973208 0.037861768098501614
0.00028367335793501867 0.00028367337367996015
-0.005687526580342408 -0.005687526583031398
0.006691183438382276 0.006691183429552438
-0.040151655350877925 -0.040151655356091
0.014190726565334055 0.014190726571605692
-0.01944482756440577 -0.019444827570325174
0.02268222760175732 0.02268222760726246
-0.02777607779186733 -0.027776077793362216
-0.011227283776258642 -0.011227283769343897
-0.030609171045906103 -0.03060917104225069
0.027223134803453158 0.027223134790865796
-0.03389773953040842 -0.033897739526445037
-0.0067762680082899505 -0.006776267991170925
-0.01468010554714517 -0.014680105553388499
-0.005058760105991364 -0.0050587600997076265
0.01818880834409732 0.018188808348362784
0.006502814438195892 0.006502814442477244
-0.004299093740417917 -0.004299093747661686
-0.0344671079

0.02824692591597643 0.02824692590941424
0.008245833594480874 0.008245833593711893
0.01877130509046416 0.018771305088094437
-0.022652446202084592 -0.022652446207693796
0.005843141867497875 0.005843141859251943
0.0019345901330809878 0.001934590132535163
-0.005279431090573047 -0.005279431092297671
-0.0034230211160993507 -0.0034230211110042315
-0.03298914197064656 -0.03298914197369385
0.007832174951179988 0.007832174930832991
0.0016483941933046545 0.0016483941989164916
-0.0016383746121832721 -0.0016383746137549335
0.018327833013812012 0.018327833006814842
0.02421040843370706 0.024210408433589233
-0.008093916718291483 -0.008093916736839901
0.05208854929836936 0.052088549296058766
0.014699679758965736 0.014699679762308902
-0.03421915362717469 -0.03421915362178396
0.005503050593076663 0.005503050592992053
0.027417192687218782 0.027417192693945932
0.004290378838600699 0.004290378829985286
-0.02519298758869343 -0.02519298758496546
-0.008431932418176705 -0.008431932418950794
-0.00791067244183393

-0.005843544907417108 -0.0058435449146188026
0.012002137005926856 0.012002136995370448
-0.021009394030186146 -0.021009394024495975
0.0252645342327916 0.025264534220248432
-0.006615092671712274 -0.006615092673634137
-0.037193610324006504 -0.03719361032494817
0.026197471688900367 0.02619747170307107
0.022177253926064157 0.022177253922173176
-0.008421539618256231 -0.008421539621217278
0.022356960933151173 0.022356960949210244
0.016653192050691833 0.016653192025373187
0.030181103998403253 0.030181103993776045
-0.002548869232495135 -0.0025488692267927604
0.0036175427679461434 0.003617542776446214
0.033257961527305945 0.033257961540300585
-0.05055204653566349 -0.05055204652659739
-0.005023637473153499 -0.0050236374615764134
0.022762639792505028 0.02276263979528181
-0.02258721590493063 -0.022587215897651444
0.003355819499044387 0.0033558194889593547
-0.008741648107438193 -0.008741648116483702
-0.02533826387114068 -0.025338263887064724
-0.008262777818327174 -0.008262777839718183
0.003880264654

-0.02986065194880442 -0.02986065195109688
0.0041811459119881185 0.00418114591838048
0.0067310911617726584 0.006731091173328706
0.002698305546026832 0.0026983055345652924
0.01204972584729188 0.012049725839347046
-0.0154803470218995 -0.01548034702647527
0.014551017118252487 0.01455101712455331
-0.016787685452784702 -0.01678768546398146
-0.009676639700456693 -0.00967663968953758
0.011049877282657272 0.011049877279845076
0.025135661354825055 0.025135661374520165
-0.03268082982071198 -0.03268082982010867
-0.02192545494180318 -0.0219254549405079
0.0027978348169778264 0.002797834830481349
0.02194585733637541 0.021945857331395754
-0.048900840177750586 -0.04890084017716844
-0.040032292155039895 -0.04003229214788462
0.03398395848782264 0.033983958469541165
0.05028346439189037 0.050283464392286696
0.003139199351584443 0.0031391993227103394
-0.009859097705877458 -0.009859097716002907
-0.003457174130078789 -0.003457174124754658
-0.034746538312000884 -0.034746538291052786
-0.0007747293166901914 -0.0

0.025848204923153758 0.025848204909806324
-0.0005067493596654927 -0.0005067493757948682
0.009457925422681618 0.009457925442823978
0.013079334431531505 0.013079334437726685
-0.00566041833329615 -0.005660418334052507
-0.03525878984492118 -0.035258789821135395
-0.02204555115492602 -0.02204555116236406
0.04062535628590912 0.0406253563012271
0.01321878352712164 0.013218783534441057
-0.015272928682916811 -0.015272928677312335
0.03976348405144277 0.039763484038779495
-0.017205486203271288 -0.017205486191329555
-0.03914607456882016 -0.039146074559681665
0.006160238152286422 0.006160238164021336
0.0027932555823666247 0.0027932555823895196
-0.018377187758550597 -0.01837718777153441
0.00012403852414466922 0.0001240385349987605
-0.01004468768849576 -0.010044687681620701
0.0024749155747010748 0.0024749155835834813
-0.005875466993362902 -0.005875467024019087
0.03164327673815124 0.03164327673221834
0.013560170120891245 0.013560170120108237
0.03113802432112758 0.03113802431453649
0.008453970552371714 

-0.02523461523802264 -0.025234615219638098
0.00799942977466233 0.007999429763039245
0.013131981057974123 0.013131981058123186
-0.00770624000000771 -0.007706240023885868
0.022491169478395818 0.02249116948238594
0.0004804767087409555 0.0004804767028687706
-0.0004841839549609071 -0.0004841839373881384
-0.007249812315564234 -0.0072498123060427124
-0.022811569375866866 -0.022811569388991867
-0.01970598334714733 -0.019705983334006305
0.0027522445908123834 0.0027522445877892206
0.00302268130990021 0.0030226813052536268
-0.0036851076552715236 -0.003685107663464748
0.018303259866809904 0.0183032598854993
-0.0014221823178780654 -0.0014221823274596088
0.0031066441495589837 0.003106644164141414
0.015405941267564663 0.015405941278245903
0.006114686895910575 0.006114686890157372
-0.023041565255233033 -0.02304156525578804
0.03700578659121383 0.03700578659060483
-0.019062968116034314 -0.01906296811515773
-0.007747509261496405 -0.007747509278566155
0.029378880138348447 0.029378880150865424
-0.001964494

0.007367810204086838 0.0073678102063823294
-0.008125465121026793 -0.008125465122965636
-0.010910716878164374 -0.010910716885526027
-0.03603772555111745 -0.036037725537063636
0.03864330402937505 0.03864330402336691
-0.04341779138082194 -0.043417791384392494
-0.031594963400624704 -0.03159496340110479
-0.0033311282366349955 -0.003331128217709533
-0.0024666351747228785 -0.0024666351627899985
-0.03353074646974845 -0.033530746468279915
-0.009538122909109685 -0.009538122913710367
-0.013086858555271114 -0.013086858552391332
-0.006988138009118088 -0.0069881380015957
0.01854253879659288 0.018542538771093575
0.02856113971877404 0.02856113971994034
0.032523245595150116 0.032523245585558413
0.011191736454048582 0.011191736470905765
-0.029690222852818075 -0.02969022285803646
0.009307523752315895 0.009307523773927073
0.008789397558340944 0.008789397543118582
0.00807061472940866 0.008070614732069714
0.015931774195938993 0.015931774210997673
-0.014298321552651025 -0.01429832157118227
-0.025819140129462

0.04323488830560913 0.04323488831392552
0.04709834335988668 0.047098343358697996
0.02101729649446265 0.021017296480962955
-0.003958600673806777 -0.003958600669484724
0.012859846568423644 0.012859846565405062
-0.003718481573775592 -0.0037184815671054135
-0.001574388258007061 -0.0015743882642027527
-0.008966212568608654 -0.008966212572403265
-0.03224359913079944 -0.03224359912401553
-0.04939596742488192 -0.049395967427479086
-0.010277990072358032 -0.010277990081242194
-0.01439748412324937 -0.014397484116024371
-0.014819722486599378 -0.014819722471415274
0.024385875426405045 0.024385875430077416
-0.01668576436042113 -0.016685764370194534
-0.02452810820596249 -0.02452810821118589
0.021639470735662185 0.021639470726420026
-0.003954692037351739 -0.003954692040508689
-0.013361073217995238 -0.013361073225581775
-0.004816906829838201 -0.004816906851168312
0.0178575664601828 0.017857566469992037
-0.002057751365019384 -0.002057751369299865
-0.0012027559397516378 -0.0012027559614935512
-0.00110202

-0.01426849293031045 -0.014268492920521679
-0.03146137370403039 -0.03146137370624302
0.027205749045551272 0.027205749031367073
-0.014565396358557406 -0.014565396355692426
-0.012444138337538409 -0.0124441383198004
0.008481320820599764 0.008481320823428007
-0.0021657998392373245 -0.0021657998505730802
-0.01641371907621468 -0.01641371909499867
0.0054118661164759396 0.005411866110804907
0.0050437017584110755 0.005043701745144347
-0.020878205625458994 -0.020878205608809708
0.013561624717454352 0.01356162471211064
-0.010810495976204653 -0.01081049598727901
0.028419968791191363 0.028419968800541536
0.024521730503148997 0.024521730512816472
0.013450553704811035 0.013450553693061805
0.008059822834480734 0.008059822853567766
-0.012862682303573037 -0.01286268229705456
-0.02983620865119276 -0.0298362086814663
-0.0310058169521257 -0.031005816958362683
-0.02472646535746283 -0.024726465364111046
0.021804120849983635 0.021804120842183746
0.012635618131471687 0.012635618151790593
-1.3634422583698982e-0

-0.013114684596135436 -0.013114684604964564
0.003594282103894126 0.003594282116381464
-0.04105120280678366 -0.04105120279263019
0.009145935472457007 0.009145935475629585
0.03661840602184301 0.036618406040744844
0.02171305318610619 0.02171305317766325
0.0059314844452962 0.005931484459154034
-0.024388910825318275 -0.024388910824235662
-0.023046656827070335 -0.023046656827396813
-0.011894407820853114 -0.011894407814239115
0.004404581568357255 0.004404581588346446
0.0072290974187709705 0.007229097409577888
-0.015452789110750237 -0.015452789092762485
-0.023200538114633875 -0.023200538112888577
-0.039323704642767084 -0.039323704648097646
-0.025547271015281533 -0.02554727100978482
0.029399776732521348 0.029399776724225998
0.015166912715251587 0.015166912703534761
0.025792936736863527 0.025792936741986235
-0.014382067633886298 -0.014382067647922268
0.01234692252877966 0.012346922528827518
0.0054048448655200365 0.005404844882761494
-0.012897533741949513 -0.012897533729905318
0.00696210922568484

0.02202244600204704 0.02202244600013614
-0.051843326518350316 -0.051843326498435253
0.019689474463054576 0.019689474473061352
0.045599601374142915 0.045599601383727865
-0.02717698575610555 -0.027176985772925374
-0.0187133976803836 -0.01871339769810021
-0.01448970913786606 -0.014489709143639116
-0.002724272246102811 -0.002724272252230264
0.010380170863020972 0.010380170856194582
-0.000649878759587843 -0.0006498787730180311
0.0279388986493507 0.027938898661261643
0.017876247555824645 0.01787624757110251
0.016950170826421473 0.016950170822482846
-0.0016847055536537904 -0.0016847055306357104
-0.019912315401185158 -0.019912315396553026
-0.0009273771981640258 -0.0009273771972573285
0.03883887548713227 0.038838875493496516
-0.05656898183609069 -0.056568981854354654
0.016387089887365366 0.016387089885050443
-0.003482327826315766 -0.003482327848303157
0.038638119365084884 0.03863811937065975
-0.004181413512871854 -0.004181413526538336
0.03487382336077905 0.034873823362424616
0.00125098171546200

0.015681045431006343 0.015681045439919217
-0.04278445852034476 -0.04278445850935952
0.030823978035533044 0.03082397803666481
-0.005803802368573242 -0.005803802372028598
-0.026052799050302566 -0.026052799073639218
0.018905043480424523 0.018905043486228124
0.01524400446545931 0.015244004480940985
0.004420477124740075 0.004420477117683674
0.009658934759141504 0.009658934763123739
-0.03654004186270361 -0.03654004185893456
0.019643205039616588 0.01964320504033168
-0.01217053979240526 -0.012170539798184164
-0.013135183873882333 -0.013135183873913546
0.02630958205067834 0.02630958204630218
-0.02169845800328706 -0.021698458008145845
0.025592649596901877 0.025592649599559533
0.008983370191170159 0.008983370181070427
0.02313654254141061 0.02313654254848529
-0.020238170557124742 -0.020238170561626134
0.018617572984901642 0.018617572994372722
0.008513293313228976 0.008513293314749149
-0.0015472512348295646 -0.0015472512382430634
-0.017623323323627718 -0.017623323333992857
-0.0017988992877396954 -0

0.0008933933977428233 0.0008933933814958549
-0.010801792146118944 -0.010801792149628396
-0.002221095229976635 -0.002221095218857272
0.012530531882207931 0.012530531878773841
0.006791300544303508 0.006791300544151112
0.04709224189250227 0.04709224190602156
0.013901481307979417 0.013901481321632046
0.013132602408931599 0.013132602405541148
0.01638053430194767 0.01638053432895248
0.00659456486023169 0.0065945648719534225
-0.003694962718782182 -0.0036949627135740566
-0.008068575795230244 -0.00806857580748499
0.006970094020550192 0.0069700940130701374
0.019936858414307125 0.01993685840862014
0.004468311941918369 0.004468311942673608
-0.018584708588051647 -0.018584708594282517
-0.01727818517973332 -0.017278185193703166
0.0049564527531909255 0.004956452759330432
0.006107308618339045 0.006107308614389239
-0.0242102827432366 -0.024210282756342846
-0.028993023174633318 -0.028993023160062133
-0.009340073338140081 -0.009340073336971955
-0.01694396354523827 -0.016943963543347706
0.00528550965178417

0.009049387283159583 0.00904938728396587
0.0028174030874897997 0.00281740308860634
0.01368521343602116 0.013685213451353205
-0.0329674281638358 -0.03296742816516485
0.02674932304953922 0.026749323045471837
0.0208753044017829 0.020875304396206218
-0.014965108615149736 -0.014965108618980592
-0.016186681671246886 -0.016186681683905135
-0.008933678577642526 -0.008933678574685189
0.004685445722782243 0.004685445742502736
-0.03200419450585372 -0.03200419449456149
-0.015295566286863717 -0.015295566280215665
-0.02528713634145737 -0.025287136340423896
0.03508457166504857 0.03508457167011869
0.013865288036716557 0.013865288051029266
-0.0028790395258283586 -0.002879039517900139
-0.014134626737143195 -0.014134626735717857
-0.019187121166352916 -0.01918712115855925
0.024145459201578272 0.024145459187607795
-0.01483357732938555 -0.01483357734421986
0.02439560519514849 0.024395605202620626
-0.07103806302204645 -0.07103806300978732
0.017101791895606382 0.017101791893736618
0.012971836900396038 0.01297

-0.000621563074466921 -0.0006215630676820183
0.06237472405321956 0.0623747240524608
0.024716790310162003 0.02471679032556295
-0.03098711285524138 -0.03098711285343114
0.007891402172796283 0.007891402198367814
0.030733083802708495 0.03073308381118522
-0.021679644497559596 -0.021679644501837455
0.012731795813954786 0.012731795795417609
-0.002996076454143752 -0.0029960764535985614
-0.007716316890240064 -0.0077163168965554965
-0.02609191364421562 -0.026091913651882234
0.01935515518487372 0.019355155167488647
0.0042069309061381465 0.00420693089253632
0.005428170002144198 0.005428170002375054
-0.006824833056246832 -0.006824833054253076
0.0029942334984546324 0.002994233505582144
-0.020440577688013814 -0.02044057769712282
0.00967960388508241 0.009679603873991027
0.00165859421500765 0.0016585942175240118
0.016635106053122538 0.016635106048212833
0.018814700068652355 0.018814700064595513
0.02343849149916465 0.02343849150321375
0.02321612135386298 0.0232161213808979
-0.002637398073302443 -0.00263

0.003727343871863875 0.0037273438779905628
-0.002921750726612098 -0.00292175075244927
0.0023636086696052646 0.0023636086643463727
0.011294773153498621 0.011294773161196757
0.04780408331569343 0.04780408331406249
0.026813415060401018 0.0268134150660515
-0.007577087692198194 -0.007577087668408921
0.02908040427712859 0.02908040426241598
-0.010236103538224371 -0.010236103542560215
-0.01744848231314102 -0.01744848230345042
-0.028890841754076003 -0.028890841763384852
0.017586344702885195 0.017586344691622458
0.04591200911751115 0.045912009127846425
0.012708298080511814 0.012708298080532641
-0.003018086495265721 -0.003018086491834992
0.03654392006489957 0.03654392004559526
0.0007276110970071018 0.0007276110824960823
0.032281479495899434 0.03228147948952653
-0.011707317849235682 -0.01170731784849721
0.004650356561981324 0.004650356566493485
0.028579747183499524 0.02857974719105982
0.000567228738603455 0.0005672287306524026
-0.010324964551889203 -0.010324964572205886
-0.009213014923210805 -0.00

-0.010493932727830635 -0.010493932722788202
0.004173948910937777 0.004173948919827808
-0.011411365808981678 -0.011411365807845185
-0.027301021014379187 -0.027301021043868442
0.0002780843305992348 0.00027808433333831317
0.013712315713250668 0.013712315727332223
-0.024545909259735044 -0.024545909260709205
-0.000758704092946911 -0.0007587040995460369
0.029094439861186386 0.029094439857324513
-0.03703478073699358 -0.03703478073102673
-0.00863377337324993 -0.008633773385113841
0.01694533777079642 0.016945337755203127
-0.00537200828019722 -0.0053720082604513655
0.00012602484380749588 0.00012602483501211736
0.011124949472845832 0.011124949494956125
-0.03156662124010365 -0.03156662122805187
-0.024433923131403273 -0.02443392312923009
0.01139387523818492 0.011393875243292937
0.011954029596699832 0.011954029610627968
-0.012020764103589297 -0.012020764117437464
0.034357811127788844 0.034357811107277314
0.0021617888477325087 0.002161788859034175
-0.01701986053952457 -0.01701986054314375
0.014890546

-0.019656073811838495 -0.019656073813045793
0.000407240141813055 0.00040724015271109687
-0.013752443842761137 -0.01375244385037888
0.003166342497813977 0.003166342499305585
0.02151737087934541 0.021517370885071326
-0.01593538048101209 -0.015935380481835182
0.01982352855249312 0.01982352855200986
0.00433237621408304 0.004332376213334044
0.013578045181725212 0.013578045177098373
-0.007743888371065841 -0.007743888374989182
0.009025164721508223 0.009025164748877046
-0.0013264110842513236 -0.001326411069868527
0.010140276224477423 0.01014027621870639
0.014280693354001376 0.014280693338974968
0.0054382785883601795 0.005438278605218726
0.027679685237626858 0.027679685232762093
-0.02913172729098643 -0.029131727297126982
-0.03386142280723056 -0.03386142279904192
0.0038278478660600393 0.0038278478609043982
-0.05526467600947792 -0.05526467601324469
-0.021603170251158477 -0.021603170252681988
0.02875105265885574 0.028751052649766958
-0.02235245445739087 -0.022352454442930988
0.025183828153851673 0

0.004719927391637474 0.004719927382268452
0.014421798790432195 0.01442179877741978
0.02640796276974876 0.02640796277209034
0.021249139875806868 0.021249139892098864
-0.010094850862787011 -0.010094850866337879
0.007254758977973126 0.007254758993546772
0.011268697359217643 0.011268697353017386
-0.039063318866154065 -0.03906331886849301
-0.002934165558122343 -0.0029341655549686148
0.012267473196394834 0.012267473192828502
-0.01002811815498672 -0.010028118158089683
0.025721918477158674 0.025721918484045144
0.027522486497507787 0.027522486489850447
0.0051397230677260085 0.005139723069369495
-0.027220046009934683 -0.027220045994980065
-0.0005332174065762269 -0.0005332174257688393
0.005532734492293734 0.005532734492774693
0.02120704865686654 0.021207048650495604
0.002922653650246475 0.002922653630221816
0.0055242505465363575 0.005524250545896336
0.014364693690594189 0.014364693678992067
0.023840926135573863 0.0238409261443806
-0.01406598429940208 -0.014065984288436082
0.05959332767376725 0.05

-0.009161985223364514 -0.009161985214944934
0.0030914239571777735 0.0030914239390611438
-0.006232307309633757 -0.006232307314668616
0.020296751837475365 0.02029675183479185
-0.01837878515094951 -0.0183787851826267
0.011882182359627876 0.01188218239356331
0.01828339646377707 0.018283396463480983
-0.003125211945970859 -0.003125211933685534
0.015232398935716492 0.01523239891998429
-0.001492329755287667 -0.001492329770869105
0.023354323925814168 0.023354323919200223
-0.03440103194848496 -0.03440103197860367
-0.02118340139347105 -0.021183401388569223
-0.0030699112241491487 -0.003069911236330824
-0.04443181830904788 -0.044431818313483966
-0.00653679903697169 -0.006536799035394835
-0.006220344335884238 -0.006220344328511373
-0.026487682715531532 -0.026487682713849377
-0.01956698805181534 -0.01956698805205548
-0.017061139548352363 -0.017061139545582193
0.008040479917946678 0.008040479904103393
0.010724391984115806 0.010724391996674852
-0.02165909242230827 -0.021659092430681422
0.02859631292310

0.014806152028035445 0.014806152037749596
-0.012340968228769266 -0.01234096822511077
0.013469582271522397 0.013469582271774526
0.013641519216140848 0.01364151920313361
-0.024428969061299235 -0.02442896904764069
-0.051048944137878804 -0.0510489441385431
-0.013993663638978547 -0.013993663650069264
-0.012251367462047856 -0.012251367453863791
-0.013253308537443727 -0.013253308539518114
0.027544470977790912 0.02754447097075285
-0.0283460762598801 -0.028346076264007532
-0.00227463895982773 -0.002274638966071052
-0.009559634579772942 -0.009559634572831044
-0.009520722631388753 -0.009520722632494483
0.030877378941701356 0.03087737894258424
-0.017203031333998187 -0.017203031332790886
0.0044178455078917106 0.004417845489435024
-0.020419971836141734 -0.020419971846763474
0.009146242024924303 0.009146242030411145
0.02424308686207245 0.024243086849118353
0.0014395310800795434 0.0014395310721226904
-0.005600207052210961 -0.005600207053646499
-0.024113322795047864 -0.024113322805163758
0.000171215758

True

Также реализуем функцию предсказания (вычисления значения) модели на новых данных.

Какое значение точности мы ожидаем увидеть до начала тренировки?

In [32]:
# Finally, implement predict function!

# TODO: Implement predict function
# What would be the value we expect?
multiclass_accuracy(model_with_reg.predict(train_X[:30]), train_y[:30]) 

0.06666666666666667

# Допишем код для процесса тренировки

Если все реализовано корректно, значение функции ошибки должно уменьшаться с каждой эпохой, пусть и медленно. Не беспокойтесь пока про validation accuracy.

In [36]:
model = TwoLayerNet(n_input = train_X.shape[1], n_output = 10, hidden_layer_size = 100, reg = 1e1)
dataset = Dataset(train_X, train_y, val_X, val_y)
trainer = Trainer(model, dataset, SGD(), learning_rate = 1e-2)

# TODO Implement missing pieces in Trainer.fit function
# You should expect loss to go down every epoch, even if it's slow
loss_history, train_history, val_history = trainer.fit()

Loss: 2.302527, Train accuracy: 0.100020, val accuracy: 0.099000
Loss: 2.304126, Train accuracy: 0.100102, val accuracy: 0.095000
Loss: 2.305604, Train accuracy: 0.099939, val accuracy: 0.103000
Loss: 2.300418, Train accuracy: 0.099980, val accuracy: 0.101000
Loss: 2.302966, Train accuracy: 0.100163, val accuracy: 0.092000
Loss: 2.301714, Train accuracy: 0.100020, val accuracy: 0.099000
Loss: 2.302397, Train accuracy: 0.100143, val accuracy: 0.093000


KeyboardInterrupt: 

In [None]:
plt.plot(train_history)
plt.plot(val_history)

# Улучшаем процесс тренировки

Мы реализуем несколько ключевых оптимизаций, необходимых для тренировки современных нейросетей.

## Уменьшение скорости обучения (learning rate decay)

Одна из необходимых оптимизаций во время тренировки нейронных сетей - постепенное уменьшение скорости обучения по мере тренировки.

Один из стандартных методов - уменьшение скорости обучения (learning rate) каждые N эпох на коэффициент d (часто называемый decay). Значения N и d, как всегда, являются гиперпараметрами и должны подбираться на основе эффективности на проверочных данных (validation data). 

В нашем случае N будет равным 1.

In [None]:
# TODO Implement learning rate decay inside Trainer.fit method
# Decay should happen once per epoch

model = TwoLayerNet(n_input = train_X.shape[1], n_output = 10, hidden_layer_size = 100, reg = 1e-1)
dataset = Dataset(train_X, train_y, val_X, val_y)
trainer = Trainer(model, dataset, SGD(), learning_rate_decay=0.99)

initial_learning_rate = trainer.learning_rate
loss_history, train_history, val_history = trainer.fit()

assert trainer.learning_rate < initial_learning_rate, "Learning rate should've been reduced"
assert trainer.learning_rate > 0.5*initial_learning_rate, "Learning rate shouldn'tve been reduced that much!"

# Накопление импульса (Momentum SGD)

Другой большой класс оптимизаций - использование более эффективных методов градиентного спуска. Мы реализуем один из них - накопление импульса (Momentum SGD).

Этот метод хранит скорость движения, использует градиент для ее изменения на каждом шаге, и изменяет веса пропорционально значению скорости.
(Физическая аналогия: Вместо скорости градиенты теперь будут задавать ускорение, но будет присутствовать сила трения.)

```
velocity = momentum * velocity - learning_rate * gradient 
w = w + velocity
```

`momentum` здесь коэффициент затухания, который тоже является гиперпараметром (к счастью, для него часто есть хорошее значение по умолчанию, типичный диапазон -- 0.8-0.99).

Несколько полезных ссылок, где метод разбирается более подробно:  
http://cs231n.github.io/neural-networks-3/#sgd  
https://distill.pub/2017/momentum/

In [None]:
# TODO: Implement MomentumSGD.update function in optim.py

model = TwoLayerNet(n_input = train_X.shape[1], n_output = 10, hidden_layer_size = 100, reg = 1e-1)
dataset = Dataset(train_X, train_y, val_X, val_y)
trainer = Trainer(model, dataset, MomentumSGD(), learning_rate=1e-4, learning_rate_decay=0.99)

# You should see even better results than before!
loss_history, train_history, val_history = trainer.fit()

# Ну что, давайте уже тренировать сеть!

## Последний тест - переобучимся (overfit) на маленьком наборе данных

Хороший способ проверить, все ли реализовано корректно - переобучить сеть на маленьком наборе данных.  
Наша модель обладает достаточной мощностью, чтобы приблизить маленький набор данных идеально, поэтому мы ожидаем, что на нем мы быстро дойдем до 100% точности на тренировочном наборе. 

Если этого не происходит, то где-то была допущена ошибка!

In [None]:
data_size = 15
model = TwoLayerNet(n_input = train_X.shape[1], n_output = 10, hidden_layer_size = 100, reg = 1e-1)
dataset = Dataset(train_X[:data_size], train_y[:data_size], val_X[:data_size], val_y[:data_size])
trainer = Trainer(model, dataset, SGD(), learning_rate=1e-1, num_epochs=150, batch_size=5)

# You should expect this to reach 1.0 training accuracy 
loss_history, train_history, val_history = trainer.fit()

Теперь найдем гипепараметры, для которых этот процесс сходится быстрее.
Если все реализовано корректно, то существуют параметры, при которых процесс сходится в **20** эпох или еще быстрее.
Найдите их!

In [None]:
# Now, tweak some hyper parameters and make it train to 1.0 accuracy in 20 epochs or less

model = TwoLayerNet(n_input = train_X.shape[1], n_output = 10, hidden_layer_size = 100, reg = 1e-1)
dataset = Dataset(train_X[:data_size], train_y[:data_size], val_X[:data_size], val_y[:data_size])
# TODO: Change any hyperparamers or optimizators to reach training accuracy in 20 epochs
trainer = Trainer(model, dataset, SGD(), learning_rate=1e-1, num_epochs=20, batch_size=5)

loss_history, train_history, val_history = trainer.fit()

# Итак, основное мероприятие!

Натренируйте лучшую нейросеть! Можно добавлять и изменять параметры, менять количество нейронов в слоях сети и как угодно экспериментировать. 

Добейтесь точности лучше **60%** на validation set.

In [None]:
# Let's train the best one-hidden-layer network we can

learning_rates = 1e-4
reg_strength = 1e-3
learning_rate_decay = 0.999
hidden_layer_size = 128
num_epochs = 200
batch_size = 64

best_classifier = None
best_val_accuracy = None

loss_history = []
train_history = []
val_history = []

# TODO find the best hyperparameters to train the network
# Don't hesitate to add new values to the arrays above, perform experiments, use any tricks you want
# You should expect to get to at least 40% of valudation accuracy
# Save loss/train/history of the best classifier to the variables above

print('best validation accuracy achieved: %f' % best_val_accuracy)

In [None]:
plt.figure(figsize=(15, 7))
plt.subplot(211)
plt.title("Loss")
plt.plot(loss_history)
plt.subplot(212)
plt.title("Train/validation accuracy")
plt.plot(train_history)
plt.plot(val_history)

# Как обычно, посмотрим, как наша лучшая модель работает на тестовых данных

In [None]:
test_pred = best_classifier.predict(test_X)
test_accuracy = multiclass_accuracy(test_pred, test_y)
print('Neural net test set accuracy: %f' % (test_accuracy, ))