# FUNCTION GENERATOR using Policy Gradient

Useful links:
Policy Gradient Explanation: http://karpathy.github.io/2016/05/31/rl/ <br>
Example of Policy Gradient: https://github.com/keon/policy-gradient

In [14]:
import numpy as np
from keras.models import Sequential, Model
from keras.layers import TimeDistributed, Dense, Reshape, Flatten, GRU, Input, Embedding
from keras.optimizers import Adam
from keras.layers.convolutional import Convolution2D
from PolicyGradientModel import PolicyGradientModel
from RewardCalculator import RewardCalculator

In [15]:
ALLOWED_PARAMETERS = list('XY')
ALLOWED_SYMBOLS = ALLOWED_PARAMETERS + list('0123456789+-*/#')
NUM_SYMBOLS = len(ALLOWED_SYMBOLS)
MAX_LENGTH = 2 # Max length of the output expression
CORRECT_EXPRESSION = "3*X+2*Y"

### DEFINE MODEL

In [16]:
def getModel():
    # Trying to neglect input
    input1 = Input(shape=(1,1))
    # TODO: Add noise layer to make output vary
    x = GRU(128)(input1)
    x = Dense(100, activation='relu')(x)
    x = Dense(100, activation='relu')(x)
    out = Dense(NUM_SYMBOLS, activation='softmax')(x)
    model = Model(inputs=input1, outputs=out)
    model.compile(optimizer=Adam(lr=0.00001),
                loss='categorical_crossentropy')
    return model

In [4]:
setting = []
setting.append([0.0,0.6,-0.0,0.05,-0.7]) # Converge to Number + Math Symbol

In [5]:
rewardCalculator = RewardCalculator(correctExpression=CORRECT_EXPRESSION,
                                    parameters=ALLOWED_PARAMETERS,
                                    functionDifferenceRewardWeight=0.0,
                                    compilableRewardWeight=1, 
                                    lengthRewardWeight=-0.00,
                                    foundMathSymbolWeight=0.00,
                                    foundVariableWeight=0.0,
                                    rewardOffset=0.0,
                                    usingFile=False)

In [6]:
model = getModel()
pgModel = PolicyGradientModel(model=model,
                              allowedSymbol=ALLOWED_SYMBOLS,
                              numSymbol=NUM_SYMBOLS,
                              maxLength=MAX_LENGTH,
                              rewardCalculator=rewardCalculator,
                              learningRate=0.00001,
                              fileName="Number.hdf5")

In [13]:
pgModel.train(input=np.ones((1,1,1)))

ValueError: cannot reshape array of size 68 into shape (2,17)

In [17]:
rewardCalculator = RewardCalculator(correctExpression=CORRECT_EXPRESSION,
                                    parameters=ALLOWED_PARAMETERS,
                                    functionDifferenceRewardWeight=0.0,
                                    compilableRewardWeight=0.60, 
                                    lengthRewardWeight=-0.01,
                                    foundMathSymbolWeight=0.1,
                                    foundVariableWeight=0.5,
                                    rewardOffset=-0.7,
                                    usingFile=False)

In [18]:
model = getModel()
pgModel = PolicyGradientModel(model=model,
                              allowedSymbol=ALLOWED_SYMBOLS,
                              numSymbol=NUM_SYMBOLS,
                              maxLength=MAX_LENGTH,
                              rewardCalculator=rewardCalculator,
                              learningRate=0.1,
                              fileName="Number_FoundSymbol.hdf5")

In [17]:
pgModel.loadWeight("Number_FoundSymbol.hdf5")

In [19]:
pgModel.train(input=np.ones((1,1,1)))

Epoch: 0	Loss: 3.18740239143	Example Output: 59	Example Reward:  1
[[ 0.05780873  0.05890265  0.057917    0.05993034  0.0582322   0.05772592
   0.06080284  0.05927365  0.06057513  0.05917893  0.0614829   0.05876951
   0.05900101  0.05836398  0.05662588  0.05742087  0.05798845]]
2.83267
[[-0.05780873 -0.05890265 -0.057917   -0.05993034 -0.0582322  -0.05772592
  -0.06080284  0.94072634 -0.06057513 -0.05917893 -0.0614829  -0.05876951
  -0.05900101 -0.05836398 -0.05662588 -0.05742087 -0.05798845]
 [-0.05780873 -0.05890265 -0.057917   -0.05993034 -0.0582322  -0.05772592
  -0.06080284 -0.05927365 -0.06057513 -0.05917893 -0.0614829   0.94123048
  -0.05900101 -0.05836398 -0.05662588 -0.05742087 -0.05798845]]
Saving Weight
Epoch: 1	Loss: 3.0873726368	Example Output: 01	Example Reward:  1
[[ 0.05781686  0.05886423  0.05791876  0.0599242   0.05823967  0.05774028
   0.06082724  0.05928804  0.06056385  0.05917481  0.06148875  0.05880089
   0.05898921  0.05834967  0.05662919  0.05738513  0.05799927]

Epoch: 12	Loss: 3.21496427059	Example Output: 51	Example Reward:  1
[[ 0.05779     0.05857465  0.05813979  0.06004338  0.05823864  0.0577242
   0.06099442  0.05923342  0.06074494  0.05924104  0.06140959  0.0589084
   0.05881745  0.05833099  0.05637677  0.05744695  0.05798537]]
2.83162
[[-0.05779    -0.05857465 -0.05813979 -0.06004338 -0.05823864 -0.0577242
  -0.06099442  0.94076657 -0.06074494 -0.05924104 -0.06140959 -0.0589084
  -0.05881745 -0.05833099 -0.05637677 -0.05744695 -0.05798537]
 [-0.05779    -0.05857465 -0.05813979  0.93995661 -0.05823864 -0.0577242
  -0.06099442 -0.05923342 -0.06074494 -0.05924104 -0.06140959 -0.0589084
  -0.05881745 -0.05833099 -0.05637677 -0.05744695 -0.05798537]]
Epoch: 13	Loss: 2.8040653944	Example Output: 11	Example Reward:  1
[[ 0.05779365  0.05854386  0.05813313  0.06005042  0.05825261  0.05770748
   0.06100012  0.05927437  0.0607332   0.05927424  0.0614291   0.05891396
   0.05879166  0.05831306  0.05634617  0.05745067  0.05799227]]
2.83093
[[-0.057

Epoch: 25	Loss: 2.931331563	Example Output: 65	Example Reward:  1
2.83083
[[-0.05758806 -0.05830891 -0.05816649 -0.06019774 -0.0583292  -0.05755941
  -0.06112522 -0.05935987  0.93918145 -0.05935967 -0.06169409 -0.05896595
  -0.05871514 -0.05830858 -0.05616852 -0.05742802 -0.05790658]
 [-0.05758806 -0.05830891 -0.05816649 -0.06019774 -0.0583292  -0.05755941
  -0.06112522  0.94064015 -0.06081852 -0.05935967 -0.06169409 -0.05896595
  -0.05871514 -0.05830858 -0.05616852 -0.05742802 -0.05790658]]
Epoch: 26	Loss: 2.77620587349	Example Output: +X	Example Reward:  -0.3
[[ 0.05756742  0.05828067  0.05815039  0.06020851  0.05834208  0.05753905
   0.06112196  0.05939902  0.0608572   0.05935862  0.06171291  0.0589536
   0.05871099  0.05829411  0.05617779  0.05742591  0.05789978]]
4.10767
[[ 0.28272977  0.28251582  0.28255489  0.28193745  0.28249738  0.2827383
   0.28166342  0.28218031  0.28174287  0.28219244  0.28148612  0.28231394
  -0.0176133   0.28251177  0.28314668  0.28277224  0.28263009]
 [-

Epoch: 38	Loss: 3.34166617393	Example Output: /9	Example Reward:  -0.3
[[ 0.05741126  0.05798857  0.058031    0.0604196   0.05849197  0.05738618
   0.06138813  0.05965083  0.06112216  0.05930742  0.06181812  0.05887931
   0.05863286  0.05812747  0.05613079  0.05729948  0.05791491]]
4.10762
[[ 0.28277662  0.28260344  0.28259072  0.28187412  0.28245243  0.28278416
   0.28158358  0.28210476  0.28166336  0.28220779  0.28145456  0.28233621
   0.28241014  0.28256178  0.28316078 -0.01718985  0.28262553]
 [ 0.28277662  0.28260344  0.28259072  0.28187412  0.28245243  0.28278416
   0.28158358  0.28210476  0.28166336  0.28220779  0.28145456 -0.01766379
   0.28241014  0.28256178  0.28316078  0.28281015  0.28262553]]
Epoch: 39	Loss: 3.72521317005	Example Output: -9	Example Reward:  -0.3
[[ 0.05739532  0.05796266  0.0580431   0.06042525  0.05850269  0.05737643
   0.06143842  0.05968132  0.06115255  0.05929393  0.061829    0.05886223
   0.05861625  0.0581096   0.05612183  0.0572799   0.05790951]]
4.1

Epoch: 50	Loss: 3.59792692661	Example Output: +*	Example Reward:  -0.3
[[ 0.0572955   0.05766061  0.05807195  0.06058408  0.05853423  0.0572421
   0.06166809  0.05983136  0.06145147  0.05934872  0.06177044  0.05901097
   0.05844521  0.0581207   0.05588717  0.05717047  0.05790689]]
4.10711
[[ 0.28281137  0.28270182  0.28257841  0.2818248   0.28243974  0.28282738
   0.28149959  0.28205061  0.28156456  0.28219539  0.28146887  0.28229672
  -0.01753356  0.28256381  0.28323385  0.28284886  0.28262794]
 [ 0.28281137  0.28270182  0.28257841  0.2818248   0.28243974  0.28282738
   0.28149959  0.28205061  0.28156456  0.28219539  0.28146887  0.28229672
   0.28246644  0.28256381 -0.01676615  0.28284886  0.28262794]]
Saving Weight
Epoch: 51	Loss: 3.34295127392	Example Output: 2+	Example Reward:  1
[[ 0.05728146  0.05764478  0.0581002   0.06060056  0.05855654  0.05723897
   0.06166434  0.05983455  0.06144714  0.05934155  0.06177044  0.05899799
   0.05843961  0.05810757  0.05589827  0.05717497  0.0579

Epoch: 65	Loss: 3.46943824291	Example Output: 5/	Example Reward:  1
[[ 0.05716572  0.05751665  0.05807202  0.06057373  0.05874415  0.05724277
   0.06174115  0.05987261  0.06141392  0.05946759  0.06186166  0.05907379
   0.05838486  0.05795825  0.05584958  0.05709203  0.05796959]]
2.83344
[[-0.05716572 -0.05751665 -0.05807202 -0.06057373 -0.05874415 -0.05724277
  -0.06174115  0.94012737 -0.06141392 -0.05946759 -0.06186166 -0.05907379
  -0.05838486 -0.05795825 -0.05584958 -0.05709203 -0.05796959]
 [-0.05716572 -0.05751665 -0.05807202 -0.06057373 -0.05874415 -0.05724277
  -0.06174115 -0.05987261 -0.06141392 -0.05946759 -0.06186166 -0.05907379
  -0.05838486 -0.05795825 -0.05584958  0.94290799 -0.05796959]]
Epoch: 66	Loss: 2.93166558743	Example Output: 5+	Example Reward:  1
[[ 0.05715341  0.05751086  0.05805728  0.0605786   0.05875233  0.05721539
   0.06176092  0.05988676  0.06142091  0.05948072  0.06186391  0.05908218
   0.05838025  0.05794676  0.05584059  0.0570941   0.05797508]]
2.83231
[

Epoch: 78	Loss: 3.72537064552	Example Output: 7Y	Example Reward:  -0.3
[[ 0.05695472  0.05733417  0.05814879  0.06057261  0.05881279  0.05715423
   0.06180248  0.06017637  0.06144677  0.05946877  0.06193681  0.05905347
   0.0584477   0.05792987  0.05576683  0.05704988  0.05794375]]
4.10773
[[ 0.2829136   0.28279975  0.28255537  0.28182822  0.28235617  0.28285375
   0.28145927  0.28194711  0.28156596 -0.01784063  0.28141898  0.28228396
   0.2824657   0.28262106  0.28326997  0.28288504  0.28261688]
 [ 0.2829136  -0.01720025  0.28255537  0.28182822  0.28235617  0.28285375
   0.28145927  0.28194711  0.28156596  0.28215939  0.28141898  0.28228396
   0.2824657   0.28262106  0.28326997  0.28288504  0.28261688]]
Epoch: 79	Loss: 3.59722676277	Example Output: 80	Example Reward:  1
[[ 0.05696366  0.05730571  0.05815359  0.06056957  0.05880826  0.05718829
   0.06177648  0.06017151  0.06145879  0.05946643  0.06192877  0.05906522
   0.05844565  0.0579235   0.05577555  0.05705134  0.05794765]]
2.8308

Epoch: 91	Loss: 3.21462693214	Example Output: 01	Example Reward:  1
[[ 0.05692109  0.05709353  0.05827812  0.06068261  0.05872571  0.05732111
   0.06180934  0.06009797  0.06149731  0.05943719  0.06204351  0.05915658
   0.05841158  0.05797405  0.05565169  0.05702437  0.05787428]]
2.83169
[[-0.05692109 -0.05709353  0.94172186 -0.06068261 -0.05872571 -0.05732111
  -0.06180934 -0.06009797 -0.06149731 -0.05943719 -0.06204351 -0.05915658
  -0.05841158 -0.05797405 -0.05565169 -0.05702437 -0.05787428]
 [-0.05692109 -0.05709353 -0.05827812  0.93931741 -0.05872571 -0.05732111
  -0.06180934 -0.06009797 -0.06149731 -0.05943719 -0.06204351 -0.05915658
  -0.05841158 -0.05797405 -0.05565169 -0.05702437 -0.05787428]]
Epoch: 92	Loss: 3.85193228722	Example Output: /8	Example Reward:  -0.3
[[ 0.05690696  0.05706828  0.05830667  0.06072128  0.05872631  0.05731413
   0.06182514  0.0600978   0.06148469  0.05941851  0.06207626  0.05915824
   0.05840811  0.05797698  0.05562418  0.05702215  0.05786435]]
4.1082

Epoch: 104	Loss: 3.59714803696	Example Output: 6X	Example Reward:  -0.3
[[ 0.05683789  0.05691374  0.05817541  0.0606869   0.05884589  0.05721635
   0.06206508  0.06029661  0.06141467  0.05951838  0.0621802   0.05926743
   0.05830077  0.05782996  0.05556315  0.05691371  0.05797387]]
4.10805
[[ 0.28294864  0.2829259   0.28254738  0.28179395  0.28234625  0.2828351
   0.2813805   0.28191105 -0.0184244   0.28214449  0.28134593  0.2822198
   0.28250977  0.28265101  0.28333107  0.2829259   0.28260785]
 [-0.01705137  0.2829259   0.28254738  0.28179395  0.28234625  0.2828351
   0.2813805   0.28191105  0.28157562  0.28214449  0.28134593  0.2822198
   0.28250977  0.28265101  0.28333107  0.2829259   0.28260785]]
Epoch: 105	Loss: 2.9307574749	Example Output: Y9	Example Reward:  -0.3
4.10752
[[ 0.28295359 -0.01706464  0.28254753  0.28178886  0.28233969  0.28284007
   0.28137892  0.28189841  0.28156486  0.28214818  0.28135252  0.28222418
   0.28251004  0.28265047  0.28332919  0.28292942  0.28260887]

Epoch: 117	Loss: 3.3140846014	Example Output: *8	Example Reward:  -0.3
[[ 0.05681184  0.05654747  0.0581514   0.06065277  0.05906953  0.057355
   0.06206421  0.06072376  0.06159087  0.05950268  0.06194875  0.05916818
   0.05819558  0.05775137  0.0557132   0.05675859  0.05799481]]
4.10787
[[ 0.28295645  0.28303578  0.2825546   0.28180417  0.28227916  0.28279352
   0.28138074  0.28178287  0.28152275  0.28214923  0.28141537  0.28224957
   0.28254133  0.28267461 -0.01671396  0.28297243  0.28260157]
 [ 0.28295645  0.28303578  0.2825546   0.28180417  0.28227916  0.28279352
   0.28138074  0.28178287  0.28152275  0.28214923 -0.01858462  0.28224957
   0.28254133  0.28267461  0.28328606  0.28297243  0.28260157]]
Epoch: 118	Loss: 2.96006746292	Example Output: 91	Example Reward:  1
[[ 0.05684144  0.05651702  0.0581553   0.06063341  0.05907823  0.05734807
   0.06204841  0.06072244  0.06160043  0.05952036  0.06192622  0.05920101
   0.05818176  0.05773862  0.05571634  0.05676781  0.05800311]]
2.8309


Epoch: 129	Loss: 3.21514849663	Example Output: 6-	Example Reward:  1
[[ 0.05686038  0.05626749  0.05819052  0.06065893  0.05910782  0.05755507
   0.06201214  0.06079411  0.06162446  0.05944699  0.06196143  0.05932818
   0.05812619  0.05771538  0.05570632  0.05667641  0.05796819]]
2.83134
[[-0.05686038 -0.05626749 -0.05819052 -0.06065893 -0.05910782 -0.05755507
  -0.06201214 -0.06079411  0.93837553 -0.05944699 -0.06196143 -0.05932818
  -0.05812619 -0.05771538 -0.05570632 -0.05667641 -0.05796819]
 [-0.05686038 -0.05626749 -0.05819052 -0.06065893 -0.05910782 -0.05755507
  -0.06201214 -0.06079411 -0.06162446 -0.05944699 -0.06196143 -0.05932818
  -0.05812619  0.94228464 -0.05570632 -0.05667641 -0.05796819]]
Epoch: 130	Loss: 2.93159117699	Example Output: 7+	Example Reward:  1
[[ 0.05687489  0.05623478  0.05821535  0.06062786  0.0591089   0.05757335
   0.06199509  0.06082801  0.0616226   0.05946032  0.06193446  0.05933592
   0.05811937  0.05771514  0.05570611  0.05667674  0.05797115]]
2.83278

Epoch: 143	Loss: 3.59672932625	Example Output: 8*	Example Reward:  1
[[ 0.05674872  0.05598776  0.0584011   0.06060778  0.0591395   0.05764351
   0.06194624  0.06112719  0.06166357  0.05945718  0.06191762  0.05936342
   0.05816312  0.05767968  0.05560394  0.05662642  0.05792329]]
2.83294
[[-0.05674872 -0.05598776 -0.0584011  -0.06060778 -0.0591395  -0.05764351
  -0.06194624 -0.06112719 -0.06166357 -0.05945718  0.9380824  -0.05936342
  -0.05816312 -0.05767968 -0.05560394 -0.05662642 -0.05792329]
 [-0.05674872 -0.05598776 -0.0584011  -0.06060778 -0.0591395  -0.05764351
  -0.06194624 -0.06112719 -0.06166357 -0.05945718 -0.06191762 -0.05936342
  -0.05816312 -0.05767968  0.94439608 -0.05662642 -0.05792329]]
Epoch: 144	Loss: 3.31372416019	Example Output: 32	Example Reward:  1
[[ 0.05672756  0.05597346  0.05838437  0.06062031  0.05914321  0.05762131
   0.0619765   0.06113152  0.06167398  0.05946375  0.06194419  0.05935616
   0.05815665  0.0576763   0.05560493  0.05661171  0.0579341 ]]
2.83345

Epoch: 157	Loss: 3.46954133511	Example Output: -0	Example Reward:  -0.3
[[ 0.05659558  0.05577698  0.05854966  0.06063996  0.05926347  0.05760663
   0.06219559  0.06114121  0.06162712  0.05948426  0.06203749  0.0594228
   0.0580354   0.05762872  0.05545951  0.05654833  0.05798724]]
4.10749
[[ 0.28302133  0.28326693  0.28243512  0.28180802  0.28222096  0.28271803
   0.28134134  0.28165767  0.28151187  0.28215474  0.28138876  0.28217319
   0.28258941 -0.01728862  0.28336215  0.28303552  0.28260386]
 [ 0.28302133  0.28326693 -0.0175649   0.28180802  0.28222096  0.28271803
   0.28134134  0.28165767  0.28151187  0.28215474  0.28138876  0.28217319
   0.28258941  0.28271142  0.28336215  0.28303552  0.28260386]]
Epoch: 158	Loss: 3.0587600708	Example Output: 7/	Example Reward:  1
[[ 0.05659344  0.05576177  0.0585564   0.06063965  0.05928722  0.05762683
   0.06220926  0.06114729  0.06160852  0.05947537  0.06206636  0.05942841
   0.05802908  0.05761195  0.05544627  0.05653141  0.05798074]]
2.8340

Epoch: 170	Loss: 3.21384818554	Example Output: 8+	Example Reward:  1
[[ 0.05648599  0.05541546  0.05866885  0.06069643  0.0595045   0.05754419
   0.06243131  0.0612741   0.06164774  0.05954019  0.06234943  0.05962587
   0.05791599  0.05746552  0.05519573  0.05638723  0.05785146]]
2.83042
[[-0.05648599 -0.05541546 -0.05866885 -0.06069643 -0.0595045  -0.05754419
  -0.06243131 -0.0612741  -0.06164774 -0.05954019  0.93765056 -0.05962587
  -0.05791599 -0.05746552 -0.05519573 -0.05638723 -0.05785146]
 [-0.05648599 -0.05541546 -0.05866885 -0.06069643 -0.0595045  -0.05754419
  -0.06243131 -0.0612741  -0.06164774 -0.05954019 -0.06234943 -0.05962587
   0.94208401 -0.05746552 -0.05519573 -0.05638723 -0.05785146]]
Saving Weight
Epoch: 171	Loss: 3.08479063511	Example Output: 66	Example Reward:  1
[[ 0.05647111  0.05537692  0.05865453  0.06075198  0.05950772  0.05750826
   0.06246448  0.06129581  0.06165927  0.05951918  0.06240024  0.05965451
   0.05791229  0.05746753  0.05514699  0.05637349  0.0578

Epoch: 183	Loss: 2.93036341667	Example Output: 61	Example Reward:  1
[[ 0.05633254  0.05519662  0.05879078  0.06067379  0.05952966  0.05751095
   0.06244337  0.0613489   0.06184807  0.05963289  0.06236072  0.05968394
   0.05782227  0.05748817  0.05517496  0.05638712  0.0577753 ]]
2.82846
[[-0.05633254 -0.05519662 -0.05879078 -0.06067379 -0.05952966 -0.05751095
  -0.06244337 -0.0613489   0.93815196 -0.05963289 -0.06236072 -0.05968394
  -0.05782227 -0.05748817 -0.05517496 -0.05638712 -0.0577753 ]
 [-0.05633254 -0.05519662 -0.05879078  0.93932623 -0.05952966 -0.05751095
  -0.06244337 -0.0613489  -0.06184807 -0.05963289 -0.06236072 -0.05968394
  -0.05782227 -0.05748817 -0.05517496 -0.05638712 -0.0577753 ]]
Epoch: 184	Loss: 3.31331634521	Example Output: Y7	Example Reward:  -0.3
[[ 0.05632194  0.05517925  0.05878783  0.06069207  0.05954798  0.057502
   0.06245599  0.06135222  0.06189439  0.05964044  0.06235041  0.05967017
   0.05780359  0.05747233  0.05517465  0.05637974  0.05777502]]
4.1070

Epoch: 196	Loss: 3.46817109585	Example Output: 57	Example Reward:  1
[[ 0.05625069  0.05488254  0.05882941  0.06061311  0.0598254   0.0573511
   0.0626532   0.06159956  0.06182717  0.05975447  0.06252911  0.05989565
   0.05768493  0.05731544  0.05495427  0.05628226  0.0577517 ]]
2.82934
[[-0.05625069 -0.05488254 -0.05882941 -0.06061311 -0.0598254  -0.0573511
  -0.0626532   0.93840045 -0.06182717 -0.05975447 -0.06252911 -0.05989565
  -0.05768493 -0.05731544 -0.05495427 -0.05628226 -0.0577517 ]
 [-0.05625069 -0.05488254 -0.05882941 -0.06061311 -0.0598254  -0.0573511
  -0.0626532  -0.06159956 -0.06182717  0.94024551 -0.06252911 -0.05989565
  -0.05768493 -0.05731544 -0.05495427 -0.05628226 -0.0577517 ]]
Epoch: 197	Loss: 3.59648790359	Example Output: Y7	Example Reward:  -0.3
[[ 0.05624766  0.05485922  0.05880417  0.06063627  0.05981889  0.05735222
   0.06266198  0.0616124   0.06184186  0.05976027  0.06256904  0.05990159
   0.05766002  0.05729986  0.05494659  0.05628147  0.05774644]]
4.10695

Epoch: 210	Loss: 3.08720374107	Example Output: 9	Example Reward:  1
[[ 0.05618438  0.0546153   0.05881972  0.06070331  0.05988165  0.05741549
   0.06272168  0.06163013  0.06185081  0.05972978  0.062689    0.06001255
   0.05758084  0.05726456  0.0548906   0.05624948  0.05776071]]
2.8323
[[-0.05618438 -0.0546153  -0.05881972 -0.06070331 -0.05988165 -0.05741549
  -0.06272168 -0.06163013 -0.06185081 -0.05972978 -0.062689    0.93998742
  -0.05758084 -0.05726456 -0.0548906  -0.05624948 -0.05776071]
 [-0.05618438 -0.0546153  -0.05881972 -0.06070331 -0.05988165 -0.05741549
  -0.06272168 -0.06163013 -0.06185081 -0.05972978 -0.062689   -0.06001255
  -0.05758084 -0.05726456 -0.0548906  -0.05624948  0.94223928]]
Saving Weight
Epoch: 211	Loss: 3.2143435955	Example Output: 3X	Example Reward:  -0.3
[[ 0.05618666  0.05460017  0.05884548  0.06072089  0.05989621  0.05743974
   0.06269713  0.06161308  0.06184989  0.05972818  0.06267025  0.06001702
   0.05759992  0.05723713  0.05489263  0.05624368  0.0577

Epoch: 225	Loss: 3.46947870255	Example Output: 17	Example Reward:  1
[[ 0.05606614  0.05441251  0.05899288  0.06095546  0.0599965   0.05751178
   0.06265862  0.06167829  0.06188586  0.05958942  0.06274801  0.05999243
   0.05769933  0.05711089  0.05476984  0.05620888  0.0577231 ]]
2.82992
[[-0.05606614 -0.05441251 -0.05899288  0.93904454 -0.0599965  -0.05751178
  -0.06265862 -0.06167829 -0.06188586 -0.05958942 -0.06274801 -0.05999243
  -0.05769933 -0.05711089 -0.05476984 -0.05620888 -0.0577231 ]
 [-0.05606614 -0.05441251 -0.05899288 -0.06095546 -0.0599965  -0.05751178
  -0.06265862 -0.06167829 -0.06188586  0.94041055 -0.06274801 -0.05999243
  -0.05769933 -0.05711089 -0.05476984 -0.05620888 -0.0577231 ]]
Epoch: 226	Loss: 2.95732741356	Example Output: 5	Example Reward:  1
[[ 0.05606559  0.05438776  0.05898604  0.06096098  0.05999091  0.05749947
   0.06267648  0.06168304  0.06190256  0.05960904  0.06275594  0.06002412
   0.05770058  0.0571099   0.05474201  0.05619084  0.05771472]]
2.83092


Epoch: 240	Loss: 2.52026188374	Example Output: 12	Example Reward:  1
[[ 0.05589535  0.05426162  0.05918112  0.06106437  0.06012096  0.05749587
   0.06279095  0.06180084  0.06201307  0.05952911  0.06272469  0.06008609
   0.05772686  0.05696177  0.05460652  0.05609997  0.05764085]]
2.82932
[[-0.05589535 -0.05426162 -0.05918112  0.93893564 -0.06012096 -0.05749587
  -0.06279095 -0.06180084 -0.06201307 -0.05952911 -0.06272469 -0.06008609
  -0.05772686 -0.05696177 -0.05460652 -0.05609997 -0.05764085]
 [-0.05589535 -0.05426162 -0.05918112 -0.06106437  0.93987906 -0.05749587
  -0.06279095 -0.06180084 -0.06201307 -0.05952911 -0.06272469 -0.06008609
  -0.05772686 -0.05696177 -0.05460652 -0.05609997 -0.05764085]]
Saving Weight
Epoch: 241	Loss: 3.3405806303	Example Output: /Y	Example Reward:  -0.3
[[ 0.05589139  0.0542563   0.05916589  0.06107996  0.06014722  0.05747787
   0.06279618  0.06181145  0.06204759  0.05954035  0.06270457  0.06008824
   0.05771666  0.05693257  0.05460681  0.05610329  0.05

Epoch: 254	Loss: 3.31272988319	Example Output: 0X	Example Reward:  -0.3
[[ 0.05561831  0.05413128  0.05925091  0.06123498  0.06026285  0.05738106
   0.06305945  0.06172478  0.06213412  0.05951634  0.06303331  0.06021743
   0.05770003  0.056919    0.05432269  0.05596925  0.05752419]]
4.1069
[[ 0.28331453  0.28376064 -0.01777527  0.28162953  0.28192115  0.28278571
   0.28108218  0.28148258  0.28135976  0.28214511  0.28109002  0.28193477
   0.28268999  0.28292432  0.28370321  0.28320923  0.28274274]
 [-0.01668549  0.28376064  0.28222474  0.28162953  0.28192115  0.28278571
   0.28108218  0.28148258  0.28135976  0.28214511  0.28109002  0.28193477
   0.28268999  0.28292432  0.28370321  0.28320923  0.28274274]]
Epoch: 255	Loss: 3.46843354702	Example Output: 1/	Example Reward:  1
[[ 0.05559363  0.05412526  0.05926022  0.06126183  0.06025787  0.05735606
   0.06308334  0.06170264  0.06214594  0.05952265  0.06305933  0.06024453
   0.05771248  0.05691531  0.0542808   0.05596243  0.05751559]]
2.832

Epoch: 269	Loss: 3.08561053276	Example Output: 86	Example Reward:  1
[[ 0.0553325   0.053931    0.05935964  0.06140625  0.06038111  0.05736837
   0.06318592  0.06185817  0.0623349   0.05953239  0.06316793  0.0602047
   0.05772502  0.05674626  0.05410109  0.05589726  0.05746745]]
2.82562
[[-0.0553325  -0.053931   -0.05935964 -0.06140625 -0.06038111 -0.05736837
  -0.06318592 -0.06185817 -0.0623349  -0.05953239  0.93683207 -0.0602047
  -0.05772502 -0.05674626 -0.05410109 -0.05589726 -0.05746745]
 [-0.0553325  -0.053931   -0.05935964 -0.06140625 -0.06038111 -0.05736837
  -0.06318592 -0.06185817  0.9376651  -0.05953239 -0.06316793 -0.0602047
  -0.05772502 -0.05674626 -0.05410109 -0.05589726 -0.05746745]]
Epoch: 270	Loss: 3.46780080795	Example Output: -*	Example Reward:  -0.3
[[ 0.05530792  0.05390826  0.05938072  0.06138771  0.0604192   0.05733382
   0.06322889  0.06186413  0.06232244  0.05956795  0.06320869  0.06022559
   0.05771181  0.05673414  0.05405881  0.05588261  0.05745737]]
4.10577

Epoch: 282	Loss: 3.46757605076	Example Output: /+	Example Reward:  -0.3
[[ 0.05522611  0.05366869  0.0594138   0.06128351  0.06071426  0.05715267
   0.06343097  0.0621168   0.0622437   0.05980778  0.06329376  0.06036586
   0.05761775  0.0565477   0.05397453  0.05574911  0.05739301]]
4.10641
[[ 0.28343219  0.2838994   0.28217587  0.28161496  0.28178573  0.2828542
   0.28097072  0.28136498  0.28132689  0.28205767  0.28101188  0.28189024
   0.28271469  0.2830357   0.28380767 -0.01672473  0.28278211]
 [ 0.28343219  0.2838994   0.28217587  0.28161496  0.28178573  0.2828542
   0.28097072  0.28136498  0.28132689  0.28205767  0.28101188  0.28189024
  -0.01728532  0.2830357   0.28380767  0.28327528  0.28278211]]
Epoch: 283	Loss: 3.34131758213	Example Output: 14	Example Reward:  1
[[ 0.05522657  0.05366189  0.05939857  0.06129453  0.06071306  0.05715409
   0.06342552  0.06211582  0.06230108  0.05983474  0.06325974  0.06035714
   0.05758401  0.05652975  0.05398656  0.05576608  0.05739081]]
2.8261

Epoch: 295	Loss: 2.92945020199	Example Output: 09	Example Reward:  1
2.83011
[[-0.05511848 -0.05354912  0.94052702 -0.06124485 -0.06075987 -0.057209
  -0.06334106 -0.06220642 -0.06240389 -0.05990652 -0.06329005 -0.06036351
  -0.05762442 -0.05647141 -0.05398247 -0.05574775 -0.05730818]
 [-0.05511848 -0.05354912 -0.059473   -0.06124485 -0.06075987 -0.057209
  -0.06334106 -0.06220642 -0.06240389 -0.05990652 -0.06329005  0.93963647
  -0.05762442 -0.05647141 -0.05398247 -0.05574775 -0.05730818]]
Epoch: 296	Loss: 2.39157276154	Example Output: 29	Example Reward:  1
[[ 0.05511153  0.05353374  0.05951167  0.06123419  0.06078359  0.0572041
   0.06335082  0.06222348  0.06240527  0.05990577  0.06328043  0.06035688
   0.05762063  0.05644841  0.05398523  0.05574406  0.05730023]]
2.82902
[[-0.05511153 -0.05353374 -0.05951167 -0.06123419  0.93921638 -0.0572041
  -0.06335082 -0.06222348 -0.06240527 -0.05990577 -0.06328043 -0.06035688
  -0.05762063 -0.05644841 -0.05398523 -0.05574406 -0.05730023]
 [-0.0

Epoch: 310	Loss: 3.08605852127	Example Output: 2	Example Reward:  1
[[ 0.05500153  0.05332578  0.05962673  0.06146799  0.06081988  0.05717739
   0.06358634  0.06216557  0.06258754  0.05999021  0.0632996   0.060376
   0.05747148  0.0564153   0.05382092  0.05563728  0.05723041]]
2.83156
[[-0.05500153 -0.05332578 -0.05962673 -0.06146799  0.93918014 -0.05717739
  -0.06358634 -0.06216557 -0.06258754 -0.05999021 -0.0632996  -0.060376
  -0.05747148 -0.0564153  -0.05382092 -0.05563728 -0.05723041]
 [-0.05500153 -0.05332578 -0.05962673 -0.06146799 -0.06081988 -0.05717739
  -0.06358634 -0.06216557 -0.06258754 -0.05999021 -0.0632996  -0.060376
  -0.05747148 -0.0564153  -0.05382092 -0.05563728  0.94276959]]
Saving Weight
Epoch: 311	Loss: 3.1841054678	Example Output: Y0	Example Reward:  -0.3
[[ 0.05498534  0.05331193  0.05963596  0.06146282  0.06084441  0.05717662
   0.06358977  0.06215712  0.06257535  0.05999556  0.06333315  0.06038529
   0.05746073  0.05639898  0.05381425  0.05564201  0.05723071]

Epoch: 323	Loss: 3.0848454237	Example Output: 91	Example Reward:  1
[[ 0.05478328  0.05308982  0.05971002  0.06147428  0.06110983  0.05709766
   0.06374492  0.0623624   0.06259193  0.06011052  0.06340613  0.06039757
   0.05744237  0.0562408   0.05368179  0.05558652  0.05717009]]
2.82823
[[-0.05478328 -0.05308982 -0.05971002 -0.06147428 -0.06110983 -0.05709766
  -0.06374492 -0.0623624  -0.06259193 -0.06011052 -0.06340613  0.93960243
  -0.05744237 -0.0562408  -0.05368179 -0.05558652 -0.05717009]
 [-0.05478328 -0.05308982 -0.05971002  0.93852574 -0.06110983 -0.05709766
  -0.06374492 -0.0623624  -0.06259193 -0.06011052 -0.06340613 -0.06039757
  -0.05744237 -0.0562408  -0.05368179 -0.05558652 -0.05717009]]
Epoch: 324	Loss: 2.93027057648	Example Output: Y5	Example Reward:  -0.3
[[ 0.05477349  0.0530578   0.05969473  0.06149561  0.06112734  0.05711155
   0.06376872  0.06241414  0.06258178  0.06007825  0.06341527  0.06039888
   0.0574549   0.05622004  0.05368502  0.05556465  0.05715784]]
4.106

Epoch: 335	Loss: 3.05744724274	Example Output: Y5	Example Reward:  -0.3
[[ 0.05462969  0.05281568  0.05964245  0.06156749  0.06116391  0.05700601
   0.06396887  0.06256503  0.0626353   0.06020082  0.06361036  0.06066271
   0.05739073  0.05610991  0.05343184  0.05547671  0.05712245]]
4.10666
[[ 0.28361112 -0.0158447   0.28210729  0.28152975  0.28165084  0.28289822
   0.28080934  0.28123051  0.28120941  0.28193977  0.2809169   0.28180119
   0.28278279  0.28316703  0.28397045  0.28335699  0.28286326]
 [ 0.28361112  0.28415531  0.28210729  0.28152975  0.28165084  0.28289822
   0.28080934 -0.01876951  0.28120941  0.28193977  0.2809169   0.28180119
   0.28278279  0.28316703  0.28397045  0.28335699  0.28286326]]
Epoch: 336	Loss: 3.4673112154	Example Output: 2X	Example Reward:  -0.3
[[ 0.05461307  0.05279489  0.05962507  0.0615912   0.06116452  0.05698071
   0.06401481  0.06257725  0.06264009  0.06019012  0.06364448  0.06066278
   0.05737548  0.0561106   0.05340752  0.05548543  0.05712197]]
4.

Epoch: 350	Loss: 3.21111855507	Example Output: 01	Example Reward:  1
[[ 0.05447148  0.05264085  0.05947247  0.06178058  0.06123894  0.05690378
   0.06411343  0.06264938  0.06266516  0.06020408  0.06377627  0.06078648
   0.05727375  0.05611902  0.05329271  0.05548487  0.05712678]]
2.82854
[[-0.05447148 -0.05264085  0.94052756 -0.06178058 -0.06123894 -0.05690378
  -0.06411343 -0.06264938 -0.06266516 -0.06020408 -0.06377627 -0.06078648
  -0.05727375 -0.05611902 -0.05329271 -0.05548487 -0.05712678]
 [-0.05447148 -0.05264085 -0.05947247  0.93821943 -0.06123894 -0.05690378
  -0.06411343 -0.06264938 -0.06266516 -0.06020408 -0.06377627 -0.06078648
  -0.05727375 -0.05611902 -0.05329271 -0.05548487 -0.05712678]]
Saving Weight
Epoch: 351	Loss: 2.95572462082	Example Output: 40	Example Reward:  1
[[ 0.05444477  0.05261461  0.05948663  0.06179095  0.0612575   0.05687173
   0.06413937  0.06266609  0.06269503  0.06021815  0.06380028  0.06081203
   0.05726144  0.05610286  0.05325062  0.05548022  0.0571

Epoch: 362	Loss: 2.80111284256	Example Output: 1/	Example Reward:  1
[[ 0.05437353  0.05242969  0.05961559  0.06171323  0.06145919  0.05708471
   0.06409712  0.06288911  0.06255298  0.06022962  0.06386119  0.06088498
   0.05724293  0.05592932  0.0531968   0.055427    0.05701305]]
2.83205
[[-0.05437353 -0.05242969 -0.05961559  0.93828678 -0.06145919 -0.05708471
  -0.06409712 -0.06288911 -0.06255298 -0.06022962 -0.06386119 -0.06088498
  -0.05724293 -0.05592932 -0.0531968  -0.055427   -0.05701305]
 [-0.05437353 -0.05242969 -0.05961559 -0.06171323 -0.06145919 -0.05708471
  -0.06409712 -0.06288911 -0.06255298 -0.06022962 -0.06386119 -0.06088498
  -0.05724293 -0.05592932 -0.0531968   0.94457299 -0.05701305]]
Epoch: 363	Loss: 3.34009892941	Example Output: 46	Example Reward:  1
[[ 0.0543653   0.05241784  0.05961275  0.06171261  0.06147045  0.05708146
   0.06410734  0.06290058  0.0625454   0.06025442  0.06385175  0.06089287
   0.05724412  0.05591967  0.05318232  0.05542462  0.05701647]]
2.8241


Epoch: 375	Loss: 3.33854382038	Example Output: 36	Example Reward:  1
[[ 0.05426853  0.05225599  0.05974423  0.06169071  0.06159509  0.05727082
   0.06411537  0.06305813  0.06252773  0.06020162  0.06386868  0.0608803
   0.05721502  0.05582456  0.053197    0.05529124  0.05699496]]
2.8297
[[-0.05426853 -0.05225599 -0.05974423 -0.06169071 -0.06159509  0.94272918
  -0.06411537 -0.06305813 -0.06252773 -0.06020162 -0.06386868 -0.0608803
  -0.05721502 -0.05582456 -0.053197   -0.05529124 -0.05699496]
 [-0.05426853 -0.05225599 -0.05974423 -0.06169071 -0.06159509 -0.05727082
  -0.06411537 -0.06305813  0.93747228 -0.06020162 -0.06386868 -0.0608803
  -0.05721502 -0.05582456 -0.053197   -0.05529124 -0.05699496]]
Epoch: 376	Loss: 3.46718239784	Example Output: 04	Example Reward:  1
[[ 0.05426054  0.05224304  0.05975311  0.06171314  0.06160062  0.05728335
   0.06412656  0.06306443  0.06254251  0.06018616  0.06387769  0.06086662
   0.0571954   0.05581102  0.05319941  0.05529173  0.05698461]]
2.82631
[[-

Epoch: 387	Loss: 3.59524073601	Example Output: 14	Example Reward:  1
[[ 0.05405968  0.0520698   0.05988584  0.06192337  0.06170054  0.05722711
   0.06430241  0.06316587  0.06249008  0.06004303  0.06424002  0.06080692
   0.05723595  0.05579941  0.05304426  0.05518321  0.05682257]]
2.82428
[[-0.05405968 -0.0520698  -0.05988584  0.93807662 -0.06170054 -0.05722711
  -0.06430241 -0.06316587 -0.06249008 -0.06004303 -0.06424002 -0.06080692
  -0.05723595 -0.05579941 -0.05304426 -0.05518321 -0.05682257]
 [-0.05405968 -0.0520698  -0.05988584 -0.06192337 -0.06170054 -0.05722711
   0.93569762 -0.06316587 -0.06249008 -0.06004303 -0.06424002 -0.06080692
  -0.05723595 -0.05579941 -0.05304426 -0.05518321 -0.05682257]]
Epoch: 388	Loss: 3.33818974495	Example Output: -3	Example Reward:  -0.3
[[ 0.05404594  0.05205309  0.05987593  0.06192891  0.06170234  0.05722589
   0.06432507  0.06317049  0.06247045  0.06004956  0.06427363  0.06084067
   0.05723453  0.05579171  0.05302962  0.05516475  0.05681736]]
4.10

Epoch: 399	Loss: 3.18534624577	Example Output: YX	Example Reward:  -0.3
[[ 0.05402318  0.0519297   0.06001001  0.06182595  0.06182925  0.05731104
   0.06418175  0.06326044  0.06236549  0.06016639  0.06425645  0.06099215
   0.05731099  0.05570094  0.05308169  0.05502163  0.05673293]]
4.10403
[[ 0.28379306 -0.01557891  0.281997    0.28145224  0.28145123  0.28280669
   0.28074548  0.28102189  0.28129038  0.28195009  0.28072309  0.28170237
   0.28280672  0.28328973  0.2840755   0.28349352  0.28298011]
 [-0.01620696  0.28442109  0.281997    0.28145224  0.28145123  0.28280669
   0.28074548  0.28102189  0.28129038  0.28195009  0.28072309  0.28170237
   0.28280672  0.28328973  0.2840755   0.28349352  0.28298011]]
Epoch: 400	Loss: 3.46746079922	Example Output: /3	Example Reward:  -0.3
[[ 0.05400873  0.0519162   0.06001195  0.06182456  0.06188084  0.05730454
   0.064175    0.06327529  0.06236443  0.06016901  0.06424198  0.06098603
   0.05732667  0.05569429  0.05307313  0.05501049  0.05673689]]
4

Epoch: 412	Loss: 2.80004575253	Example Output: 76	Example Reward:  1
[[ 0.05389863  0.05176745  0.06003027  0.06182213  0.06204608  0.05727369
   0.06427971  0.0633227   0.06254512  0.06023247  0.06424574  0.06106884
   0.05730404  0.05567521  0.05290992  0.05489932  0.05667871]]
2.82692
[[-0.05389863 -0.05176745 -0.06003027 -0.06182213 -0.06204608 -0.05727369
  -0.06427971 -0.0633227  -0.06254512  0.93976754 -0.06424574 -0.06106884
  -0.05730404 -0.05567521 -0.05290992 -0.05489932 -0.05667871]
 [-0.05389863 -0.05176745 -0.06003027 -0.06182213 -0.06204608 -0.05727369
  -0.06427971 -0.0633227   0.93745488 -0.06023247 -0.06424574 -0.06106884
  -0.05730404 -0.05567521 -0.05290992 -0.05489932 -0.05667871]]
Epoch: 413	Loss: 2.67361192703	Example Output: 1	Example Reward:  1
[[ 0.05386509  0.05175605  0.0600269   0.06186919  0.06204012  0.05723844
   0.06429758  0.06330464  0.06258339  0.06025125  0.06427278  0.06107412
   0.05729019  0.05569346  0.05286757  0.05490906  0.05666018]]
2.83051


Epoch: 427	Loss: 3.72341725826	Example Output: *8	Example Reward:  -0.3
[[ 0.05370889  0.05168136  0.06014252  0.06197087  0.06206861  0.0573418
   0.06425472  0.06317896  0.06271709  0.06042585  0.06428912  0.06109933
   0.05723457  0.05559983  0.05274967  0.05490302  0.05663382]]
4.10679
[[ 0.28388733  0.28449562  0.28195727  0.28140876  0.28137943  0.28279746
   0.2807236   0.28104633  0.28118488  0.28187224  0.28071329  0.28167021
   0.28282964  0.28332007 -0.0158249   0.2835291   0.28300986]
 [ 0.28388733  0.28449562  0.28195727  0.28140876  0.28137943  0.28279746
   0.2807236   0.28104633  0.28118488  0.28187224 -0.01928674  0.28167021
   0.28282964  0.28332007  0.2841751   0.2835291   0.28300986]]
Epoch: 428	Loss: 2.51825027466	Example Output: *6	Example Reward:  -0.3
[[ 0.05370738  0.05168141  0.06017155  0.06195748  0.06207271  0.05736251
   0.06423958  0.06316695  0.06270853  0.06043152  0.06428736  0.06111887
   0.05724018  0.05559413  0.05273838  0.05489268  0.05662881]]
4.

Epoch: 441	Loss: 3.21404936314	Example Output: 43	Example Reward:  1
[[ 0.05367177  0.05150864  0.06024332  0.06196391  0.06210941  0.05757636
   0.06417776  0.06320101  0.06266472  0.06049788  0.06440995  0.06140578
   0.05723693  0.0554981   0.05256293  0.05467877  0.05659281]]
2.82775
[[-0.05367177 -0.05150864 -0.06024332 -0.06196391 -0.06210941 -0.05757636
   0.93582225 -0.06320101 -0.06266472 -0.06049788 -0.06440995 -0.06140578
  -0.05723693 -0.0554981  -0.05256293 -0.05467877 -0.05659281]
 [-0.05367177 -0.05150864 -0.06024332 -0.06196391 -0.06210941  0.94242364
  -0.06417776 -0.06320101 -0.06266472 -0.06049788 -0.06440995 -0.06140578
  -0.05723693 -0.0554981  -0.05256293 -0.05467877 -0.05659281]]
Epoch: 442	Loss: 3.08187768459	Example Output: 95	Example Reward:  1
[[ 0.05366813  0.0515003   0.06024463  0.06195062  0.062152    0.05758205
   0.06418462  0.06320457  0.06264767  0.06051296  0.06440885  0.06142138
   0.05722443  0.05548454  0.05254975  0.05466779  0.05659575]]
2.82528

Epoch: 454	Loss: 3.18325984478	Example Output: X2	Example Reward:  -0.3
[[ 0.05356918  0.05121465  0.06013959  0.0619994   0.06224412  0.05757004
   0.06440406  0.06348479  0.06284394  0.06059003  0.06446467  0.06161162
   0.05713102  0.05537855  0.05236664  0.05441467  0.05657297]]
4.10642
[[-0.01607075  0.28463563  0.28195813  0.2814002   0.28132677  0.282729
   0.28067878  0.28095457  0.28114682  0.28182301  0.2806606   0.28151652
   0.28286073  0.28338644  0.28429002  0.28367561  0.28302813]
 [ 0.28392926  0.28463563  0.28195813  0.2814002  -0.01867324  0.282729
   0.28067878  0.28095457  0.28114682  0.28182301  0.2806606   0.28151652
   0.28286073  0.28338644  0.28429002  0.28367561  0.28302813]]
Epoch: 455	Loss: 3.08153820038	Example Output: 8X	Example Reward:  -0.3
[[ 0.05354652  0.05117681  0.06013283  0.06200344  0.06226341  0.05757119
   0.06442675  0.06351522  0.06284367  0.06057159  0.0645235   0.06163332
   0.05713397  0.05537025  0.05234528  0.05438333  0.05655879]]
4.106

Epoch: 466	Loss: 3.3117235899	Example Output: 62	Example Reward:  1
[[ 0.05345203  0.05101365  0.06007466  0.06200608  0.06242928  0.05768402
   0.06440456  0.06365206  0.06289733  0.06052749  0.06464006  0.06168615
   0.05704942  0.0552715   0.05232612  0.05423088  0.05665464]]
2.82445
[[-0.05345203 -0.05101365 -0.06007466 -0.06200608 -0.06242928 -0.05768402
  -0.06440456 -0.06365206  0.93710268 -0.06052749 -0.06464006 -0.06168615
  -0.05704942 -0.0552715  -0.05232612 -0.05423088 -0.05665464]
 [-0.05345203 -0.05101365 -0.06007466 -0.06200608  0.93757069 -0.05768402
  -0.06440456 -0.06365206 -0.06289733 -0.06052749 -0.06464006 -0.06168615
  -0.05704942 -0.0552715  -0.05232612 -0.05423088 -0.05665464]]
Epoch: 467	Loss: 3.46626257896	Example Output: -6	Example Reward:  -0.3
[[ 0.05345014  0.05100533  0.06006376  0.06202809  0.06245142  0.05769866
   0.06439815  0.06364162  0.06294107  0.0605211   0.06463829  0.06166385
   0.05702676  0.05525198  0.05234528  0.05422134  0.05665313]]
4.107

Epoch: 478	Loss: 3.593815732	Example Output: 60	Example Reward:  1
[[ 0.05336626  0.05098645  0.06010186  0.06216826  0.06243809  0.05778325
   0.06436218  0.06369717  0.06311442  0.06050184  0.06462741  0.06149984
   0.05695391  0.05521617  0.05234143  0.05420619  0.0566353 ]]
2.82615
[[-0.05336626 -0.05098645 -0.06010186 -0.06216826 -0.06243809 -0.05778325
  -0.06436218 -0.06369717  0.9368856  -0.06050184 -0.06462741 -0.06149984
  -0.05695391 -0.05521617 -0.05234143 -0.05420619 -0.0566353 ]
 [-0.05336626 -0.05098645  0.93989813 -0.06216826 -0.06243809 -0.05778325
  -0.06436218 -0.06369717 -0.06311442 -0.06050184 -0.06462741 -0.06149984
  -0.05695391 -0.05521617 -0.05234143 -0.05420619 -0.0566353 ]]
Epoch: 479	Loss: 2.92878563404	Example Output: 9Y	Example Reward:  -0.3
[[ 0.05334559  0.05097846  0.0601014   0.06217019  0.06243606  0.0577802
   0.064367    0.06369624  0.06314496  0.06053451  0.06463499  0.06149286
   0.05694302  0.0552206   0.05232297  0.05420082  0.05663014]]
4.10543

Epoch: 491	Loss: 2.95561814308	Example Output: 5/	Example Reward:  1
[[ 0.05311405  0.05075991  0.06022148  0.06216922  0.06244846  0.05779365
   0.06456571  0.06374303  0.0633704   0.06054443  0.06478607  0.061605
   0.05680069  0.05525921  0.05213869  0.05409873  0.05658134]]
2.83078
[[-0.05311405 -0.05075991 -0.06022148 -0.06216922 -0.06244846 -0.05779365
  -0.06456571  0.936257   -0.0633704  -0.06054443 -0.06478607 -0.061605
  -0.05680069 -0.05525921 -0.05213869 -0.05409873 -0.05658134]
 [-0.05311405 -0.05075991 -0.06022148 -0.06216922 -0.06244846 -0.05779365
  -0.06456571 -0.06374303 -0.0633704  -0.06054443 -0.06478607 -0.061605
  -0.05680069 -0.05525921 -0.05213869  0.94590127 -0.05658134]]
Epoch: 492	Loss: 3.05510766506	Example Output: 7Y	Example Reward:  -0.3
[[ 0.05310006  0.05072175  0.06022854  0.0621563   0.06249379  0.05780752
   0.06454652  0.06378581  0.06335631  0.06054285  0.06482837  0.0615989
   0.05678927  0.05523669  0.05214772  0.05409408  0.05656557]]
4.10504
[[ 

Epoch: 505	Loss: 2.80318522453	Example Output: 1	Example Reward:  1
2.82964
[[-0.05291923 -0.05051884 -0.06015487  0.93776637 -0.06254749 -0.05780144
  -0.06462221 -0.06390496 -0.06338721 -0.06056404 -0.06504386 -0.06164679
  -0.05676729 -0.05518056 -0.05211832 -0.05403317 -0.05655608]
 [-0.05291923 -0.05051884 -0.06015487 -0.06223361 -0.06254749 -0.05780144
  -0.06462221 -0.06390496 -0.06338721 -0.06056404 -0.06504386 -0.06164679
  -0.05676729 -0.05518056 -0.05211832 -0.05403317  0.94344389]]
Epoch: 506	Loss: 2.8017383337	Example Output: /8	Example Reward:  -0.3
[[ 0.0529182   0.05053563  0.06017455  0.06225238  0.06253304  0.05781545
   0.06460439  0.06387688  0.06337537  0.06055714  0.06503218  0.06163529
   0.05677577  0.05517907  0.05212375  0.05405582  0.05655508]]
4.10703
[[ 0.28412455  0.28483933  0.28194764  0.2813243   0.28124011  0.28265539
   0.2806187   0.28083694  0.28098741  0.28183287  0.28049037  0.28150943
   0.2829673   0.28344628  0.28436288 -0.01621675  0.28303349]

Epoch: 518	Loss: 3.46527209282	Example Output: 47	Example Reward:  1
[[ 0.05285997  0.05033274  0.06031444  0.06223392  0.06256858  0.05790289
   0.06465124  0.06400225  0.06329927  0.06064779  0.06524143  0.0618654
   0.05665085  0.0550744   0.05191976  0.05395528  0.05647987]]
2.82413
[[-0.05285997 -0.05033274 -0.06031444 -0.06223392 -0.06256858 -0.05790289
   0.93534875 -0.06400225 -0.06329927 -0.06064779 -0.06524143 -0.0618654
  -0.05665085 -0.0550744  -0.05191976 -0.05395528 -0.05647987]
 [-0.05285997 -0.05033274 -0.06031444 -0.06223392 -0.06256858 -0.05790289
  -0.06465124 -0.06400225 -0.06329927  0.93935221 -0.06524143 -0.0618654
  -0.05665085 -0.0550744  -0.05191976 -0.05395528 -0.05647987]]
Epoch: 519	Loss: 2.80025832653	Example Output: 37	Example Reward:  1
[[ 0.05283982  0.05031204  0.06030197  0.06225118  0.06257423  0.05789908
   0.06467942  0.06401181  0.06331902  0.06066393  0.06526201  0.06189129
   0.05662861  0.0550639   0.05188779  0.05394617  0.0564677 ]]
2.82961
[[

Epoch: 531	Loss: 3.33859374523	Example Output: -5	Example Reward:  -0.3
[[ 0.05273332  0.05029067  0.06034423  0.06248924  0.06254587  0.0580297
   0.06468072  0.06383418  0.06355567  0.06077445  0.06520891  0.06187595
   0.05648298  0.05498507  0.05175888  0.05397771  0.05643248]]
4.10691
[[ 0.28418002  0.28491282  0.28189674  0.28125325  0.28123623  0.2825911
   0.28059581  0.28084975  0.28093332  0.28176767  0.28043735  0.28143722
   0.28305513 -0.01649552  0.28447235  0.28380668  0.28307027]
 [ 0.28418002  0.28491282  0.28189674  0.28125325  0.28123623  0.2825911
   0.28059581 -0.01915026  0.28093332  0.28176767  0.28043735  0.28143722
   0.28305513  0.28350449  0.28447235  0.28380668  0.28307027]]
Epoch: 532	Loss: 2.82867994308	Example Output: 62	Example Reward:  1
[[ 0.05273773  0.05028636  0.06035627  0.06251963  0.06253675  0.05805809
   0.06466076  0.06380999  0.06358638  0.06076411  0.06520192  0.06188145
   0.0564658   0.05496202  0.05177068  0.05398361  0.05641837]]
2.82336

Epoch: 545	Loss: 2.92760570049	Example Output: 71	Example Reward:  1
[[ 0.05267825  0.05017938  0.06031903  0.06259388  0.0625746   0.05807161
   0.06479966  0.06388788  0.06363359  0.06081325  0.06522558  0.06191206
   0.05642509  0.05498085  0.0516567   0.053892    0.05635661]]
2.82547
[[-0.05267825 -0.05017938 -0.06031903 -0.06259388 -0.0625746  -0.05807161
  -0.06479966 -0.06388788 -0.06363359  0.93918675 -0.06522558 -0.06191206
  -0.05642509 -0.05498085 -0.0516567  -0.053892   -0.05635661]
 [-0.05267825 -0.05017938 -0.06031903  0.93740612 -0.0625746  -0.05807161
  -0.06479966 -0.06388788 -0.06363359 -0.06081325 -0.06522558 -0.06191206
  -0.05642509 -0.05498085 -0.0516567  -0.053892   -0.05635661]]
Epoch: 546	Loss: 3.33884804249	Example Output: 11	Example Reward:  1
[[ 0.05266932  0.05018725  0.06032303  0.06262735  0.06255432  0.05809798
   0.06478428  0.06385722  0.0636511   0.06083238  0.06522468  0.06191165
   0.05641145  0.05497485  0.05164676  0.05389986  0.05634654]]
2.82397

Epoch: 558	Loss: 2.7992272377	Example Output: /6	Example Reward:  -0.3
[[ 0.05261781  0.05013204  0.06050323  0.06268013  0.06256286  0.05823464
   0.06462962  0.06389033  0.06383245  0.06095002  0.06502921  0.06192432
   0.05639384  0.05481709  0.05163709  0.053906    0.05625923]]
4.10657
[[ 0.28421468  0.28496039  0.28184903  0.28119597  0.28123114  0.28252962
   0.28061113  0.28083292  0.28085026  0.28171501  0.28049126  0.2814227
   0.28308186  0.28355488  0.28450888 -0.0161718   0.28312224]
 [ 0.28421468  0.28496039  0.28184903  0.28119597  0.28123114  0.28252962
   0.28061113  0.28083292 -0.01914974  0.28171501  0.28049126  0.2814227
   0.28308186  0.28355488  0.28450888  0.2838282   0.28312224]]
Epoch: 559	Loss: 3.05701212883	Example Output: -8	Example Reward:  -0.3
[[ 0.05262137  0.0501102   0.06049336  0.06267724  0.06258386  0.05821573
   0.06464846  0.06391059  0.06383298  0.0609592   0.06504869  0.06193535
   0.05637718  0.05479274  0.0516308   0.05391099  0.05625133]]
4.10

Epoch: 572	Loss: 2.95382349491	Example Output: 45	Example Reward:  1
[[ 0.05247815  0.0498329   0.06064104  0.06265895  0.06295087  0.05813546
   0.06466801  0.06420336  0.06395308  0.06108996  0.065138    0.06192966
   0.05641322  0.05452444  0.05149148  0.05381569  0.05607563]]
2.82092
[[-0.05247815 -0.0498329  -0.06064104 -0.06265895 -0.06295087 -0.05813546
   0.935332   -0.06420336 -0.06395308 -0.06108996 -0.065138   -0.06192966
  -0.05641322 -0.05452444 -0.05149148 -0.05381569 -0.05607563]
 [-0.05247815 -0.0498329  -0.06064104 -0.06265895 -0.06295087 -0.05813546
  -0.06466801  0.93579662 -0.06395308 -0.06108996 -0.065138   -0.06192966
  -0.05641322 -0.05452444 -0.05149148 -0.05381569 -0.05607563]]
Epoch: 573	Loss: 3.340052104	Example Output: /0	Example Reward:  -0.3
[[ 0.05246595  0.04980064  0.0606293   0.0626407   0.06300969  0.05812966
   0.06468344  0.06424375  0.06396294  0.06110538  0.06513374  0.06193909
   0.05641626  0.05450041  0.05147597  0.05380283  0.05606032]]
4.1056

Epoch: 586	Loss: 3.08061807156	Example Output: *-	Example Reward:  -0.3
[[ 0.05240541  0.04966534  0.06061409  0.06251616  0.06311491  0.05817296
   0.0647147   0.06429143  0.06408347  0.06119163  0.06500151  0.06208382
   0.05635089  0.05439376  0.05154689  0.0538254   0.05602762]]
4.10337
[[ 0.28427839  0.2851004   0.28181577  0.28124517  0.28106555  0.28254813
   0.28058562  0.28071257  0.28077498  0.28164253  0.28049958  0.28137487
   0.28309473  0.28368187 -0.01546407  0.2838524   0.28319174]
 [ 0.28427839  0.2851004   0.28181577  0.28124517  0.28106555  0.28254813
   0.28058562  0.28071257  0.28077498  0.28164253  0.28049958  0.28137487
   0.28309473 -0.01631813  0.28453594  0.2838524   0.28319174]]
Epoch: 587	Loss: 3.18296897411	Example Output: 16	Example Reward:  1
[[ 0.05239477  0.04965437  0.06059885  0.06255139  0.06309187  0.05818608
   0.0647246   0.06429195  0.0641167   0.0611745   0.0650157   0.06209887
   0.05633465  0.0543953   0.05152653  0.05382229  0.05602165]]
2.82

Epoch: 601	Loss: 3.05776715279	Example Output: ++	Example Reward:  -0.3
[[ 0.05226789  0.04939466  0.06061442  0.06277473  0.06315798  0.05826803
   0.06482219  0.0645141   0.06427284  0.0610258   0.06521311  0.06205498
   0.05628883  0.05426684  0.05143989  0.05371456  0.05590915]]
4.10512
[[ 0.28431964  0.28518161  0.28181568  0.2811676   0.28105262  0.28251961
   0.28055334  0.28064579  0.28071818  0.28169227  0.2804361   0.28138351
  -0.01688665  0.28371996  0.28456804  0.28388563  0.28322726]
 [ 0.28431964  0.28518161  0.28181568  0.2811676   0.28105262  0.28251961
   0.28055334  0.28064579  0.28071818  0.28169227  0.2804361   0.28138351
  -0.01688665  0.28371996  0.28456804  0.28388563  0.28322726]]
Epoch: 602	Loss: 2.80101256371	Example Output: 0+	Example Reward:  1
2.83052
[[-0.0522875  -0.04939329  0.93937504 -0.06281164 -0.06313841 -0.05827077
  -0.06479537 -0.06450853 -0.06428692 -0.06100964 -0.06520341 -0.06204596
  -0.05626679 -0.05427072 -0.05145319 -0.05373349 -0.0558994

Epoch: 615	Loss: 2.92716217041	Example Output: 9	Example Reward:  1
[[ 0.05218567  0.04930682  0.06073877  0.0626935   0.0631229   0.05855592
   0.0647704   0.06439241  0.0644372   0.06106052  0.06518996  0.062165
   0.05618139  0.05426894  0.05130762  0.05367851  0.05594451]]
2.82951
[[-0.05218567 -0.04930682 -0.06073877 -0.0626935  -0.0631229  -0.05855592
  -0.0647704  -0.06439241 -0.0644372  -0.06106052 -0.06518996  0.93783498
  -0.05618139 -0.05426894 -0.05130762 -0.05367851 -0.05594451]
 [-0.05218567 -0.04930682 -0.06073877 -0.0626935  -0.0631229  -0.05855592
  -0.0647704  -0.06439241 -0.0644372  -0.06106052 -0.06518996 -0.062165
  -0.05618139 -0.05426894 -0.05130762 -0.05367851  0.9440555 ]]
Epoch: 616	Loss: 2.80165772438	Example Output: 6+	Example Reward:  1
[[ 0.05217586  0.04930743  0.06076761  0.062672    0.06316682  0.05854787
   0.06475423  0.06438518  0.06444433  0.06107381  0.06517211  0.06218982
   0.05616958  0.0542445   0.05129789  0.05368093  0.05595003]]
2.8275
[[-0.

Epoch: 627	Loss: 3.08137640953	Example Output: 79	Example Reward:  1
[[ 0.05199755  0.04933399  0.06094232  0.06266916  0.06320114  0.05864115
   0.06467769  0.06432568  0.06466391  0.06126892  0.06507561  0.06209305
   0.05611095  0.05416599  0.05127975  0.05368328  0.05586987]]
2.82498
[[-0.05199755 -0.04933399 -0.06094232 -0.06266916 -0.06320114 -0.05864115
  -0.06467769 -0.06432568 -0.06466391  0.93873107 -0.06507561 -0.06209305
  -0.05611095 -0.05416599 -0.05127975 -0.05368328 -0.05586987]
 [-0.05199755 -0.04933399 -0.06094232 -0.06266916 -0.06320114 -0.05864115
  -0.06467769 -0.06432568 -0.06466391 -0.06126892 -0.06507561  0.93790698
  -0.05611095 -0.05416599 -0.05127975 -0.05368328 -0.05586987]]
Epoch: 628	Loss: 3.05836634636	Example Output: 9	Example Reward:  1
[[ 0.05198333  0.04933713  0.06097087  0.06265809  0.06320985  0.0586674
   0.06467281  0.06432065  0.06468153  0.06129067  0.06504049  0.06208833
   0.05613951  0.0541488   0.05127567  0.05366351  0.05585139]]
2.82961
[

  -0.01682517  0.28377128  0.28462681  0.28393149  0.28324935]]
Epoch: 639	Loss: 3.59203836918	Example Output: /Y	Example Reward:  -0.3
[[ 0.05186653  0.04917606  0.06112204  0.06252706  0.06344023  0.05866269
   0.06457828  0.06448333  0.06464311  0.06133535  0.06510344  0.06228302
   0.05606953  0.05406683  0.05125279  0.05355792  0.05583182]]
4.10226
[[ 0.28444004  0.28524721  0.28166339  0.28124189  0.28096795  0.2824012
   0.28062654  0.280655    0.28060707  0.2815994   0.280469    0.28131509
   0.28317913  0.28377995  0.28462419 -0.01606738  0.28325048]
 [ 0.28444004 -0.01475282  0.28166339  0.28124189  0.28096795  0.2824012
   0.28062654  0.280655    0.28060707  0.2815994   0.280469    0.28131509
   0.28317913  0.28377995  0.28462419  0.28393263  0.28325048]]
Epoch: 640	Loss: 2.79864280224	Example Output: 4X	Example Reward:  -0.3
[[ 0.05185388  0.04913738  0.0611048   0.06250791  0.06345898  0.05864453
   0.06460981  0.06453874  0.06466237  0.06133818  0.06511354  0.06230453
   

Epoch: 651	Loss: 2.66969678402	Example Output: 3-	Example Reward:  1
[[ 0.05175744  0.04873405  0.06091379  0.06262186  0.06358196  0.05845112
   0.06505839  0.06490559  0.06477716  0.06127727  0.06527524  0.06269083
   0.05593018  0.05402797  0.05093499  0.05322518  0.05583686]]
2.8339
[[-0.05175744 -0.04873405 -0.06091379 -0.06262186 -0.06358196  0.94154888
  -0.06505839 -0.06490559 -0.06477716 -0.06127727 -0.06527524 -0.06269083
  -0.05593018 -0.05402797 -0.05093499 -0.05322518 -0.05583686]
 [-0.05175744 -0.04873405 -0.06091379 -0.06262186 -0.06358196 -0.05845112
  -0.06505839 -0.06490559 -0.06477716 -0.06127727 -0.06527524 -0.06269083
  -0.05593018  0.94597203 -0.05093499 -0.05322518 -0.05583686]]
Epoch: 652	Loss: 2.95480959415	Example Output: 6*	Example Reward:  1
[[ 0.05173467  0.0486943   0.06091052  0.06259393  0.06361374  0.05844703
   0.06507993  0.06491639  0.06478211  0.06129838  0.06530535  0.06274842
   0.05593099  0.05401708  0.05090724  0.05319246  0.05582743]]
2.8317
[

  -0.05583936 -0.05389318 -0.050588   -0.05312587 -0.05560827]]
Epoch: 665	Loss: 2.64599893093	Example Output: 3*	Example Reward:  1
[[ 0.05146151  0.04843599  0.06097454  0.06280818  0.06362873  0.05819606
   0.06550404  0.06504079  0.06508788  0.06132611  0.06561623  0.06289168
   0.05584078  0.05389577  0.05058339  0.05310766  0.05560069]]
2.83709
[[-0.05146151 -0.04843599 -0.06097454 -0.06280818 -0.06362873  0.94180393
  -0.06550404 -0.06504079 -0.06508788 -0.06132611 -0.06561623 -0.06289168
  -0.05584078 -0.05389577 -0.05058339 -0.05310766 -0.05560069]
 [-0.05146151 -0.04843599 -0.06097454 -0.06280818 -0.06362873 -0.05819606
  -0.06550404 -0.06504079 -0.06508788 -0.06132611 -0.06561623 -0.06289168
  -0.05584078 -0.05389577  0.94941664 -0.05310766 -0.05560069]]
Epoch: 666	Loss: 3.08078200817	Example Output: *+	Example Reward:  -0.3
[[ 0.05145264  0.04841582  0.06096573  0.06280334  0.0636214   0.05821151
   0.06552579  0.06505913  0.06510606  0.06135216  0.06558386  0.06288549
   0

Epoch: 678	Loss: 3.08203914165	Example Output: 76	Example Reward:  1
[[ 0.05128324  0.04821028  0.06093244  0.06276071  0.06367624  0.05825153
   0.06562134  0.06508517  0.06530263  0.06138063  0.06564137  0.06310041
   0.05582336  0.05389962  0.05049492  0.05287547  0.0556606 ]]
2.82151
[[-0.05128324 -0.04821028 -0.06093244 -0.06276071 -0.06367624 -0.05825153
  -0.06562134 -0.06508517 -0.06530263  0.93861938 -0.06564137 -0.06310041
  -0.05582336 -0.05389962 -0.05049492 -0.05287547 -0.0556606 ]
 [-0.05128324 -0.04821028 -0.06093244 -0.06276071 -0.06367624 -0.05825153
  -0.06562134 -0.06508517  0.93469739 -0.06138063 -0.06564137 -0.06310041
  -0.05582336 -0.05389962 -0.05049492 -0.05287547 -0.0556606 ]]
Epoch: 679	Loss: 3.209466362	Example Output: -+	Example Reward:  -0.3
[[ 0.05126576  0.04821826  0.06093067  0.06281195  0.06364129  0.05826941
   0.0656288   0.06507952  0.06532622  0.06137641  0.06566469  0.06310707
   0.05580075  0.05390229  0.05045799  0.05286688  0.05565196]]
4.1038

Epoch: 691	Loss: 2.51672985554	Example Output: 96	Example Reward:  1
2.82015
[[-0.05112831 -0.04819922 -0.06097378 -0.0627313  -0.0636828  -0.05839039
  -0.06565889 -0.06503776 -0.06516804 -0.06145008 -0.06586493  0.93685627
  -0.05573316 -0.05382046 -0.05045249 -0.05286312 -0.05570158]
 [-0.05112831 -0.04819922 -0.06097378 -0.0627313  -0.0636828  -0.05839039
  -0.06565889 -0.06503776  0.93483198 -0.06145008 -0.06586493 -0.06314375
  -0.05573316 -0.05382046 -0.05045249 -0.05286312 -0.05570158]]
Epoch: 692	Loss: 2.92503342628	Example Output: Y0	Example Reward:  -0.3
[[ 0.05111748  0.0481699   0.06095358  0.06280947  0.06366942  0.0583835
   0.06566595  0.06504222  0.06518906  0.06143518  0.06588935  0.06317431
   0.05572975  0.05380609  0.05044854  0.05283659  0.05567965]]
4.10348
[[ 0.28466478 -0.01445097  0.28171393  0.28115717  0.28089917  0.28248495
   0.28030023  0.28048736  0.28044328  0.28156945  0.2802332   0.28104773
   0.28328109  0.28385818  0.28486544  0.28414902  0.28329611

Epoch: 705	Loss: 3.20805783272	Example Output: 19	Example Reward:  1
[[ 0.05118899  0.04814533  0.06113819  0.06289007  0.06362328  0.05868341
   0.06544413  0.06511131  0.0650608   0.06132141  0.06581991  0.0631026
   0.05561478  0.05368644  0.05057184  0.05289002  0.05570746]]
2.82199
[[-0.05118899 -0.04814533 -0.06113819  0.93710995 -0.06362328 -0.05868341
  -0.06544413 -0.06511131 -0.0650608  -0.06132141 -0.06581991 -0.0631026
  -0.05561478 -0.05368644 -0.05057184 -0.05289002 -0.05570746]
 [-0.05118899 -0.04814533 -0.06113819 -0.06289007 -0.06362328 -0.05868341
  -0.06544413 -0.06511131 -0.0650608  -0.06132141 -0.06581991  0.9368974
  -0.05561478 -0.05368644 -0.05057184 -0.05289002 -0.05570746]]
Epoch: 706	Loss: 3.08300521374	Example Output: 4+	Example Reward:  1
[[ 0.05118453  0.04814735  0.06115811  0.06291533  0.06359332  0.05871133
   0.06541923  0.0650935   0.06505194  0.06131162  0.06583765  0.06313715
   0.05562306  0.05368242  0.05055477  0.05289019  0.05568855]]
2.82632
[[

Epoch: 718	Loss: 3.18195235729	Example Output: 93	Example Reward:  1
[[ 0.05108751  0.04809254  0.06134374  0.06306553  0.06355112  0.05891703
   0.06534553  0.06504932  0.06504314  0.06125602  0.06587676  0.06303573
   0.05573135  0.05356896  0.05065583  0.05286032  0.05551963]]
2.82528
[[-0.05108751 -0.04809254 -0.06134374 -0.06306553 -0.06355112 -0.05891703
  -0.06534553 -0.06504932 -0.06504314 -0.06125602 -0.06587676  0.93696427
  -0.05573135 -0.05356896 -0.05065583 -0.05286032 -0.05551963]
 [-0.05108751 -0.04809254 -0.06134374 -0.06306553 -0.06355112  0.94108295
  -0.06534553 -0.06504932 -0.06504314 -0.06125602 -0.06587676 -0.06303573
  -0.05573135 -0.05356896 -0.05065583 -0.05286032 -0.05551963]]
Epoch: 719	Loss: 2.92621262074	Example Output: 74	Example Reward:  1
[[ 0.05109288  0.04809817  0.06133807  0.06308085  0.06352111  0.05894051
   0.06532554  0.06501984  0.06502223  0.06126269  0.06588463  0.0630704
   0.05572964  0.0535699   0.05066866  0.05285216  0.05552274]]
2.82155


Epoch: 731	Loss: 3.20841379166	Example Output: -5	Example Reward:  -0.3
[[ 0.05095644  0.04798464  0.06135143  0.06313422  0.0635774   0.05893869
   0.06534556  0.06507274  0.06510308  0.06126038  0.06602614  0.06296472
   0.05562706  0.05348938  0.05078018  0.05286388  0.05552394]]
4.10602
[[ 0.28471309  0.28560463  0.28159457  0.28105974  0.28092679  0.28231841
   0.28039634  0.28047821  0.28046909  0.2816219   0.28019217  0.28111058
   0.2833119  -0.01604682  0.28476596  0.28414086  0.28334284]
 [ 0.28471309  0.28560463  0.28159457  0.28105974  0.28092679  0.28231841
   0.28039634 -0.01952182  0.28046909  0.2816219   0.28019217  0.28111058
   0.2833119   0.28395319  0.28476596  0.28414086  0.28334284]]
Epoch: 732	Loss: 3.21078875065	Example Output: 3+	Example Reward:  1
[[ 0.05094515  0.04796914  0.06134872  0.06313048  0.06361438  0.0589239
   0.06536402  0.06507977  0.06510092  0.06126977  0.06603113  0.06297427
   0.05564363  0.05347474  0.05076592  0.05284256  0.05552145]]
2.831

Epoch: 745	Loss: 2.94977881908	Example Output: 98	Example Reward:  1
[[ 0.05082962  0.04781447  0.06152296  0.0630283   0.06371838  0.05903964
   0.06547236  0.06518608  0.06512171  0.06127971  0.06616228  0.06318469
   0.0556695   0.05331227  0.05063113  0.05261646  0.05541049]]
2.81913
[[-0.05082962 -0.04781447 -0.06152296 -0.0630283  -0.06371838 -0.05903964
  -0.06547236 -0.06518608 -0.06512171 -0.06127971 -0.06616228  0.93681532
  -0.0556695  -0.05331227 -0.05063113 -0.05261646 -0.05541049]
 [-0.05082962 -0.04781447 -0.06152296 -0.0630283  -0.06371838 -0.05903964
  -0.06547236 -0.06518608 -0.06512171 -0.06127971  0.93383771 -0.06318469
  -0.0556695  -0.05331227 -0.05063113 -0.05261646 -0.05541049]]
Epoch: 746	Loss: 2.92569088936	Example Output: 01	Example Reward:  1
2.82284
[[-0.05081106 -0.04777522  0.93849313 -0.06306349 -0.06371921 -0.05902511
  -0.06551627 -0.0652268  -0.06515519 -0.06127172 -0.06618817 -0.06320355
  -0.05565846 -0.05328898 -0.05060634 -0.05258401 -0.05539961]


Epoch: 759	Loss: 3.46479074955	Example Output: +7	Example Reward:  -0.3
[[ 0.05080893  0.0476893   0.06159839  0.06311116  0.06382643  0.05908653
   0.06547917  0.06521394  0.06525949  0.06129653  0.06613143  0.06324922
   0.05554822  0.05311512  0.05070384  0.05252675  0.05535561]]
4.10556
[[ 0.28475735  0.28569323  0.28152049  0.28106666  0.28085208  0.28227407
   0.28035626  0.28043583  0.28042215  0.28161106  0.28016058  0.28102523
  -0.01666447  0.28406549  0.28478888  0.28424197  0.28339332]
 [ 0.28475735  0.28569323  0.28152049  0.28106666  0.28085208  0.28227407
   0.28035626  0.28043583  0.28042215 -0.01838896  0.28016058  0.28102523
   0.28333554  0.28406549  0.28478888  0.28424197  0.28339332]]
Epoch: 760	Loss: 3.59238221645	Example Output: *7	Example Reward:  -0.3
[[ 0.0508008   0.0476895   0.06159057  0.0630932   0.0638136   0.05910329
   0.06548183  0.06522055  0.06523316  0.06129639  0.06615591  0.06325895
   0.05553903  0.05313023  0.05070138  0.05253373  0.05535785]]
4

Epoch: 771	Loss: 3.46260647774	Example Output: -5	Example Reward:  -0.3
[[ 0.05054262  0.04764228  0.06173727  0.06326704  0.0638269   0.05912824
   0.06549788  0.06524917  0.06530329  0.06135418  0.06636014  0.06320813
   0.05552881  0.05309805  0.05047965  0.05251615  0.05526022]]
4.10576
[[ 0.28483725  0.28570732  0.28147882  0.2810199   0.28085193  0.28226155
   0.28035066  0.28042525  0.28040904  0.28159377  0.28009197  0.28103757
   0.28334138 -0.01592942  0.28485611  0.28424516  0.28342193]
 [ 0.28483725  0.28570732  0.28147882  0.2810199   0.28085193  0.28226155
   0.28035066 -0.01957475  0.28040904  0.28159377  0.28009197  0.28103757
   0.28334138  0.28407058  0.28485611  0.28424516  0.28342193]]
Epoch: 772	Loss: 2.51559143066	Example Output: +5	Example Reward:  -0.3
[[ 0.05054041  0.04763581  0.06173122  0.06326907  0.06381699  0.05916754
   0.06549556  0.06527347  0.06526937  0.06134026  0.06639282  0.06322758
   0.05552282  0.05309929  0.05046312  0.05249356  0.05526115]]
4

Epoch: 784	Loss: 3.84704799652	Example Output: /4	Example Reward:  -0.3
[[ 0.05039164  0.04733681  0.06173484  0.06346857  0.06380709  0.05913097
   0.06559589  0.06539074  0.06549973  0.06126217  0.06654587  0.06355656
   0.05548299  0.05301462  0.05021681  0.05235203  0.05521275]]
4.10551
[[ 0.28488252  0.28579897  0.28147957  0.28095943  0.28085789  0.28226072
   0.28032124  0.28038281  0.28035009  0.28162137  0.28003627  0.28093305
   0.28335512  0.28409562  0.28493497 -0.01570561  0.28343618]
 [ 0.28488252  0.28579897  0.28147957  0.28095943  0.28085789  0.28226072
  -0.01967877  0.28038281  0.28035009  0.28162137  0.28003627  0.28093305
   0.28335512  0.28409562  0.28493497  0.2842944   0.28343618]]
Epoch: 785	Loss: 3.20691535473	Example Output: 7	Example Reward:  1
[[ 0.05038313  0.04732395  0.06171095  0.06348266  0.06381953  0.05910048
   0.06560202  0.06541138  0.06551563  0.06126252  0.06652542  0.0635464
   0.05547331  0.05303636  0.05022008  0.05236327  0.055223  ]]
2.8292

Epoch: 796	Loss: 3.05322062969	Example Output: -+	Example Reward:  -0.3
[[ 0.05029004  0.04719889  0.06169598  0.06351496  0.06398767  0.05922693
   0.06571215  0.06548901  0.06547536  0.0613212   0.06662355  0.06355187
   0.05532698  0.05296013  0.05021884  0.05222491  0.05518157]]
4.10307
[[ 0.284913    0.28584033  0.28149122  0.28094554  0.28080371  0.28223193
   0.28028637  0.28035331  0.28035742  0.28160366  0.28001294  0.28093445
   0.28340191 -0.01588804  0.28493437  0.28433254  0.28344554]
 [ 0.284913    0.28584033  0.28149122  0.28094554  0.28080371  0.28223193
   0.28028637  0.28035331  0.28035742  0.28160366  0.28001294  0.28093445
  -0.01659809  0.28411198  0.28493437  0.28433254  0.28344554]]
Epoch: 797	Loss: 3.20844304562	Example Output: 44	Example Reward:  1
[[ 0.05027967  0.04720099  0.06167321  0.06356877  0.06397563  0.05924024
   0.0657125   0.06548071  0.06547961  0.06131989  0.06665162  0.06354991
   0.05530315  0.05294889  0.05021558  0.05222393  0.0551757 ]]
2.81

Epoch: 808	Loss: 3.59289069176	Example Output: 83	Example Reward:  1
[[ 0.05019382  0.0471169   0.06172258  0.06362589  0.06403416  0.05944906
   0.0656869   0.06561164  0.06560107  0.06141576  0.06648433  0.06353599
   0.05523662  0.05270464  0.05027417  0.05222854  0.0550779 ]]
2.82128
[[-0.05019382 -0.0471169  -0.06172258 -0.06362589 -0.06403416 -0.05944906
  -0.0656869  -0.06561164 -0.06560107 -0.06141576  0.93351567 -0.06353599
  -0.05523662 -0.05270464 -0.05027417 -0.05222854 -0.0550779 ]
 [-0.05019382 -0.0471169  -0.06172258 -0.06362589 -0.06403416  0.94055092
  -0.0656869  -0.06561164 -0.06560107 -0.06141576 -0.06648433 -0.06353599
  -0.05523662 -0.05270464 -0.05027417 -0.05222854 -0.0550779 ]]
Epoch: 809	Loss: 3.20937550068	Example Output: +/	Example Reward:  -0.3
[[ 0.05020627  0.04712774  0.06173963  0.06358594  0.06409272  0.05948582
   0.06563668  0.06559729  0.06555891  0.06143561  0.06646384  0.06352527
   0.05524855  0.05268402  0.05029726  0.05224249  0.05507203]]
4.10

Epoch: 820	Loss: 3.3354013443	Example Output: /6	Example Reward:  -0.3
[[ 0.05014221  0.04714004  0.06177628  0.06344548  0.06414664  0.05953652
   0.06555457  0.06562823  0.06577267  0.06162507  0.06624423  0.06342477
   0.05519707  0.05262783  0.05039762  0.05231114  0.05502963]]
4.10545
[[ 0.28495735  0.28585801  0.28146714  0.28096637  0.28075603  0.28213906
   0.28033364  0.28031155  0.28026822  0.2815125   0.28012675  0.28097257
   0.28344089  0.28421167  0.28488073 -0.01569334  0.28349113]
 [ 0.28495735  0.28585801  0.28146714  0.28096637  0.28075603  0.28213906
   0.28033364  0.28031155 -0.0197318   0.2815125   0.28012675  0.28097257
   0.28344089  0.28421167  0.28488073  0.28430668  0.28349113]]
Saving Weight
Epoch: 821	Loss: 3.3335288763	Example Output: 14	Example Reward:  1
[[ 0.05013523  0.04712903  0.06179698  0.06341946  0.06416354  0.05955764
   0.06556118  0.06561905  0.06579617  0.06162564  0.0662256   0.06341375
   0.05519339  0.052618    0.05042329  0.05228995  0.055

Epoch: 833	Loss: 3.33735172749	Example Output: 7/	Example Reward:  1
[[ 0.05013734  0.04710427  0.062122    0.06340605  0.0641428   0.0597094
   0.065479    0.06550698  0.06587745  0.06158519  0.06621964  0.06335174
   0.05514242  0.05250723  0.05047785  0.05222288  0.05500783]]
2.8316
[[-0.05013734 -0.04710427 -0.062122   -0.06340605 -0.0641428  -0.0597094
  -0.065479   -0.06550698 -0.06587745  0.93841481 -0.06621964 -0.06335174
  -0.05514242 -0.05250723 -0.05047785 -0.05222288 -0.05500783]
 [-0.05013734 -0.04710427 -0.062122   -0.06340605 -0.0641428  -0.0597094
  -0.065479   -0.06550698 -0.06587745 -0.06158519 -0.06621964 -0.06335174
  -0.05514242 -0.05250723 -0.05047785  0.94777715 -0.05500783]]
Epoch: 834	Loss: 3.07939074039	Example Output: 7*	Example Reward:  1
[[ 0.05014359  0.04709524  0.06213476  0.06338294  0.06418604  0.0596945
   0.06546356  0.06550553  0.0658761   0.06160091  0.06620743  0.06336266
   0.05512916  0.05248502  0.05047117  0.05225366  0.05500785]]
2.83329
[[-0

Epoch: 848	Loss: 3.05373468399	Example Output: 36	Example Reward:  1
[[ 0.05001858  0.04697528  0.06220775  0.06339671  0.06440959  0.05969429
   0.06555158  0.06565889  0.06582037  0.06158786  0.06633001  0.06335397
   0.05511138  0.05238533  0.05032353  0.05219433  0.05498052]]
2.82145
[[-0.05001858 -0.04697528 -0.06220775 -0.06339671 -0.06440959  0.94030571
  -0.06555158 -0.06565889 -0.06582037 -0.06158786 -0.06633001 -0.06335397
  -0.05511138 -0.05238533 -0.05032353 -0.05219433 -0.05498052]
 [-0.05001858 -0.04697528 -0.06220775 -0.06339671 -0.06440959 -0.05969429
  -0.06555158 -0.06565889  0.9341796  -0.06158786 -0.06633001 -0.06335397
  -0.05511138 -0.05238533 -0.05032353 -0.05219433 -0.05498052]]
Epoch: 849	Loss: 2.92346353531	Example Output: 0-	Example Reward:  1
[[ 0.05000213  0.04697321  0.06220918  0.06341866  0.06441337  0.05969862
   0.06556156  0.0656309   0.06586359  0.06159351  0.06633157  0.06335002
   0.05510144  0.05238569  0.05030946  0.05218872  0.05496834]]
2.83079

Epoch: 861	Loss: 3.46434869766	Example Output: +9	Example Reward:  -0.3
[[ 0.04998389  0.0470284   0.06227944  0.06336625  0.06435817  0.05980285
   0.06555096  0.06546284  0.06593801  0.06169542  0.06611755  0.06332668
   0.05506667  0.05234063  0.05044785  0.05217236  0.05506204]]
4.1056
[[ 0.28500482  0.28589147  0.28131616  0.28099015  0.28069255  0.28205916
   0.28033471  0.28036118  0.2802186   0.2814914   0.28016475  0.28100201
  -0.01652     0.28429782  0.28486568  0.28434831  0.28348139]
 [ 0.28500482  0.28589147  0.28131616  0.28099015  0.28069255  0.28205916
   0.28033471  0.28036118  0.2802186   0.2814914   0.28016475 -0.018998
   0.28348002  0.28429782  0.28486568  0.28434831  0.28348139]]
Epoch: 862	Loss: 3.20772125721	Example Output: 86	Example Reward:  1
[[ 0.04998419  0.04704868  0.06227726  0.06334008  0.06437173  0.05980141
   0.06551833  0.06545504  0.0659375   0.06172374  0.0660713   0.06332477
   0.05506368  0.05233301  0.0504851   0.05219721  0.055067  ]]
2.81636

Epoch: 874	Loss: 2.92795953751	Example Output: X-	Example Reward:  1
[[ 0.04999324  0.04707741  0.06241152  0.06313985  0.06443368  0.06001626
   0.06538258  0.06538462  0.06583162  0.06186601  0.0659845   0.0632312
   0.05503322  0.05234874  0.05064531  0.05217187  0.05504839]]
2.8419
[[ 0.95000678 -0.04707741 -0.06241152 -0.06313985 -0.06443368 -0.06001626
  -0.06538258 -0.06538462 -0.06583162 -0.06186601 -0.0659845  -0.0632312
  -0.05503322 -0.05234874 -0.05064531 -0.05217187 -0.05504839]
 [-0.04999324 -0.04707741 -0.06241152 -0.06313985 -0.06443368 -0.06001626
  -0.06538258 -0.06538462 -0.06583162 -0.06186601 -0.0659845  -0.0632312
  -0.05503322  0.94765127 -0.05064531 -0.05217187 -0.05504839]]
Epoch: 875	Loss: 3.46262636185	Example Output: -7	Example Reward:  -0.3
[[ 0.05000773  0.04708774  0.06240375  0.06313349  0.06440728  0.0600182
   0.06536341  0.06535882  0.06582824  0.0619094   0.06595618  0.06321861
   0.05501708  0.05237587  0.05063813  0.05220095  0.05507518]]
4.10456
[

Epoch: 887	Loss: 3.05373637676	Example Output: 22	Example Reward:  1
[[ 0.04986059  0.0470138   0.06222172  0.06350389  0.06424607  0.0598879
   0.0655065   0.06528343  0.06603781  0.06190128  0.06619042  0.06321336
   0.05487648  0.05236584  0.05060519  0.05225385  0.05503178]]
2.81904
[[-0.04986059 -0.0470138  -0.06222172 -0.06350389  0.93575394 -0.0598879
  -0.0655065  -0.06528343 -0.06603781 -0.06190128 -0.06619042 -0.06321336
  -0.05487648 -0.05236584 -0.05060519 -0.05225385 -0.05503178]
 [-0.04986059 -0.0470138  -0.06222172 -0.06350389  0.93575394 -0.0598879
  -0.0655065  -0.06528343 -0.06603781 -0.06190128 -0.06619042 -0.06321336
  -0.05487648 -0.05236584 -0.05060519 -0.05225385 -0.05503178]]
Epoch: 888	Loss: 3.46183297634	Example Output: Y6	Example Reward:  -0.3
[[ 0.04984701  0.04698395  0.06223679  0.06349712  0.06430473  0.05986051
   0.06551744  0.06531607  0.0660448   0.06188809  0.06619608  0.0631896
   0.05486663  0.05237176  0.05059851  0.0522573   0.05502363]]
4.10385


Epoch: 900	Loss: 2.51467111111	Example Output: 2*	Example Reward:  1
[[ 0.04977396  0.04695016  0.06221297  0.06338163  0.06437819  0.05989427
   0.06551094  0.06531906  0.06616463  0.06193021  0.06613693  0.0632249
   0.05484881  0.05233698  0.05062892  0.05227855  0.05502889]]
2.8308
[[-0.04977396 -0.04695016 -0.06221297 -0.06338163  0.9356218  -0.05989427
  -0.06551094 -0.06531906 -0.06616463 -0.06193021 -0.06613693 -0.0632249
  -0.05484881 -0.05233698 -0.05062892 -0.05227855 -0.05502889]
 [-0.04977396 -0.04695016 -0.06221297 -0.06338163 -0.06437819 -0.05989427
  -0.06551094 -0.06531906 -0.06616463 -0.06193021 -0.06613693 -0.0632249
  -0.05484881 -0.05233698  0.9493711  -0.05227855 -0.05502889]]
Saving Weight
Epoch: 901	Loss: 2.92393381596	Example Output: 1/	Example Reward:  1
[[ 0.04976055  0.04693083  0.06221081  0.06339511  0.06439252  0.05988004
   0.06553157  0.06532639  0.06618938  0.06193021  0.06614083  0.0632346
   0.05483583  0.05233246  0.05062651  0.0522594   0.05502295]

Epoch: 913	Loss: 2.92421638966	Example Output: 08	Example Reward:  1
[[ 0.04959214  0.04684374  0.06222155  0.06358345  0.06430192  0.05995894
   0.06552803  0.06538109  0.06622946  0.06186168  0.06637981  0.06325068
   0.0548682   0.05219817  0.05064232  0.05225109  0.05490776]]
2.81885
[[-0.04959214 -0.04684374  0.93777847 -0.06358345 -0.06430192 -0.05995894
  -0.06552803 -0.06538109 -0.06622946 -0.06186168 -0.06637981 -0.06325068
  -0.0548682  -0.05219817 -0.05064232 -0.05225109 -0.05490776]
 [-0.04959214 -0.04684374 -0.06222155 -0.06358345 -0.06430192 -0.05995894
  -0.06552803 -0.06538109 -0.06622946 -0.06186168  0.93362021 -0.06325068
  -0.0548682  -0.05219817 -0.05064232 -0.05225109 -0.05490776]]
Epoch: 914	Loss: 2.66965723038	Example Output: 64	Example Reward:  1
2.81635
[[-0.04955735 -0.04684373 -0.06224611 -0.06361032 -0.06428587 -0.05998145
  -0.06551589 -0.06538846  0.93375719 -0.06183209 -0.06643592 -0.06322949
  -0.05487003 -0.05219769 -0.0506346  -0.05224563 -0.05488252]


Epoch: 925	Loss: 2.79791409969	Example Output: *8	Example Reward:  -0.3
[[ 0.04947878  0.04664871  0.06236089  0.06354197  0.06452574  0.06010129
   0.06559623  0.06562181  0.06637079  0.06178218  0.0664098   0.0632156
   0.05471542  0.05201666  0.05066163  0.05208084  0.05487171]]
4.1049
[[ 0.28515637  0.28600541  0.28129175  0.28093743  0.2806423   0.28196964
   0.28032115  0.28031346  0.28008878  0.28146535  0.28007707  0.28103533
   0.2835854   0.28439501 -0.01519849  0.28437576  0.28353852]
 [ 0.28515637  0.28600541  0.28129175  0.28093743  0.2806423   0.28196964
   0.28032115  0.28031346  0.28008878  0.28146535 -0.01992294  0.28103533
   0.2835854   0.28439501  0.28480151  0.28437576  0.28353852]]
Epoch: 926	Loss: 3.46208863258	Example Output: YX	Example Reward:  -0.3
[[ 0.04948808  0.04662718  0.06236494  0.06357448  0.06453962  0.06009299
   0.06564171  0.06562635  0.06637837  0.06177356  0.06640232  0.06322777
   0.05469026  0.05203381  0.05061849  0.05206363  0.05485645]]
4.0

Epoch: 937	Loss: 2.95087866783	Example Output: 08	Example Reward:  1
[[ 0.04937744  0.04649837  0.06250297  0.06360704  0.06467503  0.06007282
   0.06560134  0.06576132  0.06658053  0.06194317  0.0663144   0.06333113
   0.05468867  0.05184505  0.05046485  0.05198218  0.05475375]]
2.81832
[[-0.04937744 -0.04649837  0.93749702 -0.06360704 -0.06467503 -0.06007282
  -0.06560134 -0.06576132 -0.06658053 -0.06194317 -0.0663144  -0.06333113
  -0.05468867 -0.05184505 -0.05046485 -0.05198218 -0.05475375]
 [-0.04937744 -0.04649837 -0.06250297 -0.06360704 -0.06467503 -0.06007282
  -0.06560134 -0.06576132 -0.06658053 -0.06194317  0.9336856  -0.06333113
  -0.05468867 -0.05184505 -0.05046485 -0.05198218 -0.05475375]]
Epoch: 938	Loss: 3.05373284817	Example Output: 17	Example Reward:  1
[[ 0.04936802  0.04650305  0.06250239  0.06362902  0.06465763  0.06009591
   0.06561191  0.065727    0.06656972  0.0619569   0.06632614  0.06334335
   0.05468025  0.05183508  0.05046452  0.05196969  0.05475944]]
2.82082

Epoch: 949	Loss: 3.46183447838	Example Output: X1	Example Reward:  -0.3
[[ 0.04928021  0.04648451  0.06270477  0.06357476  0.0647845   0.06024671
   0.06555326  0.06562153  0.06652313  0.06213674  0.06639609  0.06326167
   0.05462157  0.05169016  0.05046347  0.05197662  0.0546802 ]]
4.10372
[[-0.01478406  0.28605464  0.28118858  0.28092757  0.28056467  0.28192601
   0.28033403  0.28031355  0.28004307  0.28135899  0.28008118  0.28102151
   0.28361353  0.28449297  0.28486097  0.28440702  0.28359595]
 [ 0.28521594  0.28605464  0.28118858 -0.01907243  0.28056467  0.28192601
   0.28033403  0.28031355  0.28004307  0.28135899  0.28008118  0.28102151
   0.28361353  0.28449297  0.28486097  0.28440702  0.28359595]]
Epoch: 950	Loss: 3.20822422504	Example Output: 0+	Example Reward:  1
[[ 0.04928432  0.04648388  0.06270688  0.06355709  0.06479264  0.06026626
   0.06555621  0.06561015  0.06649024  0.06213501  0.06639877  0.06326892
   0.05463023  0.05169036  0.05048582  0.0519607   0.05468253]]
2.82

Epoch: 961	Loss: 3.20649209023	Example Output: 41	Example Reward:  1
[[ 0.04910114  0.04642035  0.06304024  0.06338237  0.0651065   0.06032474
   0.06560263  0.06562222  0.06655512  0.0621587   0.06630822  0.06320053
   0.0546548   0.05160552  0.05042533  0.05188698  0.05460456]]
2.818
[[-0.04910114 -0.04642035 -0.06304024 -0.06338237 -0.0651065  -0.06032474
   0.93439734 -0.06562222 -0.06655512 -0.0621587  -0.06630822 -0.06320053
  -0.0546548  -0.05160552 -0.05042533 -0.05188698 -0.05460456]
 [-0.04910114 -0.04642035 -0.06304024  0.93661761 -0.0651065  -0.06032474
  -0.06560263 -0.06562222 -0.06655512 -0.0621587  -0.06630822 -0.06320053
  -0.0546548  -0.05160552 -0.05042533 -0.05188698 -0.05460456]]
Epoch: 962	Loss: 2.64547359943	Example Output: -5	Example Reward:  -0.3
[[ 0.04911701  0.04642915  0.06304052  0.06338428  0.06510901  0.06034936
   0.06559097  0.06561914  0.06655187  0.06214574  0.0662901   0.0631969
   0.05465388  0.05159323  0.05045273  0.05188037  0.05459565]]
4.10484

Epoch: 973	Loss: 2.79656250477	Example Output: 20	Example Reward:  1
[[ 0.04910465  0.0464242   0.06311444  0.06352972  0.06513602  0.06042859
   0.06543704  0.06573525  0.06643754  0.06212504  0.06622981  0.06318293
   0.0546395   0.05155606  0.05044953  0.05192912  0.05454051]]
2.81857
[[-0.04910465 -0.0464242  -0.06311444 -0.06352972  0.93486398 -0.06042859
  -0.06543704 -0.06573525 -0.06643754 -0.06212504 -0.06622981 -0.06318293
  -0.0546395  -0.05155606 -0.05044953 -0.05192912 -0.05454051]
 [-0.04910465 -0.0464242   0.93688554 -0.06352972 -0.06513602 -0.06042859
  -0.06543704 -0.06573525 -0.06643754 -0.06212504 -0.06622981 -0.06318293
  -0.0546395  -0.05155606 -0.05044953 -0.05192912 -0.05454051]]
Epoch: 974	Loss: 3.05038499832	Example Output: 76	Example Reward:  1
[[ 0.04910353  0.04641888  0.06313032  0.06355752  0.06515413  0.06042461
   0.06546962  0.06573294  0.06643622  0.0621306   0.06622777  0.063173
   0.0546212   0.05153447  0.05043936  0.05190973  0.05453612]]
2.81835
[

Epoch: 986	Loss: 2.51422810555	Example Output: 83	Example Reward:  1
[[ 0.04899698  0.04638226  0.06317949  0.06376858  0.06524165  0.06021736
   0.06545353  0.06558711  0.06655576  0.06222504  0.06621013  0.06343952
   0.05459101  0.05144714  0.05023748  0.0519055   0.05456147]]
2.81998
[[-0.04899698 -0.04638226 -0.06317949 -0.06376858 -0.06524165 -0.06021736
  -0.06545353 -0.06558711 -0.06655576 -0.06222504  0.93378985 -0.06343952
  -0.05459101 -0.05144714 -0.05023748 -0.0519055  -0.05456147]
 [-0.04899698 -0.04638226 -0.06317949 -0.06376858 -0.06524165  0.93978262
  -0.06545353 -0.06558711 -0.06655576 -0.06222504 -0.06621013 -0.06343952
  -0.05459101 -0.05144714 -0.05023748 -0.0519055  -0.05456147]]
Epoch: 987	Loss: 3.05084898472	Example Output: /9	Example Reward:  -0.3
4.10435
[[ 0.2853049   0.28609008  0.28105265  0.28086472  0.28042862  0.28192434
   0.28036925  0.28031093  0.28002635  0.28133687  0.28013676  0.28096679
   0.28362846  0.28456643  0.28493044 -0.01556949  0.2836320

Epoch: 999	Loss: 3.33524096012	Example Output: Y9	Example Reward:  -0.3
[[ 0.04891455  0.04627536  0.06319205  0.0638561   0.06538246  0.06037316
   0.06539571  0.06577564  0.06667249  0.06218186  0.06623981  0.06343243
   0.05441739  0.05136899  0.05016282  0.05181747  0.05454174]]
4.10257
[[ 0.28532565 -0.01388261  0.2810424   0.28084317  0.28038526  0.28188807
   0.28038129  0.28026733  0.27999827  0.28134546  0.28012806  0.28097028
   0.28367481  0.28458932  0.28495118  0.28445476  0.28363749]
 [ 0.28532565  0.2861174   0.2810424   0.28084317  0.28038526  0.28188807
   0.28038129  0.28026733  0.27999827  0.28134546  0.28012806 -0.01902973
   0.28367481  0.28458932  0.28495118  0.28445476  0.28363749]]
Epoch: 1000	Loss: 2.66987502575	Example Output: 13	Example Reward:  1
2.8215
[[-0.04891895 -0.04628025 -0.06320038  0.9361583  -0.06537861 -0.06044329
  -0.06535711 -0.06575767 -0.06665037 -0.06220322 -0.06624231 -0.06343006
  -0.05439329 -0.05135525 -0.05018453 -0.05181558 -0.0545473

Epoch: 1011	Loss: 3.20450232029	Example Output: X1	Example Reward:  -0.3
[[ 0.04876828  0.04621746  0.06330273  0.06410091  0.06537548  0.06071788
   0.06537424  0.06574127  0.06676623  0.0622325   0.06628875  0.06347083
   0.05429731  0.05111329  0.05012958  0.05166065  0.05444266]]
4.10344
[[-0.01463049  0.28613478  0.2810092   0.28076974  0.28038737  0.28178465
   0.28038773  0.28027761  0.27997014  0.28133026  0.28011337  0.28095877
   0.28371081  0.28466603  0.28496113  0.28450182  0.28366721]
 [ 0.28536952  0.28613478  0.2810092  -0.01923027  0.28038737  0.28178465
   0.28038773  0.28027761  0.27997014  0.28133026  0.28011337  0.28095877
   0.28371081  0.28466603  0.28496113  0.28450182  0.28366721]]
Epoch: 1012	Loss: 3.20670626163	Example Output: 1Y	Example Reward:  -0.3
[[ 0.04874273  0.04620965  0.06334989  0.06408028  0.0654192   0.06076138
   0.06536895  0.06573552  0.06675597  0.06224287  0.06629949  0.06344055
   0.05427794  0.05109882  0.05013401  0.05165524  0.05442752]]

Epoch: 1023	Loss: 3.17912538052	Example Output: 26	Example Reward:  1
[[ 0.04863919  0.0461411   0.06351064  0.06396943  0.06556897  0.06088418
   0.06533998  0.0657064   0.06668799  0.06223177  0.06641806  0.06342264
   0.05427711  0.05105621  0.05017428  0.05157785  0.05439419]]
2.815
[[-0.04863919 -0.0461411  -0.06351064 -0.06396943  0.93443102 -0.06088418
  -0.06533998 -0.0657064  -0.06668799 -0.06223177 -0.06641806 -0.06342264
  -0.05427711 -0.05105621 -0.05017428 -0.05157785 -0.05439419]
 [-0.04863919 -0.0461411  -0.06351064 -0.06396943 -0.06556897 -0.06088418
  -0.06533998 -0.0657064   0.933312   -0.06223177 -0.06641806 -0.06342264
  -0.05427711 -0.05105621 -0.05017428 -0.05157785 -0.05439419]]
Epoch: 1024	Loss: 3.07651212215	Example Output: 92	Example Reward:  1
[[ 0.04862237  0.04611886  0.06349366  0.06401404  0.06558446  0.0608426
   0.06536685  0.06572445  0.06674719  0.06222507  0.06641068  0.06344998
   0.05426846  0.05103921  0.05013403  0.05156826  0.0543899 ]]
2.81745


Epoch: 1036	Loss: 3.46222894192	Example Output: /2	Example Reward:  -0.3
[[ 0.04849822  0.04599239  0.06345193  0.06418782  0.06574184  0.06076831
   0.06565979  0.06571353  0.0667489   0.06217659  0.06664125  0.06329229
   0.05418603  0.05094866  0.05014134  0.05150322  0.05434788]]
4.10452
[[ 0.28545055  0.28620231  0.28096443  0.28074366  0.28027746  0.28176951
   0.28030208  0.28028595  0.27997532  0.28134704  0.28000763  0.28101233
   0.28374419  0.28471541  0.28495762 -0.01545097  0.28369564]
 [ 0.28545055  0.28620231  0.28096443  0.28074366 -0.01972255  0.28176951
   0.28030208  0.28028595  0.27997532  0.28134704  0.28000763  0.28101233
   0.28374419  0.28471541  0.28495762  0.28454903  0.28369564]]
Epoch: 1037	Loss: 3.5888011694	Example Output: /6	Example Reward:  -0.3
[[ 0.04848911  0.0460023   0.06347457  0.06416538  0.06572427  0.06076215
   0.06564824  0.06569473  0.06674964  0.06219054  0.06666062  0.06329093
   0.05419748  0.05094819  0.05014471  0.05150337  0.05435378]]


Epoch: 1049	Loss: 3.20577671528	Example Output: XX	Example Reward:  -0.3
[[ 0.04849323  0.04609763  0.06340872  0.06411251  0.06572609  0.0610938
   0.06553138  0.06551125  0.06664076  0.06231093  0.06671745  0.06324025
   0.05402615  0.05092189  0.05023728  0.05155023  0.05438044]]
4.09908
[[-0.01454797  0.28617072  0.2809774   0.28076625  0.28028217  0.28167188
   0.28034061  0.28034663  0.28000778  0.28130674  0.27998477  0.28102794
   0.28379217  0.28472343  0.28492883  0.28453496  0.28368589]
 [-0.01454797  0.28617072  0.2809774   0.28076625  0.28028217  0.28167188
   0.28034061  0.28034663  0.28000778  0.28130674  0.27998477  0.28102794
   0.28379217  0.28472343  0.28492883  0.28453496  0.28368589]]
Epoch: 1050	Loss: 3.46284315586	Example Output: /6	Example Reward:  -0.3
[[ 0.04847546  0.04610431  0.06341839  0.06410825  0.06571329  0.06110268
   0.06552548  0.0655046   0.06664792  0.06232545  0.06670529  0.06324134
   0.05402267  0.05092317  0.05026764  0.05154232  0.05437173]]


Epoch: 1062	Loss: 3.20670595169	Example Output: 34	Example Reward:  1
[[ 0.04847407  0.04602355  0.06332954  0.06395118  0.06571893  0.06125904
   0.06546815  0.06559811  0.06662078  0.06239474  0.06674165  0.0633579
   0.05400928  0.05089334  0.05037265  0.05142418  0.05436293]]
2.81919
[[-0.04847407 -0.04602355 -0.06332954 -0.06395118 -0.06571893  0.93874097
  -0.06546815 -0.06559811 -0.06662078 -0.06239474 -0.06674165 -0.0633579
  -0.05400928 -0.05089334 -0.05037265 -0.05142418 -0.05436293]
 [-0.04847407 -0.04602355 -0.06332954 -0.06395118 -0.06571893 -0.06125904
   0.93453187 -0.06559811 -0.06662078 -0.06239474 -0.06674165 -0.0633579
  -0.05400928 -0.05089334 -0.05037265 -0.05142418 -0.05436293]]
Epoch: 1063	Loss: 3.84777829647	Example Output: +4	Example Reward:  -0.3
[[ 0.04846109  0.04604353  0.06332958  0.06392168  0.06571572  0.06128
   0.06546899  0.06558288  0.06660091  0.06241068  0.06675928  0.0633558
   0.05402058  0.05088769  0.05037756  0.0514288   0.05435527]]
4.10519
[

Epoch: 1074	Loss: 3.07647972107	Example Output: /1	Example Reward:  -0.3
[[ 0.04834045  0.04603459  0.06331494  0.06400809  0.06566826  0.06136061
   0.06549939  0.06563921  0.06659824  0.06233096  0.06683113  0.06323991
   0.05402662  0.05094113  0.05042187  0.05141202  0.05433263]]
4.1041
[[ 0.28549787  0.28618965  0.28100553  0.28079757  0.28029954  0.28159183
   0.28035021  0.28030825  0.28002053  0.28130072  0.27995068  0.28102803
   0.28379202  0.28471768  0.28487346 -0.01542361  0.28370023]
 [ 0.28549787  0.28618965  0.28100553 -0.01920243  0.28029954  0.28159183
   0.28035021  0.28030825  0.28002053  0.28130072  0.27995068  0.28102803
   0.28379202  0.28471768  0.28487346  0.28457642  0.28370023]]
Epoch: 1075	Loss: 3.08171896935	Example Output: *1	Example Reward:  -0.3
[[ 0.0483433   0.04602624  0.06330917  0.06406867  0.06564538  0.06136057
   0.06552364  0.0656283   0.0666388   0.06230729  0.06681833  0.06323728
   0.0540163   0.05093707  0.05041327  0.0514097   0.05431668]]


Epoch: 1086	Loss: 3.20640566349	Example Output: 9*	Example Reward:  1
[[ 0.04822712  0.04591076  0.0634658   0.06400414  0.06571263  0.06137525
   0.06562075  0.06567576  0.06663875  0.06244376  0.06696247  0.06328774
   0.05397599  0.05085457  0.05029769  0.05130055  0.05424633]]
2.83057
[[-0.04822712 -0.04591076 -0.0634658  -0.06400414 -0.06571263 -0.06137525
  -0.06562075 -0.06567576 -0.06663875 -0.06244376 -0.06696247  0.93671227
  -0.05397599 -0.05085457 -0.05029769 -0.05130055 -0.05424633]
 [-0.04822712 -0.04591076 -0.0634658  -0.06400414 -0.06571263 -0.06137525
  -0.06562075 -0.06567576 -0.06663875 -0.06244376 -0.06696247 -0.06328774
  -0.05397599 -0.05085457  0.94970232 -0.05130055 -0.05424633]]
Epoch: 1087	Loss: 2.79306445122	Example Output: 20	Example Reward:  1
[[ 0.04819763  0.04588481  0.0634468   0.06399553  0.06574871  0.06135533
   0.06564386  0.06565865  0.0666762   0.06251871  0.06696515  0.06331187
   0.05394884  0.05083971  0.05027895  0.05129303  0.05423623]]
2.817

Epoch: 1098	Loss: 2.81914157867	Example Output: 88	Example Reward:  1
[[ 0.04809703  0.04591333  0.06350014  0.06393082  0.0658724   0.06139468
   0.06561652  0.06553292  0.06663766  0.06262249  0.06702619  0.06332883
   0.05395421  0.0508398   0.05027198  0.05122248  0.05423854]]
2.81328
[[-0.04809703 -0.04591333 -0.06350014 -0.06393082 -0.0658724  -0.06139468
  -0.06561652 -0.06553292 -0.06663766 -0.06262249  0.9329738  -0.06332883
  -0.05395421 -0.0508398  -0.05027198 -0.05122248 -0.05423854]
 [-0.04809703 -0.04591333 -0.06350014 -0.06393082 -0.0658724  -0.06139468
  -0.06561652 -0.06553292 -0.06663766 -0.06262249  0.9329738  -0.06332883
  -0.05395421 -0.0508398  -0.05027198 -0.05122248 -0.05423854]]
Epoch: 1099	Loss: 3.04815366268	Example Output: 84	Example Reward:  1
[[ 0.04806746  0.04588367  0.06354035  0.06393779  0.06587622  0.06138495
   0.06562886  0.06554761  0.06664532  0.06260835  0.06709957  0.06336243
   0.05395603  0.0508235   0.05023117  0.05120061  0.05420611]]
2.814

Epoch: 1111	Loss: 3.33200454712	Example Output: 62	Example Reward:  1
[[ 0.04804403  0.04590558  0.06380893  0.06364572  0.0659145   0.06143868
   0.06544572  0.06543835  0.06670573  0.06284247  0.06704983  0.06332126
   0.05388336  0.05074732  0.05030825  0.05130685  0.05419332]]
2.81434
[[-0.04804403 -0.04590558 -0.06380893 -0.06364572 -0.0659145  -0.06143868
  -0.06544572 -0.06543835  0.9332943  -0.06284247 -0.06704983 -0.06332126
  -0.05388336 -0.05074732 -0.05030825 -0.05130685 -0.05419332]
 [-0.04804403 -0.04590558 -0.06380893 -0.06364572  0.93408549 -0.06143868
  -0.06544572 -0.06543835 -0.06670573 -0.06284247 -0.06704983 -0.06332126
  -0.05388336 -0.05074732 -0.05030825 -0.05130685 -0.05419332]]
Epoch: 1112	Loss: 3.30676746368	Example Output: X5	Example Reward:  -0.3
[[ 0.04804657  0.04588889  0.06382657  0.06364717  0.06595279  0.06143362
   0.06544247  0.06544757  0.06671431  0.06282891  0.0670609   0.06332287
   0.05387266  0.05072507  0.0503033   0.05130154  0.05418478]]
4.

Epoch: 1123	Loss: 3.17953059673	Example Output: X4	Example Reward:  -0.3
[[ 0.04795997  0.04579834  0.0638637   0.06360064  0.06597666  0.06138572
   0.06550352  0.0656052   0.06683328  0.06282157  0.06704269  0.06340557
   0.053944    0.05066577  0.05028852  0.05117608  0.05412875]]
4.10323
[[-0.01438799  0.28626052  0.2808409   0.28091982  0.28020701  0.28158429
   0.28034896  0.28031844  0.27995002  0.28115353  0.2798872   0.28097835
   0.28381681  0.28480026  0.28491345  0.2846472   0.28376138]
 [ 0.28561202  0.28626052  0.2808409   0.28091982  0.28020701  0.28158429
  -0.01965106  0.28031844  0.27995002  0.28115353  0.2798872   0.28097835
   0.28381681  0.28480026  0.28491345  0.2846472   0.28376138]]
Epoch: 1124	Loss: 3.33215334415	Example Output: 03	Example Reward:  1
[[ 0.04793477  0.04580497  0.06385687  0.06359418  0.06595053  0.06136689
   0.06551699  0.06559105  0.06684333  0.06283796  0.06705628  0.06340311
   0.05394315  0.05069023  0.05028276  0.05118176  0.05414519]]
2.

Epoch: 1137	Loss: 2.94740455151	Example Output: 93	Example Reward:  1
[[ 0.04786027  0.04569126  0.06384567  0.06370826  0.06593337  0.0613989
   0.06551278  0.06566477  0.06700849  0.06281301  0.06711979  0.06339005
   0.05383473  0.05066403  0.050204    0.05123005  0.05412068]]
2.82023
[[-0.04786027 -0.04569126 -0.06384567 -0.06370826 -0.06593337 -0.0613989
  -0.06551278 -0.06566477 -0.06700849 -0.06281301 -0.06711979  0.93660992
  -0.05383473 -0.05066403 -0.050204   -0.05123005 -0.05412068]
 [-0.04786027 -0.04569126 -0.06384567 -0.06370826 -0.06593337  0.93860108
  -0.06551278 -0.06566477 -0.06700849 -0.06281301 -0.06711979 -0.06339005
  -0.05383473 -0.05066403 -0.050204   -0.05123005 -0.05412068]]
Epoch: 1138	Loss: 2.38378443718	Example Output: 87	Example Reward:  1
[[ 0.04784009  0.04565572  0.06383641  0.06373443  0.0659392   0.06141511
   0.06553832  0.06570598  0.06704769  0.06281037  0.06712429  0.06339166
   0.05381311  0.0506381   0.05020066  0.05119866  0.05411024]]
2.81619

Epoch: 1151	Loss: 3.20530409813	Example Output: 9+	Example Reward:  1
[[ 0.04775776  0.04570368  0.06360628  0.0638475   0.0657366   0.06148444
   0.0656971   0.06553302  0.06711357  0.06300674  0.06711981  0.06351981
   0.05362596  0.05068797  0.05007698  0.05128533  0.0541974 ]]
2.82684
[[-0.04775776 -0.04570368 -0.06360628 -0.0638475  -0.0657366  -0.06148444
  -0.0656971  -0.06553302 -0.06711357 -0.06300674 -0.06711981  0.93648016
  -0.05362596 -0.05068797 -0.05007698 -0.05128533 -0.0541974 ]
 [-0.04775776 -0.04570368 -0.06360628 -0.0638475  -0.0657366  -0.06148444
  -0.0656971  -0.06553302 -0.06711357 -0.06300674 -0.06711981 -0.06351981
   0.94637406 -0.05068797 -0.05007698 -0.05128533 -0.0541974 ]]
Epoch: 1152	Loss: 3.17821130753	Example Output: +*	Example Reward:  -0.3
[[ 0.04775097  0.04569793  0.06358252  0.06387232  0.06572548  0.06147515
   0.06569146  0.06557196  0.0670844   0.06297795  0.06714597  0.06353824
   0.05363822  0.05070207  0.0500628   0.05127871  0.05420385]]
4.

2.81478
[[-0.04758101 -0.04554347 -0.06359161 -0.06402917 -0.06580548 -0.06157598
  -0.065871    0.93443465 -0.06730247 -0.06309894 -0.06721661 -0.06364474
  -0.05345938 -0.05056483 -0.04990639 -0.05113192 -0.05411175]
 [-0.04758101 -0.04554347 -0.06359161 -0.06402917  0.93419451 -0.06157598
  -0.065871   -0.06556533 -0.06730247 -0.06309894 -0.06721661 -0.06364474
  -0.05345938 -0.05056483 -0.04990639 -0.05113192 -0.05411175]]
Epoch: 1166	Loss: 2.92415423393	Example Output: X-	Example Reward:  1
[[ 0.04757036  0.04554481  0.06357624  0.06402437  0.06580345  0.06159496
   0.0658922   0.06555521  0.067301    0.06311326  0.06720855  0.06367645
   0.05345689  0.05055948  0.04989038  0.05112206  0.05411031]]
2.84399
[[ 0.95242965 -0.04554481 -0.06357624 -0.06402437 -0.06580345 -0.06159496
  -0.0658922  -0.06555521 -0.067301   -0.06311326 -0.06720855 -0.06367645
  -0.05345689 -0.05055948 -0.04989038 -0.05112206 -0.05411031]
 [-0.04757036 -0.04554481 -0.06357624 -0.06402437 -0.06580345 -0.061

Epoch: 1179	Loss: 2.79465360641	Example Output: 54	Example Reward:  1
[[ 0.04770418  0.04565094  0.06382348  0.06387287  0.06578412  0.06198102
   0.06553097  0.06549624  0.06729069  0.06307859  0.06707702  0.06339168
   0.05339765  0.05046697  0.05018176  0.05128453  0.05398729]]
2.81518
[[-0.04770418 -0.04565094 -0.06382348 -0.06387287 -0.06578412 -0.06198102
  -0.06553097  0.93450379 -0.06729069 -0.06307859 -0.06707702 -0.06339168
  -0.05339765 -0.05046697 -0.05018176 -0.05128453 -0.05398729]
 [-0.04770418 -0.04565094 -0.06382348 -0.06387287 -0.06578412 -0.06198102
   0.93446904 -0.06549624 -0.06729069 -0.06307859 -0.06707702 -0.06339168
  -0.05339765 -0.05046697 -0.05018176 -0.05128453 -0.05398729]]
Epoch: 1180	Loss: 3.17883532047	Example Output: 93	Example Reward:  1
[[ 0.04772098  0.04563699  0.06379873  0.06386313  0.06578563  0.06199804
   0.06555077  0.06551582  0.06726938  0.06307472  0.06709981  0.06340101
   0.05337381  0.0504691   0.05017525  0.05126565  0.05400118]]
2.819

Epoch: 1193	Loss: 2.63934090137	Example Output: X3	Example Reward:  -0.3
[[ 0.04762306  0.04563765  0.06383675  0.06383333  0.06568918  0.06224627
   0.06547679  0.06544157  0.06734571  0.06314468  0.06722522  0.06351684
   0.05323241  0.05040272  0.05020544  0.05123069  0.05391174]]
4.1022
[[-0.01428692  0.28630871  0.28084898  0.28084999  0.28029326  0.28132614
   0.28035697  0.28036755  0.2797963   0.28105661  0.27983245  0.28094494
   0.28403029  0.28487921  0.28493837  0.28463081  0.2838265 ]
 [ 0.28571311  0.28630871  0.28084898  0.28084999  0.28029326 -0.01867388
   0.28035697  0.28036755  0.2797963   0.28105661  0.27983245  0.28094494
   0.28403029  0.28487921  0.28493837  0.28463081  0.2838265 ]]
Epoch: 1194	Loss: 2.92178318501	Example Output: 2*	Example Reward:  1
[[ 0.04760525  0.04562198  0.06383865  0.0638655   0.06568653  0.06224177
   0.0654966   0.0654562   0.06734262  0.06313007  0.06726752  0.06352495
   0.05322487  0.05039816  0.05019926  0.05121206  0.05388802]]
2.8

Epoch: 1207	Loss: 3.20864064693	Example Output: 8-	Example Reward:  1
[[ 0.04748916  0.04540715  0.06384716  0.06378829  0.06587075  0.06217078
   0.06578483  0.06563731  0.06738474  0.06318621  0.0673558   0.06356325
   0.05318025  0.05032183  0.05006912  0.05113415  0.05380911]]
2.82668
[[-0.04748916 -0.04540715 -0.06384716 -0.06378829 -0.06587075 -0.06217078
  -0.06578483 -0.06563731 -0.06738474 -0.06318621  0.93264419 -0.06356325
  -0.05318025 -0.05032183 -0.05006912 -0.05113415 -0.05380911]
 [-0.04748916 -0.04540715 -0.06384716 -0.06378829 -0.06587075 -0.06217078
  -0.06578483 -0.06563731 -0.06738474 -0.06318621 -0.0673558  -0.06356325
  -0.05318025  0.94967818 -0.05006912 -0.05113415 -0.05380911]]
Epoch: 1208	Loss: 2.64250223637	Example Output: +1	Example Reward:  -0.3
[[ 0.04747771  0.04542205  0.06386387  0.06378272  0.0658389   0.06215981
   0.06581239  0.06561627  0.06736981  0.06315865  0.06737711  0.06356806
   0.05319573  0.05035703  0.05006802  0.05113317  0.05379872]]
4.

Epoch: 1219	Loss: 2.63945438862	Example Output: 8X	Example Reward:  -0.3
[[ 0.04745765  0.04530686  0.0637996   0.06382817  0.06580985  0.06206034
   0.06591211  0.0655995   0.06742069  0.06318448  0.06734721  0.06369532
   0.05316233  0.05037019  0.05001089  0.05107316  0.05396162]]
4.1032
[[ 0.28576273  0.28640795  0.28086013  0.28085157  0.28025705  0.28138191
   0.28022638  0.28032017  0.2797738   0.28104466 -0.02020416  0.28089142
   0.2840513   0.28488895  0.28499675  0.28467807  0.28381151]
 [-0.01423729  0.28640795  0.28086013  0.28085157  0.28025705  0.28138191
   0.28022638  0.28032017  0.2797738   0.28104466  0.27979586  0.28089142
   0.2840513   0.28488895  0.28499675  0.28467807  0.28381151]]
Epoch: 1220	Loss: 3.0503418684	Example Output: 55	Example Reward:  1
[[ 0.04744469  0.04531416  0.06378184  0.06382974  0.06579449  0.06210227
   0.0659109   0.06558567  0.06742131  0.06317062  0.06736602  0.06370632
   0.05315701  0.05037558  0.05001243  0.05105823  0.05396866]]
2.81

Epoch: 1231	Loss: 3.20205864906	Example Output: +/	Example Reward:  -0.3
[[ 0.0473458   0.04521114  0.06360977  0.06409398  0.06572242  0.06217907
   0.06602184  0.06578619  0.06769729  0.06309984  0.0674115   0.06359148
   0.05304211  0.05038254  0.04991827  0.05097288  0.05391394]]
4.10062
[[ 0.28579625  0.28643668  0.28091708  0.28077182  0.2802833   0.28134629
   0.28019345  0.28026417  0.27969083  0.28107005  0.27977657  0.28092256
  -0.01591263  0.28488526  0.28502452  0.28470814  0.28382581]
 [ 0.28579625  0.28643668  0.28091708  0.28077182  0.2802833   0.28134629
   0.28019345  0.28026417  0.27969083  0.28107005  0.27977657  0.28092256
   0.28408739  0.28488526  0.28502452 -0.01529186  0.28382581]]
Epoch: 1232	Loss: 3.1528646946	Example Output: */	Example Reward:  -0.3
[[ 0.04733574  0.04520966  0.06361794  0.06410297  0.06574063  0.06217486
   0.06604941  0.06578971  0.06771867  0.06309936  0.06739891  0.06357367
   0.05303432  0.05037612  0.04991576  0.05095805  0.05390418]]


Epoch: 1246	Loss: 3.07644357681	Example Output: 2	Example Reward:  1
[[ 0.04722878  0.04503837  0.06368916  0.06425473  0.06604648  0.06199305
   0.06616502  0.06592382  0.06789616  0.06312606  0.06733543  0.06353617
   0.05296156  0.05030859  0.04967691  0.05086853  0.05395118]]
2.82378
[[-0.04722878 -0.04503837 -0.06368916 -0.06425473  0.93395352 -0.06199305
  -0.06616502 -0.06592382 -0.06789616 -0.06312606 -0.06733543 -0.06353617
  -0.05296156 -0.05030859 -0.04967691 -0.05086853 -0.05395118]
 [-0.04722878 -0.04503837 -0.06368916 -0.06425473 -0.06604648 -0.06199305
  -0.06616502 -0.06592382 -0.06789616 -0.06312606 -0.06733543 -0.06353617
  -0.05296156 -0.05030859 -0.04967691 -0.05086853  0.9460488 ]]
Epoch: 1247	Loss: 2.66618335247	Example Output: 48	Example Reward:  1
[[ 0.04721206  0.04501062  0.06369164  0.06425212  0.06606475  0.06200435
   0.06619056  0.06595644  0.06789498  0.06312189  0.0673417   0.06353565
   0.05295325  0.05030668  0.04967487  0.05083703  0.05395143]]
2.8125

Epoch: 1259	Loss: 2.79146709442	Example Output: 9-	Example Reward:  1
[[ 0.0471758   0.04494128  0.06376909  0.06439253  0.06586877  0.06214332
   0.06622446  0.06589741  0.06790969  0.0631377   0.06733231  0.06357285
   0.05284278  0.05034325  0.04974241  0.05077901  0.05392733]]
2.82909
[[-0.0471758  -0.04494128 -0.06376909 -0.06439253 -0.06586877 -0.06214332
  -0.06622446 -0.06589741 -0.06790969 -0.0631377  -0.06733231  0.93642712
  -0.05284278 -0.05034325 -0.04974241 -0.05077901 -0.05392733]
 [-0.0471758  -0.04494128 -0.06376909 -0.06439253 -0.06586877 -0.06214332
  -0.06622446 -0.06589741 -0.06790969 -0.0631377  -0.06733231 -0.06357285
  -0.05284278  0.94965672 -0.04974241 -0.05077901 -0.05392733]]
Epoch: 1260	Loss: 3.43437409401	Example Output: +8	Example Reward:  -0.3
[[ 0.04716003  0.04493175  0.06375897  0.0644208   0.06585132  0.06212549
   0.06622212  0.0659124   0.06790832  0.06311688  0.06736504  0.06359426
   0.05284275  0.05036857  0.04972335  0.05077721  0.05392076]]
4.

Epoch: 1272	Loss: 3.43390371799	Example Output: *1	Example Reward:  -0.3
[[ 0.04710954  0.04487267  0.06364611  0.06451965  0.06586221  0.06206867
   0.06629474  0.06580051  0.06778821  0.06320933  0.0675382   0.06385439
   0.05276334  0.05037457  0.04964258  0.05071188  0.05394343]]
4.10299
[[ 0.28586715  0.28653821  0.2809062   0.28064412  0.28024137  0.2813794
   0.28011158  0.28025988  0.27966353  0.28103721  0.27973855  0.2808437
   0.28417102  0.28488764 -0.01489277  0.28478646  0.28381696]
 [ 0.28586715  0.28653821  0.2809062  -0.0193559   0.28024137  0.2813794
   0.28011158  0.28025988  0.27966353  0.28103721  0.27973855  0.2808437
   0.28417102  0.28488764  0.28510725  0.28478646  0.28381696]]
Epoch: 1273	Loss: 2.64128332138	Example Output: +1	Example Reward:  -0.3
[[ 0.0470967   0.04488198  0.06365636  0.06451576  0.06587542  0.06203982
   0.06631199  0.06579309  0.06779228  0.0632327   0.06752719  0.0638377
   0.05276244  0.05036675  0.04963019  0.05073132  0.05394822]]
4.10

Epoch: 1285	Loss: 3.07750477791	Example Output: 0	Example Reward:  1
[[ 0.04699166  0.04487544  0.06356321  0.06475993  0.0658719   0.06187386
   0.06649935  0.06579402  0.06797005  0.06312354  0.06767849  0.06378647
   0.05270784  0.05031642  0.04947899  0.05079491  0.05391394]]
2.82547
[[-0.04699166 -0.04487544  0.93643677 -0.06475993 -0.0658719  -0.06187386
  -0.06649935 -0.06579402 -0.06797005 -0.06312354 -0.06767849 -0.06378647
  -0.05270784 -0.05031642 -0.04947899 -0.05079491 -0.05391394]
 [-0.04699166 -0.04487544 -0.06356321 -0.06475993 -0.0658719  -0.06187386
  -0.06649935 -0.06579402 -0.06797005 -0.06312354 -0.06767849 -0.06378647
  -0.05270784 -0.05031642 -0.04947899 -0.05079491  0.94608605]]
Epoch: 1286	Loss: 3.17740795612	Example Output: 89	Example Reward:  1
[[ 0.04700925  0.04487656  0.06354861  0.06475519  0.06585056  0.06190107
   0.06646881  0.06580678  0.06796755  0.06311867  0.06765293  0.06378306
   0.05269305  0.05030974  0.0495118   0.05080796  0.05393842]]
2.8139

Epoch: 1298	Loss: 3.20242612362	Example Output: 9X	Example Reward:  -0.3
[[ 0.04692901  0.04478529  0.06355072  0.06461962  0.06593803  0.06181942
   0.066508    0.06608275  0.0681389   0.06312896  0.06752329  0.06379974
   0.05260485  0.05024894  0.04951129  0.05077814  0.05403312]]
4.10189
[[ 0.28592131  0.28656441  0.28093481  0.28061414  0.2802186   0.28145418
   0.28004763  0.28017518  0.27955833  0.28106132  0.27974302 -0.01913992
   0.28421855  0.28492534  0.28514662  0.28476655  0.28379008]
 [-0.0140787   0.28656441  0.28093481  0.28061414  0.2802186   0.28145418
   0.28004763  0.28017518  0.27955833  0.28106132  0.27974302  0.2808601
   0.28421855  0.28492534  0.28514662  0.28476655  0.28379008]]
Epoch: 1299	Loss: 2.53779141903	Example Output: 53	Example Reward:  1
[[ 0.04689625  0.04476687  0.06355157  0.06471523  0.06592945  0.06179151
   0.0665101   0.06611653  0.06818742  0.0631163   0.0675254   0.06376816
   0.05258913  0.05024535  0.04947917  0.0507933   0.05401829]]
2.8

Epoch: 1312	Loss: 3.58894507885	Example Output: +2	Example Reward:  -0.3
[[ 0.04671235  0.0446422   0.06352212  0.06482778  0.06613902  0.06178442
   0.06650638  0.06642094  0.06834966  0.0630964   0.06750407  0.06371406
   0.05248838  0.05017162  0.04946841  0.05072848  0.05392369]]
4.104
[[ 0.2859863   0.28660735  0.28094339  0.28055167  0.28015831  0.2814647
   0.2800481   0.28007373  0.27949512  0.2810711   0.2797488   0.28088579
  -0.01574652  0.28494853  0.2851595   0.28478146  0.28382292]
 [ 0.2859863   0.28660735  0.28094339  0.28055167 -0.01984171  0.2814647
   0.2800481   0.28007373  0.27949512  0.2810711   0.2797488   0.28088579
   0.28425351  0.28494853  0.2851595   0.28478146  0.28382292]]
Epoch: 1313	Loss: 2.92124099731	Example Output: /4	Example Reward:  -0.3
[[ 0.04670837  0.04465711  0.0635154   0.06480387  0.06615513  0.06177565
   0.06648101  0.06644067  0.06833901  0.06314549  0.06745712  0.06370665
   0.05251105  0.05015923  0.04947486  0.05073279  0.05393657]]
4.1

Epoch: 1325	Loss: 3.20078513622	Example Output: +0	Example Reward:  -0.3
[[ 0.04653494  0.04457808  0.06346167  0.06488123  0.06632362  0.06178224
   0.06648412  0.06658586  0.06833223  0.06333126  0.06736752  0.06368615
   0.05252695  0.05010787  0.04941114  0.05064651  0.05395868]]
4.10335
[[ 0.28603953  0.28662658  0.28096151  0.28053564  0.28010291  0.28146535
   0.28005478  0.28002426  0.27950037  0.28100064  0.27978978  0.28089416
  -0.01575809  0.28496763  0.28517666  0.28480607  0.2838124 ]
 [ 0.28603953  0.28662658 -0.0190385   0.28053564  0.28010291  0.28146535
   0.28005478  0.28002426  0.27950037  0.28100064  0.27978978  0.28089416
   0.28424191  0.28496763  0.28517666  0.28480607  0.2838124 ]]
Epoch: 1326	Loss: 3.30509448051	Example Output: /+	Example Reward:  -0.3
[[ 0.04653252  0.04456635  0.06343275  0.06485889  0.06634994  0.06177115
   0.06651861  0.0665973   0.06835214  0.06335768  0.06734503  0.06370945
   0.05251032  0.05009676  0.04940712  0.05063343  0.05396061]]

Epoch: 1338	Loss: 2.66113712788	Example Output: 76	Example Reward:  1
[[ 0.04645589  0.04454149  0.06368955  0.0645756   0.06646174  0.0620749
   0.06650691  0.06658021  0.06839018  0.06336994  0.06737585  0.06365325
   0.05247149  0.04995572  0.04958333  0.05047578  0.05383813]]
2.81326
[[-0.04645589 -0.04454149 -0.06368955 -0.0645756  -0.06646174 -0.0620749
  -0.06650691 -0.06658021 -0.06839018  0.93663007 -0.06737585 -0.06365325
  -0.05247149 -0.04995572 -0.04958333 -0.05047578 -0.05383813]
 [-0.04645589 -0.04454149 -0.06368955 -0.0645756  -0.06646174 -0.0620749
  -0.06650691 -0.06658021  0.93160981 -0.06336994 -0.06737585 -0.06365325
  -0.05247149 -0.04995572 -0.04958333 -0.05047578 -0.05383813]]
Epoch: 1339	Loss: 3.20193595886	Example Output: +4	Example Reward:  -0.3
[[ 0.0464172   0.04450927  0.0637412   0.06457599  0.06650441  0.0620633
   0.06653522  0.06659066  0.06845362  0.06340902  0.06736739  0.06366267
   0.05245044  0.04990923  0.04954491  0.05046075  0.05380471]]
4.1039

Epoch: 1351	Loss: 2.6387595892	Example Output: 53	Example Reward:  1
[[ 0.04651124  0.04456295  0.06403392  0.06425773  0.06664869  0.06234035
   0.06637002  0.06661213  0.06831086  0.06348141  0.0671616   0.06371728
   0.05241876  0.04977245  0.04962268  0.05042515  0.05375285]]
2.81537
[[-0.04651124 -0.04456295 -0.06403392 -0.06425773 -0.06664869 -0.06234035
  -0.06637002  0.93338788 -0.06831086 -0.06348141 -0.0671616  -0.06371728
  -0.05241876 -0.04977245 -0.04962268 -0.05042515 -0.05375285]
 [-0.04651124 -0.04456295 -0.06403392 -0.06425773 -0.06664869  0.93765962
  -0.06637002 -0.06661213 -0.06831086 -0.06348141 -0.0671616  -0.06371728
  -0.05241876 -0.04977245 -0.04962268 -0.05042515 -0.05375285]]
Epoch: 1352	Loss: 3.08312869072	Example Output: 3	Example Reward:  1
[[ 0.04656177  0.04457084  0.06404348  0.06426089  0.06660457  0.06239627
   0.06633845  0.0666042   0.068288    0.06343616  0.06717496  0.06369396
   0.05241573  0.04978129  0.0496712   0.0504191   0.05373907]]
2.8261


Epoch: 1364	Loss: 3.33282625675	Example Output: 23	Example Reward:  1
[[ 0.04662864  0.04463058  0.06415158  0.06410134  0.06645223  0.06265938
   0.06629302  0.06649101  0.06820297  0.06353289  0.06700524  0.06373835
   0.05238912  0.04976236  0.04986266  0.05033238  0.05376624]]
2.81536
[[-0.04662864 -0.04463058 -0.06415158 -0.06410134  0.93354779 -0.06265938
  -0.06629302 -0.06649101 -0.06820297 -0.06353289 -0.06700524 -0.06373835
  -0.05238912 -0.04976236 -0.04986266 -0.05033238 -0.05376624]
 [-0.04662864 -0.04463058 -0.06415158 -0.06410134 -0.06645223  0.93734062
  -0.06629302 -0.06649101 -0.06820297 -0.06353289 -0.06700524 -0.06373835
  -0.05238912 -0.04976236 -0.04986266 -0.05033238 -0.05376624]]
Epoch: 1365	Loss: 2.92246260643	Example Output: 08	Example Reward:  1
[[ 0.04662544  0.04463296  0.0641516   0.06410188  0.066462    0.06268076
   0.06626645  0.06649467  0.0681938   0.06354839  0.0669844   0.0637321
   0.05237653  0.04977801  0.04987109  0.05034078  0.05375909]]
2.8137

Epoch: 1377	Loss: 3.07672326565	Example Output: *-	Example Reward:  -0.3
[[ 0.04657834  0.04462589  0.06418814  0.06421277  0.06634271  0.06270157
   0.06623963  0.06645102  0.06831137  0.06360887  0.06692582  0.06398665
   0.05236681  0.04972512  0.04978621  0.05027767  0.05367146]]
4.09886
[[ 0.28602651  0.28661224  0.28074357  0.28073618  0.28009719  0.28118953
   0.28012812  0.2800647   0.27950659  0.28091735  0.27992228  0.28080401
   0.28428999  0.28508249 -0.01493586  0.28491673  0.28389856]
 [ 0.28602651  0.28661224  0.28074357  0.28073618  0.28009719  0.28118953
   0.28012812  0.2800647   0.27950659  0.28091735  0.27992228  0.28080401
   0.28428999 -0.01491754  0.28506416  0.28491673  0.28389856]]
Epoch: 1378	Loss: 2.79869675636	Example Output: 3X	Example Reward:  -0.3
[[ 0.04656391  0.04466339  0.06417898  0.06424847  0.06630273  0.06267475
   0.06624138  0.06643283  0.06834584  0.06360587  0.0669039   0.06397312
   0.05236756  0.04973632  0.04978627  0.05030884  0.0536659 ]]

Epoch: 1391	Loss: 3.33089468479	Example Output: 96	Example Reward:  1
[[ 0.04645491  0.04471471  0.06428999  0.06432571  0.06638598  0.06275816
   0.06615491  0.06637207  0.06839888  0.06377329  0.06678477  0.06399831
   0.05236145  0.04959331  0.04974284  0.05030109  0.05358957]]
2.81274
[[-0.04645491 -0.04471471 -0.06428999 -0.06432571 -0.06638598 -0.06275816
  -0.06615491 -0.06637207 -0.06839888 -0.06377329 -0.06678477  0.93600166
  -0.05236145 -0.04959331 -0.04974284 -0.05030109 -0.05358957]
 [-0.04645491 -0.04471471 -0.06428999 -0.06432571 -0.06638598 -0.06275816
  -0.06615491 -0.06637207  0.93160111 -0.06377329 -0.06678477 -0.06399831
  -0.05236145 -0.04959331 -0.04974284 -0.05030109 -0.05358957]]
Epoch: 1392	Loss: 2.66287946701	Example Output: 13	Example Reward:  1
[[ 0.04643318  0.04469386  0.06430946  0.0643476   0.06637858  0.06275903
   0.06617521  0.06634937  0.06842753  0.06377088  0.06682117  0.0640341
   0.05236524  0.04958241  0.04971258  0.05027572  0.05356409]]
2.8167

Epoch: 1405	Loss: 3.59139719009	Example Output: -6	Example Reward:  -0.3
[[ 0.04626897  0.04448302  0.06458295  0.06442592  0.06642736  0.06272802
   0.06638809  0.06647813  0.06855369  0.06385172  0.0667743   0.06423651
   0.05239458  0.04944381  0.04951007  0.0500931   0.0533597 ]]
4.10339
[[ 0.28611934  0.2866551   0.28062513  0.28067222  0.28007179  0.2811816
   0.2800836   0.28005657  0.27943391  0.28084451  0.27996773  0.28072906
   0.28428164 -0.01483314  0.28514698  0.28497207  0.28399211]
 [ 0.28611934  0.2866551   0.28062513  0.28067222  0.28007179  0.2811816
   0.2800836   0.28005657 -0.02056611  0.28084451  0.27996773  0.28072906
   0.28428164  0.28516686  0.28514698  0.28497207  0.28399211]]
Epoch: 1406	Loss: 3.45763018131	Example Output: YY	Example Reward:  -0.3
[[ 0.04631616  0.04449635  0.06457561  0.06439315  0.06640185  0.06279274
   0.06636181  0.06646727  0.06849205  0.06383605  0.06676517  0.06426873
   0.05238869  0.04943131  0.04955682  0.0500902   0.05336594]]
4

Epoch: 1418	Loss: 2.92435309887	Example Output: 3/	Example Reward:  1
[[ 0.04646824  0.0445969   0.064622    0.06407236  0.06613099  0.06301494
   0.06626834  0.06632068  0.06823634  0.06390357  0.06674488  0.06442881
   0.05241023  0.04959262  0.04965861  0.05012649  0.05340398]]
2.82896
[[-0.04646824 -0.0445969  -0.064622   -0.06407236 -0.06613099  0.93698508
  -0.06626834 -0.06632068 -0.06823634 -0.06390357 -0.06674488 -0.06442881
  -0.05241023 -0.04959262 -0.04965861 -0.05012649 -0.05340398]
 [-0.04646824 -0.0445969  -0.064622   -0.06407236 -0.06613099 -0.06301494
  -0.06626834 -0.06632068 -0.06823634 -0.06390357 -0.06674488 -0.06442881
  -0.05241023 -0.04959262 -0.04965861  0.94987351 -0.05340398]]
Epoch: 1419	Loss: 2.51042990685	Example Output: 20	Example Reward:  1
2.81387
[[-0.0464648  -0.04461755 -0.06465245 -0.06406429  0.93390691 -0.06304998
  -0.06624918 -0.0662991  -0.06821675 -0.06390297 -0.0667528  -0.06441492
  -0.05242241 -0.04959689 -0.04965061 -0.05015885 -0.05339345

Epoch: 1431	Loss: 2.91928412914	Example Output: 68	Example Reward:  1
2.8104
[[-0.04628434 -0.04439389 -0.06471013 -0.06417298 -0.06623593 -0.06308481
  -0.06639513 -0.0665916   0.93180931 -0.06399729 -0.06681944 -0.06441587
  -0.05243939 -0.04955435 -0.0494469  -0.04996283 -0.05330442]
 [-0.04628434 -0.04439389 -0.06471013 -0.06417298 -0.06623593 -0.06308481
  -0.06639513 -0.0665916  -0.0681907  -0.06399729  0.93318057 -0.06441587
  -0.05243939 -0.04955435 -0.0494469  -0.04996283 -0.05330442]]
Epoch: 1432	Loss: 3.33147408962	Example Output: 94	Example Reward:  1
[[ 0.04627139  0.04439217  0.06470513  0.06417851  0.0662404   0.06309231
   0.06639022  0.06658958  0.06821778  0.06400567  0.06684123  0.06442194
   0.05242785  0.04953312  0.04944191  0.04995446  0.0532963 ]]
2.81355
[[-0.04627139 -0.04439217 -0.06470513 -0.06417851 -0.0662404  -0.06309231
  -0.06639022 -0.06658958 -0.06821778 -0.06400567 -0.06684123  0.93557805
  -0.05242785 -0.04953312 -0.04944191 -0.04995446 -0.0532963 ]

Epoch: 1443	Loss: 3.33562073708	Example Output: *	Example Reward:  -0.3
[[ 0.04630223  0.04438642  0.06458709  0.06436368  0.06619339  0.06303982
   0.06640868  0.06666628  0.06845564  0.06391881  0.06668514  0.06441385
   0.05234768  0.04952011  0.04944531  0.04993762  0.05332835]]
4.0996
[[ 0.28610936  0.28668407  0.28062388  0.28069091  0.28014198  0.28108805
   0.2800774   0.28000012  0.27946332  0.28082436  0.27999446  0.28067586
   0.28429571  0.28514397 -0.01483359  0.28501874  0.2840015 ]
 [ 0.28610936  0.28668407  0.28062388  0.28069091  0.28014198  0.28108805
   0.2800774   0.28000012  0.27946332  0.28082436  0.27999446  0.28067586
   0.28429571  0.28514397  0.28516641  0.28501874 -0.01599851]]
Epoch: 1444	Loss: 3.18341355324	Example Output: 4+	Example Reward:  1
[[ 0.04630955  0.04444217  0.06458107  0.06435014  0.06616146  0.06301609
   0.06637827  0.06663416  0.06845756  0.06391716  0.06664203  0.06439416
   0.05238461  0.04956287  0.04944618  0.04997776  0.05334468]]
2.82

Epoch: 1457	Loss: 3.46526813507	Example Output: 8X	Example Reward:  -0.3
[[ 0.04616914  0.04427648  0.06439994  0.06452683  0.06637344  0.0628171
   0.06648148  0.06694205  0.0684201   0.06369755  0.06687914  0.06440969
   0.05249301  0.04957455  0.0492909   0.04991117  0.05333753]]
4.10192
[[ 0.28614926  0.28671706  0.28068003  0.28064197  0.28008798  0.28115487
   0.28005558  0.27991739  0.27947399  0.28089073 -0.02006374  0.28067711
   0.28425211  0.28512764  0.28521276  0.28502667  0.28399876]
 [-0.01385074  0.28671706  0.28068003  0.28064197  0.28008798  0.28115487
   0.28005558  0.27991739  0.27947399  0.28089073  0.27993625  0.28067711
   0.28425211  0.28512764  0.28521276  0.28502667  0.28399876]]
Epoch: 1458	Loss: 3.0748966217	Example Output: 9*	Example Reward:  1
[[ 0.04619653  0.04428121  0.06440476  0.06448232  0.06639159  0.0628078
   0.06646716  0.06693695  0.06838666  0.06368989  0.06687362  0.06441436
   0.05249405  0.04958181  0.04932705  0.04990804  0.05335618]]
2.828

Epoch: 1470	Loss: 2.66179223061	Example Output: XX	Example Reward:  -0.3
4.09637
[[-0.01385671  0.28674266  0.2806465   0.28066045  0.28010371  0.28112209
   0.28002661  0.27987474  0.27949503  0.28091979  0.27994943  0.28071836
   0.28427497  0.28510898  0.28518862  0.28503942  0.28398558]
 [-0.01385671  0.28674266  0.2806465   0.28066045  0.28010371  0.28112209
   0.28002661  0.27987474  0.27949503  0.28091979  0.27994943  0.28071836
   0.28427497  0.28510898  0.28518862  0.28503942  0.28398558]]
Saving Weight
Epoch: 1471	Loss: 2.79155664444	Example Output: 32	Example Reward:  1
2.8146
[[-0.04615885 -0.04417392 -0.06455842 -0.06446358 -0.06639294  0.93711609
  -0.06656484 -0.06711338 -0.06832694 -0.06360847 -0.06684892 -0.06426279
  -0.05243414 -0.04961234 -0.04934597 -0.04989009 -0.0533605 ]
 [-0.04615885 -0.04417392 -0.06455842 -0.06446358  0.93360704 -0.06288391
  -0.06656484 -0.06711338 -0.06832694 -0.06360847 -0.06684892 -0.06426279
  -0.05243414 -0.04961234 -0.04934597 -0.04989

Epoch: 1485	Loss: 2.94719383717	Example Output: 6/	Example Reward:  1
[[ 0.04595277  0.04401585  0.06484877  0.06437922  0.06659391  0.06304134
   0.06641562  0.06727465  0.0682297   0.06369475  0.06714782  0.06425971
   0.05242161  0.04947172  0.04924297  0.04983399  0.05317565]]
2.82463
[[-0.04595277 -0.04401585 -0.06484877 -0.06437922 -0.06659391 -0.06304134
  -0.06641562 -0.06727465  0.93177032 -0.06369475 -0.06714782 -0.06425971
  -0.05242161 -0.04947172 -0.04924297 -0.04983399 -0.05317565]
 [-0.04595277 -0.04401585 -0.06484877 -0.06437922 -0.06659391 -0.06304134
  -0.06641562 -0.06727465 -0.0682297  -0.06369475 -0.06714782 -0.06425971
  -0.05242161 -0.04947172 -0.04924297  0.95016599 -0.05317565]]
Epoch: 1486	Loss: 2.92554757595	Example Output: 13	Example Reward:  1
[[ 0.04594311  0.04402553  0.06485926  0.06437606  0.06658144  0.06306664
   0.06637885  0.06727001  0.06822951  0.06367541  0.06715567  0.06426874
   0.05241989  0.0494659   0.04925262  0.04985591  0.05317548]]
2.815

Epoch: 1499	Loss: 3.20128304958	Example Output: 79	Example Reward:  1
[[ 0.04597406  0.04401001  0.06468035  0.06457249  0.06636593  0.06346995
   0.0663126   0.06711876  0.06810953  0.0636787   0.06720462  0.06431025
   0.0522235   0.04945176  0.04939154  0.0498574   0.05326857]]
2.81538
[[-0.04597406 -0.04401001 -0.06468035 -0.06457249 -0.06636593 -0.06346995
  -0.0663126  -0.06711876 -0.06810953  0.93632132 -0.06720462 -0.06431025
  -0.0522235  -0.04945176 -0.04939154 -0.0498574  -0.05326857]
 [-0.04597406 -0.04401001 -0.06468035 -0.06457249 -0.06636593 -0.06346995
  -0.0663126  -0.06711876 -0.06810953 -0.0636787  -0.06720462  0.93568975
  -0.0522235  -0.04945176 -0.04939154 -0.0498574  -0.05326857]]
Epoch: 1500	Loss: 2.76513319016	Example Output: 16	Example Reward:  1
[[ 0.04597708  0.04399565  0.06467197  0.06457817  0.06634634  0.06347263
   0.06631351  0.06713382  0.0680966   0.06368224  0.06723925  0.06433979
   0.05221609  0.0494514   0.04938133  0.04984273  0.05326139]]
2.811

Epoch: 1512	Loss: 3.20432913303	Example Output: */	Example Reward:  -0.3
[[ 0.04597292  0.04400023  0.06467903  0.06464301  0.066366    0.06351402
   0.066252    0.06718667  0.06811899  0.06362182  0.0674407   0.06433175
   0.05209304  0.04950466  0.04926531  0.04975877  0.05325098]]
4.09831
[[ 0.28620812  0.28679994  0.28059632  0.2806071   0.28009021  0.28094581
   0.28012443  0.27984402  0.27956432  0.28091347  0.27976781  0.28070047
   0.28437209  0.28514862 -0.01477959  0.28507239  0.28402472]
 [ 0.28620812  0.28679994  0.28059632  0.2806071   0.28009021  0.28094581
   0.28012443  0.27984402  0.27956432  0.28091347  0.27976781  0.28070047
   0.28437209  0.28514862  0.28522041 -0.01492763  0.28402472]]
Epoch: 1513	Loss: 2.94468407631	Example Output: 3/	Example Reward:  1
[[ 0.04594344  0.04399775  0.06468052  0.06467813  0.06639239  0.06351352
   0.06625222  0.0671966   0.06812505  0.06359721  0.06747981  0.06433302
   0.05211797  0.04950723  0.04922929  0.04972704  0.05322886]]
2.

Epoch: 1526	Loss: 3.20363681316	Example Output: -9	Example Reward:  -0.3
[[ 0.04582493  0.04395051  0.06477064  0.06500816  0.06625361  0.06361897
   0.06622505  0.06736273  0.06815766  0.06356486  0.06750268  0.06431077
   0.05204674  0.04939766  0.04912856  0.04971717  0.0531594 ]]
4.10212
[[ 0.28625253  0.28681487  0.28056881  0.28049755  0.28012392  0.28091434
   0.2801325   0.27979121  0.2795527   0.28093055  0.27974921  0.28070676
   0.28438601 -0.0148193   0.28526145  0.28508484  0.28405219]
 [ 0.28625253  0.28681487  0.28056881  0.28049755  0.28012392  0.28091434
   0.2801325   0.27979121  0.2795527   0.28093055  0.27974921 -0.01929323
   0.28438601  0.28518072  0.28526145  0.28508484  0.28405219]]
Epoch: 1527	Loss: 3.45927345753	Example Output: 21	Example Reward:  1
[[ 0.04584087  0.04395612  0.0647768   0.06502228  0.06624957  0.06361571
   0.06622043  0.06734771  0.06814121  0.06356294  0.06752361  0.06429996
   0.05203499  0.04938897  0.04913599  0.04971848  0.05316439]]
2.

Epoch: 1538	Loss: 2.92172050476	Example Output: 2-	Example Reward:  1
[[ 0.04584303  0.04398556  0.06494471  0.06517114  0.06621747  0.0636818
   0.06607141  0.067212    0.06809136  0.06352103  0.06756306  0.064302
   0.05199914  0.04925428  0.04921094  0.04978728  0.05314384]]
2.82653
[[-0.04584303 -0.04398556 -0.06494471 -0.06517114  0.93378252 -0.0636818
  -0.06607141 -0.067212   -0.06809136 -0.06352103 -0.06756306 -0.064302
  -0.05199914 -0.04925428 -0.04921094 -0.04978728 -0.05314384]
 [-0.04584303 -0.04398556 -0.06494471 -0.06517114 -0.06621747 -0.0636818
  -0.06607141 -0.067212   -0.06809136 -0.06352103 -0.06756306 -0.064302
  -0.05199914  0.9507457  -0.04921094 -0.04978728 -0.05314384]]
Epoch: 1539	Loss: 2.66532449722	Example Output: 18	Example Reward:  1
[[ 0.04583497  0.0439705   0.06497564  0.06518698  0.06621711  0.06369246
   0.06607245  0.06723424  0.06806559  0.06349678  0.06755942  0.06430277
   0.0519875   0.04925923  0.04922332  0.04978574  0.05313523]]
2.8115
[[-0.04

Epoch: 1552	Loss: 2.92008488178	Example Output: 2+	Example Reward:  1
2.82375
[[-0.04583644 -0.04389398 -0.06513892 -0.06501831  0.93375844 -0.06353854
  -0.06595397 -0.06720244 -0.06807084 -0.0636813  -0.06748965 -0.06448107
  -0.05203406 -0.04925411 -0.04920645 -0.04980308 -0.05315526]
 [-0.04583644 -0.04389398 -0.06513892 -0.06501831 -0.06624157 -0.06353854
  -0.06595397 -0.06720244 -0.06807084 -0.0636813  -0.06748965 -0.06448107
   0.94796592 -0.04925411 -0.04920645 -0.04980308 -0.05315526]]
Epoch: 1553	Loss: 3.58688688278	Example Output: Y7	Example Reward:  -0.3
[[ 0.04582884  0.04388927  0.06512748  0.06498969  0.06627952  0.06354496
   0.0659533   0.06720766  0.06805833  0.06368522  0.06748985  0.06446374
   0.05203899  0.04924849  0.04923305  0.04979889  0.05316278]]
4.10021
[[ 0.28625137 -0.01316678  0.28046176  0.28050309  0.28011614  0.28093651
   0.28021401  0.2798377   0.27958253  0.28089443  0.27975306  0.2806609
   0.28438833  0.28522548  0.2852301   0.28506035  0.284051

Epoch: 1565	Loss: 3.20179586411	Example Output: 51	Example Reward:  1
[[ 0.0458582   0.04393551  0.0651324   0.06490923  0.06632599  0.06364619
   0.06597149  0.06700611  0.06796706  0.06369822  0.06747653  0.06443518
   0.0520287   0.04928128  0.04931447  0.04978799  0.05322539]]
2.8122
[[-0.0458582  -0.04393551 -0.0651324  -0.06490923 -0.06632599 -0.06364619
  -0.06597149  0.93299389 -0.06796706 -0.06369822 -0.06747653 -0.06443518
  -0.0520287  -0.04928128 -0.04931447 -0.04978799 -0.05322539]
 [-0.0458582  -0.04393551 -0.0651324   0.93509078 -0.06632599 -0.06364619
  -0.06597149 -0.06700611 -0.06796706 -0.06369822 -0.06747653 -0.06443518
  -0.0520287  -0.04928128 -0.04931447 -0.04978799 -0.05322539]]
Epoch: 1566	Loss: 3.04756605625	Example Output: Y9	Example Reward:  -0.3
[[ 0.04583467  0.04391836  0.06510992  0.06491794  0.06633955  0.06361882
   0.06599282  0.06704132  0.06799106  0.06369377  0.06747794  0.06445211
   0.05203555  0.04927401  0.04930048  0.04977184  0.05322984]]
4.1

Epoch: 1579	Loss: 2.92362692356	Example Output: 4*	Example Reward:  1
[[ 0.04573632  0.04384341  0.06513875  0.0648988   0.06630474  0.06356371
   0.06611118  0.06706534  0.06800494  0.06381873  0.06747868  0.06453048
   0.05211651  0.04922595  0.04914875  0.04974788  0.05326582]]
2.82666
[[-0.04573632 -0.04384341 -0.06513875 -0.0648988  -0.06630474 -0.06356371
   0.93388879 -0.06706534 -0.06800494 -0.06381873 -0.06747868 -0.06453048
  -0.05211651 -0.04922595 -0.04914875 -0.04974788 -0.05326582]
 [-0.04573632 -0.04384341 -0.06513875 -0.0648988  -0.06630474 -0.06356371
  -0.06611118 -0.06706534 -0.06800494 -0.06381873 -0.06747868 -0.06453048
  -0.05211651 -0.04922595  0.95085126 -0.04974788 -0.05326582]]
Epoch: 1580	Loss: 3.45865142345	Example Output: 51	Example Reward:  1
[[ 0.04573987  0.04386436  0.0651201   0.06485467  0.06627286  0.06360961
   0.06611867  0.06701341  0.06798979  0.06386436  0.06746092  0.06453171
   0.05212988  0.04922801  0.04917591  0.04974825  0.05327766]]
2.812

Epoch: 1594	Loss: 3.45643460751	Example Output: /0	Example Reward:  -0.3
[[ 0.04565021  0.04379297  0.06530918  0.06468328  0.06651139  0.06355525
   0.0660539   0.06703575  0.06816132  0.06405913  0.06725699  0.06454563
   0.05201415  0.04908256  0.04929473  0.04975054  0.05324297]]
4.10241
[[ 0.28630495  0.28686213  0.28040725  0.28059503  0.28004658  0.28093344
   0.28018382  0.27988929  0.27955163  0.28078228  0.27982292  0.28063631
   0.28439575  0.28527525  0.28521159 -0.01492516  0.28402713]
 [ 0.28630495  0.28686213 -0.01959275  0.28059503  0.28004658  0.28093344
   0.28018382  0.27988929  0.27955163  0.28078228  0.27982292  0.28063631
   0.28439575  0.28527525  0.28521159  0.28507483  0.28402713]]
Epoch: 1595	Loss: 2.48498315811	Example Output: 33	Example Reward:  1
[[ 0.04564527  0.04379438  0.06530454  0.06468001  0.06654577  0.06353233
   0.06604875  0.06705648  0.06818008  0.06405864  0.06723105  0.06452742
   0.05201235  0.04907432  0.04930931  0.04975216  0.05324712]]
2.

Epoch: 1609	Loss: 3.20327734947	Example Output: 3Y	Example Reward:  -0.3
[[ 0.04548258  0.0438046   0.06531905  0.06498417  0.06650502  0.06356364
   0.06603257  0.0671092   0.06839352  0.06390282  0.06740781  0.06455293
   0.05194623  0.04896778  0.04927449  0.049658    0.05309562]]
4.10002
[[ 0.28635523  0.28685865  0.2804043   0.28050476  0.28004852 -0.01906909
   0.28019023  0.27986723  0.27948195  0.28082916  0.27977768  0.28063414
   0.28441614  0.28530967  0.28521767  0.28510261  0.28407133]
 [ 0.28635523 -0.01314138  0.2804043   0.28050476  0.28004852  0.28093091
   0.28019023  0.27986723  0.27948195  0.28082916  0.27977768  0.28063414
   0.28441614  0.28530967  0.28521767  0.28510261  0.28407133]]
Epoch: 1610	Loss: 2.92308683395	Example Output: X2	Example Reward:  -0.3
[[ 0.04549956  0.04379077  0.06531423  0.06497698  0.06649752  0.06354727
   0.06603459  0.06712418  0.06841834  0.06391199  0.06739239  0.06454366
   0.05194351  0.04898524  0.0492818   0.04964574  0.05309225]]

Epoch: 1622	Loss: 3.20124981403	Example Output: 45	Example Reward:  1
[[ 0.04545284  0.04369966  0.0653358   0.06514262  0.06626755  0.06352703
   0.06590323  0.06753016  0.06851529  0.06372832  0.06741318  0.06444092
   0.05190784  0.04899886  0.04930163  0.04972393  0.05311114]]
2.81066
[[-0.04545284 -0.04369966 -0.0653358  -0.06514262 -0.06626755 -0.06352703
   0.93409675 -0.06753016 -0.06851529 -0.06372832 -0.06741318 -0.06444092
  -0.05190784 -0.04899886 -0.04930163 -0.04972393 -0.05311114]
 [-0.04545284 -0.04369966 -0.0653358  -0.06514262 -0.06626755 -0.06352703
  -0.06590323  0.93246984 -0.06851529 -0.06372832 -0.06741318 -0.06444092
  -0.05190784 -0.04899886 -0.04930163 -0.04972393 -0.05311114]]
Epoch: 1623	Loss: 3.0469394207	Example Output: Y1	Example Reward:  -0.3
[[ 0.04544783  0.0436859   0.06532276  0.06516935  0.06627563  0.06354141
   0.06594746  0.06752898  0.06851228  0.06370726  0.06744118  0.06444056
   0.05188885  0.04898803  0.04928413  0.04970666  0.05311177]]
4.1

Epoch: 1636	Loss: 3.20162196159	Example Output: 7+	Example Reward:  1
[[ 0.04543393  0.0434992   0.06536284  0.06512659  0.06640361  0.06339236
   0.06618037  0.06771369  0.06847723  0.06370246  0.06755768  0.0646043
   0.05178711  0.04896159  0.04907874  0.04954431  0.05317406]]
2.82541
[[-0.04543393 -0.0434992  -0.06536284 -0.06512659 -0.06640361 -0.06339236
  -0.06618037 -0.06771369 -0.06847723  0.93629754 -0.06755768 -0.0646043
  -0.05178711 -0.04896159 -0.04907874 -0.04954431 -0.05317406]
 [-0.04543393 -0.0434992  -0.06536284 -0.06512659 -0.06640361 -0.06339236
  -0.06618037 -0.06771369 -0.06847723 -0.06370246 -0.06755768 -0.0646043
   0.94821286 -0.04896159 -0.04907874 -0.04954431 -0.05317406]]
Epoch: 1637	Loss: 3.07163441181	Example Output: 1Y	Example Reward:  -0.3
[[ 0.04540081  0.04346921  0.06536826  0.06511305  0.06641944  0.06334433
   0.06620649  0.067765    0.06850915  0.06373307  0.06754832  0.06462676
   0.05180711  0.04894479  0.04904786  0.04953042  0.05316591]]
4.100

Epoch: 1650	Loss: 1.68808474541	Example Output: 93	Example Reward:  1
2.81428
[[-0.04515768 -0.04327062 -0.06546768 -0.06501859 -0.06675042 -0.0631707
  -0.06635793 -0.06778114 -0.06881172 -0.06377979 -0.06772922  0.93522346
  -0.05180964 -0.04883347 -0.04888926 -0.04934245 -0.05305323]
 [-0.04515768 -0.04327062 -0.06546768 -0.06501859 -0.06675042  0.93682933
  -0.06635793 -0.06778114 -0.06881172 -0.06377979 -0.06772922 -0.06477655
  -0.05180964 -0.04883347 -0.04888926 -0.04934245 -0.05305323]]
Saving Weight
Epoch: 1651	Loss: 3.15049462318	Example Output: -3	Example Reward:  -0.3
[[ 0.04516433  0.0432719   0.06545774  0.06499454  0.06677109  0.0631871
   0.06636762  0.06776556  0.06878648  0.06377294  0.06774322  0.06480285
   0.05180714  0.04883928  0.04888718  0.04932252  0.05305855]]
4.10126
[[ 0.28645071  0.28701845  0.2803627   0.28050163  0.27996868  0.28104389
   0.28008974  0.27967036  0.27936405  0.28086814  0.27967703  0.28055915
   0.28445786 -0.01465178  0.28533384  0.28520

Epoch: 1663	Loss: 3.32669525146	Example Output: 91	Example Reward:  1
[[ 0.04513238  0.04327574  0.06553314  0.06481972  0.0668028   0.06327231
   0.06622913  0.06785508  0.06864835  0.06370168  0.06777349  0.06492811
   0.05191798  0.0488348   0.04894195  0.0492865   0.05304682]]
2.81289
[[-0.04513238 -0.04327574 -0.06553314 -0.06481972 -0.0668028  -0.06327231
  -0.06622913 -0.06785508 -0.06864835 -0.06370168 -0.06777349  0.93507189
  -0.05191798 -0.0488348  -0.04894195 -0.0492865  -0.05304682]
 [-0.04513238 -0.04327574 -0.06553314  0.93518031 -0.0668028  -0.06327231
  -0.06622913 -0.06785508 -0.06864835 -0.06370168 -0.06777349 -0.06492811
  -0.05191798 -0.0488348  -0.04894195 -0.0492865  -0.05304682]]
Epoch: 1664	Loss: 3.20098192692	Example Output: +X	Example Reward:  -0.3
[[ 0.04513159  0.04324295  0.06552289  0.0648312   0.06681806  0.063229
   0.06629077  0.06787708  0.06864583  0.06368557  0.06778477  0.06500219
   0.05190884  0.04882376  0.0489106   0.04924809  0.05304686]]
4.09

Epoch: 1676	Loss: 3.19766309261	Example Output: 28	Example Reward:  1
[[ 0.04516235  0.04334819  0.0654577   0.0648483   0.06667592  0.06315215
   0.06629428  0.06769527  0.06867135  0.06371494  0.06767585  0.06513994
   0.0520326   0.04887616  0.04885123  0.04932622  0.05307757]]
2.80948
[[-0.04516235 -0.04334819 -0.0654577  -0.0648483   0.9333241  -0.06315215
  -0.06629428 -0.06769527 -0.06867135 -0.06371494 -0.06767585 -0.06513994
  -0.0520326  -0.04887616 -0.04885123 -0.04932622 -0.05307757]
 [-0.04516235 -0.04334819 -0.0654577  -0.0648483  -0.06667592 -0.06315215
  -0.06629428 -0.06769527 -0.06867135 -0.06371494  0.93232417 -0.06513994
  -0.0520326  -0.04887616 -0.04885123 -0.04932622 -0.05307757]]
Epoch: 1677	Loss: 3.19848542213	Example Output: -8	Example Reward:  -0.3
[[ 0.04512547  0.04331893  0.06545612  0.06485198  0.06671124  0.06314945
   0.06636719  0.06771705  0.06868725  0.06372252  0.06769868  0.06514686
   0.0520259   0.04885234  0.04881885  0.04929059  0.0530596 ]]
4.

Epoch: 1688	Loss: 3.07072606087	Example Output: 78	Example Reward:  1
[[ 0.0450502   0.04319597  0.06532576  0.0649755   0.06670109  0.06332732
   0.06643693  0.06799433  0.06877226  0.06366517  0.067667    0.06512932
   0.05190039  0.04874909  0.04888215  0.0492146   0.05301289]]
2.8116
[[-0.0450502  -0.04319597 -0.06532576 -0.0649755  -0.06670109 -0.06332732
  -0.06643693 -0.06799433 -0.06877226  0.93633485 -0.067667   -0.06512932
  -0.05190039 -0.04874909 -0.04888215 -0.0492146  -0.05301289]
 [-0.0450502  -0.04319597 -0.06532576 -0.0649755  -0.06670109 -0.06332732
  -0.06643693 -0.06799433 -0.06877226 -0.06366517  0.93233299 -0.06512932
  -0.05190039 -0.04874909 -0.04888215 -0.0492146  -0.05301289]]
Epoch: 1689	Loss: 3.06970994473	Example Output: 91	Example Reward:  1
[[ 0.04502275  0.04316918  0.06535562  0.06497904  0.06669561  0.06332041
   0.06644086  0.06801242  0.06877248  0.06372888  0.06770974  0.06515697
   0.05188953  0.04873545  0.04883981  0.0491874   0.05298388]]
2.8124

Epoch: 1701	Loss: 2.91856768131	Example Output: 91	Example Reward:  1
[[ 0.04499048  0.04311028  0.06527814  0.06533661  0.06651619  0.06348978
   0.06647604  0.06793892  0.06905118  0.06373024  0.06765854  0.06507557
   0.05171758  0.04855752  0.04885806  0.04914176  0.0530731 ]]
2.8121
[[-0.04499048 -0.04311028 -0.06527814 -0.06533661 -0.06651619 -0.06348978
  -0.06647604 -0.06793892 -0.06905118 -0.06373024 -0.06765854  0.93492442
  -0.05171758 -0.04855752 -0.04885806 -0.04914176 -0.0530731 ]
 [-0.04499048 -0.04311028 -0.06527814  0.93466341 -0.06651619 -0.06348978
  -0.06647604 -0.06793892 -0.06905118 -0.06373024 -0.06765854 -0.06507557
  -0.05171758 -0.04855752 -0.04885806 -0.04914176 -0.0530731 ]]
Epoch: 1702	Loss: 3.32804892063	Example Output: 25	Example Reward:  1
[[ 0.04499346  0.04310529  0.0652897   0.06533528  0.06652154  0.06346882
   0.06645292  0.067952    0.06903224  0.06374992  0.0676366   0.06511061
   0.05171338  0.04854946  0.04887152  0.04914798  0.0530693 ]]
2.8090

2.80892
[[-0.04491073 -0.04295032 -0.06554418 -0.06525481 -0.06645211 -0.06359657
  -0.06668471 -0.06798682  0.9309327  -0.06390133 -0.06778435 -0.06525402
  -0.05153871 -0.048492   -0.04872287 -0.04896193 -0.05289732]
 [-0.04491073 -0.04295032 -0.06554418  0.93474519 -0.06645211 -0.06359657
  -0.06668471 -0.06798682 -0.06906731 -0.06390133 -0.06778435 -0.06525402
  -0.05153871 -0.048492   -0.04872287 -0.04896193 -0.05289732]]
Epoch: 1716	Loss: 3.20568511486	Example Output: *7	Example Reward:  -0.3
[[ 0.04492137  0.04293557  0.06556047  0.06526984  0.06644073  0.06358591
   0.06668573  0.06799002  0.06910874  0.06389242  0.06776553  0.06524542
   0.05151644  0.04848174  0.04875192  0.0489633   0.05288485]]
4.10115
[[ 0.28652358  0.28711936  0.28033188  0.28041905  0.2800678   0.28092423
   0.27999428  0.279603    0.2792674   0.28083229  0.27967036  0.28042638
   0.28454509  0.2854555  -0.01462558  0.28531101  0.28413457]
 [ 0.28652358  0.28711936  0.28033188  0.28041905  0.2800678   0.

Epoch: 1730	Loss: 3.07299084663	Example Output: *6	Example Reward:  -0.3
[[ 0.04480442  0.04284079  0.06568059  0.06549976  0.06649297  0.06356575
   0.06682081  0.06806705  0.06926986  0.06364129  0.06784737  0.06515653
   0.05141367  0.04849516  0.04863051  0.04900803  0.05276537]]
4.10224
[[ 0.28655869  0.28714779  0.28029582  0.28035009  0.28005213  0.28093028
   0.27995378  0.27957988  0.27921906  0.28090763  0.2796458   0.28045306
   0.28457591  0.28545147 -0.01458915  0.2852976   0.28417039]
 [ 0.28655869  0.28714779  0.28029582  0.28035009  0.28005213  0.28093028
   0.27995378  0.27957988 -0.02078096  0.28090763  0.2796458   0.28045306
   0.28457591  0.28545147  0.28541085  0.2852976   0.28417039]]
Saving Weight
Epoch: 1731	Loss: 2.6612095356	Example Output: X*	Example Reward:  1
[[ 0.04479637  0.0428312   0.06571244  0.06549499  0.06655128  0.06360799
   0.0668213   0.06804448  0.06926235  0.06365231  0.06785699  0.06515862
   0.05139035  0.04847142  0.04861404  0.04898545  0.

Epoch: 1742	Loss: 3.45486869812	Example Output: 36	Example Reward:  1
[[ 0.04477337  0.04282354  0.06586412  0.06568838  0.06673665  0.06350034
   0.06691106  0.06775461  0.0692308   0.06353251  0.06805748  0.0653381
   0.05130144  0.04836682  0.0486162   0.04888046  0.05262414]]
2.80985
[[-0.04477337 -0.04282354 -0.06586412 -0.06568838 -0.06673665  0.93649966
  -0.06691106 -0.06775461 -0.0692308  -0.06353251 -0.06805748 -0.0653381
  -0.05130144 -0.04836682 -0.0486162  -0.04888046 -0.05262414]
 [-0.04477337 -0.04282354 -0.06586412 -0.06568838 -0.06673665 -0.06350034
  -0.06691106 -0.06775461  0.93076921 -0.06353251 -0.06805748 -0.0653381
  -0.05130144 -0.04836682 -0.0486162  -0.04888046 -0.05262414]]
Epoch: 1743	Loss: 2.91974649429	Example Output: 01	Example Reward:  1
2.81065
[[-0.04476932 -0.04282586  0.93413651 -0.06567824 -0.06673234 -0.06353182
  -0.06690734 -0.06776863 -0.06925376 -0.06355491 -0.06803214 -0.06532528
  -0.05128148 -0.04835157 -0.04861395 -0.0488699  -0.05263995]
 

Epoch: 1757	Loss: 3.19849696159	Example Output: 9/	Example Reward:  1
[[ 0.04453118  0.04269783  0.06600695  0.06594545  0.06685638  0.06343006
   0.06720179  0.06779197  0.06943937  0.06346979  0.06816168  0.0651747
   0.0512263   0.04830016  0.04844791  0.04875509  0.05256345]]
2.8258
[[-0.04453118 -0.04269783 -0.06600695 -0.06594545 -0.06685638 -0.06343006
  -0.06720179 -0.06779197 -0.06943937 -0.06346979 -0.06816168  0.9348253
  -0.0512263  -0.04830016 -0.04844791 -0.04875509 -0.05256345]
 [-0.04453118 -0.04269783 -0.06600695 -0.06594545 -0.06685638 -0.06343006
  -0.06720179 -0.06779197 -0.06943937 -0.06346979 -0.06816168 -0.0651747
  -0.0512263  -0.04830016 -0.04844791  0.95124489 -0.05256345]]
Epoch: 1758	Loss: 2.81294436455	Example Output: 43	Example Reward:  1
[[ 0.04452338  0.0426781   0.06600083  0.06594136  0.06683772  0.06344967
   0.06720801  0.0677688   0.06944075  0.06349776  0.06819481  0.06525229
   0.05120265  0.04827739  0.04843602  0.04874133  0.05254916]]
2.81106
[

Epoch: 1771	Loss: 3.45949888229	Example Output: --	Example Reward:  -0.3
[[ 0.04439114  0.04259393  0.06613587  0.06589313  0.06704224  0.0636223
   0.06728242  0.06771228  0.06954614  0.06362597  0.06822484  0.06525388
   0.0510997   0.04816506  0.04840142  0.04860127  0.05240846]]
4.09632
[[ 0.28668267  0.28722182  0.28015924  0.28023207  0.27988735  0.28091332
   0.27981529  0.27968633  0.27913615  0.28091222  0.27953255  0.28042385
   0.28467008 -0.01444952  0.28547958  0.28541964  0.28427747]
 [ 0.28668267  0.28722182  0.28015924  0.28023207  0.27988735  0.28091332
   0.27981529  0.27968633  0.27913615  0.28091222  0.27953255  0.28042385
   0.28467008 -0.01444952  0.28547958  0.28541964  0.28427747]]
Epoch: 1772	Loss: 3.20118873119	Example Output: */	Example Reward:  -0.3
[[ 0.0443919   0.04263991  0.06613351  0.06591833  0.06705917  0.06363644
   0.06723724  0.06766446  0.06952009  0.06364746  0.06820261  0.06521954
   0.05108925  0.04814808  0.04844412  0.0486348   0.05241314]]


Epoch: 1785	Loss: 3.19980082512	Example Output: 67	Example Reward:  1
[[ 0.04430841  0.04257293  0.06618357  0.06610282  0.06702334  0.06363069
   0.06734935  0.06751195  0.06961071  0.06373514  0.06821745  0.06519242
   0.05098108  0.04807165  0.04849998  0.04859171  0.05241685]]
2.80881
[[-0.04430841 -0.04257293 -0.06618357 -0.06610282 -0.06702334 -0.06363069
  -0.06734935 -0.06751195  0.93038929 -0.06373514 -0.06821745 -0.06519242
  -0.05098108 -0.04807165 -0.04849998 -0.04859171 -0.05241685]
 [-0.04430841 -0.04257293 -0.06618357 -0.06610282 -0.06702334 -0.06363069
  -0.06734935 -0.06751195 -0.06961071  0.93626487 -0.06821745 -0.06519242
  -0.05098108 -0.04807165 -0.04849998 -0.04859171 -0.05241685]]
Epoch: 1786	Loss: 3.19914808273	Example Output: 6-	Example Reward:  1
[[ 0.04428897  0.04255943  0.06616677  0.06616018  0.06701235  0.06360713
   0.06736294  0.06749693  0.06968281  0.06374621  0.06821557  0.06517548
   0.05095261  0.0480754   0.04847882  0.04860331  0.05241513]]
2.822

Epoch: 1798	Loss: 3.19677648544	Example Output: 47	Example Reward:  1
[[ 0.04424408  0.04262707  0.06600726  0.06633624  0.06682303  0.06359544
   0.06744491  0.0673282   0.06984372  0.06389459  0.06811272  0.06525154
   0.05079551  0.04809613  0.04833761  0.04870585  0.05255608]]
2.81024
[[-0.04424408 -0.04262707 -0.06600726 -0.06633624 -0.06682303 -0.06359544
   0.93255508 -0.0673282  -0.06984372 -0.06389459 -0.06811272 -0.06525154
  -0.05079551 -0.04809613 -0.04833761 -0.04870585 -0.05255608]
 [-0.04424408 -0.04262707 -0.06600726 -0.06633624 -0.06682303 -0.06359544
  -0.06744491 -0.0673282  -0.06984372  0.93610543 -0.06811272 -0.06525154
  -0.05079551 -0.04809613 -0.04833761 -0.04870585 -0.05255608]]
Epoch: 1799	Loss: 3.32940456867	Example Output: 18	Example Reward:  1
[[ 0.04423159  0.04262749  0.06600943  0.06631058  0.06683154  0.06358751
   0.06745834  0.06732289  0.06984138  0.0639483   0.06808321  0.06526679
   0.05080422  0.04809187  0.04833673  0.04869187  0.05255629]]
2.807

Epoch: 1811	Loss: 2.79198389053	Example Output: 75	Example Reward:  1
[[ 0.0441586   0.04259397  0.06613105  0.06641826  0.06688427  0.06355036
   0.06733938  0.06722703  0.06984033  0.06397989  0.06806813  0.06542712
   0.0508082   0.04805176  0.04826054  0.04868109  0.05258   ]]
2.81026
[[-0.0441586  -0.04259397 -0.06613105 -0.06641826 -0.06688427 -0.06355036
  -0.06733938 -0.06722703 -0.06984033  0.93602014 -0.06806813 -0.06542712
  -0.0508082  -0.04805176 -0.04826054 -0.04868109 -0.05258   ]
 [-0.0441586  -0.04259397 -0.06613105 -0.06641826 -0.06688427 -0.06355036
  -0.06733938  0.93277299 -0.06984033 -0.06397989 -0.06806813 -0.06542712
  -0.0508082  -0.04805176 -0.04826054 -0.04868109 -0.05258   ]]
Epoch: 1812	Loss: 3.32667663097	Example Output: 2/	Example Reward:  1
[[ 0.04413838  0.04258784  0.06617313  0.06639992  0.06695002  0.06353403
   0.06733548  0.06721847  0.0698662   0.06402364  0.06804701  0.06540652
   0.05079561  0.04803835  0.0482456   0.04867549  0.05256421]]
2.824

Epoch: 1825	Loss: 3.32415554523	Example Output: 60	Example Reward:  1
[[ 0.04409609  0.04241889  0.06617597  0.0664055   0.06723621  0.06344248
   0.06733847  0.06754397  0.06995702  0.06399131  0.06805059  0.06546149
   0.05069521  0.04787232  0.04820362  0.04854324  0.05256769]]
2.80634
[[-0.04409609 -0.04241889 -0.06617597 -0.0664055  -0.06723621 -0.06344248
  -0.06733847 -0.06754397  0.93004298 -0.06399131 -0.06805059 -0.06546149
  -0.05069521 -0.04787232 -0.04820362 -0.04854324 -0.05256769]
 [-0.04409609 -0.04241889  0.933824   -0.0664055  -0.06723621 -0.06344248
  -0.06733847 -0.06754397 -0.06995702 -0.06399131 -0.06805059 -0.06546149
  -0.05069521 -0.04787232 -0.04820362 -0.04854324 -0.05256769]]
Epoch: 1826	Loss: 3.07154400349	Example Output: 98	Example Reward:  1
[[ 0.04408009  0.04240348  0.06622387  0.0663888   0.06724212  0.06344865
   0.06732533  0.06753482  0.07001378  0.06400453  0.06803308  0.06549684
   0.05070043  0.04785137  0.04818207  0.04853127  0.05253952]]
2.808

Epoch: 1838	Loss: 3.45705001354	Example Output: /3	Example Reward:  -0.3
[[ 0.0439254   0.04222479  0.06630202  0.06618109  0.06766111  0.06342809
   0.06741378  0.0678538   0.06986298  0.06402483  0.06813561  0.06542265
   0.05063586  0.04772745  0.04809501  0.04856314  0.0525424 ]]
4.10027
[[ 0.28682238  0.28733259  0.28010941  0.2801457   0.27970168  0.28097159
   0.27977586  0.27964386  0.27904111  0.28079256  0.27955931  0.28037322
   0.28480926  0.28568178  0.28557152 -0.01456894  0.2842373 ]
 [ 0.28682238  0.28733259  0.28010941  0.2801457   0.27970168 -0.01902843
   0.27977586  0.27964386  0.27904111  0.28079256  0.27955931  0.28037322
   0.28480926  0.28568178  0.28557152  0.28543109  0.2842373 ]]
Epoch: 1839	Loss: 3.06955060959	Example Output: /5	Example Reward:  -0.3
[[ 0.04390761  0.04220878  0.06630128  0.06617249  0.06774054  0.06338646
   0.06745208  0.06788695  0.06982876  0.06402624  0.06815062  0.06539074
   0.05063057  0.04771852  0.04810728  0.04855958  0.05253156]]

Epoch: 1852	Loss: 2.50524187088	Example Output: 68	Example Reward:  1
[[ 0.04385065  0.04220914  0.06608607  0.06639224  0.06787551  0.06348965
   0.06748446  0.06769244  0.06993271  0.06398661  0.06806646  0.0653993
   0.05040199  0.04767355  0.04813926  0.04864925  0.05267069]]
2.80466
[[-0.04385065 -0.04220914 -0.06608607 -0.06639224 -0.06787551 -0.06348965
  -0.06748446 -0.06769244  0.9300673  -0.06398661 -0.06806646 -0.0653993
  -0.05040199 -0.04767355 -0.04813926 -0.04864925 -0.05267069]
 [-0.04385065 -0.04220914 -0.06608607 -0.06639224 -0.06787551 -0.06348965
  -0.06748446 -0.06769244 -0.06993271 -0.06398661  0.93193352 -0.0653993
  -0.05040199 -0.04767355 -0.04813926 -0.04864925 -0.05267069]]
Epoch: 1853	Loss: 3.07584993839	Example Output: /6	Example Reward:  -0.3
[[ 0.04385334  0.04219703  0.06607462  0.06641991  0.06783861  0.06350062
   0.0674746   0.0676517   0.07003333  0.06400319  0.06805465  0.0654207
   0.05036824  0.04765576  0.04812148  0.04865194  0.05268031]]
4.1017

Epoch: 1867	Loss: 2.89347379208	Example Output: 5Y	Example Reward:  -0.3
[[ 0.04375696  0.04208696  0.06618176  0.06620283  0.06815981  0.06344283
   0.06749285  0.06770959  0.06997649  0.0641076   0.06811924  0.06541956
   0.05025487  0.04756618  0.04810656  0.04863751  0.05277836]]
4.09901
[[ 0.28687292  0.28737393  0.28014547  0.28013918  0.27955207  0.28096718
   0.27975217 -0.02031288  0.27900705  0.28076774  0.27956423  0.28037414
   0.28492355  0.28573015  0.28556806  0.28540877  0.28416651]
 [ 0.28687292 -0.01262609  0.28014547  0.28013918  0.27955207  0.28096718
   0.27975217  0.27968714  0.27900705  0.28076774  0.27956423  0.28037414
   0.28492355  0.28573015  0.28556806  0.28540877  0.28416651]]
Epoch: 1868	Loss: 2.91383492947	Example Output: 26	Example Reward:  1
[[ 0.0437614   0.04210255  0.06617586  0.06618258  0.06814579  0.06344055
   0.06746858  0.067687    0.06995145  0.06411998  0.06812169  0.06542042
   0.05026392  0.04757971  0.04811975  0.04865479  0.05280398]]
2.

Epoch: 1880	Loss: 3.33082826138	Example Output: XY	Example Reward:  -0.3
[[ 0.04388914  0.04220504  0.06623316  0.0660693   0.06809483  0.06361455
   0.06722925  0.06756777  0.06994899  0.06433151  0.06784303  0.06525715
   0.05014863  0.04754318  0.04837511  0.04885406  0.05279533]]
4.09266
[[-0.01316674  0.2873385   0.28013006  0.28017923  0.27957156  0.28091565
   0.27983123  0.27972969  0.27901533  0.28070056  0.27964711  0.28042287
   0.28495544  0.28573707  0.28548747  0.2853438   0.28416142]
 [ 0.28683326 -0.01266151  0.28013006  0.28017923  0.27957156  0.28091565
   0.27983123  0.27972969  0.27901533  0.28070056  0.27964711  0.28042287
   0.28495544  0.28573707  0.28548747  0.2853438   0.28416142]]
Saving Weight
Epoch: 1881	Loss: 3.06848399639	Example Output: 47	Example Reward:  1
[[ 0.04390559  0.0421944   0.06619192  0.06608303  0.06810517  0.06360326
   0.06724287  0.06755544  0.06995369  0.06433482  0.06782936  0.06527781
   0.05013038  0.04756111  0.04838197  0.04884416  0

Epoch: 1893	Loss: 3.07218055725	Example Output: 09	Example Reward:  1
[[ 0.04399773  0.04236882  0.06612177  0.06587696  0.06799119  0.06358752
   0.06714794  0.06745415  0.06974055  0.06439199  0.06779175  0.06524841
   0.05013919  0.04772414  0.04851932  0.04903437  0.05286419]]
2.80993
[[-0.04399773 -0.04236882  0.93387824 -0.06587696 -0.06799119 -0.06358752
  -0.06714794 -0.06745415 -0.06974055 -0.06439199 -0.06779175 -0.06524841
  -0.05013919 -0.04772414 -0.04851932 -0.04903437 -0.05286419]
 [-0.04399773 -0.04236882 -0.06612177 -0.06587696 -0.06799119 -0.06358752
  -0.06714794 -0.06745415 -0.06974055 -0.06439199 -0.06779175  0.93475157
  -0.05013919 -0.04772414 -0.04851932 -0.04903437 -0.05286419]]
Epoch: 1894	Loss: 3.07835078239	Example Output: 80	Example Reward:  1
[[ 0.04402642  0.04238852  0.06614552  0.06582701  0.06796747  0.06361812
   0.06711039  0.06741769  0.06972504  0.06441396  0.0678004   0.06524353
   0.05013369  0.04772836  0.04855535  0.04903347  0.05286509]]
2.808

Epoch: 1906	Loss: 3.32836954594	Example Output: 1*	Example Reward:  1
[[ 0.0439529   0.04245632  0.06615756  0.06573933  0.06804239  0.06374789
   0.06706178  0.06712228  0.06960733  0.06465513  0.06780235  0.06535717
   0.05020719  0.04767933  0.04847059  0.049078    0.05286248]]
2.82513
[[-0.0439529  -0.04245632 -0.06615756  0.93426067 -0.06804239 -0.06374789
  -0.06706178 -0.06712228 -0.06960733 -0.06465513 -0.06780235 -0.06535717
  -0.05020719 -0.04767933 -0.04847059 -0.049078   -0.05286248]
 [-0.0439529  -0.04245632 -0.06615756 -0.06573933 -0.06804239 -0.06374789
  -0.06706178 -0.06712228 -0.06960733 -0.06465513 -0.06780235 -0.06535717
  -0.05020719 -0.04767933  0.95152938 -0.049078   -0.05286248]]
Epoch: 1907	Loss: 2.91830441952	Example Output: 26	Example Reward:  1
[[ 0.04395455  0.04246352  0.06615921  0.06577228  0.06805433  0.06376059
   0.06704661  0.06709204  0.06961122  0.06464727  0.06780703  0.06535034
   0.05019838  0.04767303  0.04848533  0.04907678  0.05284743]]
2.805

Saving Weight
Epoch: 1921	Loss: 3.20024588108	Example Output: 34	Example Reward:  1
[[ 0.04399199  0.04251254  0.06616477  0.06603544  0.06785855  0.06394658
   0.06696779  0.06688394  0.06966872  0.06451765  0.06781968  0.06527882
   0.05017067  0.04776768  0.04854247  0.04906325  0.0528095 ]]
2.81041
[[-0.04399199 -0.04251254 -0.06616477 -0.06603544 -0.06785855  0.9360534
  -0.06696779 -0.06688394 -0.06966872 -0.06451765 -0.06781968 -0.06527882
  -0.05017067 -0.04776768 -0.04854247 -0.04906325 -0.0528095 ]
 [-0.04399199 -0.04251254 -0.06616477 -0.06603544 -0.06785855 -0.06394658
   0.93303221 -0.06688394 -0.06966872 -0.06451765 -0.06781968 -0.06527882
  -0.05017067 -0.04776768 -0.04854247 -0.04906325 -0.0528095 ]]
Epoch: 1922	Loss: 2.91706004143	Example Output: /4	Example Reward:  -0.3
[[ 0.0439795   0.04251242  0.0661421   0.06604394  0.06785971  0.06400714
   0.06698123  0.06685842  0.0696705   0.06452415  0.06782572  0.06527585
   0.05016759  0.04776863  0.04854221  0.0490405   0.

Epoch: 1936	Loss: 3.33715529442	Example Output: Y6	Example Reward:  -0.3
[[ 0.04404442  0.04271738  0.0660302   0.06624573  0.06767559  0.06411251
   0.0669547   0.06646199  0.06948233  0.06445626  0.06789304  0.06519314
   0.05012936  0.04795507  0.04864406  0.04915482  0.05284943]]
4.10003
[[ 0.28678668 -0.01281522  0.28019094  0.2801263   0.27969733  0.28076625
   0.2799136   0.28006142  0.27915531  0.28066313  0.27963209  0.28044209
   0.28496119  0.28561348  0.2854068   0.28525355  0.28414518]
 [ 0.28678668  0.2871848   0.28019094  0.2801263   0.27969733  0.28076625
   0.2799136   0.28006142 -0.0208447   0.28066313  0.27963209  0.28044209
   0.28496119  0.28561348  0.2854068   0.28525355  0.28414518]]
Epoch: 1937	Loss: 2.50896356106	Example Output: 9/	Example Reward:  1
[[ 0.04406971  0.04277204  0.06603975  0.06623591  0.06763954  0.06413169
   0.06691649  0.0664205   0.06942486  0.0644554   0.06787189  0.06516478
   0.05014384  0.04798555  0.04868694  0.04918311  0.05285798]]
2.

Epoch: 1951	Loss: 2.76351897717	Example Output: 42	Example Reward:  1
[[ 0.04402864  0.0426066   0.06576891  0.06644633  0.06773601  0.06429552
   0.06724077  0.06641432  0.06949522  0.06437316  0.06775568  0.06513485
   0.05002571  0.04798011  0.04880195  0.04903224  0.0528641 ]]
2.8075
[[-0.04402864 -0.0426066  -0.06576891 -0.06644633 -0.06773601 -0.06429552
   0.93275923 -0.06641432 -0.06949522 -0.06437316 -0.06775568 -0.06513485
  -0.05002571 -0.04798011 -0.04880195 -0.04903224 -0.0528641 ]
 [-0.04402864 -0.0426066  -0.06576891 -0.06644633  0.93226397 -0.06429552
  -0.06724077 -0.06641432 -0.06949522 -0.06437316 -0.06775568 -0.06513485
  -0.05002571 -0.04798011 -0.04880195 -0.04903224 -0.0528641 ]]
Epoch: 1952	Loss: 3.04674260616	Example Output: /X	Example Reward:  -0.3
[[ 0.04402796  0.04260422  0.06574352  0.06643356  0.06775475  0.06429406
   0.06723636  0.06640796  0.06950165  0.06439645  0.06773657  0.06514417
   0.05002749  0.0479783   0.04882136  0.0490246   0.05286706]]
4.0

Epoch: 1965	Loss: 3.32477786541	Example Output: 47	Example Reward:  1
[[ 0.04391047  0.04253388  0.06568683  0.06624529  0.06776514  0.06433526
   0.0672611   0.06620684  0.06974672  0.06479017  0.06770532  0.06513484
   0.04986305  0.04794782  0.04890611  0.04906807  0.05289308]]
2.80963
[[-0.04391047 -0.04253388 -0.06568683 -0.06624529 -0.06776514 -0.06433526
   0.9327389  -0.06620684 -0.06974672 -0.06479017 -0.06770532 -0.06513484
  -0.04986305 -0.04794782 -0.04890611 -0.04906807 -0.05289308]
 [-0.04391047 -0.04253388 -0.06568683 -0.06624529 -0.06776514 -0.06433526
  -0.0672611  -0.06620684 -0.06974672  0.93520981 -0.06770532 -0.06513484
  -0.04986305 -0.04794782 -0.04890611 -0.04906807 -0.05289308]]
Epoch: 1966	Loss: 2.94225172997	Example Output: Y*	Example Reward:  1
[[ 0.04386976  0.04249196  0.0656611   0.0662942   0.0677925   0.0642844
   0.06733665  0.06620079  0.06982769  0.06480148  0.06773926  0.06513928
   0.04982674  0.04795244  0.04886097  0.04904024  0.0528806 ]]
2.8466

[[ 0.28682992  0.28725481  0.28040794 -0.01989124  0.27966624  0.2807714
   0.27976483  0.28015721  0.27906823  0.28053609  0.27966774  0.28040051
   0.28507322  0.28558609  0.28532192  0.28531078  0.28407454]
 [ 0.28682992 -0.01274522  0.28040794  0.28010878  0.27966624  0.2807714
   0.27976483  0.28015721  0.27906823  0.28053609  0.27966774  0.28040051
   0.28507322  0.28558609  0.28532192  0.28531078  0.28407454]]
Epoch: 1978	Loss: 3.17569227219	Example Output: 79	Example Reward:  1
[[ 0.04390011  0.04249134  0.06529961  0.06627812  0.06777847  0.06406976
   0.0674247   0.0661232   0.0697664   0.06487275  0.06781086  0.06535033
   0.04976602  0.04805611  0.04895533  0.04896799  0.05308891]]
2.811
[[-0.04390011 -0.04249134 -0.06529961 -0.06627812 -0.06777847 -0.06406976
  -0.0674247  -0.0661232  -0.0697664   0.93512726 -0.06781086 -0.06535033
  -0.04976602 -0.04805611 -0.04895533 -0.04896799 -0.05308891]
 [-0.04390011 -0.04249134 -0.06529961 -0.06627812 -0.06777847 -0.06406976
  -0.0

Epoch: 1991	Loss: 2.5079154253	Example Output: 06	Example Reward:  1
2.80718
[[-0.0438825  -0.04243951  0.9346199  -0.0662851  -0.06785271 -0.06402881
  -0.06749916 -0.06623897 -0.06982653 -0.06485514 -0.06781019 -0.06541531
  -0.04967275 -0.04793158 -0.0489476  -0.04889119 -0.05304275]
 [-0.0438825  -0.04243951 -0.06538013 -0.0662851  -0.06785271 -0.06402881
  -0.06749916 -0.06623897  0.93017346 -0.06485514 -0.06781019 -0.06541531
  -0.04967275 -0.04793158 -0.0489476  -0.04889119 -0.05304275]]
Epoch: 1992	Loss: 3.19771475792	Example Output: 74	Example Reward:  1
[[ 0.04387444  0.04242826  0.06538665  0.06630289  0.0678589   0.06406455
   0.06749246  0.06622705  0.06983432  0.06485266  0.06781371  0.06541216
   0.0496503   0.04791173  0.04894193  0.04889634  0.05305169]]
2.80926
[[-0.04387444 -0.04242826 -0.06538665 -0.06630289 -0.0678589  -0.06406455
  -0.06749246 -0.06622705 -0.06983432  0.93514735 -0.06781371 -0.06541216
  -0.0496503  -0.04791173 -0.04894193 -0.04889634 -0.05305169]

Epoch: 2004	Loss: 3.19956786633	Example Output: //	Example Reward:  -0.3
[[ 0.04373268  0.04236696  0.06536483  0.06613676  0.0679468   0.06402037
   0.06752444  0.06619454  0.06992516  0.06501504  0.06791281  0.06557284
   0.04965189  0.04786948  0.04887012  0.04885807  0.05303719]]
4.09657
[[ 0.2868802   0.28728992  0.28039056  0.28015897  0.27961597  0.28079391
   0.27974269  0.28014165  0.27902246  0.28049549  0.27962616  0.28032815
   0.28510445  0.28563917  0.285339   -0.01465742  0.28408885]
 [ 0.2868802   0.28728992  0.28039056  0.28015897  0.27961597  0.28079391
   0.27974269  0.28014165  0.27902246  0.28049549  0.27962616  0.28032815
   0.28510445  0.28563917  0.285339   -0.01465742  0.28408885]]
Epoch: 2005	Loss: 3.05019240379	Example Output: 6-	Example Reward:  1
[[ 0.04373924  0.04237818  0.0653643   0.06612393  0.06795128  0.06400601
   0.06752921  0.06616579  0.06991332  0.06503052  0.06791423  0.06557787
   0.04964704  0.04788361  0.0488741   0.04885096  0.05305039]]
2.

Epoch: 2019	Loss: 2.78656318188	Example Output: 69	Example Reward:  1
[[ 0.04372428  0.04237984  0.06549173  0.06631937  0.06785357  0.06410901
   0.06742048  0.06620994  0.06992098  0.06506683  0.06778979  0.06560748
   0.04958778  0.04779433  0.04878123  0.04890662  0.05303678]]
2.80675
[[-0.04372428 -0.04237984 -0.06549173 -0.06631937 -0.06785357 -0.06410901
  -0.06742048 -0.06620994  0.93007904 -0.06506683 -0.06778979 -0.06560748
  -0.04958778 -0.04779433 -0.04878123 -0.04890662 -0.05303678]
 [-0.04372428 -0.04237984 -0.06549173 -0.06631937 -0.06785357 -0.06410901
  -0.06742048 -0.06620994 -0.06992098 -0.06506683 -0.06778979  0.93439251
  -0.04958778 -0.04779433 -0.04878123 -0.04890662 -0.05303678]]
Epoch: 2020	Loss: 2.50698378086	Example Output: 2-	Example Reward:  1
2.82407
[[-0.04371161 -0.04234735 -0.06550978 -0.06630353  0.93213236 -0.06412353
  -0.06743421 -0.06621062 -0.06992497 -0.06507651 -0.06783342 -0.06568403
  -0.04957838 -0.04775855 -0.04875173 -0.04887252 -0.0530117 

Epoch: 2031	Loss: 2.65904643536	Example Output: 66	Example Reward:  1
[[ 0.04366569  0.04226405  0.06547973  0.06632195  0.06798591  0.06416409
   0.06738824  0.06612365  0.07024074  0.06518788  0.06778073  0.06584739
   0.04952308  0.04761599  0.04871737  0.04877316  0.05292032]]
2.80288
[[-0.04366569 -0.04226405 -0.06547973 -0.06632195 -0.06798591 -0.06416409
  -0.06738824 -0.06612365  0.92975926 -0.06518788 -0.06778073 -0.06584739
  -0.04952308 -0.04761599 -0.04871737 -0.04877316 -0.05292032]
 [-0.04366569 -0.04226405 -0.06547973 -0.06632195 -0.06798591 -0.06416409
  -0.06738824 -0.06612365  0.92975926 -0.06518788 -0.06778073 -0.06584739
  -0.04952308 -0.04761599 -0.04871737 -0.04877316 -0.05292032]]
Epoch: 2032	Loss: 3.06746375561	Example Output: 49	Example Reward:  1
[[ 0.04363983  0.04223403  0.06548032  0.066397    0.06800102  0.06412463
   0.06744545  0.06611203  0.07033878  0.06519552  0.06777009  0.0658555
   0.04949588  0.04758562  0.04868231  0.04874876  0.05289318]]
2.8080

Epoch: 2045	Loss: 2.50618293285	Example Output: *Y	Example Reward:  -0.3
[[ 0.04371852  0.04232872  0.06557284  0.06636065  0.06797267  0.06431729
   0.06726278  0.06599181  0.07030942  0.06532036  0.06755463  0.06568319
   0.04942646  0.04749906  0.04882893  0.0488829   0.05296978]]
4.09431
[[ 0.28688446  0.28730139  0.28032815  0.28009182  0.27960822  0.28070483
   0.27982119  0.28020248  0.27890718  0.28040391  0.27973363  0.28029504
   0.28517208  0.2857503  -0.01464868  0.28533515  0.28410909]
 [ 0.28688446 -0.01269862  0.28032815  0.28009182  0.27960822  0.28070483
   0.27982119  0.28020248  0.27890718  0.28040391  0.27973363  0.28029504
   0.28517208  0.2857503   0.28535134  0.28533515  0.28410909]]
Epoch: 2046	Loss: 3.04528660774	Example Output: 69	Example Reward:  1
[[ 0.0437251   0.04232978  0.06555418  0.06636717  0.06796973  0.06431104
   0.06724609  0.06599931  0.07029979  0.06536664  0.06751691  0.06570329
   0.04942216  0.04749736  0.04881637  0.04888633  0.05298881]]
2.

Epoch: 2060	Loss: 2.8130907774	Example Output: 64	Example Reward:  1
[[ 0.04364675  0.04238027  0.06565767  0.06589806  0.06811919  0.06411171
   0.06699479  0.06588419  0.07027227  0.06587014  0.06722154  0.06584365
   0.04964405  0.0475016   0.04887613  0.04895693  0.05312112]]
2.80541
[[-0.04364675 -0.04238027 -0.06565767 -0.06589806 -0.06811919 -0.06411171
  -0.06699479 -0.06588419  0.92972773 -0.06587014 -0.06722154 -0.06584365
  -0.04964405 -0.0475016  -0.04887613 -0.04895693 -0.05312112]
 [-0.04364675 -0.04238027 -0.06565767 -0.06589806 -0.06811919 -0.06411171
   0.93300521 -0.06588419 -0.07027227 -0.06587014 -0.06722154 -0.06584365
  -0.04964405 -0.0475016  -0.04887613 -0.04895693 -0.05312112]]
Saving Weight
Epoch: 2061	Loss: 3.19823572636	Example Output: 47	Example Reward:  1
[[ 0.04362379  0.0423544   0.0656408   0.06589858  0.06813998  0.06408636
   0.06702212  0.06590059  0.07029309  0.06590293  0.06722307  0.06585623
   0.04962309  0.04749412  0.04885366  0.04896038  0.053

Epoch: 2074	Loss: 2.94090180397	Example Output: 09	Example Reward:  1
[[ 0.04344282  0.04217001  0.06573338  0.06579944  0.06831632  0.0638438
   0.06733114  0.06606712  0.07015979  0.06595776  0.06742445  0.06608112
   0.04965703  0.04762854  0.04860351  0.04874066  0.05304312]]
2.80915
[[-0.04344282 -0.04217001  0.93426663 -0.06579944 -0.06831632 -0.0638438
  -0.06733114 -0.06606712 -0.07015979 -0.06595776 -0.06742445 -0.06608112
  -0.04965703 -0.04762854 -0.04860351 -0.04874066 -0.05304312]
 [-0.04344282 -0.04217001 -0.06573338 -0.06579944 -0.06831632 -0.0638438
  -0.06733114 -0.06606712 -0.07015979 -0.06595776 -0.06742445  0.93391889
  -0.04965703 -0.04762854 -0.04860351 -0.04874066 -0.05304312]]
Epoch: 2075	Loss: 3.19696512222	Example Output: 48	Example Reward:  1
[[ 0.04341972  0.0421268   0.06574993  0.06580227  0.06833132  0.06384382
   0.067343    0.06611948  0.07013912  0.06595232  0.06748201  0.06612565
   0.0496459   0.04762486  0.04856825  0.04871126  0.05301435]]
2.80684


Epoch: 2087	Loss: 3.19772088528	Example Output: 96	Example Reward:  1
[[ 0.0433415   0.04192632  0.06558019  0.0656605   0.06829523  0.06413632
   0.06738701  0.06639813  0.06997255  0.06594766  0.06780207  0.06631967
   0.04949458  0.04751913  0.04860395  0.04847126  0.053144  ]]
2.80559
[[-0.0433415  -0.04192632 -0.06558019 -0.0656605  -0.06829523 -0.06413632
  -0.06738701 -0.06639813 -0.06997255 -0.06594766 -0.06780207  0.9336803
  -0.04949458 -0.04751913 -0.04860395 -0.04847126 -0.053144  ]
 [-0.0433415  -0.04192632 -0.06558019 -0.0656605  -0.06829523 -0.06413632
  -0.06738701 -0.06639813  0.93002743 -0.06594766 -0.06780207 -0.06631967
  -0.04949458 -0.04751913 -0.04860395 -0.04847126 -0.053144  ]]
Epoch: 2088	Loss: 3.17427880764	Example Output: 7X	Example Reward:  -0.3
[[ 0.04333844  0.04191263  0.06555851  0.06566206  0.0682618   0.06410669
   0.06737398  0.0664377   0.06995794  0.06595508  0.06783529  0.06637506
   0.04950584  0.04754859  0.04857464  0.04846026  0.05313554]]
4.0

Epoch: 2101	Loss: 3.19854397774	Example Output: 0-	Example Reward:  1
[[ 0.04346758  0.04187261  0.06532285  0.06555144  0.06812505  0.06402867
   0.06739086  0.06659091  0.06971935  0.06579807  0.06800969  0.06651244
   0.04957342  0.04773068  0.04866974  0.04844774  0.05318892]]
2.82561
[[-0.04346758 -0.04187261  0.93467712 -0.06555144 -0.06812505 -0.06402867
  -0.06739086 -0.06659091 -0.06971935 -0.06579807 -0.06800969 -0.06651244
  -0.04957342 -0.04773068 -0.04866974 -0.04844774 -0.05318892]
 [-0.04346758 -0.04187261 -0.06532285 -0.06555144 -0.06812505 -0.06402867
  -0.06739086 -0.06659091 -0.06971935 -0.06579807 -0.06800969 -0.06651244
  -0.04957342  0.95226932 -0.04866974 -0.04844774 -0.05318892]]
Epoch: 2102	Loss: 3.45587363243	Example Output: 00	Example Reward:  1
[[ 0.04346003  0.04186896  0.06535669  0.06550855  0.06813004  0.06400193
   0.06736706  0.06664456  0.0696918   0.06582038  0.06798297  0.06649406
   0.04959585  0.04775995  0.04867991  0.04845541  0.05318189]]
2.809

   0.04961331  0.04784971  0.04860995  0.04860109  0.05316093]]
2.81004
[[-0.04336768 -0.04189275 -0.06551045 -0.06548039 -0.06801451  0.9361245
  -0.06729526 -0.06670244 -0.06968211 -0.06596114 -0.06792514 -0.06645762
  -0.04961331 -0.04784971 -0.04860995 -0.04860109 -0.05316093]
 [-0.04336768 -0.04189275 -0.06551045 -0.06548039 -0.06801451 -0.06387552
  -0.06729526  0.93329757 -0.06968211 -0.06596114 -0.06792514 -0.06645762
  -0.04961331 -0.04784971 -0.04860995 -0.04860109 -0.05316093]]
Epoch: 2116	Loss: 3.32479617596	Example Output: -*	Example Reward:  -0.3
[[ 0.04335076  0.04186534  0.06549544  0.06547442  0.06802287  0.06387047
   0.06732259  0.06671409  0.06968677  0.06597255  0.06794427  0.06651486
   0.04959714  0.04783849  0.04857624  0.04858916  0.05316452]]
4.09594
[[ 0.28699479  0.28744042  0.28035137  0.28035769  0.27959317  0.28083888
   0.27980322  0.27998579  0.27909398  0.28020823  0.27961671  0.28004557
   0.28512087 -0.01435155  0.28542715  0.28542325  0.28405064]
 [

Epoch: 2129	Loss: 3.19831385612	Example Output: 54	Example Reward:  1
[[ 0.04345281  0.04192491  0.06532079  0.06544565  0.06810901  0.06391282
   0.06725221  0.06656542  0.06959231  0.06602356  0.06775564  0.06644428
   0.04954797  0.04789599  0.04871286  0.04870335  0.05334041]]
2.8077
[[-0.04345281 -0.04192491 -0.06532079 -0.06544565 -0.06810901 -0.06391282
  -0.06725221  0.93343461 -0.06959231 -0.06602356 -0.06775564 -0.06644428
  -0.04954797 -0.04789599 -0.04871286 -0.04870335 -0.05334041]
 [-0.04345281 -0.04192491 -0.06532079 -0.06544565 -0.06810901 -0.06391282
   0.93274778 -0.06656542 -0.06959231 -0.06602356 -0.06775564 -0.06644428
  -0.04954797 -0.04789599 -0.04871286 -0.04870335 -0.05334041]]
Epoch: 2130	Loss: 3.32711799145	Example Output: 65	Example Reward:  1
[[ 0.04342332  0.04190485  0.06532894  0.06548411  0.06812894  0.06388709
   0.06730808  0.06658266  0.06960236  0.06600082  0.06776894  0.06643055
   0.0495344   0.0479021   0.04870306  0.04868522  0.05332467]]
2.8059

Epoch: 2141	Loss: 3.04893314838	Example Output: /2	Example Reward:  -0.3
[[ 0.04343095  0.04188105  0.06515893  0.06563289  0.06805345  0.06384393
   0.06749345  0.06651629  0.0697985   0.065966    0.06779845  0.0664537
   0.04943828  0.04796426  0.04861829  0.04864123  0.05331044]]
4.10129
[[ 0.28697073  0.28743568  0.28045231  0.28031015  0.27958399  0.28084683
   0.27975199  0.28004512  0.27906048  0.2802102   0.27966049  0.2800639
   0.28516853  0.28561074  0.28541452 -0.01459237  0.28400686]
 [ 0.28697073  0.28743568  0.28045231  0.28031015 -0.02041603  0.28084683
   0.27975199  0.28004512  0.27906048  0.2802102   0.27966049  0.2800639
   0.28516853  0.28561074  0.28541452  0.28540766  0.28400686]]
Epoch: 2142	Loss: 2.94370527267	Example Output: 2+	Example Reward:  1
[[ 0.04344211  0.0418947   0.06515643  0.0656184   0.06806257  0.0639049
   0.0674741   0.06648213  0.06974143  0.06596386  0.06782248  0.06642056
   0.04942616  0.04797801  0.04865832  0.04863734  0.05331655]]
2.8219

Epoch: 2155	Loss: 3.58341994286	Example Output: -4	Example Reward:  -0.3
[[ 0.04346393  0.0418807   0.06525131  0.06557561  0.06822486  0.06399569
   0.0672818   0.06649442  0.0695878   0.06588996  0.06799174  0.0664182
   0.04946242  0.04802207  0.04865127  0.04857446  0.05323372]]
4.10093
[[ 0.28696084  0.2874358   0.28042462  0.28032732  0.27953255  0.2808013
   0.27981547  0.28005168  0.27912366  0.28023303  0.2796025   0.28007457
   0.28516129 -0.01440662  0.28540462  0.28542769  0.2840299 ]
 [ 0.28696084  0.2874358   0.28042462  0.28032732  0.27953255  0.2808013
  -0.02018454  0.28005168  0.27912366  0.28023303  0.2796025   0.28007457
   0.28516129  0.28559339  0.28540462  0.28542769  0.2840299 ]]
Epoch: 2156	Loss: 3.0677924633	Example Output: 3X	Example Reward:  -0.3
[[ 0.04345751  0.041864    0.06524542  0.06563205  0.06821549  0.06400365
   0.06725492  0.06652697  0.0695825   0.06584588  0.06805363  0.06642165
   0.04945165  0.04800916  0.04865073  0.04856261  0.05322218]]
4.0

Epoch: 2170	Loss: 2.66171865463	Example Output: 89	Example Reward:  1
[[ 0.04357511  0.04208317  0.06513192  0.0657298   0.06799334  0.06445108
   0.06693099  0.06643782  0.06933898  0.06566245  0.06788432  0.06637199
   0.04945106  0.04801495  0.04888288  0.04874853  0.05331163]]
2.80758
[[-0.04357511 -0.04208317 -0.06513192 -0.0657298  -0.06799334 -0.06445108
  -0.06693099 -0.06643782 -0.06933898 -0.06566245  0.93211567 -0.06637199
  -0.04945106 -0.04801495 -0.04888288 -0.04874853 -0.05331163]
 [-0.04357511 -0.04208317 -0.06513192 -0.0657298  -0.06799334 -0.06445108
  -0.06693099 -0.06643782 -0.06933898 -0.06566245 -0.06788432  0.93362802
  -0.04945106 -0.04801495 -0.04888288 -0.04874853 -0.05331163]]
Saving Weight
Epoch: 2171	Loss: 2.9179438591	Example Output: 9+	Example Reward:  1
[[ 0.04355778  0.04207755  0.06512497  0.06573548  0.06798541  0.06442656
   0.06696132  0.0664196   0.06936678  0.06567518  0.06789982  0.06638544
   0.04944224  0.04801452  0.0488663   0.04874045  0.053

Epoch: 2182	Loss: 2.66362826824	Example Output: 6-	Example Reward:  1
[[ 0.04344285  0.04206333  0.06518978  0.06567398  0.0681761   0.06428424
   0.06694346  0.06634291  0.06944504  0.06592158  0.06779205  0.06634838
   0.04938578  0.0480396   0.04881734  0.04888261  0.05325092]]
2.82254
[[-0.04344285 -0.04206333 -0.06518978 -0.06567398 -0.0681761  -0.06428424
  -0.06694346 -0.06634291  0.93055499 -0.06592158 -0.06779205 -0.06634838
  -0.04938578 -0.0480396  -0.04881734 -0.04888261 -0.05325092]
 [-0.04344285 -0.04206333 -0.06518978 -0.06567398 -0.0681761  -0.06428424
  -0.06694346 -0.06634291 -0.06944504 -0.06592158 -0.06779205 -0.06634838
  -0.04938578  0.95196038 -0.04881734 -0.04888261 -0.05325092]]
Epoch: 2183	Loss: 3.4545582056	Example Output: 4X	Example Reward:  -0.3
[[ 0.04343019  0.0420442   0.06518876  0.06567881  0.06818486  0.06427374
   0.0669354   0.06634384  0.06944019  0.06590977  0.06786416  0.06634665
   0.04937001  0.04805899  0.04881334  0.04887512  0.05324196]]
4.0

Epoch: 2196	Loss: 3.45921490192	Example Output: Y*	Example Reward:  1
[[ 0.0432944   0.0419164   0.06492198  0.06581882  0.06826519  0.06420553
   0.06706878  0.06667329  0.06956907  0.06598202  0.0679149   0.06636206
   0.0491181   0.04803479  0.04865111  0.04888028  0.05332325]]
2.84691
[[-0.0432944   0.95808363 -0.06492198 -0.06581882 -0.06826519 -0.06420553
  -0.06706878 -0.06667329 -0.06956907 -0.06598202 -0.0679149  -0.06636206
  -0.0491181  -0.04803479 -0.04865111 -0.04888028 -0.05332325]
 [-0.0432944  -0.0419164  -0.06492198 -0.06581882 -0.06826519 -0.06420553
  -0.06706878 -0.06667329 -0.06956907 -0.06598202 -0.0679149  -0.06636206
  -0.0491181  -0.04803479  0.9513489  -0.04888028 -0.05332325]]
Epoch: 2197	Loss: 3.32713699341	Example Output: 96	Example Reward:  1
[[ 0.04331557  0.04196881  0.06491438  0.06586681  0.06820975  0.06424697
   0.06702577  0.06662405  0.06956288  0.06595144  0.06788756  0.06633661
   0.04910733  0.04804547  0.04869995  0.04890332  0.05333332]]
2.806

Epoch: 2208	Loss: 3.20192317963	Example Output: 3	Example Reward:  1
[[ 0.04323257  0.04194321  0.06496182  0.06585117  0.06830072  0.06446258
   0.06692223  0.06661852  0.06968771  0.06596922  0.06781831  0.0663396
   0.04908867  0.04793136  0.0487713   0.04883894  0.05326197]]
2.82082
[[-0.04323257 -0.04194321 -0.06496182 -0.06585117 -0.06830072  0.9355374
  -0.06692223 -0.06661852 -0.06968771 -0.06596922 -0.06781831 -0.0663396
  -0.04908867 -0.04793136 -0.0487713  -0.04883894 -0.05326197]
 [-0.04323257 -0.04194321 -0.06496182 -0.06585117 -0.06830072 -0.06446258
  -0.06692223 -0.06661852 -0.06968771 -0.06596922 -0.06781831 -0.0663396
  -0.04908867 -0.04793136 -0.0487713  -0.04883894  0.946738  ]]
Epoch: 2209	Loss: 3.19926733971	Example Output: 88	Example Reward:  1
[[ 0.0432518   0.04193978  0.06493091  0.06585015  0.06829027  0.06445982
   0.06691457  0.06664051  0.06966868  0.06596826  0.06779634  0.06634227
   0.04909273  0.04794065  0.04879338  0.04883726  0.0532826 ]]
2.80626
[[

Epoch: 2221	Loss: 3.20038890839	Example Output: 36	Example Reward:  1
[[ 0.04319668  0.04188142  0.06492992  0.0657741   0.06824925  0.06468555
   0.06686933  0.06678583  0.06956039  0.06589759  0.06797901  0.06643281
   0.04908828  0.04792334  0.04870881  0.04874867  0.05328903]]
2.80723
[[-0.04319668 -0.04188142 -0.06492992 -0.0657741  -0.06824925  0.93531448
  -0.06686933 -0.06678583 -0.06956039 -0.06589759 -0.06797901 -0.06643281
  -0.04908828 -0.04792334 -0.04870881 -0.04874867 -0.05328903]
 [-0.04319668 -0.04188142 -0.06492992 -0.0657741  -0.06824925 -0.06468555
  -0.06686933 -0.06678583  0.93043959 -0.06589759 -0.06797901 -0.06643281
  -0.04908828 -0.04792334 -0.04870881 -0.04874867 -0.05328903]]
Epoch: 2222	Loss: 2.379991436	Example Output: 85	Example Reward:  1
[[ 0.04319985  0.04186219  0.06490827  0.06579484  0.06821338  0.06472268
   0.06687742  0.06679486  0.06955154  0.06587845  0.06800421  0.06647967
   0.04908191  0.04792364  0.04869653  0.04872298  0.05328758]]
2.80674

Epoch: 2235	Loss: 3.58210742474	Example Output: 39	Example Reward:  1
[[ 0.04327223  0.04184252  0.0649543   0.06565902  0.06799588  0.06498779
   0.06661524  0.06700801  0.06947044  0.06588     0.06801812  0.06641611
   0.04913285  0.04790567  0.04886427  0.04872387  0.05325368]]
2.80937
[[-0.04327223 -0.04184252 -0.0649543  -0.06565902 -0.06799588  0.93501222
  -0.06661524 -0.06700801 -0.06947044 -0.06588    -0.06801812 -0.06641611
  -0.04913285 -0.04790567 -0.04886427 -0.04872387 -0.05325368]
 [-0.04327223 -0.04184252 -0.0649543  -0.06565902 -0.06799588 -0.06498779
  -0.06661524 -0.06700801 -0.06947044 -0.06588    -0.06801812  0.93358392
  -0.04913285 -0.04790567 -0.04886427 -0.04872387 -0.05325368]]
Epoch: 2236	Loss: 3.20423810482	Example Output: -1	Example Reward:  -0.3
[[ 0.04327195  0.04186315  0.06497818  0.06567781  0.06795712  0.06500323
   0.06656422  0.06700759  0.06947784  0.06587014  0.06799287  0.06640432
   0.04915294  0.0479148   0.04886054  0.04876189  0.05324141]]
4.

Epoch: 2250	Loss: 2.79224057198	Example Output: Y6	Example Reward:  -0.3
[[ 0.0432681   0.04187983  0.06473472  0.06587858  0.06773249  0.0651724
   0.06648292  0.06700622  0.069468    0.06592979  0.06799478  0.06643464
   0.04912353  0.0479673   0.04874987  0.04879939  0.0533775 ]]
4.09936
[[ 0.28701958 -0.01256395  0.2805796   0.28023645  0.27968025  0.28044829
   0.28005514  0.27989814  0.27915961  0.28022107  0.27960157  0.28006962
   0.28526294  0.28560981  0.28537506  0.28536019  0.28398675]
 [ 0.28701958  0.28743607  0.2805796   0.28023645  0.27968025  0.28044829
   0.28005514  0.27989814 -0.0208404   0.28022107  0.27960157  0.28006962
   0.28526294  0.28560981  0.28537506  0.28536019  0.28398675]]
Saving Weight
Epoch: 2251	Loss: 3.30239083767	Example Output: 52	Example Reward:  1
[[ 0.04328893  0.04190546  0.06472394  0.06588569  0.06768708  0.0651638
   0.06646994  0.06698312  0.06947756  0.06591699  0.06799276  0.06641264
   0.04912891  0.04798295  0.04876372  0.04883628  0.0

Epoch: 2263	Loss: 2.76506869793	Example Output: 7X	Example Reward:  -0.3
4.09927
[[ 0.2869615   0.28739133  0.28056258  0.28025761  0.27971414  0.28045487
   0.28013036  0.27993467  0.2792075  -0.01976058  0.27962694  0.28012803
   0.28525651  0.28557321  0.28534445  0.28525931  0.28395778]
 [-0.01303853  0.28739133  0.28056258  0.28025761  0.27971414  0.28045487
   0.28013036  0.27993467  0.2792075   0.28023943  0.27962694  0.28012803
   0.28525651  0.28557321  0.28534445  0.28525931  0.28395778]]
Epoch: 2264	Loss: 2.94614868164	Example Output: 3*	Example Reward:  1
[[ 0.0434675   0.04205901  0.06478309  0.06581728  0.06757119  0.06519803
   0.06622904  0.06684582  0.06930841  0.06587219  0.06789629  0.06623769
   0.04912888  0.04810821  0.04884721  0.04914469  0.05348551]]
2.82497
[[-0.0434675  -0.04205901 -0.06478309 -0.06581728 -0.06757119  0.934802
  -0.06622904 -0.06684582 -0.06930841 -0.06587219 -0.06789629 -0.06623769
  -0.04912888 -0.04810821 -0.04884721 -0.04914469 -0.0534855

Epoch: 2277	Loss: 3.06634764671	Example Output: 85	Example Reward:  1
[[ 0.04347246  0.04201392  0.06495366  0.06590483  0.06732578  0.06544598
   0.06613164  0.06700546  0.06925183  0.06563571  0.06811135  0.06640584
   0.04908993  0.04806358  0.04882067  0.04899097  0.05337637]]
2.80688
[[-0.04347246 -0.04201392 -0.06495366 -0.06590483 -0.06732578 -0.06544598
  -0.06613164 -0.06700546 -0.06925183 -0.06563571  0.93188864 -0.06640584
  -0.04908993 -0.04806358 -0.04882067 -0.04899097 -0.05337637]
 [-0.04347246 -0.04201392 -0.06495366 -0.06590483 -0.06732578 -0.06544598
  -0.06613164  0.93299454 -0.06925183 -0.06563571 -0.06811135 -0.06640584
  -0.04908993 -0.04806358 -0.04882067 -0.04899097 -0.05337637]]
Epoch: 2278	Loss: 3.19799969196	Example Output: 62	Example Reward:  1
[[ 0.04344058  0.04197988  0.06497345  0.06592246  0.06732664  0.06546476
   0.06614107  0.0670482   0.06926946  0.06562451  0.06818351  0.06641916
   0.04907539  0.04803703  0.04878895  0.04896139  0.0533436 ]]
2.805

   0.04897023  0.04789487  0.04870516  0.04872433  0.05328791]]
2.81785
[[-0.04334056 -0.04175792 -0.06489863 -0.06610476 -0.06753138 -0.06542767
  -0.06630576 -0.06733401 -0.06935963 -0.06562837  0.93173939 -0.06646822
  -0.04897023 -0.04789487 -0.04870516 -0.04872433 -0.05328791]
 [-0.04334056 -0.04175792 -0.06489863 -0.06610476 -0.06753138 -0.06542767
  -0.06630576 -0.06733401 -0.06935963 -0.06562837 -0.0682606  -0.06646822
  -0.04897023 -0.04789487 -0.04870516 -0.04872433  0.94671208]]
Saving Weight
Epoch: 2291	Loss: 2.37720997334	Example Output: 5-	Example Reward:  1
[[ 0.04329865  0.04172288  0.06486017  0.06618631  0.06754734  0.06539825
   0.06634631  0.06734043  0.06943978  0.06562767  0.06831243  0.06645796
   0.04893611  0.0478803   0.04866305  0.04869756  0.05328489]]
2.82381
[[-0.04329865 -0.04172288 -0.06486017 -0.06618631 -0.06754734 -0.06539825
  -0.06634631  0.93265957 -0.06943978 -0.06562767 -0.06831243 -0.06645796
  -0.04893611 -0.0478803  -0.04866305 -0.04869756 -0.

Epoch: 2303	Loss: 3.45304980278	Example Output: 77	Example Reward:  1
[[ 0.04326827  0.04165503  0.06505796  0.06611327  0.06770968  0.06523133
   0.06641883  0.06749661  0.06941828  0.06550598  0.06830206  0.06641892
   0.04902038  0.04789008  0.04859826  0.0486207   0.05327437]]
2.80946
[[-0.04326827 -0.04165503 -0.06505796 -0.06611327 -0.06770968 -0.06523133
  -0.06641883 -0.06749661 -0.06941828  0.93449402 -0.06830206 -0.06641892
  -0.04902038 -0.04789008 -0.04859826 -0.0486207  -0.05327437]
 [-0.04326827 -0.04165503 -0.06505796 -0.06611327 -0.06770968 -0.06523133
  -0.06641883 -0.06749661 -0.06941828  0.93449402 -0.06830206 -0.06641892
  -0.04902038 -0.04789008 -0.04859826 -0.0486207  -0.05327437]]
Epoch: 2304	Loss: 3.2007679224	Example Output: 6-	Example Reward:  1
[[ 0.04325895  0.04165675  0.06507031  0.0660776   0.06771037  0.0651976
   0.06645284  0.06748863  0.06940598  0.06558549  0.06827705  0.06642012
   0.04903679  0.04789941  0.04857614  0.04861074  0.05327526]]
2.82221

Epoch: 2316	Loss: 3.06728544235	Example Output: Y0	Example Reward:  -0.3
[[ 0.04309657  0.04156297  0.06516203  0.06602962  0.0679583   0.0651444
   0.06665378  0.06745557  0.06949342  0.06577116  0.06834594  0.06634792
   0.04905     0.04780952  0.04852793  0.04845719  0.05313369]]
4.09805
[[ 0.28707105 -0.01246889  0.28045139  0.28019112  0.27961251  0.28045669
   0.28000388  0.27976334  0.27915198  0.28026867  0.27949622  0.28009564
   0.28528503  0.28565714  0.28544164  0.28546286  0.28405991]
 [ 0.28707105  0.28753111 -0.01954861  0.28019112  0.27961251  0.28045669
   0.28000388  0.27976334  0.27915198  0.28026867  0.27949622  0.28009564
   0.28528503  0.28565714  0.28544164  0.28546286  0.28405991]]
Epoch: 2317	Loss: 3.32500665188	Example Output: 49	Example Reward:  1
[[ 0.04307745  0.04153977  0.06512799  0.06605068  0.0679796   0.06511557
   0.0666909   0.0674874   0.06951135  0.06579782  0.06832021  0.06638272
   0.04903362  0.04779811  0.04850684  0.04844846  0.05313147]]
2.8

Epoch: 2330	Loss: 3.04706864357	Example Output: 1-	Example Reward:  1
[[ 0.04306461  0.04145207  0.06506362  0.06614809  0.06807671  0.06498531
   0.06686898  0.06737675  0.06959667  0.06598774  0.06816894  0.06659941
   0.04896733  0.04767597  0.04839806  0.04843789  0.05313186]]
2.82446
[[-0.04306461 -0.04145207 -0.06506362  0.9338519  -0.06807671 -0.06498531
  -0.06686898 -0.06737675 -0.06959667 -0.06598774 -0.06816894 -0.06659941
  -0.04896733 -0.04767597 -0.04839806 -0.04843789 -0.05313186]
 [-0.04306461 -0.04145207 -0.06506362 -0.06614809 -0.06807671 -0.06498531
  -0.06686898 -0.06737675 -0.06959667 -0.06598774 -0.06816894 -0.06659941
  -0.04896733  0.95232403 -0.04839806 -0.04843789 -0.05313186]]
Saving Weight
Epoch: 2331	Loss: 2.78742129803	Example Output: 76	Example Reward:  1
[[ 0.04306353  0.04144264  0.06505685  0.0661613   0.0680454   0.06502294
   0.06688422  0.06738908  0.06957372  0.06594607  0.06823019  0.06661461
   0.04895831  0.04768649  0.04840307  0.04840773  0.05

Epoch: 2343	Loss: 3.71165647507	Example Output: XX	Example Reward:  -0.3
[[ 0.04302219  0.04145706  0.06512247  0.06609061  0.06810315  0.06500052
   0.06697781  0.06733423  0.06952477  0.06600274  0.06819016  0.06669509
   0.04892433  0.04766348  0.04835166  0.04840948  0.05313025]]
4.09224
[[-0.01290666  0.28756291  0.28046328  0.28017282  0.27956906  0.28049985
   0.27990666  0.27979973  0.27914259  0.2801992   0.27954295  0.27999148
   0.28532273  0.28570098  0.28549451  0.28547716  0.28406093]
 [-0.01290666  0.28756291  0.28046328  0.28017282  0.27956906  0.28049985
   0.27990666  0.27979973  0.27914259  0.2801992   0.27954295  0.27999148
   0.28532273  0.28570098  0.28549451  0.28547716  0.28406093]]
Epoch: 2344	Loss: 3.19786727428	Example Output: Y2	Example Reward:  -0.3
[[ 0.04302486  0.0414635   0.06513951  0.06605976  0.06813265  0.06496021
   0.06695566  0.06735083  0.06951549  0.06601491  0.06816122  0.06668939
   0.04893944  0.04768238  0.04833484  0.04842292  0.05315247]]

Epoch: 2355	Loss: 3.45224869251	Example Output: 1X	Example Reward:  -0.3
[[ 0.04303176  0.04153757  0.06512255  0.0660528   0.06816181  0.06494375
   0.06704307  0.06710507  0.06969915  0.06609364  0.06789103  0.06668276
   0.04900835  0.04766397  0.0482388   0.04853768  0.05318621]]
4.09871
[[ 0.28709048  0.28753874  0.28046325 -0.01981584  0.27955148  0.28051689
   0.27988708  0.27986848  0.27909026  0.28017193  0.27963272  0.27999517
   0.28529751  0.28570083  0.28552836  0.28543872  0.28404415]
 [-0.01290953  0.28753874  0.28046325  0.28018418  0.27955148  0.28051689
   0.27988708  0.27986848  0.27909026  0.28017193  0.27963272  0.27999517
   0.28529751  0.28570083  0.28552836  0.28543872  0.28404415]]
Epoch: 2356	Loss: 3.07063314915	Example Output: 95	Example Reward:  1
[[ 0.04302881  0.04155084  0.06512269  0.06600491  0.06819307  0.06494497
   0.06702092  0.06709462  0.06968799  0.06616289  0.06785379  0.06667835
   0.04901508  0.04765887  0.04825164  0.04854235  0.05318822]]
2.

Epoch: 2367	Loss: 3.45764682293	Example Output: +Y	Example Reward:  -0.3
[[ 0.04317694  0.04169254  0.0650545   0.06603554  0.06805515  0.0649024
   0.06684709  0.06713134  0.06952044  0.06604003  0.06764612  0.0666084
   0.04910638  0.0478139   0.04848697  0.04868351  0.05319881]]
4.09394
[[ 0.28704694  0.28749225  0.28048366  0.28018937  0.27958345  0.28052929
   0.27994588  0.27986062  0.27914387  0.28018799  0.27970618  0.2800175
  -0.01473191  0.28565586  0.28545392  0.28539497  0.28404036]
 [ 0.28704694 -0.01250776  0.28048366  0.28018937  0.27958345  0.28052929
   0.27994588  0.27986062  0.27914387  0.28018799  0.27970618  0.2800175
   0.2852681   0.28565586  0.28545392  0.28539497  0.28404036]]
Epoch: 2368	Loss: 3.04257423878	Example Output: /X	Example Reward:  -0.3
[[ 0.04318076  0.04167809  0.06503271  0.06604005  0.06804748  0.06487656
   0.06685528  0.06715909  0.06953918  0.06602708  0.06766151  0.06659985
   0.04909244  0.04782153  0.04849954  0.04868282  0.05320609]]
4.0

Epoch: 2379	Loss: 3.06980397701	Example Output: 29	Example Reward:  1
[[ 0.04318753  0.04168645  0.0650797   0.06600736  0.06813722  0.06486905
   0.06687234  0.06707937  0.06953321  0.06618861  0.06762714  0.06657171
   0.04902069  0.04778191  0.04851122  0.0487029   0.05314366]]
2.8066
[[-0.04318753 -0.04168645 -0.0650797  -0.06600736  0.93186277 -0.06486905
  -0.06687234 -0.06707937 -0.06953321 -0.06618861 -0.06762714 -0.06657171
  -0.04902069 -0.04778191 -0.04851122 -0.0487029  -0.05314366]
 [-0.04318753 -0.04168645 -0.0650797  -0.06600736 -0.06813722 -0.06486905
  -0.06687234 -0.06707937 -0.06953321 -0.06618861 -0.06762714  0.93342829
  -0.04902069 -0.04778191 -0.04851122 -0.0487029  -0.05314366]]
Epoch: 2380	Loss: 3.33454833031	Example Output: 5Y	Example Reward:  -0.3
[[ 0.04320025  0.04170072  0.06512041  0.06599731  0.06814234  0.06485025
   0.06685242  0.0670433   0.06951223  0.06617979  0.06761933  0.06661467
   0.04902311  0.04777535  0.0485083   0.04871023  0.05314996]]
4.0

Epoch: 2392	Loss: 3.71113266945	Example Output: //	Example Reward:  -0.3
[[ 0.04321914  0.04173427  0.06527597  0.06592489  0.06810829  0.06485169
   0.06673343  0.06719427  0.06947153  0.0661474   0.06755787  0.06643955
   0.04899571  0.04788443  0.04860963  0.0486883   0.0531636 ]]
4.09617
[[ 0.28703427  0.28747973  0.28041723  0.28022254  0.27956751  0.28054449
   0.27997997  0.27984172  0.27915856  0.28015581  0.27973264  0.28006813
   0.2853013   0.2856347   0.28541714 -0.01460649  0.28405094]
 [ 0.28703427  0.28747973  0.28041723  0.28022254  0.27956751  0.28054449
   0.27997997  0.27984172  0.27915856  0.28015581  0.27973264  0.28006813
   0.2853013   0.2856347   0.28541714 -0.01460649  0.28405094]]
Epoch: 2393	Loss: 3.06901164055	Example Output: 42	Example Reward:  1
[[ 0.04321947  0.04173921  0.06523686  0.06590511  0.06812592  0.06482143
   0.06676841  0.06718089  0.0694768   0.06616389  0.06753505  0.06642887
   0.04899051  0.04791157  0.0486158   0.04867955  0.0532007 ]]
2.

Epoch: 2405	Loss: 3.07040483952	Example Output: 33	Example Reward:  1
[[ 0.04316019  0.04177592  0.0650997   0.06564634  0.06856804  0.06486832
   0.06682423  0.06719979  0.069355    0.06630582  0.0674274   0.06621756
   0.04895693  0.04790758  0.04873848  0.04863486  0.05331386]]
2.81048
[[-0.04316019 -0.04177592 -0.0650997  -0.06564634 -0.06856804  0.93513167
  -0.06682423 -0.06719979 -0.069355   -0.06630582 -0.0674274  -0.06621756
  -0.04895693 -0.04790758 -0.04873848 -0.04863486 -0.05331386]
 [-0.04316019 -0.04177592 -0.0650997  -0.06564634 -0.06856804  0.93513167
  -0.06682423 -0.06719979 -0.069355   -0.06630582 -0.0674274  -0.06621756
  -0.04895693 -0.04790758 -0.04873848 -0.04863486 -0.05331386]]
Epoch: 2406	Loss: 3.4552560091	Example Output: 4X	Example Reward:  -0.3
[[ 0.04317364  0.04178816  0.06508687  0.06560864  0.06859244  0.06494804
   0.06679387  0.06719507  0.06930579  0.06628642  0.06743632  0.06620664
   0.04897277  0.04789497  0.04876077  0.04864143  0.05330817]]
4.0

Epoch: 2419	Loss: 3.19720523357	Example Output: 03	Example Reward:  1
[[ 0.0430713   0.04172023  0.06512443  0.06535181  0.06867842  0.06507569
   0.06677677  0.06753812  0.06935623  0.06642944  0.06732027  0.06610708
   0.04890471  0.04777643  0.0487263   0.04868286  0.05335993]]
2.81003
[[-0.0430713  -0.04172023  0.93487555 -0.06535181 -0.06867842 -0.06507569
  -0.06677677 -0.06753812 -0.06935623 -0.06642944 -0.06732027 -0.06610708
  -0.04890471 -0.04777643 -0.0487263  -0.04868286 -0.05335993]
 [-0.0430713  -0.04172023 -0.06512443 -0.06535181 -0.06867842  0.9349243
  -0.06677677 -0.06753812 -0.06935623 -0.06642944 -0.06732027 -0.06610708
  -0.04890471 -0.04777643 -0.0487263  -0.04868286 -0.05335993]]
Epoch: 2420	Loss: 3.06890106201	Example Output: 18	Example Reward:  1
[[ 0.04306568  0.0417179   0.06520138  0.06528343  0.06869175  0.06514012
   0.0667453   0.06755412  0.06932418  0.0664959   0.06726572  0.06607184
   0.04889177  0.04776018  0.04874468  0.04867946  0.05336656]]
2.8082

Epoch: 2433	Loss: 2.79003522396	Example Output: 36	Example Reward:  1
[[ 0.04301458  0.04161322  0.06526082  0.06526896  0.06882646  0.06517695
   0.06660174  0.06759689  0.06924922  0.06647797  0.06740407  0.06596393
   0.04882877  0.04783481  0.04894109  0.04869737  0.05324322]]
2.80685
[[-0.04301458 -0.04161322 -0.06526082 -0.06526896 -0.06882646  0.93482304
  -0.06660174 -0.06759689 -0.06924922 -0.06647797 -0.06740407 -0.06596393
  -0.04882877 -0.04783481 -0.04894109 -0.04869737 -0.05324322]
 [-0.04301458 -0.04161322 -0.06526082 -0.06526896 -0.06882646 -0.06517695
  -0.06660174 -0.06759689  0.93075079 -0.06647797 -0.06740407 -0.06596393
  -0.04882877 -0.04783481 -0.04894109 -0.04869737 -0.05324322]]
Epoch: 2434	Loss: 2.94438667297	Example Output: 4/	Example Reward:  1
[[ 0.04300904  0.04160168  0.0652549   0.06526242  0.06879795  0.0652013
   0.06661116  0.06762259  0.06926817  0.06649132  0.06737272  0.06593875
   0.04882323  0.04782418  0.04898272  0.04870255  0.05323536]]
2.8233

Epoch: 2447	Loss: 2.09719674587	Example Output: 92	Example Reward:  1
2.80685
[[-0.04302397 -0.04166148 -0.06538875 -0.06522156 -0.06866439 -0.06525285
  -0.06636118 -0.06752605 -0.06930009 -0.0663121  -0.0675442   0.93412137
  -0.04891483 -0.04783418 -0.04910304 -0.04876257 -0.05325025]
 [-0.04302397 -0.04166148 -0.06538875 -0.06522156  0.93133563 -0.06525285
  -0.06636118 -0.06752605 -0.06930009 -0.0663121  -0.0675442  -0.0658786
  -0.04891483 -0.04783418 -0.04910304 -0.04876257 -0.05325025]]
Epoch: 2448	Loss: 3.07020168304	Example Output: 70	Example Reward:  1
[[ 0.04302907  0.04164307  0.06541382  0.06525687  0.06867262  0.06521306
   0.06634975  0.06754902  0.06931131  0.06626395  0.06757468  0.06588586
   0.04892162  0.04782599  0.04908061  0.04875194  0.05325681]]
2.80897
[[-0.04302907 -0.04164307 -0.06541382 -0.06525687 -0.06867262 -0.06521306
  -0.06634975 -0.06754902 -0.06931131  0.93373603 -0.06757468 -0.06588586
  -0.04892162 -0.04782599 -0.04908061 -0.04875194 -0.05325681]

Epoch: 2461	Loss: 3.04923915863	Example Output: 1Y	Example Reward:  -0.3
4.09826
[[ 0.28709033  0.2874921   0.28036559 -0.01958982  0.27938092  0.28043425
   0.28012514  0.27975428  0.27925935  0.28013265  0.27966976  0.28023726
   0.28531677  0.28565079  0.28527653  0.28538206  0.28402221]
 [ 0.28709033 -0.0125079   0.28036559  0.2804102   0.27938092  0.28043425
   0.28012514  0.27975428  0.27925935  0.28013265  0.27966976  0.28023726
   0.28531677  0.28565079  0.28527653  0.28538206  0.28402221]]
Epoch: 2462	Loss: 3.32820875645	Example Output: 97	Example Reward:  1
[[ 0.04304109  0.04172602  0.06546962  0.06524377  0.06871844  0.06520405
   0.06623265  0.06743177  0.06910227  0.06628117  0.067714    0.06584842
   0.04897826  0.04786737  0.04908977  0.04876274  0.05328859]]
2.80871
[[-0.04304109 -0.04172602 -0.06546962 -0.06524377 -0.06871844 -0.06520405
  -0.06623265 -0.06743177 -0.06910227 -0.06628117 -0.067714    0.93415159
  -0.04897826 -0.04786737 -0.04908977 -0.04876274 -0.05328

Epoch: 2476	Loss: 3.20175716877	Example Output: 78	Example Reward:  1
[[ 0.04314834  0.04172064  0.06547002  0.06528801  0.06845491  0.06523779
   0.06629371  0.0673084   0.06901418  0.06612923  0.06789817  0.06589016
   0.04905034  0.04793216  0.04919714  0.0487034   0.05326343]]
2.80739
[[-0.04314834 -0.04172064 -0.06547002 -0.06528801 -0.06845491 -0.06523779
  -0.06629371 -0.0673084  -0.06901418  0.93387079 -0.06789817 -0.06589016
  -0.04905034 -0.04793216 -0.04919714 -0.0487034  -0.05326343]
 [-0.04314834 -0.04172064 -0.06547002 -0.06528801 -0.06845491 -0.06523779
  -0.06629371 -0.0673084  -0.06901418 -0.06612923  0.93210185 -0.06589016
  -0.04905034 -0.04793216 -0.04919714 -0.0487034  -0.05326343]]
Epoch: 2477	Loss: 2.91870656013	Example Output: 93	Example Reward:  1
[[ 0.04319603  0.04173688  0.06547906  0.0652527   0.06841013  0.06524401
   0.06624992  0.06729545  0.06897528  0.06613346  0.06789141  0.06590059
   0.04906456  0.04792786  0.04922746  0.04874253  0.05327273]]
2.809

Epoch: 2490	Loss: 3.17787144184	Example Output: 9X	Example Reward:  -0.3
[[ 0.04320159  0.04174571  0.06551651  0.06510171  0.0683928   0.06527068
   0.06637416  0.06717896  0.06908322  0.06627734  0.06776427  0.06590889
   0.04896576  0.04794167  0.04924723  0.04875658  0.05327295]]
4.09903
[[ 0.28703955  0.2874763   0.28034505  0.28046951  0.27948216  0.28041881
   0.28008777  0.27984631  0.27927506  0.28011683  0.27967072 -0.01977267
   0.2853103   0.2856175   0.28522584  0.28537303  0.28401813]
 [-0.01296048  0.2874763   0.28034505  0.28046951  0.27948216  0.28041881
   0.28008777  0.27984631  0.27927506  0.28011683  0.27967072  0.28022733
   0.2853103   0.2856175   0.28522584  0.28537303  0.28401813]]
Saving Weight
Epoch: 2491	Loss: 2.91620130539	Example Output: 78	Example Reward:  1
[[ 0.04322271  0.04177031  0.0655023   0.065084    0.06838955  0.06525175
   0.06636781  0.06716985  0.06904027  0.06625018  0.06775285  0.06588762
   0.04899388  0.04796239  0.04927856  0.0487816   0

Epoch: 2503	Loss: 3.04424169064	Example Output: 64	Example Reward:  1
[[ 0.0432575   0.04191775  0.06551946  0.06501235  0.0683879   0.06541593
   0.06634443  0.06710833  0.06883936  0.06625276  0.06768994  0.0658071
   0.04912886  0.04793975  0.04925792  0.04880911  0.05331164]]
2.80675
[[-0.0432575  -0.04191775 -0.06551946 -0.06501235 -0.0683879  -0.06541593
  -0.06634443 -0.06710833  0.93116063 -0.06625276 -0.06768994 -0.0658071
  -0.04912886 -0.04793975 -0.04925792 -0.04880911 -0.05331164]
 [-0.0432575  -0.04191775 -0.06551946 -0.06501235 -0.0683879  -0.06541593
   0.93365556 -0.06710833 -0.06883936 -0.06625276 -0.06768994 -0.0658071
  -0.04912886 -0.04793975 -0.04925792 -0.04880911 -0.05331164]]
Epoch: 2504	Loss: 2.91770427227	Example Output: 11	Example Reward:  1
[[ 0.04325163  0.04191246  0.06551953  0.06502378  0.06838419  0.06546135
   0.06634851  0.06713431  0.06887606  0.06623135  0.06767205  0.06577919
   0.04912095  0.04793064  0.04926973  0.04878786  0.05329651]]
2.81059


Epoch: 2516	Loss: 3.07681849003	Example Output: 88	Example Reward:  1
[[ 0.04323226  0.04202259  0.06559553  0.06502926  0.06839512  0.06540909
   0.06628752  0.06716943  0.06895354  0.06630991  0.06735731  0.06574421
   0.04916962  0.04791886  0.04921493  0.04886143  0.05332936]]
2.80713
[[-0.04323226 -0.04202259 -0.06559553 -0.06502926 -0.06839512 -0.06540909
  -0.06628752 -0.06716943 -0.06895354 -0.06630991  0.9326427  -0.06574421
  -0.04916962 -0.04791886 -0.04921493 -0.04886143 -0.05332936]
 [-0.04323226 -0.04202259 -0.06559553 -0.06502926 -0.06839512 -0.06540909
  -0.06628752 -0.06716943 -0.06895354 -0.06630991  0.9326427  -0.06574421
  -0.04916962 -0.04791886 -0.04921493 -0.04886143 -0.05332936]]
Epoch: 2517	Loss: 3.06758389473	Example Output: 34	Example Reward:  1
[[ 0.0432281   0.04200062  0.06559379  0.06510802  0.06838355  0.06538856
   0.0662888   0.06720094  0.06895306  0.0662393   0.06743957  0.06570646
   0.04915418  0.04791681  0.04922301  0.04886519  0.05331005]]
2.809

Epoch: 2529	Loss: 2.93997087479	Example Output: 11	Example Reward:  1
[[ 0.04310916  0.04199144  0.0657295   0.06512976  0.0683263   0.06542222
   0.06641974  0.06711132  0.06892159  0.06622294  0.06745273  0.06567333
   0.04923453  0.04793806  0.04917856  0.0488718   0.05326702]]
2.81044
[[-0.04310916 -0.04199144 -0.0657295   0.93487024 -0.0683263  -0.06542222
  -0.06641974 -0.06711132 -0.06892159 -0.06622294 -0.06745273 -0.06567333
  -0.04923453 -0.04793806 -0.04917856 -0.0488718  -0.05326702]
 [-0.04310916 -0.04199144 -0.0657295   0.93487024 -0.0683263  -0.06542222
  -0.06641974 -0.06711132 -0.06892159 -0.06622294 -0.06745273 -0.06567333
  -0.04923453 -0.04793806 -0.04917856 -0.0488718  -0.05326702]]
Epoch: 2530	Loss: 2.2528730154	Example Output: 8+	Example Reward:  1
[[ 0.04307533  0.04196698  0.06573856  0.06523502  0.06830033  0.06539225
   0.06645039  0.06711487  0.06899733  0.06619643  0.0674588   0.06566256
   0.04920747  0.04791714  0.04913811  0.04889014  0.05325833]]
2.8226

Epoch: 2541	Loss: 2.79111075401	Example Output: 2-	Example Reward:  1
[[ 0.0430382   0.0418551   0.06581875  0.06527144  0.06835704  0.0652649
   0.06653344  0.06728003  0.06889837  0.06603912  0.0676593   0.06579654
   0.04927219  0.04790126  0.04898094  0.04879194  0.05324147]]
2.82321
[[-0.0430382  -0.0418551  -0.06581875 -0.06527144  0.93164295 -0.0652649
  -0.06653344 -0.06728003 -0.06889837 -0.06603912 -0.0676593  -0.06579654
  -0.04927219 -0.04790126 -0.04898094 -0.04879194 -0.05324147]
 [-0.0430382  -0.0418551  -0.06581875 -0.06527144 -0.06835704 -0.0652649
  -0.06653344 -0.06728003 -0.06889837 -0.06603912 -0.0676593  -0.06579654
  -0.04927219  0.95209873 -0.04898094 -0.04879194 -0.05324147]]
Epoch: 2542	Loss: 2.9385887146	Example Output: 24	Example Reward:  1
[[ 0.04300677  0.04183193  0.06580663  0.06526268  0.0683881   0.06527748
   0.06659658  0.06729196  0.06889294  0.06603531  0.06768162  0.06580897
   0.04925193  0.04790898  0.04895182  0.04876119  0.05324524]]
2.80667
[

Epoch: 2556	Loss: 2.78990225792	Example Output: 71	Example Reward:  1
[[ 0.04276881  0.04165676  0.06586333  0.06522585  0.06865183  0.06536835
   0.06692545  0.06742354  0.06885163  0.06597865  0.0677728   0.06575266
   0.04916114  0.04787608  0.04881977  0.04859787  0.05330548]]
2.80923
[[-0.04276881 -0.04165676 -0.06586333 -0.06522585 -0.06865183 -0.06536835
  -0.06692545 -0.06742354 -0.06885163  0.93402135 -0.0677728  -0.06575266
  -0.04916114 -0.04787608 -0.04881977 -0.04859787 -0.05330548]
 [-0.04276881 -0.04165676 -0.06586333  0.93477416 -0.06865183 -0.06536835
  -0.06692545 -0.06742354 -0.06885163 -0.06597865 -0.0677728  -0.06575266
  -0.04916114 -0.04787608 -0.04881977 -0.04859787 -0.05330548]]
Epoch: 2557	Loss: 3.07017395496	Example Output: 2X	Example Reward:  -0.3
[[ 0.04275325  0.04164324  0.06588569  0.06526493  0.0686557   0.06537464
   0.06691157  0.06741898  0.06884697  0.0660234   0.06774741  0.06577794
   0.04916132  0.04785152  0.04879822  0.04858958  0.05329567]]
4.

Epoch: 2569	Loss: 3.20025601387	Example Output: 0/	Example Reward:  1
[[ 0.04283505  0.04184722  0.06581517  0.06526976  0.06840426  0.06567918
   0.06693591  0.06705237  0.06856449  0.06598335  0.06773479  0.06570887
   0.04924729  0.04795886  0.04894615  0.04862254  0.0533948 ]]
2.82427
[[-0.04283505 -0.04184722  0.93418485 -0.06526976 -0.06840426 -0.06567918
  -0.06693591 -0.06705237 -0.06856449 -0.06598335 -0.06773479 -0.06570887
  -0.04924729 -0.04795886 -0.04894615 -0.04862254 -0.0533948 ]
 [-0.04283505 -0.04184722 -0.06581517 -0.06526976 -0.06840426 -0.06567918
  -0.06693591 -0.06705237 -0.06856449 -0.06598335 -0.06773479 -0.06570887
  -0.04924729 -0.04795886 -0.04894615  0.95137745 -0.0533948 ]]
Epoch: 2570	Loss: 3.3293844223	Example Output: 38	Example Reward:  1
[[ 0.0428595   0.04187281  0.06582955  0.06524657  0.06839732  0.06565662
   0.06694596  0.06699893  0.06855494  0.06597636  0.06769153  0.06568649
   0.04925641  0.04796581  0.04900042  0.04865146  0.05340942]]
2.8079

Epoch: 2583	Loss: 2.7919110775	Example Output: 62	Example Reward:  1
[[ 0.04293573  0.04188253  0.06585647  0.06522879  0.06827188  0.06594735
   0.06683619  0.06714924  0.06851729  0.06582433  0.0676548   0.06571527
   0.0492979   0.04791922  0.0492011   0.04852321  0.05323878]]
2.80537
[[-0.04293573 -0.04188253 -0.06585647 -0.06522879 -0.06827188 -0.06594735
  -0.06683619 -0.06714924  0.93148273 -0.06582433 -0.0676548  -0.06571527
  -0.0492979  -0.04791922 -0.0492011  -0.04852321 -0.05323878]
 [-0.04293573 -0.04188253 -0.06585647 -0.06522879  0.93172812 -0.06594735
  -0.06683619 -0.06714924 -0.06851729 -0.06582433 -0.0676548  -0.06571527
  -0.0492979  -0.04791922 -0.0492011  -0.04852321 -0.05323878]]
Epoch: 2584	Loss: 2.91725943089	Example Output: 39	Example Reward:  1
[[ 0.04293267  0.04190225  0.06583583  0.06518519  0.06829928  0.06595259
   0.06684468  0.06711649  0.06853033  0.06586493  0.06762484  0.06570483
   0.04929639  0.04790897  0.04924677  0.04851435  0.05323954]]
2.8092

Epoch: 2597	Loss: 3.33162677288	Example Output: Y6	Example Reward:  -0.3
[[ 0.04297384  0.041981    0.06582665  0.06496799  0.06818833  0.06610233
   0.06694438  0.06710036  0.06846409  0.06590195  0.06762876  0.06560796
   0.04927094  0.04791454  0.04938929  0.04842601  0.05331158]]
4.0992
[[ 0.28710786 -0.0125943   0.28025201  0.28050962  0.27954352  0.28016931
   0.2799167   0.27986991  0.27946079  0.28022942  0.2797114   0.28031763
   0.28521875  0.28562564  0.28518322  0.28547221  0.28400654]
 [ 0.28710786  0.28740573  0.28025201  0.28050962  0.27954352  0.28016931
   0.2799167   0.27986991 -0.02053923  0.28022942  0.2797114   0.28031763
   0.28521875  0.28562564  0.28518322  0.28547221  0.28400654]]
Epoch: 2598	Loss: 3.32974321842	Example Output: /+	Example Reward:  -0.3
[[ 0.04299539  0.04199888  0.06580831  0.06498398  0.06816189  0.06611447
   0.0669326   0.06711148  0.06844426  0.06586096  0.06762649  0.06557358
   0.04930512  0.04792561  0.04942283  0.04842903  0.05330521]]


Epoch: 2610	Loss: 3.19662528038	Example Output: -9	Example Reward:  -0.3
[[ 0.04307384  0.04217968  0.06569786  0.06506769  0.06794027  0.06615508
   0.06671088  0.06691623  0.06834583  0.06565465  0.06774534  0.0653591
   0.04943689  0.04808645  0.0496057   0.04865906  0.05336545]]
4.10071
[[ 0.28707787  0.28734609  0.28029066  0.2804797   0.27961794  0.28015348
   0.27998674  0.27992514  0.27949625  0.28030363  0.27967641  0.28039229
   0.28516895 -0.01442594  0.28511828  0.2854023   0.28399038]
 [ 0.28707787  0.28734609  0.28029066  0.2804797   0.27961794  0.28015348
   0.27998674  0.27992514  0.27949625  0.28030363  0.27967641 -0.01960773
   0.28516895  0.28557408  0.28511828  0.2854023   0.28399038]]
Saving Weight
Epoch: 2611	Loss: 3.04574043751	Example Output: -5	Example Reward:  -0.3
[[ 0.04306774  0.04218043  0.06568513  0.06506746  0.06796905  0.06618773
   0.0667059   0.06690836  0.06835269  0.06565055  0.06774344  0.06535452
   0.04943024  0.04807749  0.04959621  0.04865264 

Epoch: 2622	Loss: 2.66213598251	Example Output: Y9	Example Reward:  -0.3
[[ 0.04302343  0.04207613  0.06574959  0.06489865  0.0682837   0.06617372
   0.06664252  0.06713615  0.06840765  0.06574094  0.06760764  0.06535032
   0.04941441  0.04792185  0.04969198  0.04854499  0.0533364 ]]
4.09864
[[ 0.28709298 -0.01262284  0.28027514  0.28053042  0.27951491  0.28014788
   0.28000724  0.27985916  0.27947772  0.28027773  0.27971771  0.28039491
   0.28517568  0.28562346  0.28509241  0.28543651  0.28399909]
 [ 0.28709298  0.28737718  0.28027514  0.28053042  0.27951491  0.28014788
   0.28000724  0.27985916  0.27947772  0.28027773  0.27971771 -0.0196051
   0.28517568  0.28562346  0.28509241  0.28543651  0.28399909]]
Epoch: 2623	Loss: 3.19559512138	Example Output: 66	Example Reward:  1
[[ 0.04301157  0.04204721  0.06575954  0.06487262  0.06830717  0.06617691
   0.06665191  0.06719757  0.06841293  0.06575221  0.0676022   0.06533434
   0.04941417  0.0478983   0.04972459  0.04852319  0.05331359]]
2.8

Epoch: 2634	Loss: 2.82318887711	Example Output: 6+	Example Reward:  1
[[ 0.04300902  0.04218422  0.06571094  0.0648973   0.06813303  0.06629092
   0.06652968  0.06694308  0.06850773  0.06598862  0.06749829  0.06532899
   0.04933586  0.04788211  0.04968651  0.04866885  0.05340488]]
2.82197
[[-0.04300902 -0.04218422 -0.06571094 -0.0648973  -0.06813303 -0.06629092
  -0.06652968 -0.06694308  0.93149227 -0.06598862 -0.06749829 -0.06532899
  -0.04933586 -0.04788211 -0.04968651 -0.04866885 -0.05340488]
 [-0.04300902 -0.04218422 -0.06571094 -0.0648973  -0.06813303 -0.06629092
  -0.06652968 -0.06694308 -0.06850773 -0.06598862 -0.06749829 -0.06532899
   0.95066416 -0.04788211 -0.04968651 -0.04866885 -0.05340488]]
Epoch: 2635	Loss: 2.78721039295	Example Output: 77	Example Reward:  1
[[ 0.04297587  0.04218787  0.06569261  0.0649086   0.06812435  0.06624044
   0.06657127  0.06693997  0.06852461  0.06601042  0.06749916  0.06533648
   0.04936862  0.04789215  0.04966417  0.04866205  0.0534013 ]]
2.809

Epoch: 2646	Loss: 3.07267093658	Example Output: 98	Example Reward:  1
[[ 0.04280918  0.04208018  0.06561315  0.06495625  0.06815539  0.06601144
   0.06676939  0.06698021  0.06869801  0.06626657  0.06738161  0.06549391
   0.04935494  0.04792798  0.04954621  0.04859214  0.05336353]]
2.80846
[[-0.04280918 -0.04208018 -0.06561315 -0.06495625 -0.06815539 -0.06601144
  -0.06676939 -0.06698021 -0.06869801 -0.06626657 -0.06738161  0.93450606
  -0.04935494 -0.04792798 -0.04954621 -0.04859214 -0.05336353]
 [-0.04280918 -0.04208018 -0.06561315 -0.06495625 -0.06815539 -0.06601144
  -0.06676939 -0.06698021 -0.06869801 -0.06626657  0.93261838 -0.06549391
  -0.04935494 -0.04792798 -0.04954621 -0.04859214 -0.05336353]]
Epoch: 2647	Loss: 3.04694530964	Example Output: 8X	Example Reward:  -0.3
[[ 0.0427908   0.04207473  0.06560615  0.06497829  0.06813191  0.06598548
   0.06678952  0.06699158  0.06872727  0.06624535  0.06739599  0.06550743
   0.04936139  0.0479215   0.04954776  0.0485906   0.05335433]]
4.

Epoch: 2658	Loss: 2.66021330357	Example Output: 45	Example Reward:  1
[[ 0.04266644  0.04206241  0.06568684  0.06517972  0.06802962  0.0657509
   0.06686009  0.06693472  0.0688838   0.06608278  0.0675292   0.06532627
   0.04941681  0.04804704  0.04949564  0.04874504  0.05330269]]
2.80776
[[-0.04266644 -0.04206241 -0.06568684 -0.06517972 -0.06802962 -0.0657509
   0.93313992 -0.06693472 -0.0688838  -0.06608278 -0.0675292  -0.06532627
  -0.04941681 -0.04804704 -0.04949564 -0.04874504 -0.05330269]
 [-0.04266644 -0.04206241 -0.06568684 -0.06517972 -0.06802962 -0.0657509
  -0.06686009  0.9330653  -0.0688838  -0.06608278 -0.0675292  -0.06532627
  -0.04941681 -0.04804704 -0.04949564 -0.04874504 -0.05330269]]
Epoch: 2659	Loss: 3.19777593613	Example Output: 6	Example Reward:  1
[[ 0.0426379   0.04204317  0.06572553  0.06519467  0.06803937  0.0657335
   0.06689401  0.06694179  0.06889585  0.06607086  0.06759109  0.06532854
   0.04940502  0.04803018  0.04947666  0.04871593  0.05327603]]
2.81763
[[

Epoch: 2671	Loss: 2.63667032719	Example Output: 76	Example Reward:  1
[[ 0.04251867  0.04192618  0.06575582  0.06548323  0.06824289  0.06565602
   0.06687488  0.06698877  0.06909186  0.06600518  0.06765198  0.0651468
   0.04931773  0.04797406  0.04941614  0.04871443  0.05323536]]
2.8066
[[-0.04251867 -0.04192618 -0.06575582 -0.06548323 -0.06824289 -0.06565602
  -0.06687488 -0.06698877 -0.06909186  0.93399483 -0.06765198 -0.0651468
  -0.04931773 -0.04797406 -0.04941614 -0.04871443 -0.05323536]
 [-0.04251867 -0.04192618 -0.06575582 -0.06548323 -0.06824289 -0.06565602
  -0.06687488 -0.06698877  0.93090814 -0.06600518 -0.06765198 -0.0651468
  -0.04931773 -0.04797406 -0.04941614 -0.04871443 -0.05323536]]
Epoch: 2672	Loss: 3.32986226082	Example Output: X6	Example Reward:  -0.3
[[ 0.04252846  0.04193311  0.0657738   0.0654786   0.06823141  0.06567454
   0.06683678  0.06699003  0.06910131  0.06600691  0.06763846  0.06513453
   0.04934251  0.04796137  0.04941238  0.04872896  0.05322678]]
4.0994

Epoch: 2685	Loss: 3.33054022789	Example Output: +2	Example Reward:  -0.3
[[ 0.04258199  0.04189767  0.06575858  0.06519727  0.06846232  0.06586503
   0.06665201  0.06689322  0.06873184  0.06600833  0.06799682  0.06532441
   0.04933667  0.04784646  0.04952638  0.0486476   0.05327347]]
4.10157
[[ 0.28722543  0.2874307   0.28027242  0.28044084  0.27946132  0.28024051
   0.28000441  0.27993205  0.27938047  0.2801975   0.27960098  0.28040269
  -0.014801    0.28564608  0.28514209  0.28540573  0.28401798]
 [ 0.28722543  0.2874307   0.28027242  0.28044084 -0.0205387   0.28024051
   0.28000441  0.27993205  0.27938047  0.2801975   0.27960098  0.28040269
   0.28519902  0.28564608  0.28514209  0.28540573  0.28401798]]
Epoch: 2686	Loss: 2.66092367172	Example Output: Y+	Example Reward:  1
2.84616
[[-0.04258158  0.95810312 -0.06573441 -0.06522075 -0.06845257 -0.06584014
  -0.06665776 -0.06690509 -0.06872422 -0.06601417 -0.06800635 -0.06532221
  -0.04934249 -0.04784664 -0.04951839 -0.04865686 -0.05327

Epoch: 2698	Loss: 2.91507339478	Example Output: 36	Example Reward:  1
[[ 0.0426309   0.04195789  0.06575233  0.06532553  0.06832372  0.06588707
   0.06658303  0.06708898  0.06847338  0.06590512  0.06800625  0.06531319
   0.04942608  0.04787507  0.04949306  0.04866868  0.05328972]]
2.80723
[[-0.0426309  -0.04195789 -0.06575233 -0.06532553 -0.06832372  0.93411291
  -0.06658303 -0.06708898 -0.06847338 -0.06590512 -0.06800625 -0.06531319
  -0.04942608 -0.04787507 -0.04949306 -0.04866868 -0.05328972]
 [-0.0426309  -0.04195789 -0.06575233 -0.06532553 -0.06832372 -0.06588707
  -0.06658303 -0.06708898  0.9315266  -0.06590512 -0.06800625 -0.06531319
  -0.04942608 -0.04787507 -0.04949306 -0.04866868 -0.05328972]]
Epoch: 2699	Loss: 3.32714893818	Example Output: 4+	Example Reward:  1
[[ 0.04263103  0.04195445  0.06578526  0.06532202  0.06831322  0.06593978
   0.06656587  0.06707563  0.06846312  0.0659216   0.06799472  0.06534656
   0.04941523  0.04784924  0.04948517  0.04865566  0.05328142]]
2.823

Epoch: 2710	Loss: 3.20087144375	Example Output: 26	Example Reward:  1
[[ 0.04260424  0.04206331  0.06578445  0.06528065  0.06829748  0.06589194
   0.06645741  0.06715173  0.06847585  0.06598943  0.06777301  0.06519938
   0.04956295  0.04789886  0.04943753  0.04882669  0.05330509]]
2.80554
[[-0.04260424 -0.04206331 -0.06578445 -0.06528065  0.93170249 -0.06589194
  -0.06645741 -0.06715173 -0.06847585 -0.06598943 -0.06777301 -0.06519938
  -0.04956295 -0.04789886 -0.04943753 -0.04882669 -0.05330509]
 [-0.04260424 -0.04206331 -0.06578445 -0.06528065 -0.06829748 -0.06589194
  -0.06645741 -0.06715173  0.93152416 -0.06598943 -0.06777301 -0.06519938
  -0.04956295 -0.04789886 -0.04943753 -0.04882669 -0.05330509]]
Saving Weight
Epoch: 2711	Loss: 3.4540348053	Example Output: 78	Example Reward:  1
[[ 0.0426057   0.0420692   0.06579689  0.06527364  0.06832701  0.06586154
   0.06644196  0.06721187  0.06850321  0.06596433  0.06773783  0.06516088
   0.04956484  0.0478984   0.04943716  0.04884557  0.053

Epoch: 2723	Loss: 3.19787611961	Example Output: 72	Example Reward:  1
[[ 0.04266664  0.04210039  0.06579948  0.06525262  0.06836122  0.06585597
   0.06642845  0.06725998  0.06827811  0.06593884  0.06772823  0.06512961
   0.0495701   0.04800785  0.04938592  0.04885379  0.05338279]]
2.80747
[[-0.04266664 -0.04210039 -0.06579948 -0.06525262 -0.06836122 -0.06585597
  -0.06642845 -0.06725998 -0.06827811  0.93406117 -0.06772823 -0.06512961
  -0.0495701  -0.04800785 -0.04938592 -0.04885379 -0.05338279]
 [-0.04266664 -0.04210039 -0.06579948 -0.06525262  0.93163878 -0.06585597
  -0.06642845 -0.06725998 -0.06827811 -0.06593884 -0.06772823 -0.06512961
  -0.0495701  -0.04800785 -0.04938592 -0.04885379 -0.05338279]]
Epoch: 2724	Loss: 3.32680077553	Example Output: 51	Example Reward:  1
[[ 0.04267246  0.04209284  0.06577735  0.06526667  0.06836497  0.0658192
   0.06645509  0.06723312  0.06829049  0.06596604  0.06770989  0.06517637
   0.04955595  0.04802353  0.04935775  0.04885115  0.05338707]]
2.8088

Epoch: 2736	Loss: 3.07291059494	Example Output: 09	Example Reward:  1
[[ 0.04275076  0.04217697  0.06587814  0.06544433  0.06820059  0.06576842
   0.06645222  0.06726892  0.06823393  0.06583056  0.06757347  0.06500842
   0.04960459  0.04809063  0.04946084  0.04890028  0.05335688]]
2.81016
[[-0.04275076 -0.04217697  0.93412185 -0.06544433 -0.06820059 -0.06576842
  -0.06645222 -0.06726892 -0.06823393 -0.06583056 -0.06757347 -0.06500842
  -0.04960459 -0.04809063 -0.04946084 -0.04890028 -0.05335688]
 [-0.04275076 -0.04217697 -0.06587814 -0.06544433 -0.06820059 -0.06576842
  -0.06645222 -0.06726892 -0.06823393 -0.06583056 -0.06757347  0.9349916
  -0.04960459 -0.04809063 -0.04946084 -0.04890028 -0.05335688]]
Epoch: 2737	Loss: 3.19722847939	Example Output: Y7	Example Reward:  -0.3
[[ 0.0427235   0.04216603  0.06589822  0.06546453  0.06820566  0.06572188
   0.06645828  0.06726806  0.06825766  0.06581597  0.06758718  0.06501981
   0.04962968  0.04809597  0.04943985  0.0489051   0.05334267]]
4.0

Epoch: 2750	Loss: 3.19632630348	Example Output: 78	Example Reward:  1
[[ 0.04266249  0.04206854  0.06585901  0.06554663  0.06821875  0.06589849
   0.06649421  0.06758073  0.0682233   0.06563953  0.0676296   0.06493578
   0.04974306  0.04800845  0.04946396  0.04878981  0.05323765]]
2.80824
[[-0.04266249 -0.04206854 -0.06585901 -0.06554663 -0.06821875 -0.06589849
  -0.06649421 -0.06758073 -0.0682233   0.93436044 -0.0676296  -0.06493578
  -0.04974306 -0.04800845 -0.04946396 -0.04878981 -0.05323765]
 [-0.04266249 -0.04206854 -0.06585901 -0.06554663 -0.06821875 -0.06589849
  -0.06649421 -0.06758073 -0.0682233  -0.06563953  0.93237042 -0.06493578
  -0.04974306 -0.04800845 -0.04946396 -0.04878981 -0.05323765]]
Saving Weight
Epoch: 2751	Loss: 3.04666860104	Example Output: 13	Example Reward:  1
[[ 0.04266479  0.04206993  0.06584618  0.06555895  0.06821544  0.0659012
   0.06649181  0.0675628   0.06821654  0.06565878  0.06763398  0.06491701
   0.04973865  0.04800594  0.04946245  0.04881502  0.053

Epoch: 2762	Loss: 2.89249126911	Example Output: -4	Example Reward:  -0.3
[[ 0.04270574  0.04215602  0.06590196  0.06547013  0.06828987  0.06604271
   0.06633123  0.06765073  0.06800848  0.0655821   0.06774993  0.064697
   0.04976551  0.04804598  0.04963775  0.04882208  0.05314278]]
4.10088
[[ 0.28718829  0.28735319  0.28022942  0.28035897  0.27951306  0.28018719
   0.28010064  0.27970478  0.27959746  0.28032538  0.27967504  0.28059089
   0.28507036 -0.01441379  0.28510869  0.28535339  0.28405717]
 [ 0.28718829  0.28735319  0.28022942  0.28035897  0.27951306  0.28018719
  -0.01989937  0.27970478  0.27959746  0.28032538  0.27967504  0.28059089
   0.28507036  0.28558621  0.28510869  0.28535339  0.28405717]]
Epoch: 2763	Loss: 2.6369042635	Example Output: 39	Example Reward:  1
[[ 0.04271235  0.0421656   0.0659042   0.06544673  0.06828603  0.06602846
   0.06633668  0.06764232  0.06800652  0.06559864  0.06775267  0.06471402
   0.04976175  0.04803124  0.04964155  0.04882985  0.05314131]]
2.810

4.09877
[[ 0.28719446  0.28731218  0.28017905  0.28031388  0.2795594   0.28014275
   0.28012636  0.27973437  0.27968603  0.28035164  0.27963218 -0.01942469
   0.2850351   0.2855635   0.28514543  0.28535637  0.28409216]
 [-0.01280555  0.28731218  0.28017905  0.28031388  0.2795594   0.28014275
   0.28012636  0.27973437  0.27968603  0.28035164  0.27963218  0.28057531
   0.2850351   0.2855635   0.28514543  0.28535637  0.28409216]]
Epoch: 2775	Loss: 3.20102553368	Example Output: X/	Example Reward:  1
[[ 0.04267802  0.04230997  0.0660596   0.06565864  0.06813205  0.06616998
   0.06624901  0.06755044  0.06769504  0.06547669  0.06790243  0.06471956
   0.04988862  0.04815533  0.04950387  0.04882306  0.05302773]]
2.84622
[[ 0.957322   -0.04230997 -0.0660596  -0.06565864 -0.06813205 -0.06616998
  -0.06624901 -0.06755044 -0.06769504 -0.06547669 -0.06790243 -0.06471956
  -0.04988862 -0.04815533 -0.04950387 -0.04882306 -0.05302773]
 [-0.04267802 -0.04230997 -0.0660596  -0.06565864 -0.06813205 -0.066

Epoch: 2787	Loss: 2.5099326849	Example Output: 73	Example Reward:  1
[[ 0.04264822  0.04218822  0.06598201  0.06570506  0.06817349  0.06602513
   0.06634677  0.0677112   0.06748205  0.06540874  0.06806703  0.06494688
   0.04994896  0.04824281  0.04940618  0.04867409  0.05304315]]
2.8097
[[-0.04264822 -0.04218822 -0.06598201 -0.06570506 -0.06817349 -0.06602513
  -0.06634677 -0.0677112  -0.06748205  0.93459129 -0.06806703 -0.06494688
  -0.04994896 -0.04824281 -0.04940618 -0.04867409 -0.05304315]
 [-0.04264822 -0.04218822 -0.06598201 -0.06570506 -0.06817349  0.93397486
  -0.06634677 -0.0677112  -0.06748205 -0.06540874 -0.06806703 -0.06494688
  -0.04994896 -0.04824281 -0.04940618 -0.04867409 -0.05304315]]
Epoch: 2788	Loss: 3.32684135437	Example Output: +Y	Example Reward:  -0.3
[[ 0.04267607  0.04219956  0.06596195  0.06572624  0.06816359  0.06610373
   0.06629197  0.06768499  0.06743766  0.06541675  0.06806642  0.0649222
   0.04993349  0.04825532  0.04944114  0.04867062  0.05304838]]
4.094

Epoch: 2800	Loss: 3.06820240021	Example Output: 77	Example Reward:  1
[[ 0.04266144  0.04221362  0.06600507  0.06561983  0.06823699  0.06613855
   0.06621007  0.06768636  0.06716666  0.06546279  0.06820078  0.06494389
   0.04997402  0.0483956   0.04940432  0.0486383   0.05304172]]
2.81014
[[-0.04266144 -0.04221362 -0.06600507 -0.06561983 -0.06823699 -0.06613855
  -0.06621007 -0.06768636 -0.06716666  0.93453723 -0.06820078 -0.06494389
  -0.04997402 -0.0483956  -0.04940432 -0.0486383  -0.05304172]
 [-0.04266144 -0.04221362 -0.06600507 -0.06561983 -0.06823699 -0.06613855
  -0.06621007 -0.06768636 -0.06716666  0.93453723 -0.06820078 -0.06494389
  -0.04997402 -0.0483956  -0.04940432 -0.0486383  -0.05304172]]
Saving Weight
Epoch: 2801	Loss: 2.81274878979	Example Output: 25	Example Reward:  1
[[ 0.0426305   0.04217336  0.06600362  0.0656198   0.06827781  0.0661275
   0.06623337  0.06771134  0.06716507  0.06551906  0.06821319  0.06497683
   0.04995845  0.04837108  0.04935832  0.04862726  0.053

Epoch: 2813	Loss: 2.38068699837	Example Output: 63	Example Reward:  1
[[ 0.04247541  0.04204415  0.06588207  0.06580686  0.06843406  0.06596749
   0.06638884  0.06793827  0.06725479  0.06555192  0.06821877  0.06496063
   0.04990094  0.04839118  0.04917844  0.04860448  0.05300174]]
2.80815
[[-0.04247541 -0.04204415 -0.06588207 -0.06580686 -0.06843406 -0.06596749
  -0.06638884 -0.06793827  0.93274522 -0.06555192 -0.06821877 -0.06496063
  -0.04990094 -0.04839118 -0.04917844 -0.04860448 -0.05300174]
 [-0.04247541 -0.04204415 -0.06588207 -0.06580686 -0.06843406  0.9340325
  -0.06638884 -0.06793827 -0.06725479 -0.06555192 -0.06821877 -0.06496063
  -0.04990094 -0.04839118 -0.04917844 -0.04860448 -0.05300174]]
Epoch: 2814	Loss: 3.56000645161	Example Output: 9Y	Example Reward:  -0.3
[[ 0.04248145  0.04206876  0.065881    0.06579224  0.06841175  0.06597866
   0.06635243  0.06792289  0.06724364  0.06556307  0.06820114  0.06493973
   0.04991699  0.04842297  0.04918967  0.04862881  0.05300468]]
4.0

Epoch: 2827	Loss: 3.07311501503	Example Output: 57	Example Reward:  1
[[ 0.04241225  0.04197066  0.06597823  0.06570332  0.06843986  0.06571411
   0.06647966  0.06806749  0.0672058   0.06572752  0.06810526  0.06495433
   0.04995238  0.04854808  0.04908857  0.04862016  0.05303222]]
2.80772
[[-0.04241225 -0.04197066 -0.06597823 -0.06570332 -0.06843986 -0.06571411
  -0.06647966  0.93193251 -0.0672058  -0.06572752 -0.06810526 -0.06495433
  -0.04995238 -0.04854808 -0.04908857 -0.04862016 -0.05303222]
 [-0.04241225 -0.04197066 -0.06597823 -0.06570332 -0.06843986 -0.06571411
  -0.06647966 -0.06806749 -0.0672058   0.93427247 -0.06810526 -0.06495433
  -0.04995238 -0.04854808 -0.04908857 -0.04862016 -0.05303222]]
Epoch: 2828	Loss: 2.64078922272	Example Output: -/	Example Reward:  -0.3
[[ 0.04241436  0.04197592  0.06596364  0.06566587  0.06845368  0.0657021
   0.06650596  0.06806504  0.06718387  0.06577087  0.06808054  0.06494531
   0.0499471   0.04856457  0.04907666  0.04862398  0.05306057]]
4.0

Epoch: 2841	Loss: 3.0455586195	Example Output: 90	Example Reward:  1
[[ 0.04238378  0.04199226  0.06588168  0.06556188  0.0683557   0.06563742
   0.06661596  0.06807506  0.06724574  0.06580831  0.06810794  0.0651151
   0.04998148  0.04860047  0.04892308  0.0485146   0.05319951]]
2.8098
[[-0.04238378 -0.04199226 -0.06588168 -0.06556188 -0.0683557  -0.06563742
  -0.06661596 -0.06807506 -0.06724574 -0.06580831 -0.06810794  0.93488491
  -0.04998148 -0.04860047 -0.04892308 -0.0485146  -0.05319951]
 [-0.04238378 -0.04199226  0.93411833 -0.06556188 -0.0683557  -0.06563742
  -0.06661596 -0.06807506 -0.06724574 -0.06580831 -0.06810794 -0.0651151
  -0.04998148 -0.04860047 -0.04892308 -0.0485146  -0.05319951]]
Epoch: 2842	Loss: 3.45481965542	Example Output: 89	Example Reward:  1
[[ 0.04239321  0.04200832  0.06591529  0.06556609  0.06832158  0.06562866
   0.06663718  0.0680426   0.06723777  0.06578878  0.06810018  0.06513524
   0.04999552  0.04860393  0.04891555  0.04851013  0.05319998]]
2.80815
[

Epoch: 2853	Loss: 2.78528316021	Example Output: 75	Example Reward:  1
[[ 0.04237556  0.0420399   0.06591628  0.0657767   0.06827541  0.0655323
   0.06681932  0.06801565  0.06722077  0.06555218  0.06815869  0.06507528
   0.05003325  0.0486888   0.04879795  0.04844617  0.05327585]]
2.80789
[[-0.04237556 -0.0420399  -0.06591628 -0.0657767  -0.06827541 -0.0655323
  -0.06681932 -0.06801565 -0.06722077  0.93444782 -0.06815869 -0.06507528
  -0.05003325 -0.0486888  -0.04879795 -0.04844617 -0.05327585]
 [-0.04237556 -0.0420399  -0.06591628 -0.0657767  -0.06827541 -0.0655323
  -0.06681932  0.93198436 -0.06722077 -0.06555218 -0.06815869 -0.06507528
  -0.05003325 -0.0486888  -0.04879795 -0.04844617 -0.05327585]]
Epoch: 2854	Loss: 3.04734501839	Example Output: +-	Example Reward:  -0.3
[[ 0.04236194  0.04202494  0.06591636  0.06576338  0.06826524  0.06549647
   0.06684378  0.06805401  0.06725715  0.06559342  0.06813445  0.06506857
   0.05003024  0.04868152  0.048772    0.04846616  0.05327037]]
4.096

Epoch: 2865	Loss: 2.94158668518	Example Output: 25	Example Reward:  1
[[ 0.04216401  0.04186159  0.06593132  0.06578489  0.06818454  0.06559709
   0.06705789  0.06819244  0.06744435  0.06576884  0.068146    0.06508055
   0.04991372  0.04862741  0.04867532  0.04839631  0.0531737 ]]
2.80551
[[-0.04216401 -0.04186159 -0.06593132 -0.06578489  0.93181545 -0.06559709
  -0.06705789 -0.06819244 -0.06744435 -0.06576884 -0.068146   -0.06508055
  -0.04991372 -0.04862741 -0.04867532 -0.04839631 -0.0531737 ]
 [-0.04216401 -0.04186159 -0.06593132 -0.06578489 -0.06818454 -0.06559709
  -0.06705789  0.93180758 -0.06744435 -0.06576884 -0.068146   -0.06508055
  -0.04991372 -0.04862741 -0.04867532 -0.04839631 -0.0531737 ]]
Epoch: 2866	Loss: 3.32536025047	Example Output: 85	Example Reward:  1
[[ 0.04214876  0.04184433  0.06594878  0.06575876  0.06818645  0.06560034
   0.06708917  0.06821099  0.06745816  0.0658206   0.06811475  0.06510342
   0.04989087  0.04861462  0.04864187  0.04838664  0.0531815 ]]
2.805

Epoch: 2878	Loss: 3.19697501659	Example Output: -6	Example Reward:  -0.3
[[ 0.04198148  0.04164908  0.06604522  0.06572743  0.0684723   0.0655233
   0.06734607  0.0682646   0.06763817  0.06584349  0.06829794  0.06515908
   0.0498337   0.04846336  0.04847116  0.0482246   0.053059  ]]
4.10089
[[ 0.28740558  0.28750527  0.28018644  0.28028178  0.27945831  0.28034303
   0.27979618  0.27952063  0.27970856  0.28024697  0.27951065  0.28045228
   0.28504989 -0.01453901  0.28545865  0.28553265  0.28408232]
 [ 0.28740558  0.28750527  0.28018644  0.28028178  0.27945831  0.28034303
   0.27979618  0.27952063 -0.02029145  0.28024697  0.27951065  0.28045228
   0.28504989  0.28546101  0.28545865  0.28553265  0.28408232]]
Epoch: 2879	Loss: 3.33442871571	Example Output: Y	Example Reward:  1
[[ 0.04200701  0.04166905  0.0660503   0.06570841  0.06844526  0.06551667
   0.06733808  0.06823452  0.06764887  0.06587268  0.06824007  0.0651678
   0.04984566  0.0484696   0.04846923  0.04824214  0.05307464]]
2.842

Epoch: 2891	Loss: 3.07074530125	Example Output: X3	Example Reward:  -0.3
[[ 0.04183397  0.04150495  0.06611407  0.0657608   0.06873806  0.06544666
   0.06746301  0.06839862  0.06784189  0.06594644  0.06823311  0.06514928
   0.04971749  0.04830868  0.04833231  0.04814265  0.05306808]]
4.09806
[[-0.01255019  0.28754851  0.28016579  0.28027177  0.27937859  0.280366
   0.27976111  0.27948043  0.27964744  0.28021607  0.27953008  0.28045523
   0.28508475  0.28550741  0.28550032  0.28555721  0.28407958]
 [ 0.28744981  0.28754851  0.28016579  0.28027177  0.27937859 -0.019634
   0.27976111  0.27948043  0.27964744  0.28021607  0.27953008  0.28045523
   0.28508475  0.28550741  0.28550032  0.28555721  0.28407958]]
Epoch: 2892	Loss: 2.91592667103	Example Output: /9	Example Reward:  -0.3
[[ 0.04182579  0.04152613  0.0660994   0.06576147  0.06873015  0.06547368
   0.06748139  0.0683625   0.06782114  0.06596347  0.06824391  0.06513899
   0.04970016  0.04830917  0.04833019  0.0481469   0.05308554]]
4.1

Epoch: 2904	Loss: 2.94047150612	Example Output: X-	Example Reward:  1
[[ 0.04169504  0.04136018  0.06587478  0.06602871  0.06861094  0.06546571
   0.06769445  0.0684763   0.06773809  0.06577156  0.06863332  0.06544105
   0.04964028  0.04849649  0.04814966  0.04794954  0.05297391]]
2.84627
[[ 0.95830494 -0.04136018 -0.06587478 -0.06602871 -0.06861094 -0.06546571
  -0.06769445 -0.0684763  -0.06773809 -0.06577156 -0.06863332 -0.06544105
  -0.04964028 -0.04849649 -0.04814966 -0.04794954 -0.05297391]
 [-0.04169504 -0.04136018 -0.06587478 -0.06602871 -0.06861094 -0.06546571
  -0.06769445 -0.0684763  -0.06773809 -0.06577156 -0.06863332 -0.06544105
  -0.04964028  0.95150352 -0.04814966 -0.04794954 -0.05297391]]
Epoch: 2905	Loss: 2.78814558983	Example Output: 00	Example Reward:  1
[[ 0.04170722  0.04137152  0.06584006  0.06606103  0.06862364  0.06548496
   0.06767737  0.06845666  0.06774037  0.06577764  0.06862187  0.06544029
   0.04961758  0.04849731  0.0481452   0.04794703  0.05299033]]
2.808

Epoch: 2919	Loss: 2.7637014389	Example Output: 17	Example Reward:  1
[[ 0.04149887  0.04112324  0.06591774  0.0664278   0.06885834  0.06531064
   0.06783466  0.06885085  0.06789097  0.06596269  0.06860998  0.0655813
   0.04950152  0.04830872  0.04778899  0.04773271  0.05280101]]
2.80711
[[-0.04149887 -0.04112324 -0.06591774  0.93357217 -0.06885834 -0.06531064
  -0.06783466 -0.06885085 -0.06789097 -0.06596269 -0.06860998 -0.0655813
  -0.04950152 -0.04830872 -0.04778899 -0.04773271 -0.05280101]
 [-0.04149887 -0.04112324 -0.06591774 -0.0664278  -0.06885834 -0.06531064
  -0.06783466 -0.06885085 -0.06789097  0.93403733 -0.06860998 -0.0655813
  -0.04950152 -0.04830872 -0.04778899 -0.04773271 -0.05280101]]
Epoch: 2920	Loss: 2.91160566807	Example Output: YX	Example Reward:  -0.3
4.09063
[[ 0.2875506  -0.01233604  0.28023016  0.28006461  0.27934825  0.28040117
   0.27965137  0.27934706  0.27963057  0.28020743  0.27940848  0.28032765
   0.28515324  0.28550565  0.28566822  0.28568113  0.28416058]

Epoch: 2931	Loss: 2.63735637665	Example Output: +1	Example Reward:  -0.3
[[ 0.04136722  0.04098187  0.0658324   0.06677084  0.06877507  0.0654775
   0.06793378  0.06892453  0.06792808  0.065939    0.06897422  0.06554957
   0.04934012  0.0482428   0.04774776  0.04755073  0.0526645 ]]
4.10036
[[ 0.28758985  0.28770545  0.28025031  0.27996877  0.27936751  0.28035676
   0.27961987  0.27932265  0.2796216   0.2802183   0.27930775  0.28033516
  -0.01480204  0.28552717  0.28567567  0.2857348   0.28420067]
 [ 0.28758985  0.28770545  0.28025031 -0.02003125  0.27936751  0.28035676
   0.27961987  0.27932265  0.2796216   0.2802183   0.27930775  0.28033516
   0.28519797  0.28552717  0.28567567  0.2857348   0.28420067]]
Epoch: 2932	Loss: 3.45239613056	Example Output: +	Example Reward:  -0.3
[[ 0.04137696  0.0410279   0.06582958  0.0667458   0.06874394  0.06548489
   0.06790985  0.06887139  0.06790481  0.06598479  0.06894003  0.06552159
   0.04934667  0.04826554  0.04777744  0.04757254  0.05269625]]
4

Epoch: 2943	Loss: 2.65549001694	Example Output: 04	Example Reward:  1
[[ 0.04133227  0.04107493  0.06581052  0.06693552  0.06877475  0.06529049
   0.06784707  0.06865271  0.06814319  0.06609449  0.0689228   0.06556171
   0.04926246  0.04827562  0.04768776  0.04766991  0.0526638 ]]
2.80591
[[-0.04133227 -0.04107493  0.9341895  -0.06693552 -0.06877475 -0.06529049
  -0.06784707 -0.06865271 -0.06814319 -0.06609449 -0.0689228  -0.06556171
  -0.04926246 -0.04827562 -0.04768776 -0.04766991 -0.0526638 ]
 [-0.04133227 -0.04107493 -0.06581052 -0.06693552 -0.06877475 -0.06529049
   0.93215293 -0.06865271 -0.06814319 -0.06609449 -0.0689228  -0.06556171
  -0.04926246 -0.04827562 -0.04768776 -0.04766991 -0.0526638 ]]
Epoch: 2944	Loss: 3.45230519772	Example Output: 95	Example Reward:  1
[[ 0.04131729  0.04106484  0.06585325  0.06691839  0.06876213  0.06530094
   0.06788322  0.06863932  0.06815473  0.06610385  0.06895781  0.06560462
   0.04925338  0.04826356  0.04765114  0.04763859  0.05263298]]
2.805

Epoch: 2955	Loss: 2.91806542873	Example Output: 31	Example Reward:  1
[[ 0.04132991  0.04106756  0.06612962  0.06657806  0.0687368   0.06569667
   0.06773313  0.06874593  0.06805178  0.06621069  0.06889948  0.06554182
   0.04921944  0.04825052  0.04770869  0.04759516  0.05250477]]
2.80689
[[-0.04132991 -0.04106756 -0.06612962 -0.06657806 -0.0687368   0.93430334
  -0.06773313 -0.06874593 -0.06805178 -0.06621069 -0.06889948 -0.06554182
  -0.04921944 -0.04825052 -0.04770869 -0.04759516 -0.05250477]
 [-0.04132991 -0.04106756 -0.06612962  0.93342197 -0.0687368  -0.06569667
  -0.06773313 -0.06874593 -0.06805178 -0.06621069 -0.06889948 -0.06554182
  -0.04921944 -0.04825052 -0.04770869 -0.04759516 -0.05250477]]
Epoch: 2956	Loss: 3.06851408482	Example Output: 33	Example Reward:  1
[[ 0.0413283   0.04105153  0.06615631  0.06656703  0.06875986  0.06572944
   0.06772219  0.06875861  0.06805254  0.06620175  0.06890391  0.06555115
   0.04919815  0.0482448   0.04771522  0.04757657  0.05248266]]
2.807

Epoch: 2968	Loss: 3.32770547867	Example Output: +9	Example Reward:  -0.3
[[ 0.04144926  0.04119145  0.06610807  0.06645678  0.06872822  0.06572463
   0.06767891  0.0687115   0.06799226  0.06614716  0.06872351  0.06560574
   0.04919345  0.0482576   0.04776886  0.0476558   0.05260684]]
4.10012
[[ 0.28756523  0.28764257  0.28016761  0.28006297  0.27938154  0.28028262
   0.27969635  0.27938655  0.27960232  0.28015587  0.27938297  0.28031829
  -0.01475804  0.28552273  0.28566936  0.28570327  0.28421795]
 [ 0.28756523  0.28764257  0.28016761  0.28006297  0.27938154  0.28028262
   0.27969635  0.27938655  0.27960232  0.28015587  0.27938297 -0.01968172
   0.28524199  0.28552273  0.28566936  0.28570327  0.28421795]]
Epoch: 2969	Loss: 3.45482714176	Example Output: -7	Example Reward:  -0.3
[[ 0.04145975  0.04120016  0.06607471  0.06650122  0.06869226  0.06571328
   0.06765154  0.06877293  0.06796776  0.06608057  0.06874474  0.06556927
   0.04921505  0.04829334  0.04779216  0.04766656  0.05260465]]

Epoch: 2982	Loss: 3.07210757732	Example Output: 13	Example Reward:  1
[[ 0.04146143  0.0412848   0.06618524  0.06661723  0.06865207  0.0657193
   0.06762384  0.06845663  0.06798517  0.06606255  0.06872794  0.0655672
   0.04915693  0.04832841  0.04786797  0.04771504  0.05258828]]
2.80711
[[-0.04146143 -0.0412848  -0.06618524  0.93338275 -0.06865207 -0.0657193
  -0.06762384 -0.06845663 -0.06798517 -0.06606255 -0.06872794 -0.0655672
  -0.04915693 -0.04832841 -0.04786797 -0.04771504 -0.05258828]
 [-0.04146143 -0.0412848  -0.06618524 -0.06661723 -0.06865207  0.93428069
  -0.06762384 -0.06845663 -0.06798517 -0.06606255 -0.06872794 -0.0655672
  -0.04915693 -0.04832841 -0.04786797 -0.04771504 -0.05258828]]
Epoch: 2983	Loss: 3.04907815456	Example Output: /X	Example Reward:  -0.3
4.09286
[[ 0.2875582   0.2876088   0.28013599  0.2800118   0.2794061   0.28028071
   0.27972639  0.2794694   0.27961275  0.28018916  0.27938473  0.28033185
   0.28524944  0.28550404  0.28563586 -0.01432536  0.28422031]


Epoch: 2997	Loss: 3.45263104439	Example Output: 76	Example Reward:  1
[[ 0.04151741  0.04151132  0.06625067  0.06644273  0.0686561   0.06556687
   0.06775609  0.06822702  0.06782329  0.066259    0.06835643  0.06537946
   0.04927117  0.04848238  0.04795995  0.04787115  0.05266901]]
2.80611
[[-0.04151741 -0.04151132 -0.06625067 -0.06644273 -0.0686561  -0.06556687
  -0.06775609 -0.06822702 -0.06782329  0.93374097 -0.06835643 -0.06537946
  -0.04927117 -0.04848238 -0.04795995 -0.04787115 -0.05266901]
 [-0.04151741 -0.04151132 -0.06625067 -0.06644273 -0.0686561  -0.06556687
  -0.06775609 -0.06822702  0.93217671 -0.066259   -0.06835643 -0.06537946
  -0.04927117 -0.04848238 -0.04795995 -0.04787115 -0.05266901]]
Epoch: 2998	Loss: 3.06705331802	Example Output: *	Example Reward:  -0.3
[[ 0.0415061   0.04150662  0.06626893  0.0663852   0.06869741  0.06551727
   0.06776901  0.06818479  0.06786849  0.06634119  0.06830679  0.06540356
   0.04927509  0.04847765  0.04794015  0.04788348  0.0526682 ]]
4.0

Epoch: 3011	Loss: 3.17232496738	Example Output: 61	Example Reward:  1
[[ 0.04140485  0.04143073  0.06622744  0.06641848  0.06882188  0.06537466
   0.06804249  0.06827298  0.06811485  0.06621985  0.06827101  0.06536414
   0.04921842  0.04843495  0.04786271  0.0478528   0.05266783]]
2.80561
[[-0.04140485 -0.04143073 -0.06622744 -0.06641848 -0.06882188 -0.06537466
  -0.06804249 -0.06827298  0.93188512 -0.06621985 -0.06827101 -0.06536414
  -0.04921842 -0.04843495 -0.04786271 -0.0478528  -0.05266783]
 [-0.04140485 -0.04143073 -0.06622744  0.93358153 -0.06882188 -0.06537466
  -0.06804249 -0.06827298 -0.06811485 -0.06621985 -0.06827101 -0.06536414
  -0.04921842 -0.04843495 -0.04786271 -0.0478528  -0.05266783]]
Epoch: 3012	Loss: 3.32891504765	Example Output: 25	Example Reward:  1
[[ 0.0414186   0.04145619  0.0662128   0.06640766  0.0688256   0.06534911
   0.06801537  0.06824415  0.06809168  0.06620274  0.06828277  0.06533463
   0.04922988  0.04846004  0.04788527  0.047882    0.05270156]]
2.803

Epoch: 3023	Loss: 2.91698935032	Example Output: 16	Example Reward:  1
[[ 0.04153797  0.04150467  0.06607209  0.06619694  0.06883506  0.06547049
   0.0678122   0.06822941  0.0679116   0.06609004  0.06839416  0.06529707
   0.04916145  0.04852778  0.04811985  0.04802299  0.05281628]]
2.80619
[[-0.04153797 -0.04150467 -0.06607209  0.93380308 -0.06883506 -0.06547049
  -0.0678122  -0.06822941 -0.0679116  -0.06609004 -0.06839416 -0.06529707
  -0.04916145 -0.04852778 -0.04811985 -0.04802299 -0.05281628]
 [-0.04153797 -0.04150467 -0.06607209 -0.06619694 -0.06883506 -0.06547049
  -0.0678122  -0.06822941  0.93208838 -0.06609004 -0.06839416 -0.06529707
  -0.04916145 -0.04852778 -0.04811985 -0.04802299 -0.05281628]]
Epoch: 3024	Loss: 2.91703081131	Example Output: 38	Example Reward:  1
[[ 0.04155139  0.04150527  0.06606548  0.06622007  0.06881155  0.06547413
   0.06781796  0.0682276   0.06792083  0.0660691   0.06840056  0.06528338
   0.04914255  0.04852026  0.04814648  0.04802462  0.05281885]]
2.806

  -0.04923688 -0.04856779 -0.04815327 -0.04797623  0.94713706]]
Epoch: 3039	Loss: 3.06948382854	Example Output: 75	Example Reward:  1
[[ 0.04153379  0.04161779  0.06613999  0.06604717  0.06877937  0.06558244
   0.06779919  0.06813887  0.06787053  0.06615966  0.06816886  0.0652983
   0.04926032  0.04858166  0.04814861  0.047984    0.0528895 ]]
2.80616
[[-0.04153379 -0.04161779 -0.06613999 -0.06604717 -0.06877937 -0.06558244
  -0.06779919 -0.06813887 -0.06787053  0.93384033 -0.06816886 -0.0652983
  -0.04926032 -0.04858166 -0.04814861 -0.047984   -0.0528895 ]
 [-0.04153379 -0.04161779 -0.06613999 -0.06604717 -0.06877937 -0.06558244
  -0.06779919  0.93186116 -0.06787053 -0.06615966 -0.06816886 -0.0652983
  -0.04926032 -0.04858166 -0.04814861 -0.047984   -0.0528895 ]]
Epoch: 3040	Loss: 3.45636503696	Example Output: 75	Example Reward:  1
[[ 0.04154328  0.04164945  0.06613226  0.06605811  0.06875605  0.06554839
   0.06780963  0.06813047  0.06785823  0.06617024  0.06812843  0.06529579
   0.049

Epoch: 3052	Loss: 3.45122900009	Example Output: Y9	Example Reward:  -0.3
[[ 0.04147381  0.04154743  0.06610546  0.06618229  0.06873933  0.06558365
   0.06804368  0.0680301   0.06793809  0.06627451  0.06819034  0.06549027
   0.04922682  0.04855135  0.04801867  0.04779853  0.05280571]]
4.09777
[[ 0.28755787 -0.01246423  0.28016835  0.28014535  0.27937821  0.28032491
   0.27958691  0.27959096  0.27961859  0.28011766  0.27954292  0.28035295
   0.28523198  0.2854346   0.2855944   0.28566045  0.28415829]
 [ 0.28755787  0.28753579  0.28016835  0.28014535  0.27937821  0.28032491
   0.27958691  0.27959096  0.27961859  0.28011766  0.27954292 -0.01964708
   0.28523198  0.2854346   0.2855944   0.28566045  0.28415829]]
Epoch: 3053	Loss: 2.91631865501	Example Output: /3	Example Reward:  -0.3
[[ 0.04147504  0.04155468  0.06612162  0.0662053   0.06870831  0.06557836
   0.06806773  0.06799545  0.06795378  0.06627632  0.06818525  0.06547501
   0.04921713  0.0485481   0.0480144   0.0478147   0.05280872]]

Epoch: 3065	Loss: 3.19476261139	Example Output: -0	Example Reward:  -0.3
[[ 0.04144887  0.04152163  0.06598172  0.06603604  0.0688296   0.06555614
   0.06823553  0.06803671  0.06804093  0.06640933  0.06814886  0.0655719
   0.04911154  0.04846177  0.04798594  0.04773699  0.05288656]]
4.10014
[[ 0.28756535  0.28754354  0.28020549  0.28018919  0.27935115  0.28033316
   0.27952936  0.279589    0.27958775  0.28007722  0.27955535  0.28032845
   0.28526655 -0.01453853  0.28560424  0.28567892  0.28413406]
 [ 0.28756535  0.28754354 -0.01979452  0.28018919  0.27935115  0.28033316
   0.27952936  0.279589    0.27958775  0.28007722  0.27955535  0.28032845
   0.28526655  0.28546149  0.28560424  0.28567892  0.28413406]]
Epoch: 3066	Loss: 2.63207182884	Example Output: 71	Example Reward:  1
[[ 0.04144655  0.04150365  0.06596096  0.06600193  0.06885362  0.06553478
   0.0682533   0.0680906   0.06805016  0.06646381  0.06811135  0.06557764
   0.04911344  0.04844626  0.04797288  0.04773138  0.0528877 ]]
2.8

Epoch: 3080	Loss: 3.04536306858	Example Output: /0	Example Reward:  -0.3
[[ 0.04132182  0.04143955  0.06595683  0.06591179  0.06883874  0.06560175
   0.06821359  0.06808846  0.06809531  0.06653561  0.06818488  0.06565329
   0.04914054  0.04842447  0.04793729  0.04770828  0.05294781]]
4.09985
[[ 0.28760347  0.28756815  0.28021297  0.28022647  0.2793484   0.28031948
   0.27953595  0.27957347  0.27957141  0.28003934  0.27954456  0.28030401
   0.28525785  0.28547266  0.28561884 -0.01431248  0.28411567]
 [ 0.28760347  0.28756815 -0.01978705  0.28022647  0.2793484   0.28031948
   0.27953595  0.27957347  0.27957141  0.28003934  0.27954456  0.28030401
   0.28525785  0.28547266  0.28561884  0.28568754  0.28411567]]
Saving Weight
Epoch: 3081	Loss: 3.1990844965	Example Output: 32	Example Reward:  1
[[ 0.04134009  0.04146537  0.0659626   0.06589179  0.06879926  0.06560677
   0.06822015  0.06808153  0.06807606  0.06651467  0.06816739  0.06562662
   0.04916853  0.04843693  0.04797031  0.04772272  0.

Epoch: 3093	Loss: 3.06643533707	Example Output: 16	Example Reward:  1
[[ 0.04141065  0.04151491  0.06593197  0.06598935  0.06869992  0.06558512
   0.06825029  0.06796072  0.06818061  0.06646398  0.06812723  0.06558605
   0.04919115  0.048431    0.0480161   0.04774704  0.05291391]]
2.80599
[[-0.04141065 -0.04151491 -0.06593197  0.93401062 -0.06869992 -0.06558512
  -0.06825029 -0.06796072 -0.06818061 -0.06646398 -0.06812723 -0.06558605
  -0.04919115 -0.048431   -0.0480161  -0.04774704 -0.05291391]
 [-0.04141065 -0.04151491 -0.06593197 -0.06598935 -0.06869992 -0.06558512
  -0.06825029 -0.06796072  0.93181938 -0.06646398 -0.06812723 -0.06558605
  -0.04919115 -0.048431   -0.0480161  -0.04774704 -0.05291391]]
Epoch: 3094	Loss: 3.1799341917	Example Output: 71	Example Reward:  1
[[ 0.04143794  0.04153946  0.06592873  0.0659996   0.06864015  0.06558084
   0.06822864  0.06793117  0.06818571  0.06645879  0.06811954  0.06559721
   0.04919918  0.04843228  0.04803097  0.04777551  0.0529142 ]]
2.8073

Epoch: 3106	Loss: 2.50789031982	Example Output: 48	Example Reward:  1
[[ 0.04146325  0.04164921  0.0660315   0.06621128  0.06861888  0.06560361
   0.06806591  0.06801203  0.06809089  0.06628194  0.06807519  0.06530561
   0.049284    0.04842082  0.04800785  0.04802798  0.05284994]]
2.80469
[[-0.04146325 -0.04164921 -0.0660315  -0.06621128 -0.06861888 -0.06560361
   0.93193412 -0.06801203 -0.06809089 -0.06628194 -0.06807519 -0.06530561
  -0.049284   -0.04842082 -0.04800785 -0.04802798 -0.05284994]
 [-0.04146325 -0.04164921 -0.0660315  -0.06621128 -0.06861888 -0.06560361
  -0.06806591 -0.06801203 -0.06809089 -0.06628194  0.93192482 -0.06530561
  -0.049284   -0.04842082 -0.04800785 -0.04802798 -0.05284994]]
Epoch: 3107	Loss: 2.9368336916	Example Output: 52	Example Reward:  1
[[ 0.04143466  0.0416186   0.06602132  0.06621914  0.06865361  0.06556496
   0.06810383  0.06806117  0.06810854  0.06632067  0.06806619  0.06529668
   0.04927475  0.04842347  0.04797733  0.0480234   0.05283169]]
2.8042

Epoch: 3119	Loss: 3.32405104637	Example Output: Y9	Example Reward:  -0.3
[[ 0.04129171  0.0415624   0.06598186  0.0663857   0.06887279  0.06563063
   0.06831662  0.0678159   0.06814899  0.06639664  0.06801136  0.0653149
   0.04913357  0.0483642   0.04798505  0.04792605  0.05286165]]
4.09768
[[ 0.2876125  -0.01246872  0.28020546  0.28008431  0.27933818  0.28031084
   0.27950501  0.27965525  0.27955532  0.280081    0.2795966   0.28040555
   0.28525996  0.28549075  0.28560448  0.28562218  0.28414151]
 [ 0.2876125   0.28753129  0.28020546  0.28008431  0.27933818  0.28031084
   0.27950501  0.27965525  0.27955532  0.280081    0.2795966  -0.01959447
   0.28525996  0.28549075  0.28560448  0.28562218  0.28414151]]
Epoch: 3120	Loss: 2.91537218094	Example Output: 84	Example Reward:  1
[[ 0.04127768  0.0415442   0.06598449  0.06638186  0.06893277  0.06562919
   0.06834257  0.06782266  0.06813875  0.06640771  0.06800009  0.06530282
   0.04911761  0.048347    0.04797543  0.04792107  0.05287407]]
2.8

Epoch: 3133	Loss: 3.07219171524	Example Output: 9	Example Reward:  1
[[ 0.04115673  0.04141795  0.06582072  0.06618242  0.06907035  0.06545877
   0.06858279  0.06792795  0.06819237  0.06657534  0.0680363   0.06529602
   0.0490035   0.04840834  0.04788477  0.04791389  0.05307177]]
2.81886
[[-0.04115673 -0.04141795 -0.06582072 -0.06618242 -0.06907035 -0.06545877
  -0.06858279 -0.06792795 -0.06819237 -0.06657534 -0.0680363   0.93470401
  -0.0490035  -0.04840834 -0.04788477 -0.04791389 -0.05307177]
 [-0.04115673 -0.04141795 -0.06582072 -0.06618242 -0.06907035 -0.06545877
  -0.06858279 -0.06792795 -0.06819237 -0.06657534 -0.0680363  -0.06529602
  -0.0490035  -0.04840834 -0.04788477 -0.04791389  0.9469282 ]]
Epoch: 3134	Loss: 2.24898536205	Example Output: 8*	Example Reward:  1
[[ 0.04115266  0.04140861  0.06581493  0.06617646  0.06905531  0.06545439
   0.0685848   0.06794382  0.06818432  0.06657384  0.06804462  0.06530376
   0.04899576  0.04841025  0.04788415  0.04791744  0.0530949 ]]
2.8219

Epoch: 3145	Loss: 3.17567791939	Example Output: X3	Example Reward:  -0.3
[[ 0.04121208  0.0414263   0.06584567  0.06609109  0.06890815  0.06553042
   0.06853291  0.06794188  0.06803767  0.06655892  0.0682307   0.06551409
   0.04894492  0.048371    0.04786082  0.04788974  0.05310369]]
4.09753
[[-0.01236362  0.28757212  0.28024632  0.28017271  0.27932757  0.28034088
   0.27944013  0.27961743  0.2795887   0.28003234  0.27953079  0.2803458
   0.28531653  0.28548869  0.28564176  0.28563309  0.28406891]
 [ 0.2876364   0.28757212  0.28024632  0.28017271  0.27932757 -0.01965913
   0.27944013  0.27961743  0.2795887   0.28003234  0.27953079  0.2803458
   0.28531653  0.28548869  0.28564176  0.28563309  0.28406891]]
Epoch: 3146	Loss: 3.06727776527	Example Output: 11	Example Reward:  1
[[ 0.04122993  0.04145867  0.06587988  0.06606317  0.06888688  0.06552722
   0.06850722  0.0678928   0.06804708  0.06657462  0.0681821   0.0654934
   0.04894588  0.04837125  0.04788721  0.04793403  0.05311871]]
2.807

Epoch: 3159	Loss: 3.19878435135	Example Output: 2	Example Reward:  1
[[ 0.04117531  0.04152937  0.06590615  0.06595378  0.06900793  0.06521238
   0.06847938  0.06785017  0.06832952  0.06670795  0.06781953  0.06543723
   0.04907019  0.04834246  0.04803286  0.04805427  0.05309153]]
2.81622
[[-0.04117531 -0.04152937 -0.06590615 -0.06595378  0.93099207 -0.06521238
  -0.06847938 -0.06785017 -0.06832952 -0.06670795 -0.06781953 -0.06543723
  -0.04907019 -0.04834246 -0.04803286 -0.04805427 -0.05309153]
 [-0.04117531 -0.04152937 -0.06590615 -0.06595378 -0.06900793 -0.06521238
  -0.06847938 -0.06785017 -0.06832952 -0.06670795 -0.06781953 -0.06543723
  -0.04907019 -0.04834246 -0.04803286 -0.04805427  0.94690847]]
Epoch: 3160	Loss: 3.19268820286	Example Output: 52	Example Reward:  1
[[ 0.04116873  0.0415246   0.06590375  0.06592381  0.06905206  0.06517126
   0.0684842   0.06782937  0.06831281  0.06673025  0.06783784  0.06547084
   0.04907661  0.04835508  0.04800585  0.04804821  0.05310484]]
2.8039

Epoch: 3171	Loss: 3.5854020834	Example Output: *5	Example Reward:  -0.3
[[ 0.04126489  0.04169979  0.06604242  0.06575627  0.0689616   0.06533384
   0.06834612  0.06759123  0.06811604  0.06685857  0.06771315  0.06549716
   0.04910345  0.04837111  0.04814915  0.04802838  0.05316686]]
4.10048
[[ 0.28762054  0.28749007  0.28018728  0.28027314  0.27931154  0.28039986
   0.27949616  0.27972263  0.27956519  0.27994242  0.27968606  0.28035086
   0.28526899  0.28548867 -0.01444475  0.28559151  0.28404996]
 [ 0.28762054  0.28749007  0.28018728  0.28027314  0.27931154  0.28039986
   0.27949616 -0.02027737  0.27956519  0.27994242  0.27968606  0.28035086
   0.28526899  0.28548867  0.28555527  0.28559151  0.28404996]]
Epoch: 3172	Loss: 3.19856731892	Example Output: 87	Example Reward:  1
[[ 0.0412872   0.04173952  0.06603404  0.0657373   0.06893662  0.06540376
   0.06831802  0.06755286  0.06807063  0.06686481  0.06770556  0.06547816
   0.04910105  0.04837113  0.04817199  0.04804035  0.053187  ]]
2.8

Epoch: 3184	Loss: 3.19886860847	Example Output: +/	Example Reward:  -0.3
[[ 0.04133421  0.0418567   0.06623799  0.06577354  0.06885788  0.06532905
   0.06815284  0.06744734  0.06809776  0.06688894  0.06748279  0.06546047
   0.04917058  0.04835488  0.04814956  0.04825846  0.05314697]]
4.09583
[[ 0.28759974  0.28744301  0.28012863  0.28026795  0.27934265  0.28040129
   0.27955416  0.27976581  0.27957067  0.27993333  0.27975518  0.28036189
  -0.01475117  0.28549355  0.28555512  0.28552246  0.28405592]
 [ 0.28759974  0.28744301  0.28012863  0.28026795  0.27934265  0.28040129
   0.27955416  0.27976581  0.27957067  0.27993333  0.27975518  0.28036189
   0.28524885  0.28549355  0.28555512 -0.01447754  0.28405592]]
Epoch: 3185	Loss: 2.53537323475	Example Output: 70	Example Reward:  1
[[ 0.04134211  0.04186348  0.0662676   0.06579995  0.06883167  0.06529976
   0.06815162  0.06741931  0.06809279  0.06688599  0.06746482  0.06546478
   0.04916564  0.04836733  0.04814885  0.048299    0.05313526]]
2.

2.8087
[[-0.0412714  -0.04184378 -0.06645582 -0.06583105 -0.06867122 -0.06536245
  -0.06832162 -0.06739589 -0.06812481 -0.06692968 -0.06743991  0.93454719
  -0.0491361  -0.04838637 -0.0481008  -0.04821813 -0.05305813]
 [-0.0412714  -0.04184378 -0.06645582 -0.06583105 -0.06867122 -0.06536245
  -0.06832162 -0.06739589 -0.06812481 -0.06692968 -0.06743991  0.93454719
  -0.0491361  -0.04838637 -0.0481008  -0.04821813 -0.05305813]]
Epoch: 3199	Loss: 2.65825269222	Example Output: 76	Example Reward:  1
[[ 0.04126871  0.04183582  0.06645618  0.06586513  0.06864363  0.06540253
   0.06832342  0.0673698   0.06808075  0.06689554  0.06752498  0.06549725
   0.04913762  0.04838112  0.04809294  0.04818862  0.05303601]]
2.80562
[[-0.04126871 -0.04183582 -0.06645618 -0.06586513 -0.06864363 -0.06540253
  -0.06832342 -0.0673698  -0.06808075  0.93310446 -0.06752498 -0.06549725
  -0.04913762 -0.04838112 -0.04809294 -0.04818862 -0.05303601]
 [-0.04126871 -0.04183582 -0.06645618 -0.06586513 -0.06864363 -0.0654

Epoch: 3211	Loss: 3.06797568798	Example Output: 0	Example Reward:  1
[[ 0.04147394  0.04200107  0.06667992  0.06594557  0.06845641  0.06540611
   0.06790267  0.06723102  0.06788046  0.06662465  0.06754728  0.06557031
   0.04934531  0.0483616   0.04826409  0.04833968  0.05297   ]]
2.81864
[[-0.04147394 -0.04200107  0.93332005 -0.06594557 -0.06845641 -0.06540611
  -0.06790267 -0.06723102 -0.06788046 -0.06662465 -0.06754728 -0.06557031
  -0.04934531 -0.0483616  -0.04826409 -0.04833968 -0.05297   ]
 [-0.04147394 -0.04200107 -0.06667992 -0.06594557 -0.06845641 -0.06540611
  -0.06790267 -0.06723102 -0.06788046 -0.06662465 -0.06754728 -0.06557031
  -0.04934531 -0.0483616  -0.04826409 -0.04833968  0.94703001]]
Epoch: 3212	Loss: 2.78873445988	Example Output: 47	Example Reward:  1
[[ 0.04147362  0.04200605  0.06673857  0.06596363  0.06844634  0.06541327
   0.06787416  0.06721845  0.06785793  0.06661072  0.06755015  0.06556155
   0.04935756  0.04836565  0.04824588  0.04834293  0.05297358]]
2.8063

Epoch: 3224	Loss: 3.45425615311	Example Output: 5X	Example Reward:  -0.3
[[ 0.04144773  0.04206578  0.06668478  0.06585129  0.0684362   0.06536116
   0.06795336  0.06701079  0.06775709  0.06679218  0.06750967  0.06555355
   0.04939073  0.04845833  0.04824496  0.04834985  0.05313256]]
4.09834
[[ 0.28756568  0.28738028  0.27999458  0.28024462  0.27946916  0.28039166
   0.279614   -0.02010324  0.27967289  0.27996236  0.27974713  0.28033394
   0.2851828   0.2854625   0.28552651  0.28549504  0.28406024]
 [-0.01243432  0.28738028  0.27999458  0.28024462  0.27946916  0.28039166
   0.279614    0.2798968   0.27967289  0.27996236  0.27974713  0.28033394
   0.2851828   0.2854625   0.28552651  0.28549504  0.28406024]]
Epoch: 3225	Loss: 2.91529276371	Example Output: 44	Example Reward:  1
[[ 0.04144383  0.04207162  0.06669521  0.06584013  0.06841882  0.06540789
   0.06794079  0.06701784  0.06774952  0.06680096  0.06750708  0.06553214
   0.04939673  0.0484539   0.04825077  0.04834898  0.05312379]]
2.

Epoch: 3239	Loss: 2.78770475388	Example Output: 69	Example Reward:  1
2.80727
[[-0.04140066 -0.0420608  -0.06685899 -0.06572527 -0.06835542 -0.06566256
  -0.06812102 -0.0671102   0.93250912 -0.06659265 -0.06781027 -0.0656488
  -0.04946646 -0.04842164 -0.0481957  -0.04812724 -0.05295147]
 [-0.04140066 -0.0420608  -0.06685899 -0.06572527 -0.06835542 -0.06566256
  -0.06812102 -0.0671102  -0.0674909  -0.06659265 -0.06781027  0.93435121
  -0.04946646 -0.04842164 -0.0481957  -0.04812724 -0.05295147]]
Epoch: 3240	Loss: 2.79116230011	Example Output: 8*	Example Reward:  1
[[ 0.04139746  0.04205326  0.06688315  0.06571957  0.06836221  0.06565885
   0.06810132  0.06711498  0.06750195  0.06658342  0.0678101   0.06567474
   0.0494634   0.04840736  0.04820391  0.04812381  0.05294044]]
2.82247
[[-0.04139746 -0.04205326 -0.06688315 -0.06571957 -0.06836221 -0.06565885
  -0.06810132 -0.06711498 -0.06750195 -0.06658342  0.93218988 -0.06567474
  -0.0494634  -0.04840736 -0.04820391 -0.04812381 -0.05294044]

Epoch: 3251	Loss: 3.19881930351	Example Output: 92	Example Reward:  1
[[ 0.04148475  0.04202695  0.06675912  0.06555679  0.0683142   0.06564806
   0.06800976  0.06708824  0.06756967  0.06669366  0.06762315  0.06597924
   0.04936101  0.04851083  0.04823823  0.04812018  0.0530162 ]]
2.80646
[[-0.04148475 -0.04202695 -0.06675912 -0.06555679 -0.0683142  -0.06564806
  -0.06800976 -0.06708824 -0.06756967 -0.06669366 -0.06762315  0.93402076
  -0.04936101 -0.04851083 -0.04823823 -0.04812018 -0.0530162 ]
 [-0.04148475 -0.04202695 -0.06675912 -0.06555679  0.93168581 -0.06564806
  -0.06800976 -0.06708824 -0.06756967 -0.06669366 -0.06762315 -0.06597924
  -0.04936101 -0.04851083 -0.04823823 -0.04812018 -0.0530162 ]]
Epoch: 3252	Loss: 2.78652799129	Example Output: 91	Example Reward:  1
2.80848
[[-0.04148107 -0.04202531 -0.06674542 -0.065561   -0.0683031  -0.06566808
  -0.06805085 -0.06707178 -0.06757161 -0.06670804 -0.06761898  0.93399811
  -0.04934472 -0.04852228 -0.04822111 -0.04809097 -0.05301384

Epoch: 3266	Loss: 3.33313150406	Example Output: 1*	Example Reward:  1
[[ 0.04160582  0.04230873  0.0669428   0.06543268  0.06838216  0.06578016
   0.0677437   0.06685448  0.06726608  0.06664034  0.06745265  0.06571634
   0.04955656  0.04860172  0.04840271  0.04830829  0.05300482]]
2.82446
[[-0.04160582 -0.04230873 -0.0669428   0.93456733 -0.06838216 -0.06578016
  -0.0677437  -0.06685448 -0.06726608 -0.06664034 -0.06745265 -0.06571634
  -0.04955656 -0.04860172 -0.04840271 -0.04830829 -0.05300482]
 [-0.04160582 -0.04230873 -0.0669428  -0.06543268 -0.06838216 -0.06578016
  -0.0677437  -0.06685448 -0.06726608 -0.06664034 -0.06745265 -0.06571634
  -0.04955656 -0.04860172  0.95159727 -0.04830829 -0.05300482]]
Epoch: 3267	Loss: 3.06858525276	Example Output: +0	Example Reward:  -0.3
[[ 0.0416085   0.04230535  0.06690995  0.06547526  0.06833994  0.06575593
   0.06776789  0.06684865  0.06723963  0.06660867  0.06750894  0.0657239
   0.04955876  0.04863296  0.04841396  0.04829777  0.05300398]]
4.1

Epoch: 3280	Loss: 3.32927391529	Example Output: /6	Example Reward:  -0.3
[[ 0.04145043  0.04204102  0.06706774  0.06534687  0.06855012  0.06584527
   0.06782989  0.06706373  0.067377    0.06670865  0.06768355  0.06605284
   0.04943475  0.04847265  0.04811771  0.04814557  0.05281223]]
4.10059
[[ 0.28756487  0.2873877   0.27987969  0.28039595  0.27943498  0.28024644
   0.27965105  0.27988088  0.27978691  0.27998742  0.27969494  0.28018415
   0.28516957  0.28545821  0.28556469 -0.01444367  0.28415635]
 [ 0.28756487  0.2873877   0.27987969  0.28039595  0.27943498  0.28024644
   0.27965105  0.27988088 -0.0202131   0.27998742  0.27969494  0.28018415
   0.28516957  0.28545821  0.28556469  0.28555635  0.28415635]]
Saving Weight
Epoch: 3281	Loss: 2.91894025803	Example Output: X1	Example Reward:  -0.3
4.0979
[[-0.0124384   0.28738314  0.27987871  0.28039902  0.27943566  0.28023493
   0.27965647  0.27988932  0.27978915  0.27998585  0.27969155  0.2801865
   0.28517491  0.2854594   0.28556085  0.28

Epoch: 3295	Loss: 3.19853742123	Example Output: 1/	Example Reward:  1
[[ 0.04164635  0.04208443  0.0670672   0.06516962  0.0685322   0.06585753
   0.06755552  0.06714312  0.06719669  0.06664713  0.06754816  0.06603746
   0.04942704  0.04856211  0.04822933  0.04827393  0.05302218]]
2.82461
[[-0.04164635 -0.04208443 -0.0670672   0.93483037 -0.0685322  -0.06585753
  -0.06755552 -0.06714312 -0.06719669 -0.06664713 -0.06754816 -0.06603746
  -0.04942704 -0.04856211 -0.04822933 -0.04827393 -0.05302218]
 [-0.04164635 -0.04208443 -0.0670672  -0.06516962 -0.0685322  -0.06585753
  -0.06755552 -0.06714312 -0.06719669 -0.06664713 -0.06754816 -0.06603746
  -0.04942704 -0.04856211 -0.04822933  0.95172608 -0.05302218]]
Epoch: 3296	Loss: 3.1497985363	Example Output: 2Y	Example Reward:  -0.3
[[ 0.04165417  0.04209595  0.0670428   0.06522238  0.06852318  0.06582739
   0.06754954  0.06712484  0.0671929   0.06663952  0.06752216  0.06604613
   0.04942675  0.0485712   0.0482158   0.04830743  0.0530378 ]]
4.0

Epoch: 3308	Loss: 2.91301603317	Example Output: 74	Example Reward:  1
[[ 0.04164943  0.04205729  0.06698353  0.06524587  0.06853525  0.06561859
   0.06751262  0.06714402  0.06736892  0.0667914   0.06745329  0.06611642
   0.04937815  0.04851167  0.04818997  0.04833891  0.05310466]]
2.8066
[[-0.04164943 -0.04205729 -0.06698353 -0.06524587 -0.06853525 -0.06561859
  -0.06751262 -0.06714402 -0.06736892  0.93320858 -0.06745329 -0.06611642
  -0.04937815 -0.04851167 -0.04818997 -0.04833891 -0.05310466]
 [-0.04164943 -0.04205729 -0.06698353 -0.06524587 -0.06853525 -0.06561859
   0.93248737 -0.06714402 -0.06736892 -0.0667914  -0.06745329 -0.06611642
  -0.04937815 -0.04851167 -0.04818997 -0.04833891 -0.05310466]]
Epoch: 3309	Loss: 3.19904353619	Example Output: 29	Example Reward:  1
[[ 0.04163822  0.04205257  0.06702618  0.06522449  0.06852907  0.06557883
   0.06751717  0.06711022  0.06738026  0.06683236  0.06744351  0.06613156
   0.04938695  0.04851709  0.04817706  0.04834951  0.05310506]]
2.8063

Epoch: 3321	Loss: 3.06597547531	Example Output: /	Example Reward:  -0.3
[[ 0.04147246  0.04180603  0.06698198  0.06547318  0.06852552  0.06559087
   0.067773    0.06736618  0.06763779  0.06685226  0.06757464  0.0662402
   0.04925995  0.04837362  0.04794745  0.04816466  0.0529602 ]]
4.09691
[[ 0.28755829  0.28745821  0.27990541  0.28035805  0.27944234  0.28032276
   0.27966812  0.27979016  0.27970868  0.27994433  0.27972764  0.28012794
   0.28522202  0.28548792  0.28561577 -0.0144494   0.28411195]
 [ 0.28755829  0.28745821  0.27990541  0.28035805  0.27944234  0.28032276
   0.27966812  0.27979016  0.27970868  0.27994433  0.27972764  0.28012794
   0.28522202  0.28548792  0.28561577  0.28555062 -0.01588806]]
Epoch: 3322	Loss: 3.0429997921	Example Output: 02	Example Reward:  1
[[ 0.04146455  0.04179943  0.06698951  0.06545611  0.06853145  0.06559967
   0.06778552  0.06737411  0.06763087  0.06687157  0.06758562  0.06624913
   0.04925467  0.04836299  0.04792592  0.0481479   0.05297093]]
2.805

Epoch: 3336	Loss: 3.3245039463	Example Output: /*	Example Reward:  -0.3
[[ 0.0412631   0.04169855  0.06729155  0.06556739  0.06864453  0.06542701
   0.06796948  0.06736119  0.06773665  0.06688741  0.06764223  0.06646259
   0.04928436  0.0482439   0.04770667  0.04805627  0.0527572 ]]
4.09515
[[ 0.28762108  0.28749043  0.27981254  0.28032979  0.27940667  0.2803719
   0.27960917  0.27979165  0.27967903  0.27993381  0.27970734  0.28006124
   0.28521472  0.28552684  0.28568801 -0.01441688  0.28417286]
 [ 0.28762108  0.28749043  0.27981254  0.28032979  0.27940667  0.2803719
   0.27960917  0.27979165  0.27967903  0.27993381  0.27970734  0.28006124
   0.28521472  0.28552684 -0.014312    0.28558314  0.28417286]]
Epoch: 3337	Loss: 3.04634485245	Example Output: 3Y	Example Reward:  -0.3
[[ 0.04127781  0.04170358  0.06727678  0.06557735  0.06863019  0.06539231
   0.06795643  0.06735467  0.06774434  0.06692056  0.06761501  0.06647537
   0.04928409  0.04825295  0.04769661  0.04808201  0.05275998]]
4.

Epoch: 3349	Loss: 3.06457264423	Example Output: 70	Example Reward:  1
[[ 0.04130682  0.04166919  0.0672588   0.06543782  0.06873023  0.06535854
   0.0678788   0.06738498  0.06795395  0.06707224  0.06749952  0.06637546
   0.04918529  0.04824194  0.04771734  0.04814865  0.05278041]]
2.80585
[[-0.04130682 -0.04166919 -0.0672588  -0.06543782 -0.06873023 -0.06535854
  -0.0678788  -0.06738498 -0.06795395  0.93292773 -0.06749952 -0.06637546
  -0.04918529 -0.04824194 -0.04771734 -0.04814865 -0.05278041]
 [-0.04130682 -0.04166919  0.93274122 -0.06543782 -0.06873023 -0.06535854
  -0.0678788  -0.06738498 -0.06795395 -0.06707224 -0.06749952 -0.06637546
  -0.04918529 -0.04824194 -0.04771734 -0.04814865 -0.05278041]]
Epoch: 3350	Loss: 3.20323605537	Example Output: 88	Example Reward:  1
[[ 0.04131104  0.04168089  0.06732853  0.06537319  0.06871855  0.06537952
   0.06784067  0.0673412   0.06794413  0.06716154  0.06747624  0.06640313
   0.04918122  0.04821673  0.04772035  0.04814986  0.05277324]]
2.805

Epoch: 3365	Loss: 3.20130794048	Example Output: /7	Example Reward:  -0.3
[[ 0.04128826  0.04169321  0.06742919  0.06522705  0.06881197  0.06517827
   0.06796696  0.06717509  0.06822354  0.0674514   0.06722137  0.06648985
   0.04922315  0.04810531  0.04767172  0.04810937  0.05273427]]
4.10033
[[ 0.28761354  0.28749204  0.27977127  0.2804319   0.27935642  0.28044653
   0.27960992  0.27984747  0.27953294  0.27976459  0.27983359  0.28005308
   0.28523305  0.28556842  0.2856985  -0.01443281  0.28417975]
 [ 0.28761354  0.28749204  0.27977127  0.2804319   0.27935642  0.28044653
   0.27960992  0.27984747  0.27953294 -0.02023542  0.27983359  0.28005308
   0.28523305  0.28556842  0.2856985   0.28556719  0.28417975]]
Epoch: 3366	Loss: 3.06675918102	Example Output: 4-	Example Reward:  1
[[ 0.0412944   0.04170834  0.06746329  0.06519452  0.06881792  0.06522658
   0.06795556  0.06715346  0.06819548  0.06746994  0.06721886  0.0664842
   0.04921381  0.04809141  0.04767412  0.04809654  0.05274156]]
2.8

Epoch: 3378	Loss: 3.06864817142	Example Output: 11	Example Reward:  1
[[ 0.04133361  0.04174079  0.06759398  0.0652209   0.06866159  0.06519619
   0.067966    0.06706257  0.06832139  0.0675362   0.06708325  0.06659017
   0.04919056  0.04808571  0.0476613   0.04806795  0.0526878 ]]
2.80871
[[-0.04133361 -0.04174079 -0.06759398  0.93477911 -0.06866159 -0.06519619
  -0.067966   -0.06706257 -0.06832139 -0.0675362  -0.06708325 -0.06659017
  -0.04919056 -0.04808571 -0.0476613  -0.04806795 -0.0526878 ]
 [-0.04133361 -0.04174079 -0.06759398  0.93477911 -0.06866159 -0.06519619
  -0.067966   -0.06706257 -0.06832139 -0.0675362  -0.06708325 -0.06659017
  -0.04919056 -0.04808571 -0.0476613  -0.04806795 -0.0526878 ]]
Epoch: 3379	Loss: 2.94443302155	Example Output: 31	Example Reward:  1
[[ 0.04132673  0.04174425  0.06760667  0.06524268  0.06866364  0.06521991
   0.06796271  0.0670252   0.06829308  0.06752995  0.06709985  0.06657904
   0.04918096  0.04809143  0.04767525  0.04807861  0.0526801 ]]
2.808

Epoch: 3392	Loss: 3.1968619585	Example Output: /9	Example Reward:  -0.3
[[ 0.04128557  0.04159273  0.06749768  0.06542091  0.0687301   0.06534958
   0.06794835  0.0669329   0.06836504  0.0676597   0.06722913  0.06684392
   0.04903248  0.048039    0.04755626  0.04793424  0.05258241]]
4.10003
[[ 0.28761435  0.2875222   0.2797507   0.28037372  0.27938098  0.28039515
   0.27961552  0.27992013  0.2794905   0.2797021   0.27983126  0.27994683
   0.28529027  0.28558829  0.28573313 -0.01438027  0.28422529]
 [ 0.28761435  0.2875222   0.2797507   0.28037372  0.27938098  0.28039515
   0.27961552  0.27992013  0.2794905   0.2797021   0.27983126 -0.02005318
   0.28529027  0.28558829  0.28573313  0.28561974  0.28422529]]
Epoch: 3393	Loss: 2.66141598225	Example Output: 44	Example Reward:  1
2.80435
[[-0.04130328 -0.04157956 -0.06745917 -0.0654293  -0.06870438 -0.06533917
   0.93202478 -0.06697416 -0.06837727 -0.06763919 -0.06721879 -0.06685515
  -0.0490299  -0.04805063 -0.04756766 -0.04791523 -0.052581

Epoch: 3407	Loss: 3.71425702572	Example Output: -6	Example Reward:  -0.3
[[ 0.04127394  0.04158196  0.0675739   0.06530498  0.06871453  0.06573478
   0.06794352  0.06685843  0.06804372  0.06764981  0.06739459  0.06691353
   0.04905256  0.04803716  0.0476205   0.0477181   0.05258396]]
4.10031
[[ 0.28761783  0.28752542  0.27972785  0.2804085   0.27938566  0.28027958
   0.27961695  0.27994248  0.27958691  0.27970505  0.27978164  0.27992594
   0.28528425 -0.01441115  0.28571388  0.28568459  0.28422484]
 [ 0.28761783  0.28752542  0.27972785  0.2804085   0.27938566  0.28027958
   0.27961695  0.27994248 -0.02041312  0.27970505  0.27978164  0.27992594
   0.28528425  0.28558886  0.28571388  0.28568459  0.28422484]]
Epoch: 3408	Loss: 2.78715157509	Example Output: 83	Example Reward:  1
[[ 0.04128923  0.04160273  0.06762026  0.06528016  0.068717    0.06573995
   0.06789291  0.06683232  0.06799369  0.06763841  0.06742104  0.06689083
   0.04906559  0.04804233  0.04764247  0.04775663  0.05257444]]
2.

Epoch: 3420	Loss: 2.9176104784	Example Output: 48	Example Reward:  1
[[ 0.04137847  0.04166685  0.06750239  0.06544138  0.0686001   0.06579635
   0.06775875  0.06673645  0.06780931  0.0674668   0.06758123  0.06679665
   0.04906178  0.04809232  0.04781079  0.04784942  0.05265097]]
2.80498
[[-0.04137847 -0.04166685 -0.06750239 -0.06544138 -0.0686001  -0.06579635
   0.93224126 -0.06673645 -0.06780931 -0.0674668  -0.06758123 -0.06679665
  -0.04906178 -0.04809232 -0.04781079 -0.04784942 -0.05265097]
 [-0.04137847 -0.04166685 -0.06750239 -0.06544138 -0.0686001  -0.06579635
  -0.06775875 -0.06673645 -0.06780931 -0.0674668   0.93241876 -0.06679665
  -0.04906178 -0.04809232 -0.04781079 -0.04784942 -0.05265097]]
Saving Weight
Epoch: 3421	Loss: 3.19469554424	Example Output: 40	Example Reward:  1
[[ 0.04140455  0.04167856  0.06749772  0.06544353  0.06857179  0.0658643
   0.06772479  0.06671855  0.06779173  0.06743204  0.06758663  0.06677916
   0.0490525   0.04808437  0.04785461  0.04785175  0.0526

Epoch: 3432	Loss: 3.45642957687	Example Output: 63	Example Reward:  1
[[ 0.04136731  0.0416596   0.06761012  0.06517833  0.06891575  0.06593478
   0.0677694   0.06678177  0.06776241  0.0676669   0.06733532  0.06656214
   0.04893764  0.04807045  0.04786256  0.04788016  0.05270542]]
2.80618
[[-0.04136731 -0.0416596  -0.06761012 -0.06517833 -0.06891575 -0.06593478
  -0.0677694  -0.06678177  0.93223757 -0.0676669  -0.06733532 -0.06656214
  -0.04893764 -0.04807045 -0.04786256 -0.04788016 -0.05270542]
 [-0.04136731 -0.0416596  -0.06761012 -0.06517833 -0.06891575  0.93406522
  -0.0677694  -0.06678177 -0.06776241 -0.0676669  -0.06733532 -0.06656214
  -0.04893764 -0.04807045 -0.04786256 -0.04788016 -0.05270542]]
Epoch: 3433	Loss: 2.78669979572	Example Output: 3/	Example Reward:  1
[[ 0.04137034  0.04167943  0.06762807  0.0651934   0.06890813  0.06596866
   0.06774774  0.06678269  0.06776758  0.06764551  0.06731196  0.06651652
   0.0489344   0.04807448  0.047877    0.04788477  0.05270939]]
2.823

Epoch: 3446	Loss: 3.45521686077	Example Output: /4	Example Reward:  -0.3
[[ 0.04147095  0.04184298  0.06740494  0.06522486  0.06874005  0.06612699
   0.06777088  0.06674339  0.06778402  0.0675377   0.06715367  0.06631807
   0.04889419  0.0480708   0.04815096  0.04799136  0.05277423]]
4.10044
[[ 0.28755873  0.28744712  0.27977854  0.28043255  0.279378    0.28016192
   0.27966875  0.27997699  0.27966481  0.27973869  0.27985391  0.28010458
   0.28533176  0.28557879  0.28555474 -0.01439741  0.28416774]
 [ 0.28755873  0.28744712  0.27977854  0.28043255  0.279378    0.28016192
  -0.02033127  0.27997699  0.27966481  0.27973869  0.27985391  0.28010458
   0.28533176  0.28557879  0.28555474  0.2856026   0.28416774]]
Epoch: 3447	Loss: 2.788494277	Example Output: /1	Example Reward:  -0.3
[[ 0.04146312  0.04183838  0.0674037   0.06525358  0.06873216  0.06611224
   0.06775723  0.06675363  0.06781964  0.06750899  0.06717008  0.06628507
   0.0488856   0.04808986  0.04815978  0.04798912  0.05277787]]
4

Epoch: 3458	Loss: 3.32574429512	Example Output: 68	Example Reward:  1
[[ 0.04149234  0.04206815  0.0673056   0.06554361  0.06839239  0.06600433
   0.06763047  0.06675507  0.06769422  0.06721272  0.06731202  0.06619465
   0.04900648  0.04814951  0.04831046  0.04812282  0.05280517]]
2.80572
[[-0.04149234 -0.04206815 -0.0673056  -0.06554361 -0.06839239 -0.06600433
  -0.06763047 -0.06675507  0.93230581 -0.06721272 -0.06731202 -0.06619465
  -0.04900648 -0.04814951 -0.04831046 -0.04812282 -0.05280517]
 [-0.04149234 -0.04206815 -0.0673056  -0.06554361 -0.06839239 -0.06600433
  -0.06763047 -0.06675507 -0.06769422 -0.06721272  0.932688   -0.06619465
  -0.04900648 -0.04814951 -0.04831046 -0.04812282 -0.05280517]]
Epoch: 3459	Loss: 2.78595559597	Example Output: 90	Example Reward:  1
[[ 0.04148744  0.04207817  0.06731191  0.06557696  0.06835546  0.06602411
   0.06761713  0.06675044  0.06769047  0.06717133  0.06734736  0.06621249
   0.04901551  0.04812796  0.04831214  0.04812505  0.05279609]]
2.806

Epoch: 3472	Loss: 3.3275452137	Example Output: XX	Example Reward:  -0.3
[[ 0.0413819   0.04201335  0.06734199  0.06559466  0.06847686  0.06613605
   0.06747539  0.06680306  0.06760644  0.0670215   0.06774814  0.06634149
   0.04892643  0.04813434  0.04828815  0.04798286  0.0527274 ]]
4.09087
[[-0.01241457  0.28739601  0.27979741  0.2803216   0.27945694  0.28015921
   0.27975741  0.27995911  0.27971807  0.27989358  0.27967557  0.28009754
   0.2853221   0.28555971  0.28551355  0.28560516  0.2841818 ]
 [-0.01241457  0.28739601  0.27979741  0.2803216   0.27945694  0.28015921
   0.27975741  0.27995911  0.27971807  0.27989358  0.27967557  0.28009754
   0.2853221   0.28555971  0.28551355  0.28560516  0.2841818 ]]
Epoch: 3473	Loss: 3.04392590523	Example Output: 58	Example Reward:  1
[[ 0.0413763   0.04204072  0.06736084  0.06562974  0.06844097  0.06614532
   0.06744789  0.06680409  0.06759715  0.06699205  0.06773245  0.06631885
   0.04895056  0.04813389  0.04830255  0.04799806  0.05272851]]
2.8

Epoch: 3486	Loss: 3.19989392757	Example Output: +4	Example Reward:  -0.3
[[ 0.04146886  0.04208364  0.06724789  0.06577359  0.06844695  0.06624458
   0.06735693  0.06674234  0.06731397  0.06675506  0.06788676  0.0663707
   0.04902853  0.0481504   0.04847801  0.04792484  0.05272698]]
4.10079
[[ 0.28755936  0.28737491  0.27982566  0.28026792  0.27946594  0.28012663
   0.27979293  0.27997729  0.27980581  0.27997351  0.27963397  0.28008878
  -0.01470856  0.28555489  0.2854566   0.28562257  0.28418192]
 [ 0.28755936  0.28737491  0.27982566  0.28026792  0.27946594  0.28012663
  -0.02020708  0.27997729  0.27980581  0.27997351  0.27963397  0.28008878
   0.28529146  0.28555489  0.2854566   0.28562257  0.28418192]]
Epoch: 3487	Loss: 2.50484340191	Example Output: 68	Example Reward:  1
[[ 0.04146269  0.04209743  0.06725035  0.06575559  0.06847347  0.06623051
   0.06736518  0.06670783  0.06730924  0.06675717  0.06788599  0.06636582
   0.04904921  0.04814864  0.0484809   0.0479341   0.052726  ]]
2.8

Epoch: 3498	Loss: 3.19749116898	Example Output: 30	Example Reward:  1
[[ 0.04139854  0.04220964  0.06728323  0.06560298  0.06863175  0.06624383
   0.06745044  0.06653672  0.06724175  0.06683603  0.06781108  0.06620838
   0.04907284  0.04815599  0.04857469  0.04804561  0.05269646]]
2.80689
[[-0.04139854 -0.04220964 -0.06728323 -0.06560298 -0.06863175  0.93375617
  -0.06745044 -0.06653672 -0.06724175 -0.06683603 -0.06781108 -0.06620838
  -0.04907284 -0.04815599 -0.04857469 -0.04804561 -0.05269646]
 [-0.04139854 -0.04220964  0.93271679 -0.06560298 -0.06863175 -0.06624383
  -0.06745044 -0.06653672 -0.06724175 -0.06683603 -0.06781108 -0.06620838
  -0.04907284 -0.04815599 -0.04857469 -0.04804561 -0.05269646]]
Epoch: 3499	Loss: 3.30076048374	Example Output: -X	Example Reward:  -0.3
[[ 0.04140053  0.04222604  0.0673082   0.06556634  0.06864702  0.06625866
   0.06745852  0.06652554  0.06722101  0.06685059  0.06778296  0.06618188
   0.04908956  0.04815582  0.04857595  0.04805494  0.05269649]]
4.

Epoch: 3511	Loss: 2.91569976807	Example Output: 1+	Example Reward:  1
[[ 0.04132698  0.04224322  0.06736107  0.06558941  0.06868594  0.06641663
   0.06727529  0.06653534  0.0670654   0.06681705  0.06804234  0.06617079
   0.04911796  0.0481847   0.04853908  0.04803639  0.05259241]]
2.82309
[[-0.04132698 -0.04224322 -0.06736107  0.93441057 -0.06868594 -0.06641663
  -0.06727529 -0.06653534 -0.0670654  -0.06681705 -0.06804234 -0.06617079
  -0.04911796 -0.0481847  -0.04853908 -0.04803639 -0.05259241]
 [-0.04132698 -0.04224322 -0.06736107 -0.06558941 -0.06868594 -0.06641663
  -0.06727529 -0.06653534 -0.0670654  -0.06681705 -0.06804234 -0.06617079
   0.95088202 -0.0481847  -0.04853908 -0.04803639 -0.05259241]]
Epoch: 3512	Loss: 2.65848448277	Example Output: 38	Example Reward:  1
[[ 0.04131206  0.04222869  0.06734856  0.06558914  0.06869315  0.06643634
   0.06726032  0.06653833  0.0670374   0.06684405  0.06807289  0.0662002
   0.04911556  0.04817449  0.04851853  0.04802084  0.05260945]]
2.8061

Epoch: 3525	Loss: 2.92308247089	Example Output: /9	Example Reward:  -0.3
[[ 0.04124896  0.04212541  0.06749961  0.0654576   0.06876056  0.06653561
   0.06719324  0.06697093  0.06700578  0.0669493   0.06802545  0.06612808
   0.04918043  0.04804324  0.0484355   0.0479254   0.05251494]]
4.10011
[[ 0.28762531  0.2873624   0.27975011  0.28036273  0.27937183  0.28003934
   0.27984202  0.27990872  0.27989829  0.27991521  0.27959237  0.28016159
   0.28524587  0.28558704  0.28546935 -0.01437762  0.28424555]
 [ 0.28762531  0.2873624   0.27975011  0.28036273  0.27937183  0.28003934
   0.27984202  0.27990872  0.27989829  0.27991521  0.27959237 -0.01983843
   0.28524587  0.28558704  0.28546935  0.28562239  0.28424555]]
Epoch: 3526	Loss: 2.50823681355	Example Output: 47	Example Reward:  1
[[ 0.04126513  0.0421496   0.06748053  0.06548547  0.06875149  0.06653124
   0.06716193  0.06695709  0.06704086  0.06692834  0.06798702  0.06609274
   0.04919103  0.04803843  0.04847868  0.04795476  0.05250565]]
2.

Epoch: 3540	Loss: 2.9183208704	Example Output: 2*	Example Reward:  1
[[ 0.04117446  0.0419958   0.06744105  0.06550152  0.0690106   0.06672619
   0.06710948  0.06706062  0.06711055  0.06709316  0.06800031  0.06596065
   0.04900502  0.04792202  0.04851968  0.04785458  0.05251434]]
2.8208
[[-0.04117446 -0.0419958  -0.06744105 -0.06550152  0.93098938 -0.06672619
  -0.06710948 -0.06706062 -0.06711055 -0.06709316 -0.06800031 -0.06596065
  -0.04900502 -0.04792202 -0.04851968 -0.04785458 -0.05251434]
 [-0.04117446 -0.0419958  -0.06744105 -0.06550152 -0.0690106  -0.06672619
  -0.06710948 -0.06706062 -0.06711055 -0.06709316 -0.06800031 -0.06596065
  -0.04900502 -0.04792202  0.95148033 -0.04785458 -0.05251434]]
Saving Weight
Epoch: 3541	Loss: 3.32698292732	Example Output: 90	Example Reward:  1
[[ 0.04118977  0.04201051  0.06742481  0.06548759  0.06902301  0.06675103
   0.06711887  0.06703495  0.06708103  0.06710511  0.06798096  0.06593344
   0.04899339  0.04791673  0.04858417  0.04785182  0.0525

Epoch: 3553	Loss: 2.78720252514	Example Output: 5X	Example Reward:  -0.3
[[ 0.04130577  0.04214398  0.06756177  0.06531418  0.06885573  0.06688258
   0.06685897  0.066996    0.06705208  0.06708148  0.0678063   0.0659724
   0.04906628  0.04788511  0.04883693  0.04792749  0.05245295]]
4.0981
[[ 0.28760827  0.28735682  0.27973148  0.28040576  0.27934328  0.27993524
   0.27994233 -0.0200988   0.2798844   0.27987558  0.27965811  0.28020829
   0.28528011  0.28563449  0.28534892  0.28562176  0.28426415]
 [-0.01239173  0.28735682  0.27973148  0.28040576  0.27934328  0.27993524
   0.27994233  0.27990121  0.2798844   0.27987558  0.27965811  0.28020829
   0.28528011  0.28563449  0.28534892  0.28562176  0.28426415]]
Epoch: 3554	Loss: 2.93782000542	Example Output: 34	Example Reward:  1
[[ 0.04128493  0.04212544  0.06757281  0.06530131  0.06887922  0.06688559
   0.06683724  0.0670224   0.06708157  0.06712178  0.06779151  0.06599333
   0.04905996  0.04785734  0.04884255  0.04791334  0.05242973]]
2.80

Epoch: 3566	Loss: 3.17203505039	Example Output: 31	Example Reward:  1
[[ 0.04109972  0.04204825  0.06774181  0.06559867  0.06875587  0.06694157
   0.06695724  0.06704903  0.06727026  0.0671073   0.06785096  0.06611324
   0.04893762  0.04775013  0.04867446  0.0477771   0.05232679]]
2.80715
[[-0.04109972 -0.04204825 -0.06774181 -0.06559867 -0.06875587  0.93305844
  -0.06695724 -0.06704903 -0.06727026 -0.0671073  -0.06785096 -0.06611324
  -0.04893762 -0.04775013 -0.04867446 -0.0477771  -0.05232679]
 [-0.04109972 -0.04204825 -0.06774181  0.93440133 -0.06875587 -0.06694157
  -0.06695724 -0.06704903 -0.06727026 -0.0671073  -0.06785096 -0.06611324
  -0.04893762 -0.04775013 -0.04867446 -0.0477771  -0.05232679]]
Epoch: 3567	Loss: 3.58136839867	Example Output: 1X	Example Reward:  -0.3
[[ 0.04111101  0.04208099  0.0677463   0.06564432  0.06871624  0.06701163
   0.0669498   0.06699797  0.06725648  0.06708221  0.06782662  0.06607792
   0.04892298  0.0477516   0.04869834  0.04779302  0.0523326 ]]
4.

4.10058
[[ 0.28764772  0.28731984  0.27971837  0.28019774  0.27941251  0.27989101
   0.2799083   0.27995089  0.27980989  0.27990761  0.27973241  0.2802127
  -0.01466611  0.2856788   0.28537497  0.28561118  0.28429231]
 [ 0.28764772  0.28731984  0.27971837  0.28019774  0.27941251 -0.02010899
   0.2799083   0.27995089  0.27980989  0.27990761  0.27973241  0.2802127
   0.2853339   0.2856788   0.28537497  0.28561118  0.28429231]]
Saving Weight
Epoch: 3581	Loss: 3.32615087032	Example Output: 40	Example Reward:  1
[[ 0.04118396  0.0422815   0.06759094  0.06599203  0.06865366  0.06698901
   0.06698574  0.06686271  0.06729162  0.06694501  0.0675263   0.06591635
   0.04891505  0.04774218  0.04879165  0.04796571  0.05236669]]
2.80585
[[-0.04118396 -0.0422815  -0.06759094 -0.06599203 -0.06865366 -0.06698901
   0.93301427 -0.06686271 -0.06729162 -0.06694501 -0.0675263  -0.06591635
  -0.04891505 -0.04774218 -0.04879165 -0.04796571 -0.05236669]
 [-0.04118396 -0.0422815   0.93240905 -0.06599203 -0.068

Epoch: 3594	Loss: 3.19389028549	Example Output: 95	Example Reward:  1
[[ 0.04113692  0.04216123  0.06763055  0.06593595  0.06876142  0.06703195
   0.06694702  0.06698358  0.06744851  0.06711295  0.06740669  0.06592084
   0.04882034  0.04768932  0.04882001  0.04794668  0.05224615]]
2.80696
[[-0.04113692 -0.04216123 -0.06763055 -0.06593595 -0.06876142 -0.06703195
  -0.06694702 -0.06698358 -0.06744851 -0.06711295 -0.06740669  0.93407917
  -0.04882034 -0.04768932 -0.04882001 -0.04794668 -0.05224615]
 [-0.04113692 -0.04216123 -0.06763055 -0.06593595 -0.06876142 -0.06703195
  -0.06694702  0.93301642 -0.06744851 -0.06711295 -0.06740669 -0.06592084
  -0.04882034 -0.04768932 -0.04882001 -0.04794668 -0.05224615]]
Epoch: 3595	Loss: 3.06862931252	Example Output: 40	Example Reward:  1
[[ 0.0411335   0.0421421   0.0676498   0.06590483  0.06879071  0.06700233
   0.06693381  0.06700338  0.06746861  0.06713958  0.06739938  0.06594215
   0.04880781  0.04768361  0.04880384  0.04794455  0.05225002]]
2.805

Epoch: 3607	Loss: 2.91759474277	Example Output: 20	Example Reward:  1
[[ 0.04121656  0.04217334  0.06769165  0.06594936  0.06867223  0.06699358
   0.06682613  0.06689153  0.06743139  0.06705692  0.06738689  0.06595879
   0.04880939  0.0478037   0.04877485  0.04810728  0.05225635]]
2.8045
[[-0.04121656 -0.04217334 -0.06769165 -0.06594936  0.93132776 -0.06699358
  -0.06682613 -0.06689153 -0.06743139 -0.06705692 -0.06738689 -0.06595879
  -0.04880939 -0.0478037  -0.04877485 -0.04810728 -0.05225635]
 [-0.04121656 -0.04217334  0.93230838 -0.06594936 -0.06867223 -0.06699358
  -0.06682613 -0.06689153 -0.06743139 -0.06705692 -0.06738689 -0.06595879
  -0.04880939 -0.0478037  -0.04877485 -0.04810728 -0.05225635]]
Epoch: 3608	Loss: 2.66075866222	Example Output: 93	Example Reward:  1
[[ 0.04121458  0.04215783  0.06770927  0.0659441   0.06872813  0.06698485
   0.06683268  0.0669327   0.06741241  0.0670343   0.06739634  0.06593253
   0.04880263  0.04778786  0.04877106  0.04810696  0.05225173]]
2.8070

Epoch: 3621	Loss: 2.35221071243	Example Output: X1	Example Reward:  -0.3
[[ 0.0411972   0.04206946  0.06758747  0.06586433  0.06880174  0.06692466
   0.06694539  0.06723384  0.06745952  0.06713644  0.06720046  0.06609454
   0.04881538  0.04772538  0.04869687  0.04803034  0.05221699]]
4.09769
[[-0.01235916  0.28737918  0.27972376  0.28024071  0.27935949  0.2799226
   0.27991641  0.27982986  0.27976215  0.2798591   0.27983987  0.28017166
   0.28535539  0.28568241  0.28539094  0.28559092  0.2843349 ]
 [ 0.28764087  0.28737918  0.27972376 -0.0197593   0.27935949  0.2799226
   0.27991641  0.27982986  0.27976215  0.2798591   0.27983987  0.28017166
   0.28535539  0.28568241  0.28539094  0.28559092  0.2843349 ]]
Epoch: 3622	Loss: 3.19271476269	Example Output: 81	Example Reward:  1
[[ 0.04117692  0.04204028  0.06758656  0.06588377  0.06879042  0.06692293
   0.0669679   0.06730045  0.06751865  0.06713189  0.06719388  0.06609992
   0.04880825  0.04770638  0.04867148  0.04800531  0.05219504]]
2.80

Epoch: 3635	Loss: 2.78494284153	Example Output: 01	Example Reward:  1
[[ 0.04106686  0.04197153  0.06763868  0.06616379  0.06880909  0.06712139
   0.06693596  0.0673658   0.06764596  0.06708083  0.06721383  0.06594889
   0.04868305  0.0476506   0.04860888  0.04798479  0.05211008]]
2.80605
[[-0.04106686 -0.04197153  0.9323613  -0.06616379 -0.06880909 -0.06712139
  -0.06693596 -0.0673658  -0.06764596 -0.06708083 -0.06721383 -0.06594889
  -0.04868305 -0.0476506  -0.04860888 -0.04798479 -0.05211008]
 [-0.04106686 -0.04197153 -0.06763868  0.93383622 -0.06880909 -0.06712139
  -0.06693596 -0.0673658  -0.06764596 -0.06708083 -0.06721383 -0.06594889
  -0.04868305 -0.0476506  -0.04860888 -0.04798479 -0.05211008]]
Epoch: 3636	Loss: 2.93727042675	Example Output: YX	Example Reward:  -0.3
[[ 0.04103335  0.04194663  0.06768896  0.0662128   0.06881774  0.0670749
   0.06693932  0.06737502  0.06766836  0.06706928  0.06725061  0.0659674
   0.04868682  0.04764795  0.04856719  0.04797832  0.05207539]]
4.09

Epoch: 3648	Loss: 3.32549710274	Example Output: Y6	Example Reward:  -0.3
[[ 0.04083726  0.04182883  0.06809123  0.06636181  0.06879893  0.06714014
   0.06699289  0.06742326  0.06789525  0.06686847  0.06750484  0.06603874
   0.04867586  0.04753719  0.04836162  0.04783719  0.05180654]]
4.09808
[[ 0.28774881 -0.01254865  0.27957264  0.28009146  0.27936035  0.27985796
   0.27990216  0.27977303  0.27963144  0.27993947  0.27974856  0.28018838
   0.28539726  0.28573886  0.28549153  0.28564885  0.28445804]
 [ 0.28774881  0.28745136  0.27957264  0.28009146  0.27936035  0.27985796
   0.27990216  0.27977303 -0.02036858  0.27993947  0.27974856  0.28018838
   0.28539726  0.28573886  0.28549153  0.28564885  0.28445804]]
Epoch: 3649	Loss: 2.76280536652	Example Output: X1	Example Reward:  -0.3
[[ 0.04084976  0.04184283  0.06811529  0.06634834  0.06881075  0.06711906
   0.06697459  0.06743766  0.06789272  0.06683488  0.06749421  0.06601083
   0.04870012  0.04753584  0.04839248  0.04784656  0.05179407]]

Epoch: 3661	Loss: 2.65589511395	Example Output: 80	Example Reward:  1
[[ 0.04076064  0.04187559  0.06807054  0.06636188  0.06875177  0.06726944
   0.0672529   0.06727075  0.06799103  0.06676666  0.06752337  0.0660795
   0.04865967  0.04749491  0.04839581  0.04770462  0.051771  ]]
2.80426
[[-0.04076064 -0.04187559 -0.06807054 -0.06636188 -0.06875177 -0.06726944
  -0.0672529  -0.06727075 -0.06799103 -0.06676666  0.93247664 -0.0660795
  -0.04865967 -0.04749491 -0.04839581 -0.04770462 -0.051771  ]
 [-0.04076064 -0.04187559  0.93192947 -0.06636188 -0.06875177 -0.06726944
  -0.0672529  -0.06727075 -0.06799103 -0.06676666 -0.06752337 -0.0660795
  -0.04865967 -0.04749491 -0.04839581 -0.04770462 -0.051771  ]]
Epoch: 3662	Loss: 2.37615358829	Example Output: 3+	Example Reward:  1
[[ 0.04073236  0.04184197  0.06810826  0.0664031   0.06874947  0.06727179
   0.06729109  0.06729031  0.06801938  0.06675396  0.06756683  0.0660966
   0.0486458   0.04746464  0.0483639   0.04766467  0.05173581]]
2.82117
[

Epoch: 3674	Loss: 3.58285434246	Example Output: Y8	Example Reward:  -0.3
[[ 0.04085628  0.04203323  0.06795189  0.06630119  0.06866379  0.06706236
   0.06711445  0.06720804  0.06794365  0.06679272  0.06738131  0.06615311
   0.04880424  0.0475579   0.04840963  0.04781514  0.05195108]]
4.09813
[[ 0.28774312 -0.01260997  0.27961445  0.28010967  0.27940089  0.2798813
   0.27986568  0.27983761  0.27961692  0.27996218  0.2797856   0.28015408
   0.28535876  0.28573266  0.28547713  0.28565547  0.28441468]
 [ 0.28774312  0.28739005  0.27961445  0.28010967  0.27940089  0.2798813
   0.27986568  0.27983761  0.27961692  0.27996218 -0.02021439  0.28015408
   0.28535876  0.28573266  0.28547713  0.28565547  0.28441468]]
Epoch: 3675	Loss: 3.58587892056	Example Output: 0+	Example Reward:  1
[[ 0.04089676  0.04208223  0.06791715  0.06628121  0.06864119  0.06704617
   0.06706598  0.0671849   0.06792104  0.06678226  0.06733721  0.06612818
   0.04884047  0.04759248  0.04844508  0.04786108  0.05197662]]
2.82

Epoch: 3687	Loss: 3.19536263943	Example Output: 98	Example Reward:  1
[[ 0.04086212  0.04199997  0.06807949  0.06609818  0.06859219  0.06711733
   0.06721026  0.06721441  0.06793908  0.06687339  0.06729212  0.06623707
   0.04884555  0.04751506  0.04850632  0.04773164  0.05188587]]
2.80602
[[-0.04086212 -0.04199997 -0.06807949 -0.06609818 -0.06859219 -0.06711733
  -0.06721026 -0.06721441 -0.06793908 -0.06687339 -0.06729212  0.93376291
  -0.04884555 -0.04751506 -0.04850632 -0.04773164 -0.05188587]
 [-0.04086212 -0.04199997 -0.06807949 -0.06609818 -0.06859219 -0.06711733
  -0.06721026 -0.06721441 -0.06793908 -0.06687339  0.93270791 -0.06623707
  -0.04884555 -0.04751506 -0.04850632 -0.04773164 -0.05188587]]
Epoch: 3688	Loss: 3.04826710224	Example Output: 32	Example Reward:  1
[[ 0.04087074  0.04200865  0.06807367  0.0660678   0.06857579  0.06709531
   0.06719198  0.06721419  0.06792751  0.06690065  0.06729399  0.06628113
   0.04885779  0.04751048  0.04849937  0.04774783  0.05188312]]
2.804

Epoch: 3700	Loss: 3.17309253216	Example Output: 41	Example Reward:  1
[[ 0.04080757  0.04202362  0.06811687  0.06597928  0.06872896  0.0672637
   0.06735677  0.06702844  0.0678298   0.06709629  0.06726298  0.06634726
   0.04879808  0.04743503  0.04841248  0.04765339  0.05185951]]
2.80606
[[-0.04080757 -0.04202362 -0.06811687 -0.06597928 -0.06872896 -0.0672637
   0.93264323 -0.06702844 -0.0678298  -0.06709629 -0.06726298 -0.06634726
  -0.04879808 -0.04743503 -0.04841248 -0.04765339 -0.05185951]
 [-0.04080757 -0.04202362 -0.06811687  0.9340207  -0.06872896 -0.0672637
  -0.06735677 -0.06702844 -0.0678298  -0.06709629 -0.06726298 -0.06634726
  -0.04879808 -0.04743503 -0.04841248 -0.04765339 -0.05185951]]
Saving Weight
Epoch: 3701	Loss: 2.93992726803	Example Output: 20	Example Reward:  1
[[ 0.04083088  0.04204505  0.06812797  0.06601697  0.06870908  0.06725645
   0.06736171  0.06698643  0.0678326   0.06710323  0.06724266  0.06631998
   0.04878112  0.04744019  0.04842473  0.0476624   0.05185

Epoch: 3712	Loss: 3.58104038239	Example Output: Y5	Example Reward:  -0.3
[[ 0.04087176  0.0419679   0.06833365  0.06614925  0.06869239  0.06701043
   0.06740297  0.06721315  0.06774724  0.06696339  0.0673083   0.06628779
   0.04875602  0.04747566  0.0482844   0.04765511  0.05188064]]
4.09799
[[ 0.2877385  -0.01259037  0.27949992  0.28015524  0.2793923   0.27989689
   0.27977914  0.27983606  0.27967584  0.27991101  0.27980751  0.28011367
   0.28537321  0.28575733  0.28551468  0.28570348  0.28443581]
 [ 0.2877385   0.28740963  0.27949992  0.28015524  0.2793923   0.27989689
   0.27977914 -0.02016395  0.27967584  0.27991101  0.27980751  0.28011367
   0.28537321  0.28575733  0.28551468  0.28570348  0.28443581]]
Epoch: 3713	Loss: 3.45278122425	Example Output: 45	Example Reward:  1
[[ 0.04089442  0.04200033  0.06834747  0.06615858  0.06866477  0.06698576
   0.06739164  0.06717248  0.06773397  0.06694996  0.06728317  0.06628408
   0.04878122  0.04749158  0.04829126  0.04767978  0.05188961]]
2.

Epoch: 3724	Loss: 3.71090190411	Example Output: Y8	Example Reward:  -0.3
[[ 0.04098394  0.04195971  0.06825662  0.06612062  0.06844515  0.06669582
   0.06741703  0.06723145  0.0676847   0.06702543  0.06738763  0.06658364
   0.0487677   0.04759795  0.04825979  0.04770472  0.0518781 ]]
4.09807
[[ 0.28770483 -0.01258792  0.27952302  0.28016382  0.27946648  0.27999127
   0.2797749   0.27983057  0.27969459  0.27989239  0.27978373  0.28002492
   0.28536969  0.28572062  0.28552207  0.28568861  0.28443658]
 [ 0.28770483  0.28741211  0.27952302  0.28016382  0.27946648  0.27999127
   0.2797749   0.27983057  0.27969459  0.27989239 -0.02021629  0.28002492
   0.28536969  0.28572062  0.28552207  0.28568861  0.28443658]]
Epoch: 3725	Loss: 2.22671878338	Example Output: 77	Example Reward:  1
[[ 0.04102106  0.04199063  0.06824807  0.06608658  0.06841335  0.06667636
   0.06740771  0.06720933  0.06765067  0.06703113  0.06737118  0.06657888
   0.04879062  0.04761976  0.04828077  0.04772744  0.05189648]]
2.

Epoch: 3737	Loss: 3.32393891811	Example Output: *7	Example Reward:  -0.3
[[ 0.04112457  0.04207262  0.0682365   0.06595327  0.06813592  0.06670069
   0.06738468  0.06708809  0.06767318  0.06729197  0.06713716  0.0666934
   0.04887553  0.04771952  0.04821762  0.04776122  0.05193405]]
4.10023
[[ 0.28766263  0.28737822  0.27952906  0.28021404  0.27955922  0.27998981
   0.27978462  0.27987358  0.27969804  0.27981243  0.27985886  0.27999198
   0.28533736  0.28568414 -0.01446529  0.28567165  0.2844198 ]
 [ 0.28766263  0.28737822  0.27952906  0.28021404  0.27955922  0.27998981
   0.27978462  0.27987358  0.27969804 -0.02018759  0.27985886  0.27999198
   0.28533736  0.28568414  0.28553471  0.28567165  0.2844198 ]]
Epoch: 3738	Loss: 3.04291751385	Example Output: 56	Example Reward:  1
[[ 0.04115017  0.04209161  0.0682532   0.06592506  0.06809818  0.06676251
   0.06736331  0.06710509  0.0676236   0.06727955  0.0671474   0.06668144
   0.04888139  0.04772063  0.04823626  0.04775257  0.05192803]]
2.8

Epoch: 3749	Loss: 3.45544118881	Example Output: 0/	Example Reward:  1
[[ 0.04117144  0.04216256  0.06838515  0.06592942  0.06798748  0.06668415
   0.06727579  0.06710453  0.06746344  0.06747238  0.0671581   0.06681512
   0.04892435  0.04768884  0.04815337  0.04777757  0.05184632]]
2.82174
[[-0.04117144 -0.04216256  0.93161488 -0.06592942 -0.06798748 -0.06668415
  -0.06727579 -0.06710453 -0.06746344 -0.06747238 -0.0671581  -0.06681512
  -0.04892435 -0.04768884 -0.04815337 -0.04777757 -0.05184632]
 [-0.04117144 -0.04216256 -0.06838515 -0.06592942 -0.06798748 -0.06668415
  -0.06727579 -0.06710453 -0.06746344 -0.06747238 -0.0671581  -0.06681512
  -0.04892435 -0.04768884 -0.04815337  0.95222241 -0.05184632]]
Epoch: 3750	Loss: 2.78931591511	Example Output: 68	Example Reward:  1
[[ 0.04118845  0.04217605  0.0684019   0.06595872  0.06795549  0.06665836
   0.06724169  0.06710619  0.06743025  0.06743137  0.06716792  0.06680157
   0.04894933  0.0477026   0.04816632  0.04780737  0.05185646]]
2.805

Epoch: 3761	Loss: 2.51243948936	Example Output: +4	Example Reward:  -0.3
4.10062
[[ 0.28761485  0.28733423  0.27955332  0.28024375  0.27963361  0.28009483
   0.27980843  0.27983752  0.27982467  0.27979261  0.27983022  0.27996689
  -0.01470284  0.28563923  0.28554839  0.28559083  0.28438962]
 [ 0.28761485  0.28733423  0.27955332  0.28024375  0.27963361  0.28009483
  -0.02019158  0.27983752  0.27982467  0.27979261  0.27983022  0.27996689
   0.28529719  0.28563923  0.28554839  0.28559083  0.28438962]]
Epoch: 3762	Loss: 3.32432146072	Example Output: 7X	Example Reward:  -0.3
[[ 0.04129831  0.04220892  0.06817885  0.06581596  0.06790775  0.06629701
   0.06731915  0.06722298  0.06725591  0.06734566  0.06722968  0.06681108
   0.0490246   0.0478704   0.04815489  0.04803776  0.05202114]]
4.09806
[[ 0.2876105   0.28733733  0.27954635  0.28025523  0.27962768  0.28011093
   0.27980426  0.27983314  0.27982324 -0.0202037   0.27983111  0.2799567
   0.28529263  0.2856389   0.28555354  0.28558868  0.284

Epoch: 3776	Loss: 3.04398765564	Example Output: 6	Example Reward:  1
2.81885
[[-0.04144785 -0.0424876  -0.06804907 -0.06559709 -0.06779827 -0.06612378
  -0.06729364 -0.06684455  0.93278342 -0.06743787 -0.06693299 -0.06672641
  -0.04912152 -0.04804817 -0.0483841  -0.04824498 -0.05224551]
 [-0.04144785 -0.0424876  -0.06804907 -0.06559709 -0.06779827 -0.06612378
  -0.06729364 -0.06684455 -0.06721659 -0.06743787 -0.06693299 -0.06672641
  -0.04912152 -0.04804817 -0.0483841  -0.04824498  0.9477545 ]]
Epoch: 3777	Loss: 3.08145582676	Example Output: X	Example Reward:  1
[[ 0.04145417  0.04251981  0.06802186  0.06556414  0.06779606  0.06609245
   0.06728467  0.0668319   0.06721738  0.06748292  0.06686804  0.0666941
   0.04912069  0.04806943  0.04839471  0.0482781   0.05230959]]
2.843
[[ 0.9585458  -0.04251981 -0.06802186 -0.06556414 -0.06779606 -0.06609245
  -0.06728467 -0.0668319  -0.06721738 -0.06748292 -0.06686804 -0.0666941
  -0.04912069 -0.04806943 -0.04839471 -0.0482781  -0.05230959]
 [-0

Epoch: 3788	Loss: 2.93813183308	Example Output: 87	Example Reward:  1
[[ 0.04154256  0.04257502  0.06789662  0.06549431  0.06781281  0.06583467
   0.0674007   0.06676177  0.06711089  0.06744032  0.06682687  0.06689739
   0.04923004  0.04810098  0.04835752  0.04829165  0.05242585]]
2.80654
[[-0.04154256 -0.04257502 -0.06789662 -0.06549431 -0.06781281 -0.06583467
  -0.0674007  -0.06676177 -0.06711089 -0.06744032  0.93317312 -0.06689739
  -0.04923004 -0.04810098 -0.04835752 -0.04829165 -0.05242585]
 [-0.04154256 -0.04257502 -0.06789662 -0.06549431 -0.06781281 -0.06583467
  -0.0674007  -0.06676177 -0.06711089  0.93255967 -0.06682687 -0.06689739
  -0.04923004 -0.04810098 -0.04835752 -0.04829165 -0.05242585]]
Epoch: 3789	Loss: 2.91584935188	Example Output: 2Y	Example Reward:  -0.3
[[ 0.04153134  0.04253656  0.06788217  0.06550422  0.06781789  0.06584982
   0.067434    0.06679897  0.06712122  0.06743759  0.06686714  0.0669129
   0.04921112  0.04808012  0.04833328  0.04825984  0.05242178]]
4.0

Epoch: 3800	Loss: 3.32836880684	Example Output: 63	Example Reward:  1
[[ 0.04147455  0.04259291  0.0677705   0.0652869   0.06801207  0.06578394
   0.06737649  0.06688675  0.06707382  0.06754522  0.06662138  0.06680319
   0.04937606  0.04810292  0.04831175  0.04847541  0.05250614]]
2.80767
[[-0.04147455 -0.04259291 -0.0677705  -0.0652869  -0.06801207 -0.06578394
  -0.06737649 -0.06688675  0.93292618 -0.06754522 -0.06662138 -0.06680319
  -0.04937606 -0.04810292 -0.04831175 -0.04847541 -0.05250614]
 [-0.04147455 -0.04259291 -0.0677705  -0.0652869  -0.06801207  0.93421608
  -0.06737649 -0.06688675 -0.06707382 -0.06754522 -0.06662138 -0.06680319
  -0.04937606 -0.04810292 -0.04831175 -0.04847541 -0.05250614]]
Saving Weight
Epoch: 3801	Loss: 3.04557600021	Example Output: 2	Example Reward:  1
[[ 0.04147304  0.04261078  0.06779142  0.06525565  0.06799959  0.06580942
   0.06737144  0.06687419  0.06707298  0.06754696  0.06659736  0.06678881
   0.04939352  0.04810183  0.04831993  0.04848377  0.052

Epoch: 3813	Loss: 3.32816867828	Example Output: 18	Example Reward:  1
[[ 0.04160792  0.04281243  0.06776823  0.0649684   0.06805137  0.06575404
   0.06726005  0.06665666  0.06703264  0.06786928  0.06622664  0.06688743
   0.04944471  0.04808722  0.04834626  0.04862785  0.05259892]]
2.80915
[[-0.04160792 -0.04281243 -0.06776823  0.93503159 -0.06805137 -0.06575404
  -0.06726005 -0.06665666 -0.06703264 -0.06786928 -0.06622664 -0.06688743
  -0.04944471 -0.04808722 -0.04834626 -0.04862785 -0.05259892]
 [-0.04160792 -0.04281243 -0.06776823 -0.0649684  -0.06805137 -0.06575404
  -0.06726005 -0.06665666 -0.06703264 -0.06786928  0.93377334 -0.06688743
  -0.04944471 -0.04808722 -0.04834626 -0.04862785 -0.05259892]]
Epoch: 3814	Loss: 3.17292020321	Example Output: 32	Example Reward:  1
2.80721
[[-0.04161979 -0.04282667 -0.06774359 -0.06499711 -0.0680171   0.93422824
  -0.06723697 -0.06663553 -0.067043   -0.06787279 -0.06624337 -0.06690267
  -0.04942369 -0.04808539 -0.04834695 -0.04863657 -0.05259709

   0.28518298  0.28558642  0.28550118  0.28538883  0.28420645]]
Epoch: 3827	Loss: 2.5073738575	Example Output: 99	Example Reward:  1
[[ 0.04168041  0.04277973  0.06764244  0.06505017  0.06804697  0.06559959
   0.06730185  0.06674149  0.06713232  0.06785373  0.06602286  0.06699016
   0.04939284  0.04806516  0.04832363  0.04870178  0.05267491]]
2.80707
[[-0.04168041 -0.04277973 -0.06764244 -0.06505017 -0.06804697 -0.06559959
  -0.06730185 -0.06674149 -0.06713232 -0.06785373 -0.06602286  0.93300986
  -0.04939284 -0.04806516 -0.04832363 -0.04870178 -0.05267491]
 [-0.04168041 -0.04277973 -0.06764244 -0.06505017 -0.06804697 -0.06559959
  -0.06730185 -0.06674149 -0.06713232 -0.06785373 -0.06602286  0.93300986
  -0.04939284 -0.04806516 -0.04832363 -0.04870178 -0.05267491]]
Epoch: 3828	Loss: 2.50562057495	Example Output: 33	Example Reward:  1
[[ 0.04167776  0.04275965  0.06759708  0.06507237  0.06805442  0.06559183
   0.06732097  0.06678207  0.06716079  0.06785753  0.06598908  0.06700929
   0.0

Epoch: 3841	Loss: 3.0715344429	Example Output: 78	Example Reward:  1
[[ 0.04160124  0.04265434  0.06768363  0.06525879  0.06807593  0.06568352
   0.067215    0.0670097   0.06715402  0.06764044  0.06621689  0.0669269
   0.04935968  0.04798467  0.04828344  0.04862325  0.05262857]]
2.80702
[[-0.04160124 -0.04265434 -0.06768363 -0.06525879 -0.06807593 -0.06568352
  -0.067215   -0.0670097  -0.06715402  0.93235958 -0.06621689 -0.0669269
  -0.04935968 -0.04798467 -0.04828344 -0.04862325 -0.05262857]
 [-0.04160124 -0.04265434 -0.06768363 -0.06525879 -0.06807593 -0.06568352
  -0.067215   -0.0670097  -0.06715402 -0.06764044  0.93378311 -0.0669269
  -0.04935968 -0.04798467 -0.04828344 -0.04862325 -0.05262857]]
Epoch: 3842	Loss: 2.91404631138	Example Output: 93	Example Reward:  1
[[ 0.04158825  0.04264953  0.06768074  0.06525212  0.06808099  0.06566896
   0.06723571  0.06699511  0.06712632  0.06766658  0.06624696  0.06694418
   0.04935129  0.04799841  0.04827312  0.04861228  0.05262956]]
2.80794
[

Epoch: 3853	Loss: 2.94423127174	Example Output: 2+	Example Reward:  1
[[ 0.04172154  0.04267629  0.06765971  0.06513045  0.0680925   0.06577372
   0.06703906  0.06701197  0.06720164  0.06765705  0.06608758  0.06683125
   0.04930946  0.04804201  0.04848028  0.04862295  0.05266263]]
2.82155
[[-0.04172154 -0.04267629 -0.06765971 -0.06513045  0.93190747 -0.06577372
  -0.06703906 -0.06701197 -0.06720164 -0.06765705 -0.06608758 -0.06683125
  -0.04930946 -0.04804201 -0.04848028 -0.04862295 -0.05266263]
 [-0.04172154 -0.04267629 -0.06765971 -0.06513045 -0.0680925  -0.06577372
  -0.06703906 -0.06701197 -0.06720164 -0.06765705 -0.06608758 -0.06683125
   0.95069057 -0.04804201 -0.04848028 -0.04862295 -0.05266263]]
Epoch: 3854	Loss: 3.19858496189	Example Output: *6	Example Reward:  -0.3
[[ 0.04171069  0.04264918  0.06769845  0.06512553  0.06810434  0.06577901
   0.06702464  0.06704336  0.06721283  0.06763458  0.06609398  0.06684372
   0.04930885  0.04803604  0.04848318  0.04861859  0.0526331 ]]
4.

Epoch: 3865	Loss: 3.1745049715	Example Output: 56	Example Reward:  1
[[ 0.04156275  0.04242353  0.06760361  0.06526139  0.06819443  0.06554674
   0.0673594   0.06717357  0.06735039  0.06764209  0.06622313  0.0671
   0.0491694   0.04811172  0.04814532  0.04842142  0.05271119]]
2.8063
[[-0.04156275 -0.04242353 -0.06760361 -0.06526139 -0.06819443 -0.06554674
  -0.0673594   0.9328264  -0.06735039 -0.06764209 -0.06622313 -0.0671
  -0.0491694  -0.04811172 -0.04814532 -0.04842142 -0.05271119]
 [-0.04156275 -0.04242353 -0.06760361 -0.06526139 -0.06819443 -0.06554674
  -0.0673594  -0.06717357  0.93264961 -0.06764209 -0.06622313 -0.0671
  -0.0491694  -0.04811172 -0.04814532 -0.04842142 -0.05271119]]
Epoch: 3866	Loss: 3.04420502186	Example Output: Y6	Example Reward:  -0.3
[[ 0.04155536  0.04241738  0.06758954  0.06526331  0.06819112  0.06550823
   0.06739803  0.06717874  0.0673762   0.06763401  0.0662121   0.06711303
   0.04916193  0.04811786  0.04812483  0.04842281  0.05273554]]
4.09873
[[ 0.287

Epoch: 3878	Loss: 2.93929741383	Example Output: 76	Example Reward:  1
[[ 0.04145546  0.0423304   0.06785232  0.06513128  0.06828339  0.06546686
   0.06747936  0.06721856  0.06739238  0.06771991  0.06614848  0.06709414
   0.04921018  0.04804234  0.04804599  0.04842223  0.05270671]]
2.80573
[[-0.04145546 -0.0423304  -0.06785232 -0.06513128 -0.06828339 -0.06546686
  -0.06747936 -0.06721856 -0.06739238  0.93228006 -0.06614848 -0.06709414
  -0.04921018 -0.04804234 -0.04804599 -0.04842223 -0.05270671]
 [-0.04145546 -0.0423304  -0.06785232 -0.06513128 -0.06828339 -0.06546686
  -0.06747936 -0.06721856  0.93260765 -0.06771991 -0.06614848 -0.06709414
  -0.04921018 -0.04804234 -0.04804599 -0.04842223 -0.05270671]]
Epoch: 3879	Loss: 2.53055922985	Example Output: 25	Example Reward:  1
[[ 0.04141736  0.0423036   0.0678348   0.06515508  0.06831206  0.06549206
   0.06753206  0.06720438  0.06742593  0.06777951  0.06613775  0.06708449
   0.04917086  0.04801956  0.04800866  0.04841548  0.05270634]]
2.805

Epoch: 3891	Loss: 2.78572545052	Example Output: 32	Example Reward:  1
[[ 0.04140842  0.04233374  0.06774374  0.0654863   0.06820962  0.06540816
   0.06760771  0.06698901  0.06739857  0.0677888   0.06622687  0.06707999
   0.04914796  0.04814642  0.04788233  0.04841587  0.05272658]]
2.80682
[[-0.04140842 -0.04233374 -0.06774374 -0.0654863  -0.06820962  0.93459183
  -0.06760771 -0.06698901 -0.06739857 -0.0677888  -0.06622687 -0.06707999
  -0.04914796 -0.04814642 -0.04788233 -0.04841587 -0.05272658]
 [-0.04140842 -0.04233374 -0.06774374 -0.0654863   0.93179035 -0.06540816
  -0.06760771 -0.06698901 -0.06739857 -0.0677888  -0.06622687 -0.06707999
  -0.04914796 -0.04814642 -0.04788233 -0.04841587 -0.05272658]]
Epoch: 3892	Loss: 2.78587167263	Example Output: 29	Example Reward:  1
[[ 0.04140092  0.04231158  0.06777062  0.06547118  0.06824984  0.06545159
   0.06758018  0.06698942  0.06736874  0.06781753  0.06625176  0.06709777
   0.04912656  0.04811944  0.04787748  0.04840618  0.05270926]]
2.805

Epoch: 3903	Loss: 3.32927613258	Example Output: 6+	Example Reward:  1
[[ 0.04129127  0.04207059  0.06780881  0.06527152  0.0685908   0.06561968
   0.06755947  0.06723093  0.06763     0.06780107  0.06635167  0.06704553
   0.04896128  0.04797025  0.04792479  0.04827341  0.05259884]]
2.8214
[[-0.04129127 -0.04207059 -0.06780881 -0.06527152 -0.0685908  -0.06561968
  -0.06755947 -0.06723093  0.93237001 -0.06780107 -0.06635167 -0.06704553
  -0.04896128 -0.04797025 -0.04792479 -0.04827341 -0.05259884]
 [-0.04129127 -0.04207059 -0.06780881 -0.06527152 -0.0685908  -0.06561968
  -0.06755947 -0.06723093 -0.06763    -0.06780107 -0.06635167 -0.06704553
   0.95103872 -0.04797025 -0.04792479 -0.04827341 -0.05259884]]
Epoch: 3904	Loss: 3.19706573486	Example Output: 56	Example Reward:  1
[[ 0.04128736  0.04207323  0.0678013   0.06525993  0.06860205  0.06557832
   0.06755047  0.06725383  0.06761383  0.06775606  0.06636102  0.06703085
   0.04901196  0.04799794  0.04791793  0.04828481  0.05261914]]
2.8055

Epoch: 3915	Loss: 3.19522001743	Example Output: 12	Example Reward:  1
[[ 0.04111684  0.04189759  0.06768674  0.06523427  0.06892782  0.06553109
   0.06782141  0.06721706  0.06767809  0.0679599   0.06642309  0.06726889
   0.04891185  0.04786414  0.04774917  0.04808817  0.05262388]]
2.80579
[[-0.04111684 -0.04189759 -0.06768674  0.9347657  -0.06892782 -0.06553109
  -0.06782141 -0.06721706 -0.06767809 -0.0679599  -0.06642309 -0.06726889
  -0.04891185 -0.04786414 -0.04774917 -0.04808817 -0.05262388]
 [-0.04111684 -0.04189759 -0.06768674 -0.06523427  0.93107218 -0.06553109
  -0.06782141 -0.06721706 -0.06767809 -0.0679599  -0.06642309 -0.06726889
  -0.04891185 -0.04786414 -0.04774917 -0.04808817 -0.05262388]]
Epoch: 3916	Loss: 2.50630102158	Example Output: 3Y	Example Reward:  -0.3
[[ 0.04111063  0.04189289  0.06770034  0.06524324  0.0689492   0.06552723
   0.06781522  0.06719771  0.06764464  0.06795529  0.06647503  0.0672884
   0.0489089   0.04784695  0.04773676  0.04809904  0.05260853]]
4.0

Epoch: 3928	Loss: 3.45051760674	Example Output: 94	Example Reward:  1
[[ 0.04101302  0.04179057  0.06776277  0.06551284  0.06891636  0.06556334
   0.06766684  0.06742726  0.06798082  0.06806444  0.06631623  0.06723398
   0.04884094  0.04770991  0.04768052  0.04807537  0.0524448 ]]
2.80498
[[-0.04101302 -0.04179057 -0.06776277 -0.06551284 -0.06891636 -0.06556334
  -0.06766684 -0.06742726 -0.06798082 -0.06806444 -0.06631623  0.93276602
  -0.04884094 -0.04770991 -0.04768052 -0.04807537 -0.0524448 ]
 [-0.04101302 -0.04179057 -0.06776277 -0.06551284 -0.06891636 -0.06556334
   0.93233317 -0.06742726 -0.06798082 -0.06806444 -0.06631623 -0.06723398
  -0.04884094 -0.04770991 -0.04768052 -0.04807537 -0.0524448 ]]
Epoch: 3929	Loss: 3.58118317127	Example Output: 48	Example Reward:  1
[[ 0.04103195  0.0418085   0.06778492  0.06549008  0.06887573  0.06559521
   0.06764451  0.0674148   0.06797857  0.06806175  0.06630559  0.06725435
   0.04884576  0.0477134   0.04767684  0.04807796  0.05244013]]
2.805

   0.04888698  0.04769804  0.04762982  0.04804689  0.05237383]]
2.80533
[[-0.04104896 -0.04169346 -0.06778877  0.93439662 -0.06879324 -0.06561866
  -0.0675371  -0.06755635 -0.06808785 -0.06794787 -0.0663279  -0.06736098
  -0.04888698 -0.04769804 -0.04762982 -0.04804689 -0.05237383]
 [-0.04104896 -0.04169346 -0.06778877 -0.06560338  0.93120676 -0.06561866
  -0.0675371  -0.06755635 -0.06808785 -0.06794787 -0.0663279  -0.06736098
  -0.04888698 -0.04769804 -0.04762982 -0.04804689 -0.05237383]]
Saving Weight
Epoch: 3941	Loss: 3.19648654461	Example Output: +7	Example Reward:  -0.3
[[ 0.0410279   0.04165357  0.06779005  0.06567783  0.06879938  0.06561689
   0.06754284  0.06755425  0.06813049  0.06792047  0.06637669  0.06738172
   0.04885874  0.04767804  0.04760505  0.0480197   0.05236638]]
4.10043
[[ 0.28769165  0.28750393  0.279663    0.28029665  0.2793602   0.28031495
   0.27973714  0.27973375  0.27956086  0.27962387  0.28008699  0.27978548
  -0.01465762  0.2856966   0.2857185   0.28559411 

Epoch: 3953	Loss: 3.3219753027	Example Output: 81	Example Reward:  1
[[ 0.04112837  0.04173377  0.06770067  0.06559984  0.06892798  0.06563631
   0.06745552  0.06750689  0.06833178  0.06778961  0.06618644  0.06732094
   0.04879122  0.0476943   0.04768042  0.04804177  0.0524742 ]]
2.80732
[[-0.04112837 -0.04173377 -0.06770067 -0.06559984 -0.06892798 -0.06563631
  -0.06745552 -0.06750689 -0.06833178 -0.06778961  0.93381357 -0.06732094
  -0.04879122 -0.0476943  -0.04768042 -0.04804177 -0.0524742 ]
 [-0.04112837 -0.04173377 -0.06770067  0.93440014 -0.06892798 -0.06563631
  -0.06745552 -0.06750689 -0.06833178 -0.06778961 -0.06618644 -0.06732094
  -0.04879122 -0.0476943  -0.04768042 -0.04804177 -0.0524742 ]]
Epoch: 3954	Loss: 3.19698112011	Example Output: 1*	Example Reward:  1
[[ 0.04111554  0.04172311  0.06774022  0.06564232  0.06891105  0.06567103
   0.06745759  0.06749889  0.06830712  0.06776204  0.06623586  0.06734995
   0.04877827  0.04768205  0.04765565  0.04800903  0.05246034]]
2.8236

Epoch: 3965	Loss: 3.04662430286	Example Output: 82	Example Reward:  1
[[ 0.04120426  0.04175623  0.06774993  0.0656062   0.06865974  0.0658864
   0.06727067  0.06758     0.06818023  0.06771082  0.06630583  0.06736501
   0.04876717  0.04762856  0.04778522  0.048147    0.05239676]]
2.80503
[[-0.04120426 -0.04175623 -0.06774993 -0.0656062  -0.06865974 -0.0658864
  -0.06727067 -0.06758    -0.06818023 -0.06771082  0.93369418 -0.06736501
  -0.04876717 -0.04762856 -0.04778522 -0.048147   -0.05239676]
 [-0.04120426 -0.04175623 -0.06774993 -0.0656062   0.93134028 -0.0658864
  -0.06727067 -0.06758    -0.06818023 -0.06771082 -0.06630583 -0.06736501
  -0.04876717 -0.04762856 -0.04778522 -0.048147   -0.05239676]]
Epoch: 3966	Loss: 2.65724523067	Example Output: 79	Example Reward:  1
[[ 0.04119674  0.04175196  0.06774709  0.0656105   0.06867675  0.06588263
   0.06727608  0.06758342  0.06816816  0.06770129  0.06633607  0.06734199
   0.04876764  0.04762547  0.04778221  0.04814726  0.05240479]]
2.80495


Epoch: 3977	Loss: 3.32763080597	Example Output: 9-	Example Reward:  1
[[ 0.04125062  0.04196028  0.06773097  0.06549285  0.06844701  0.06599244
   0.06712416  0.06725729  0.06813329  0.06772914  0.0661994   0.06706505
   0.04894703  0.04765184  0.04816323  0.04837405  0.05248133]]
2.82309
[[-0.04125062 -0.04196028 -0.06773097 -0.06549285 -0.06844701 -0.06599244
  -0.06712416 -0.06725729 -0.06813329 -0.06772914 -0.0661994   0.93293494
  -0.04894703 -0.04765184 -0.04816323 -0.04837405 -0.05248133]
 [-0.04125062 -0.04196028 -0.06773097 -0.06549285 -0.06844701 -0.06599244
  -0.06712416 -0.06725729 -0.06813329 -0.06772914 -0.0661994  -0.06706505
  -0.04894703  0.95234817 -0.04816323 -0.04837405 -0.05248133]]
Epoch: 3978	Loss: 3.17869935036	Example Output: X8	Example Reward:  -0.3
[[ 0.04127073  0.04198761  0.06769612  0.06550339  0.0684281   0.06596879
   0.067095    0.06721312  0.06814433  0.06772801  0.06617122  0.06704519
   0.04894942  0.04768021  0.04820224  0.04841533  0.05250123]]
4.

Epoch: 3989	Loss: 3.19968619347	Example Output: 29	Example Reward:  1
[[ 0.04139248  0.04190354  0.06759816  0.06567884  0.06834956  0.06610354
   0.0669758   0.06749784  0.06796389  0.0675      0.06623802  0.06698846
   0.04894424  0.04767668  0.04828556  0.04844297  0.05246041]]
2.80522
[[-0.04139248 -0.04190354 -0.06759816 -0.06567884  0.93165046 -0.06610354
  -0.0669758  -0.06749784 -0.06796389 -0.0675     -0.06623802 -0.06698846
  -0.04894424 -0.04767668 -0.04828556 -0.04844297 -0.05246041]
 [-0.04139248 -0.04190354 -0.06759816 -0.06567884 -0.06834956 -0.06610354
  -0.0669758  -0.06749784 -0.06796389 -0.0675     -0.06623802  0.93301153
  -0.04894424 -0.04767668 -0.04828556 -0.04844297 -0.05246041]]
Epoch: 3990	Loss: 3.19259295464	Example Output: +7	Example Reward:  -0.3
[[ 0.04136595  0.04187191  0.06761634  0.06568694  0.06839038  0.06605645
   0.06700479  0.06751137  0.06798953  0.06752337  0.06622766  0.06702072
   0.04892941  0.04765623  0.04825056  0.04842595  0.05247243]]
4.

Epoch: 4001	Loss: 2.9237600565	Example Output: 15	Example Reward:  1
[[ 0.04145395  0.04195265  0.0676767   0.06561251  0.06836444  0.06607692
   0.06679422  0.06749059  0.06796935  0.06744278  0.06608599  0.0668395
   0.04890842  0.04774335  0.04847449  0.04861224  0.0525019 ]]
2.80706
[[-0.04145395 -0.04195265 -0.0676767   0.93438751 -0.06836444 -0.06607692
  -0.06679422 -0.06749059 -0.06796935 -0.06744278 -0.06608599 -0.0668395
  -0.04890842 -0.04774335 -0.04847449 -0.04861224 -0.0525019 ]
 [-0.04145395 -0.04195265 -0.0676767  -0.06561251 -0.06836444 -0.06607692
  -0.06679422  0.93250942 -0.06796935 -0.06744278 -0.06608599 -0.0668395
  -0.04890842 -0.04774335 -0.04847449 -0.04861224 -0.0525019 ]]
Epoch: 4002	Loss: 2.50713050365	Example Output: X4	Example Reward:  -0.3
[[ 0.04147538  0.04194686  0.06770104  0.06561962  0.06832625  0.06607196
   0.06676678  0.06751733  0.06796239  0.06742373  0.06610383  0.06681407
   0.04891643  0.04775877  0.04848548  0.04861661  0.05249349]]
4.0981

Epoch: 4013	Loss: 2.91345157623	Example Output: *4	Example Reward:  -0.3
[[ 0.04160078  0.04200491  0.06765468  0.0655383   0.06820608  0.06594531
   0.06674094  0.06751317  0.06793185  0.06732602  0.06606706  0.06684999
   0.04892759  0.04777941  0.04855546  0.04874204  0.05261643]]
4.10056
[[ 0.28751978  0.28739855  0.27970362  0.28033853  0.27953818  0.28021643
   0.27997774  0.27974606  0.27962047  0.2798022   0.28017989  0.27994502
   0.28532174  0.28566617 -0.01456664  0.28537738  0.28421509]
 [ 0.28751978  0.28739855  0.27970362  0.28033853  0.27953818  0.28021643
  -0.02002228  0.27974606  0.27962047  0.2798022   0.28017989  0.27994502
   0.28532174  0.28566617  0.28543338  0.28537738  0.28421509]]
Epoch: 4014	Loss: 2.63623013496	Example Output: 7	Example Reward:  1
[[ 0.0416139   0.04201003  0.0676394   0.065534    0.06820697  0.06597605
   0.06671769  0.06751642  0.06792021  0.06731303  0.06606573  0.06687737
   0.048919    0.04777845  0.04855641  0.0487395   0.05261595]]
2.8

Epoch: 4025	Loss: 3.32553503513	Example Output: 84	Example Reward:  1
[[ 0.04154222  0.04204214  0.06766728  0.06544375  0.06820676  0.06625818
   0.0668987   0.06731118  0.06788282  0.06730939  0.066146    0.06706064
   0.04884075  0.04771527  0.04847553  0.04861854  0.0525809 ]]
2.80717
[[-0.04154222 -0.04204214 -0.06766728 -0.06544375 -0.06820676 -0.06625818
  -0.0668987  -0.06731118 -0.06788282 -0.06730939  0.93385398 -0.06706064
  -0.04884075 -0.04771527 -0.04847553 -0.04861854 -0.0525809 ]
 [-0.04154222 -0.04204214 -0.06766728 -0.06544375 -0.06820676 -0.06625818
   0.9331013  -0.06731118 -0.06788282 -0.06730939 -0.066146   -0.06706064
  -0.04884075 -0.04771527 -0.04847553 -0.04861854 -0.0525809 ]]
Epoch: 4026	Loss: 3.19855670929	Example Output: 47	Example Reward:  1
[[ 0.04152166  0.04203788  0.06767211  0.06544603  0.06818703  0.06623879
   0.06694699  0.06730578  0.06786722  0.06726591  0.06621265  0.06708658
   0.04884182  0.04771325  0.04847321  0.04860359  0.05257946]]
2.806

Epoch: 4038	Loss: 2.52548010349	Example Output: 30	Example Reward:  1
[[ 0.04143793  0.04202442  0.06780866  0.06529486  0.06811711  0.06631806
   0.06697141  0.06727103  0.06765106  0.06709822  0.06678673  0.06714427
   0.0488035   0.04765275  0.04851479  0.04859216  0.05251315]]
2.80627
[[-0.04143793 -0.04202442 -0.06780866 -0.06529486 -0.06811711  0.93368196
  -0.06697141 -0.06727103 -0.06765106 -0.06709822 -0.06678673 -0.06714427
  -0.0488035  -0.04765275 -0.04851479 -0.04859216 -0.05251315]
 [-0.04143793 -0.04202442  0.93219137 -0.06529486 -0.06811711 -0.06631806
  -0.06697141 -0.06727103 -0.06765106 -0.06709822 -0.06678673 -0.06714427
  -0.0488035  -0.04765275 -0.04851479 -0.04859216 -0.05251315]]
Epoch: 4039	Loss: 3.45209999084	Example Output: 06	Example Reward:  1
[[ 0.04142512  0.04201007  0.06782112  0.06528138  0.06816956  0.0663228
   0.06698348  0.06726006  0.0676566   0.06712649  0.06678221  0.0671819
   0.04878815  0.04762743  0.04849603  0.04856616  0.05250148]]
2.80522

Epoch: 4051	Loss: 2.78852174282	Example Output: 09	Example Reward:  1
[[ 0.04147518  0.04203141  0.06773352  0.06525064  0.06822381  0.06616782
   0.06695466  0.06715867  0.06770415  0.06723505  0.06661861  0.0669887
   0.04879611  0.04775225  0.04870084  0.04864054  0.05256801]]
2.80595
[[-0.04147518 -0.04203141  0.93226647 -0.06525064 -0.06822381 -0.06616782
  -0.06695466 -0.06715867 -0.06770415 -0.06723505 -0.06661861 -0.0669887
  -0.04879611 -0.04775225 -0.04870084 -0.04864054 -0.05256801]
 [-0.04147518 -0.04203141 -0.06773352 -0.06525064 -0.06822381 -0.06616782
  -0.06695466 -0.06715867 -0.06770415 -0.06723505 -0.06661861  0.93301129
  -0.04879611 -0.04775225 -0.04870084 -0.04864054 -0.05256801]]
Epoch: 4052	Loss: 3.19621784687	Example Output: 81	Example Reward:  1
[[ 0.04145771  0.04202111  0.06780221  0.06523646  0.06823852  0.06613005
   0.06695025  0.06717177  0.06767388  0.06723405  0.06663669  0.06704128
   0.04883538  0.04773575  0.04867525  0.04861719  0.05254242]]
2.80806

Epoch: 4063	Loss: 2.91466498375	Example Output: Y2	Example Reward:  -0.3
[[ 0.04144739  0.0419496   0.06779069  0.0654721   0.06818888  0.06603387
   0.06709401  0.0671372   0.06766316  0.06723652  0.06677911  0.06731536
   0.04878093  0.0477231   0.04842718  0.04850809  0.05245277]]
4.09856
[[ 0.2875658  -0.01258488  0.27966282  0.28035837  0.27954334  0.28018987
   0.27987179  0.27985886  0.27970108  0.27982906  0.27996626  0.27980542
   0.28536573  0.28568307  0.28547186  0.28544757  0.28426418]
 [ 0.2875658   0.28741515  0.27966282  0.28035837 -0.02045666  0.28018987
   0.27987179  0.27985886  0.27970108  0.27982906  0.27996626  0.27980542
   0.28536573  0.28568307  0.28547186  0.28544757  0.28426418]]
Epoch: 4064	Loss: 3.58294644356	Example Output: */	Example Reward:  -0.3
[[ 0.04145241  0.04195251  0.06779436  0.065451    0.06821235  0.06600709
   0.06710701  0.06713232  0.06767538  0.0672789   0.06673896  0.06728198
   0.04878243  0.04773252  0.04842646  0.04851615  0.05245823]]

Epoch: 4076	Loss: 2.78448851109	Example Output: 16	Example Reward:  1
[[ 0.04147092  0.04208202  0.06776685  0.0653577   0.0682882   0.06602634
   0.06709366  0.06695507  0.06788284  0.06750745  0.06635851  0.06712505
   0.04873385  0.04773541  0.04849385  0.04860696  0.05251531]]
2.80698
[[-0.04147092 -0.04208202 -0.06776685  0.93464231 -0.0682882  -0.06602634
  -0.06709366 -0.06695507 -0.06788284 -0.06750745 -0.06635851 -0.06712505
  -0.04873385 -0.04773541 -0.04849385 -0.04860696 -0.05251531]
 [-0.04147092 -0.04208202 -0.06776685 -0.0653577  -0.0682882  -0.06602634
  -0.06709366 -0.06695507  0.93211716 -0.06750745 -0.06635851 -0.06712505
  -0.04873385 -0.04773541 -0.04849385 -0.04860696 -0.05251531]]
Epoch: 4077	Loss: 3.32736692429	Example Output: 04	Example Reward:  1
[[ 0.04146337  0.04210394  0.0677692   0.06541279  0.06829192  0.06600486
   0.06710389  0.06693716  0.06787325  0.0674624   0.06639022  0.06709559
   0.04874142  0.04774868  0.04848765  0.04861178  0.05250186]]
2.805

Epoch: 4088	Loss: 2.92227125168	Example Output: 63	Example Reward:  1
[[ 0.04143504  0.04207693  0.06782983  0.06546625  0.06822295  0.06581923
   0.06719064  0.06706745  0.06784746  0.06744079  0.0664212   0.06716606
   0.04884145  0.04777786  0.04846006  0.048536    0.05240082]]
2.80662
[[-0.04143504 -0.04207693 -0.06782983 -0.06546625 -0.06822295 -0.06581923
  -0.06719064 -0.06706745  0.93215251 -0.06744079 -0.0664212  -0.06716606
  -0.04884145 -0.04777786 -0.04846006 -0.048536   -0.05240082]
 [-0.04143504 -0.04207693 -0.06782983 -0.06546625 -0.06822295  0.9341808
  -0.06719064 -0.06706745 -0.06784746 -0.06744079 -0.0664212  -0.06716606
  -0.04884145 -0.04777786 -0.04846006 -0.048536   -0.05240082]]
Epoch: 4089	Loss: 3.45533604622	Example Output: 02	Example Reward:  1
[[ 0.04145372  0.04208413  0.06778762  0.06546866  0.06818216  0.06579663
   0.06717752  0.06708925  0.06783696  0.06741795  0.06642296  0.06715403
   0.04886184  0.0478089   0.04849746  0.0485464   0.0524139 ]]
2.8049

Epoch: 4100	Loss: 3.32712767124	Example Output: 0/	Example Reward:  1
[[ 0.04161492  0.04227401  0.06766896  0.06550359  0.0680639   0.06576717
   0.06685734  0.06697439  0.0676977   0.06729092  0.06637304  0.06702779
   0.0489967   0.04799591  0.04866226  0.04871602  0.05251547]]
2.82221
[[-0.04161492 -0.04227401  0.93233103 -0.06550359 -0.0680639  -0.06576717
  -0.06685734 -0.06697439 -0.0676977  -0.06729092 -0.06637304 -0.06702779
  -0.0489967  -0.04799591 -0.04866226 -0.04871602 -0.05251547]
 [-0.04161492 -0.04227401 -0.06766896 -0.06550359 -0.0680639  -0.06576717
  -0.06685734 -0.06697439 -0.0676977  -0.06729092 -0.06637304 -0.06702779
  -0.0489967  -0.04799591 -0.04866226  0.95128399 -0.05251547]]
Saving Weight
Epoch: 4101	Loss: 2.91682012081	Example Output: 10	Example Reward:  1
[[ 0.04162696  0.0422719   0.06767987  0.06553664  0.06806106  0.06572711
   0.06683978  0.06696541  0.06771395  0.06728594  0.06635652  0.0670271
   0.0490096   0.04800814  0.04864895  0.04873191  0.052

Epoch: 4112	Loss: 3.58308272362	Example Output: /8	Example Reward:  -0.3
[[ 0.04172624  0.04222544  0.06785682  0.0654697   0.06820694  0.06567492
   0.06667881  0.06701618  0.06784012  0.06736764  0.06607629  0.06691605
   0.04894549  0.04797756  0.0486325   0.04880536  0.052584  ]]
4.1006
[[ 0.28748214  0.28733239  0.27964297  0.28035912  0.27953795  0.28029755
   0.27999637  0.27989516  0.27964798  0.27978972  0.28017712  0.2799252
   0.28531638  0.28560674  0.28541026 -0.01464161  0.28422481]
 [ 0.28748214  0.28733239  0.27964297  0.28035912  0.27953795  0.28029755
   0.27999637  0.27989516  0.27964798  0.27978972 -0.01982289  0.2799252
   0.28531638  0.28560674  0.28541026  0.2853584   0.28422481]]
Epoch: 4113	Loss: 2.50762631893	Example Output: 0-	Example Reward:  1
[[ 0.04173639  0.04223249  0.06787205  0.06546028  0.06820253  0.06568821
   0.06666987  0.06702852  0.06783825  0.06736572  0.06605195  0.06689275
   0.04894843  0.04798502  0.04863639  0.04880091  0.05259034]]
2.822

Epoch: 4125	Loss: 3.06717088223	Example Output: 67	Example Reward:  1
[[ 0.04177759  0.04222998  0.06805681  0.06540927  0.06815176  0.06597061
   0.06636207  0.0670632   0.0677822   0.06733911  0.06610461  0.06670191
   0.04893413  0.04788828  0.04879108  0.04886076  0.05257672]]
2.80602
[[-0.04177759 -0.04222998 -0.06805681 -0.06540927 -0.06815176 -0.06597061
  -0.06636207 -0.0670632   0.93221778 -0.06733911 -0.06610461 -0.06670191
  -0.04893413 -0.04788828 -0.04879108 -0.04886076 -0.05257672]
 [-0.04177759 -0.04222998 -0.06805681 -0.06540927 -0.06815176 -0.06597061
  -0.06636207 -0.0670632  -0.0677822   0.93266088 -0.06610461 -0.06670191
  -0.04893413 -0.04788828 -0.04879108 -0.04886076 -0.05257672]]
Epoch: 4126	Loss: 3.30238790512	Example Output: +*	Example Reward:  -0.3
4.0961
[[ 0.28746921  0.28733119  0.27957982  0.28037581  0.27955636  0.28020132
   0.28009456  0.27988565  0.27965391  0.27979076  0.28017452  0.27998883
  -0.01467437  0.28564018  0.28536177  0.28534019  0.284230

Epoch: 4140	Loss: 3.19790949821	Example Output: *8	Example Reward:  -0.3
[[ 0.04175744  0.04221282  0.06802616  0.06549018  0.06793032  0.06623992
   0.06623267  0.06691963  0.06792195  0.06760208  0.06611086  0.06688375
   0.04887916  0.04782951  0.04872202  0.04877501  0.05246649]]
4.10055
[[ 0.28747278  0.28733617  0.27959216  0.28035295  0.27962092  0.28012803
   0.28013021  0.27992412  0.27962342  0.27971938  0.28016675  0.27993488
   0.28533626  0.28565115 -0.01461661  0.28536752  0.28426006]
 [ 0.28747278  0.28733617  0.27959216  0.28035295  0.27962092  0.28012803
   0.28013021  0.27992412  0.27962342  0.27971938 -0.01983326  0.27993488
   0.28533626  0.28565115  0.2853834   0.28536752  0.28426006]]
Saving Weight
Epoch: 4141	Loss: 2.65888941288	Example Output: 93	Example Reward:  1
[[ 0.04176418  0.04219904  0.06800115  0.06549374  0.06794804  0.06621532
   0.06624492  0.0669316   0.06790243  0.06761531  0.06611358  0.0669245
   0.04887433  0.04783623  0.04870969  0.04876404  0.

Epoch: 4152	Loss: 3.32931275368	Example Output: 18	Example Reward:  1
[[ 0.04175027  0.04224515  0.06800432  0.06539834  0.06806124  0.06625856
   0.06635358  0.06666587  0.06784672  0.0676283   0.066068    0.06701218
   0.04885912  0.04776114  0.04876499  0.0488048   0.05251749]]
2.80867
[[-0.04175027 -0.04224515 -0.06800432  0.93460166 -0.06806124 -0.06625856
  -0.06635358 -0.06666587 -0.06784672 -0.0676283  -0.066068   -0.06701218
  -0.04885912 -0.04776114 -0.04876499 -0.0488048  -0.05251749]
 [-0.04175027 -0.04224515 -0.06800432 -0.06539834 -0.06806124 -0.06625856
  -0.06635358 -0.06666587 -0.06784672 -0.0676283   0.93393201 -0.06701218
  -0.04885912 -0.04776114 -0.04876499 -0.0488048  -0.05251749]]
Epoch: 4153	Loss: 2.79230742455	Example Output: 8/	Example Reward:  1
[[ 0.04176288  0.04226116  0.06799553  0.06541185  0.06803788  0.06628808
   0.06635176  0.06666765  0.06782888  0.06760895  0.06606551  0.06700183
   0.04888718  0.04775114  0.0487809   0.04879485  0.05250397]]
2.823

Epoch: 4164	Loss: 3.32803397179	Example Output: 2	Example Reward:  1
[[ 0.0416873   0.04225021  0.06795047  0.06539659  0.06787917  0.06644168
   0.06633374  0.06653161  0.06791688  0.06767555  0.06612225  0.06713286
   0.04894635  0.04773313  0.04867161  0.04882318  0.05250747]]
2.81826
[[-0.0416873  -0.04225021 -0.06795047 -0.06539659  0.9321208  -0.06644168
  -0.06633374 -0.06653161 -0.06791688 -0.06767555 -0.06612225 -0.06713286
  -0.04894635 -0.04773313 -0.04867161 -0.04882318 -0.05250747]
 [-0.0416873  -0.04225021 -0.06795047 -0.06539659 -0.06787917 -0.06644168
  -0.06633374 -0.06653161 -0.06791688 -0.06767555 -0.06612225 -0.06713286
  -0.04894635 -0.04773313 -0.04867161 -0.04882318  0.94749254]]
Epoch: 4165	Loss: 3.06884119511	Example Output: *5	Example Reward:  -0.3
[[ 0.04166603  0.04220332  0.06792865  0.06537381  0.06789505  0.06640824
   0.06641097  0.06655816  0.06792486  0.06767065  0.0661594   0.0671736
   0.04893091  0.04774044  0.04863787  0.04879468  0.05252335]]
4.10

Epoch: 4176	Loss: 2.78458197117	Example Output: 38	Example Reward:  1
[[ 0.04155949  0.042122    0.06792738  0.06550524  0.0678779   0.06625126
   0.06674236  0.06638195  0.06794976  0.06791496  0.06607454  0.0675858
   0.04892577  0.04768423  0.04830687  0.04866929  0.05252122]]
2.80771
[[-0.04155949 -0.042122   -0.06792738 -0.06550524 -0.0678779   0.93374872
  -0.06674236 -0.06638195 -0.06794976 -0.06791496 -0.06607454 -0.0675858
  -0.04892577 -0.04768423 -0.04830687 -0.04866929 -0.05252122]
 [-0.04155949 -0.042122   -0.06792738 -0.06550524 -0.0678779  -0.06625126
  -0.06674236 -0.06638195 -0.06794976 -0.06791496  0.93392545 -0.0675858
  -0.04892577 -0.04768423 -0.04830687 -0.04866929 -0.05252122]]
Epoch: 4177	Loss: 3.04662239552	Example Output: +Y	Example Reward:  -0.3
[[ 0.04154309  0.04210056  0.06793657  0.06551428  0.06788837  0.06625897
   0.06675352  0.06637663  0.06793667  0.06790187  0.06612132  0.06764284
   0.04890551  0.04766749  0.04828624  0.0486501   0.05251602]]
4.093

Epoch: 4188	Loss: 3.19680085182	Example Output: 4	Example Reward:  1
[[ 0.04167499  0.0422      0.06778263  0.06544675  0.06776639  0.06625555
   0.06672381  0.06605807  0.06791186  0.06804159  0.0660222   0.06771911
   0.04890346  0.04772445  0.04839554  0.0487433   0.05263034]]
2.81888
[[-0.04167499 -0.0422     -0.06778263 -0.06544675 -0.06776639 -0.06625555
   0.93327618 -0.06605807 -0.06791186 -0.06804159 -0.0660222  -0.06771911
  -0.04890346 -0.04772445 -0.04839554 -0.0487433  -0.05263034]
 [-0.04167499 -0.0422     -0.06778263 -0.06544675 -0.06776639 -0.06625555
  -0.06672381 -0.06605807 -0.06791186 -0.06804159 -0.0660222  -0.06771911
  -0.04890346 -0.04772445 -0.04839554 -0.0487433   0.94736969]]
Epoch: 4189	Loss: 3.17276732922	Example Output: 0	Example Reward:  1
2.81806
[[-0.04166913 -0.0422012   0.93220448 -0.06544849 -0.06778671 -0.06624368
  -0.06675296 -0.06602509 -0.06790984 -0.06803957 -0.06602155 -0.06769961
  -0.04889473 -0.04773132 -0.04838601 -0.04874    -0.05265468]


Epoch: 4200	Loss: 3.17195112705	Example Output: X7	Example Reward:  -0.3
[[ 0.04165913  0.04206428  0.06773946  0.0655304   0.06791117  0.06599336
   0.06679136  0.06619216  0.06770977  0.0679896   0.06605138  0.06781138
   0.04884927  0.04778113  0.04835372  0.04873314  0.05283934]]
4.09855
[[-0.01249774  0.28738073  0.27967817  0.28034088  0.27962667  0.280202
   0.2799626   0.28014237  0.27968708  0.27960312  0.2801846   0.27965659
   0.28534523  0.28566569  0.28549388  0.28538007  0.28414822]
 [ 0.28750229  0.28738073  0.27967817  0.28034088  0.27962667  0.280202
   0.2799626   0.28014237  0.27968708 -0.02039688  0.2801846   0.27965659
   0.28534523  0.28566569  0.28549388  0.28538007  0.28414822]]
Saving Weight
Epoch: 4201	Loss: 3.32434170246	Example Output: -1	Example Reward:  -0.3
[[ 0.04165377  0.04205248  0.06770732  0.06551215  0.0679354   0.06594836
   0.06678563  0.06621672  0.0676959   0.06805203  0.06600864  0.06784895
   0.04885433  0.0477895   0.048336    0.04873676  0.

Epoch: 4213	Loss: 3.58398091793	Example Output: Y5	Example Reward:  -0.3
[[ 0.0416692   0.04215338  0.06754867  0.06561706  0.06771062  0.06602701
   0.06674992  0.06593135  0.06760413  0.06804462  0.06615652  0.0678588
   0.04881546  0.04797162  0.04837574  0.04881902  0.05294681]]
4.09833
[[ 0.28749925 -0.01264602  0.27973542  0.28031489  0.27968681  0.28019193
   0.27997503  0.28022063  0.27971879  0.27958664  0.28015307  0.27964237
   0.28535536  0.28560853  0.28548729  0.28535432  0.28411597]
 [ 0.28749925  0.28735399  0.27973542  0.28031489  0.27968681  0.28019193
   0.27997503 -0.01977941  0.27971879  0.27958664  0.28015307  0.27964237
   0.28535536  0.28560853  0.28548729  0.28535432  0.28411597]]
Epoch: 4214	Loss: 3.17469930649	Example Output: +1	Example Reward:  -0.3
[[ 0.0417062   0.042183    0.06754006  0.06562516  0.06766522  0.06602222
   0.06671444  0.06589396  0.06758493  0.06802923  0.06616073  0.06782277
   0.04882739  0.04800797  0.04841156  0.0488468   0.05295838]]


Epoch: 4225	Loss: 3.32589976788	Example Output: 8	Example Reward:  1
[[ 0.04172096  0.04218879  0.06759033  0.06550287  0.06764383  0.06593531
   0.06667853  0.06588972  0.06756452  0.06809977  0.06617242  0.06785218
   0.04886946  0.04818076  0.04827492  0.04884147  0.05299418]]
2.81916
[[-0.04172096 -0.04218879 -0.06759033 -0.06550287 -0.06764383 -0.06593531
  -0.06667853 -0.06588972 -0.06756452 -0.06809977  0.93382758 -0.06785218
  -0.04886946 -0.04818076 -0.04827492 -0.04884147 -0.05299418]
 [-0.04172096 -0.04218879 -0.06759033 -0.06550287 -0.06764383 -0.06593531
  -0.06667853 -0.06588972 -0.06756452 -0.06809977 -0.06617242 -0.06785218
  -0.04886946 -0.04818076 -0.04827492 -0.04884147  0.94700581]]
Epoch: 4226	Loss: 2.91732518673	Example Output: 30	Example Reward:  1
[[ 0.04171687  0.04219104  0.06760731  0.06548052  0.06764498  0.06592137
   0.06665838  0.06593586  0.06753989  0.06807521  0.06618337  0.06781821
   0.04887756  0.04818804  0.04829058  0.04886071  0.05301005]]
2.8071

Epoch: 4237	Loss: 3.19993965626	Example Output: 1*	Example Reward:  1
[[ 0.04182314  0.04225403  0.06753724  0.06544122  0.06753528  0.06588895
   0.06643713  0.06619513  0.06735913  0.06783705  0.06622416  0.06779132
   0.04896566  0.0482636   0.04839645  0.04894563  0.0531049 ]]
2.82448
[[-0.04182314 -0.04225403 -0.06753724  0.93455875 -0.06753528 -0.06588895
  -0.06643713 -0.06619513 -0.06735913 -0.06783705 -0.06622416 -0.06779132
  -0.04896566 -0.0482636  -0.04839645 -0.04894563 -0.0531049 ]
 [-0.04182314 -0.04225403 -0.06753724 -0.06544122 -0.06753528 -0.06588895
  -0.06643713 -0.06619513 -0.06735913 -0.06783705 -0.06622416 -0.06779132
  -0.04896566 -0.0482636   0.95160353 -0.04894563 -0.0531049 ]]
Epoch: 4238	Loss: 2.91664123535	Example Output: /3	Example Reward:  -0.3
[[ 0.04182612  0.0422487   0.06754734  0.06544571  0.06751625  0.06588358
   0.06641729  0.06619216  0.0673722   0.06782192  0.06623135  0.0677935
   0.04895739  0.04826112  0.04840611  0.0489505   0.05312876]]
4.1

Epoch: 4249	Loss: 2.9433131218	Example Output: 9-	Example Reward:  1
[[ 0.04174745  0.04210481  0.06750264  0.06539671  0.06756967  0.06574979
   0.06644056  0.06636578  0.06747609  0.06794257  0.06612837  0.06809393
   0.04888172  0.04817628  0.04828522  0.04885898  0.05327935]]
2.82254
[[-0.04174745 -0.04210481 -0.06750264 -0.06539671 -0.06756967 -0.06574979
  -0.06644056 -0.06636578 -0.06747609 -0.06794257 -0.06612837  0.9319061
  -0.04888172 -0.04817628 -0.04828522 -0.04885898 -0.05327935]
 [-0.04174745 -0.04210481 -0.06750264 -0.06539671 -0.06756967 -0.06574979
  -0.06644056 -0.06636578 -0.06747609 -0.06794257 -0.06612837 -0.06809393
  -0.04888172  0.95182371 -0.04828522 -0.04885898 -0.05327935]]
Epoch: 4250	Loss: 3.06888887882	Example Output: X9	Example Reward:  -0.3
[[ 0.04174032  0.0420756   0.06753895  0.06538896  0.06755789  0.06578044
   0.06644078  0.06639649  0.06745455  0.0679355   0.06616984  0.06813128
   0.04886314  0.04819441  0.04825995  0.04881753  0.05325431]]
4.09

Epoch: 4261	Loss: 3.06712474823	Example Output: -5	Example Reward:  -0.3
[[ 0.04172137  0.04228399  0.0678158   0.06521975  0.06761698  0.06577507
   0.06634705  0.06608613  0.06723548  0.0680253   0.06615953  0.0679691
   0.04891927  0.04819656  0.04836688  0.04897795  0.05328383]]
4.10051
[[ 0.2874836   0.2873148   0.27965528  0.28043407  0.27971491  0.28026748
   0.28009591  0.28017417  0.27982938  0.27959242  0.28015214  0.27960929
   0.28532425 -0.01445897  0.28548995  0.28530663  0.28401488]
 [ 0.2874836   0.2873148   0.27965528  0.28043407  0.27971491  0.28026748
   0.28009591 -0.01982584  0.27982938  0.27959242  0.28015214  0.27960929
   0.28532425  0.28554106  0.28548995  0.28530663  0.28401488]]
Epoch: 4262	Loss: 3.19682955742	Example Output: 9	Example Reward:  1
[[ 0.04171114  0.04227971  0.06785414  0.06523851  0.06760369  0.06578483
   0.06634185  0.06606373  0.06724868  0.06802623  0.06621763  0.06796198
   0.0488963   0.04816756  0.04837345  0.04897702  0.05325351]]
2.81

Epoch: 4273	Loss: 2.2544728756	Example Output: 50	Example Reward:  1
[[ 0.04169429  0.04235953  0.06797843  0.06536587  0.06758771  0.06589066
   0.06627659  0.06586414  0.06706116  0.06780466  0.06659997  0.06780276
   0.04891738  0.04820521  0.04839317  0.0490359   0.05316264]]
2.80715
[[-0.04169429 -0.04235953 -0.06797843 -0.06536587 -0.06758771 -0.06589066
  -0.06627659  0.93413585 -0.06706116 -0.06780466 -0.06659997 -0.06780276
  -0.04891738 -0.04820521 -0.04839317 -0.0490359  -0.05316264]
 [-0.04169429 -0.04235953  0.93202156 -0.06536587 -0.06758771 -0.06589066
  -0.06627659 -0.06586414 -0.06706116 -0.06780466 -0.06659997 -0.06780276
  -0.04891738 -0.04820521 -0.04839317 -0.0490359  -0.05316264]]
Epoch: 4274	Loss: 2.81291234493	Example Output: 62	Example Reward:  1
[[ 0.04168216  0.0423219   0.06797608  0.06535495  0.06760941  0.06591174
   0.06629516  0.0659133   0.06703841  0.06781156  0.06661551  0.06780689
   0.04888504  0.0481922   0.04838711  0.04903533  0.0531633 ]]
2.8065

Epoch: 4285	Loss: 3.19917564392	Example Output: 78	Example Reward:  1
[[ 0.04161543  0.04220323  0.06779657  0.06555261  0.06767463  0.06589168
   0.06636322  0.06608966  0.06700764  0.06772872  0.06672024  0.06780972
   0.04878891  0.04820607  0.04835131  0.04908368  0.05311673]]
2.80656
[[-0.04161543 -0.04220323 -0.06779657 -0.06555261 -0.06767463 -0.06589168
  -0.06636322 -0.06608966 -0.06700764  0.9322713  -0.06672024 -0.06780972
  -0.04878891 -0.04820607 -0.04835131 -0.04908368 -0.05311673]
 [-0.04161543 -0.04220323 -0.06779657 -0.06555261 -0.06767463 -0.06589168
  -0.06636322 -0.06608966 -0.06700764 -0.06772872  0.93327975 -0.06780972
  -0.04878891 -0.04820607 -0.04835131 -0.04908368 -0.05311673]]
Epoch: 4286	Loss: 2.37650437355	Example Output: 71	Example Reward:  1
[[ 0.04161315  0.04219016  0.06779028  0.06552959  0.06766309  0.06589299
   0.066372    0.06608532  0.06696053  0.06773402  0.06678986  0.06784581
   0.04878206  0.04821249  0.0483504   0.04907612  0.0531121 ]]
2.807

Epoch: 4298	Loss: 2.76280896664	Example Output: YY	Example Reward:  -0.3
[[ 0.04159381  0.04211326  0.06772206  0.06561238  0.06754744  0.06608622
   0.0663517   0.06607915  0.06691637  0.06772405  0.06691547  0.06806377
   0.04871332  0.04811564  0.04838048  0.04904335  0.05302161]]
4.09162
[[ 0.28752187 -0.01263398  0.27968338  0.28031629  0.27973577  0.28017414
   0.2800945   0.28017628  0.27992511  0.27968279  0.27992538  0.27958086
   0.28538603  0.28556532  0.28548586  0.28528699  0.28409353]
 [ 0.28752187 -0.01263398  0.27968338  0.28031629  0.27973577  0.28017414
   0.2800945   0.28017628  0.27992511  0.27968279  0.27992538  0.27958086
   0.28538603  0.28556532  0.28548586  0.28528699  0.28409353]]
Epoch: 4299	Loss: 3.17552773952	Example Output: X	Example Reward:  1
[[ 0.04160271  0.04213202  0.06771635  0.06560632  0.06755853  0.06611957
   0.06632948  0.06604655  0.06690284  0.06770307  0.06690938  0.06802903
   0.04871963  0.0481277   0.0484075   0.04905047  0.05303877]]
2.8

Epoch: 4310	Loss: 2.78644669056	Example Output: 41	Example Reward:  1
[[ 0.04158828  0.04204739  0.0677689   0.06570642  0.06744076  0.06621782
   0.06625709  0.06612132  0.06699949  0.06783033  0.06693488  0.06804693
   0.04858811  0.04807528  0.04830876  0.04909187  0.05297644]]
2.80821
[[-0.04158828 -0.04204739 -0.0677689  -0.06570642 -0.06744076 -0.06621782
   0.93374288 -0.06612132 -0.06699949 -0.06783033 -0.06693488 -0.06804693
  -0.04858811 -0.04807528 -0.04830876 -0.04909187 -0.05297644]
 [-0.04158828 -0.04204739 -0.0677689   0.93429357 -0.06744076 -0.06621782
  -0.06625709 -0.06612132 -0.06699949 -0.06783033 -0.06693488 -0.06804693
  -0.04858811 -0.04807528 -0.04830876 -0.04909187 -0.05297644]]
Saving Weight
Epoch: 4311	Loss: 3.06647446156	Example Output: Y7	Example Reward:  -0.3
[[ 0.04155765  0.04201091  0.06780276  0.06572304  0.06743445  0.06617792
   0.06634839  0.06612694  0.06698181  0.06784749  0.06699004  0.06808779
   0.04857108  0.04808774  0.04825321  0.04904684  0

Epoch: 4322	Loss: 2.53532292843	Example Output: 59	Example Reward:  1
[[ 0.04152327  0.04189846  0.06770005  0.06586061  0.0673947   0.06632245
   0.0664459   0.06613328  0.06691986  0.06793756  0.06714196  0.06835954
   0.04844743  0.04799051  0.04805288  0.04889223  0.05297936]]
2.80604
[[-0.04152327 -0.04189846 -0.06770005 -0.06586061 -0.0673947  -0.06632245
  -0.0664459   0.93386674 -0.06691986 -0.06793756 -0.06714196 -0.06835954
  -0.04844743 -0.04799051 -0.04805288 -0.04889223 -0.05297936]
 [-0.04152327 -0.04189846 -0.06770005 -0.06586061 -0.0673947  -0.06632245
  -0.0664459  -0.06613328 -0.06691986 -0.06793756 -0.06714196  0.93164045
  -0.04844743 -0.04799051 -0.04805288 -0.04889223 -0.05297936]]
Epoch: 4323	Loss: 3.06870601177	Example Output: *	Example Reward:  -0.3
[[ 0.0415061   0.04187335  0.06773935  0.06585671  0.06743748  0.06632353
   0.06645596  0.06620614  0.06691502  0.06793016  0.06716681  0.06834902
   0.04843994  0.04795642  0.04802373  0.04886971  0.05295054]]
4.0

Epoch: 4334	Loss: 2.91845345497	Example Output: 94	Example Reward:  1
[[ 0.04144774  0.04183098  0.06775857  0.06588045  0.06772183  0.06620754
   0.06657446  0.06611521  0.06696135  0.06792329  0.06730361  0.06836355
   0.04836429  0.04786977  0.04797294  0.04881105  0.05289341]]
2.80551
[[-0.04144774 -0.04183098 -0.06775857 -0.06588045 -0.06772183 -0.06620754
  -0.06657446 -0.06611521 -0.06696135 -0.06792329 -0.06730361  0.93163645
  -0.04836429 -0.04786977 -0.04797294 -0.04881105 -0.05289341]
 [-0.04144774 -0.04183098 -0.06775857 -0.06588045 -0.06772183 -0.06620754
   0.93342555 -0.06611521 -0.06696135 -0.06792329 -0.06730361 -0.06836355
  -0.04836429 -0.04786977 -0.04797294 -0.04881105 -0.05289341]]
Epoch: 4335	Loss: 2.91883649826	Example Output: 0/	Example Reward:  1
[[ 0.04146073  0.04184509  0.06775901  0.06586364  0.06772072  0.06627294
   0.06655721  0.06609907  0.06693133  0.06792098  0.06730033  0.06835671
   0.04836081  0.04786746  0.04798188  0.04881373  0.0528884 ]]
2.821

Epoch: 4346	Loss: 3.07158575058	Example Output: 15	Example Reward:  1
[[ 0.04154008  0.04193881  0.06784142  0.065688    0.06769074  0.06634269
   0.0663959   0.06612884  0.06698898  0.06784943  0.06714177  0.06821914
   0.04834536  0.04783332  0.04816507  0.04903753  0.05285281]]
2.80803
[[-0.04154008 -0.04193881 -0.06784142  0.93431199 -0.06769074 -0.06634269
  -0.0663959  -0.06612884 -0.06698898 -0.06784943 -0.06714177 -0.06821914
  -0.04834536 -0.04783332 -0.04816507 -0.04903753 -0.05285281]
 [-0.04154008 -0.04193881 -0.06784142 -0.065688   -0.06769074 -0.06634269
  -0.0663959   0.93387115 -0.06698898 -0.06784943 -0.06714177 -0.06821914
  -0.04834536 -0.04783332 -0.04816507 -0.04903753 -0.05285281]]
Epoch: 4347	Loss: 2.50599293709	Example Output: 72	Example Reward:  1
[[ 0.04153587  0.04194989  0.06782366  0.06572849  0.06769025  0.0663375
   0.0663738   0.06613285  0.06698497  0.06784754  0.06713414  0.06819241
   0.04833482  0.04783713  0.04816403  0.0490733   0.05285932]]
2.8052

Epoch: 4358	Loss: 3.32469291687	Example Output: *7	Example Reward:  -0.3
[[ 0.04150139  0.04193194  0.0678953   0.06562397  0.06785398  0.06638916
   0.06632439  0.0660583   0.06688758  0.06792282  0.06719565  0.06828631
   0.04834992  0.04780091  0.04811964  0.04898941  0.0528694 ]]
4.10058
[[ 0.28754959  0.28742042  0.27963144  0.28031281  0.2796438   0.28008327
   0.2801027   0.28018254  0.27993375  0.27962315  0.2798413   0.27951413
   0.28549504  0.28565973 -0.01443589  0.28530318  0.28413919]
 [ 0.28754959  0.28742042  0.27963144  0.28031281  0.2796438   0.28008327
   0.2801027   0.28018254  0.27993375 -0.02037685  0.2798413   0.27951413
   0.28549504  0.28565973  0.28556412  0.28530318  0.28413919]]
Epoch: 4359	Loss: 2.78590183258	Example Output: 68	Example Reward:  1
2.80622
[[-0.04150013 -0.04192189 -0.06787752 -0.06566263 -0.06784482 -0.06639604
  -0.06634612 -0.06606398  0.93307841 -0.06790499 -0.06718931 -0.06829063
  -0.04833347 -0.04779596 -0.04810064 -0.04897131 -0.05287

Epoch: 4373	Loss: 3.07608056068	Example Output: 2+	Example Reward:  1
[[ 0.04155226  0.04201931  0.0677928   0.0658091   0.06785725  0.06645331
   0.06637111  0.0659952   0.06713933  0.06778734  0.06697091  0.06800508
   0.04824256  0.04778859  0.04818511  0.04912768  0.0529031 ]]
2.82221
[[-0.04155226 -0.04201931 -0.0677928  -0.0658091   0.93214273 -0.06645331
  -0.06637111 -0.0659952  -0.06713933 -0.06778734 -0.06697091 -0.06800508
  -0.04824256 -0.04778859 -0.04818511 -0.04912768 -0.0529031 ]
 [-0.04155226 -0.04201931 -0.0677928  -0.0658091  -0.06785725 -0.06645331
  -0.06637111 -0.0659952  -0.06713933 -0.06778734 -0.06697091 -0.06800508
   0.95175743 -0.04778859 -0.04818511 -0.04912768 -0.0529031 ]]
Epoch: 4374	Loss: 2.37763798237	Example Output: 5*	Example Reward:  1
[[ 0.04155849  0.0420263   0.06778919  0.0658156   0.06783784  0.06648183
   0.06633263  0.06599603  0.0671243   0.06778546  0.06699044  0.06800867
   0.04824447  0.04778692  0.04818992  0.04914362  0.05288826]]
2.823

Epoch: 4385	Loss: 2.66207940578	Example Output: **	Example Reward:  -0.3
[[ 0.04157055  0.04203084  0.06782654  0.06575537  0.0678101   0.0663525
   0.06627811  0.06600681  0.06717163  0.06780528  0.06689677  0.0679534
   0.04841018  0.04785467  0.04815802  0.04914083  0.05297849]]
4.09552
[[ 0.28752884  0.28739074  0.27965206  0.28027341  0.27965698  0.28009427
   0.28011659  0.28019798  0.27984852  0.27965844  0.27993098  0.279614
   0.28547695  0.28564361 -0.01444741  0.28525776  0.28410646]
 [ 0.28752884  0.28739074  0.27965206  0.28027341  0.27965698  0.28009427
   0.28011659  0.28019798  0.27984852  0.27965844  0.27993098  0.279614
   0.28547695  0.28564361 -0.01444741  0.28525776  0.28410646]]
Epoch: 4386	Loss: 3.19744634628	Example Output: 2Y	Example Reward:  -0.3
[[ 0.04156756  0.04201654  0.06780891  0.06578325  0.06781716  0.0663133
   0.06629106  0.06603953  0.0671594   0.06781613  0.06691778  0.06798034
   0.04841032  0.04784717  0.0481242   0.04912233  0.05298502]]
4.0986

Epoch: 4397	Loss: 3.1999994278	Example Output: /6	Example Reward:  -0.3
[[ 0.0415146   0.04186991  0.0678881   0.06588183  0.06798913  0.06637196
   0.06624145  0.06619135  0.06715608  0.06779816  0.06704064  0.06802324
   0.04825857  0.04768617  0.04814563  0.04904646  0.05289678]]
4.10067
[[ 0.28754565  0.28743902  0.27963358  0.28023547  0.27960327  0.28008842
   0.28012758  0.28014261  0.27985319  0.27966058  0.27988783  0.27959302
   0.28552246  0.28569415  0.28555632 -0.01471394  0.28413096]
 [ 0.28754565  0.28743902  0.27963358  0.28023547  0.27960327  0.28008842
   0.28012758  0.28014261 -0.02014682  0.27966058  0.27988783  0.27959302
   0.28552246  0.28569415  0.28555632  0.28528607  0.28413096]]
Epoch: 4398	Loss: 3.32350780964	Example Output: 3X	Example Reward:  -0.3
[[ 0.0415266   0.0418891   0.06788971  0.06586974  0.06796701  0.06643178
   0.06621265  0.06620166  0.06711745  0.06777596  0.06707379  0.06800961
   0.04825107  0.04767597  0.04817146  0.04904895  0.05288741]]


Epoch: 4409	Loss: 2.78671052456	Example Output: 92	Example Reward:  1
[[ 0.041619    0.04178376  0.06790307  0.0659131   0.0680488   0.06647641
   0.06601778  0.06650701  0.06688306  0.06765644  0.06731018  0.06792977
   0.04824954  0.04771176  0.04817014  0.04903834  0.05278188]]
2.80481
[[-0.041619   -0.04178376 -0.06790307 -0.0659131  -0.0680488  -0.06647641
  -0.06601778 -0.06650701 -0.06688306 -0.06765644 -0.06731018  0.93207026
  -0.04824954 -0.04771176 -0.04817014 -0.04903834 -0.05278188]
 [-0.041619   -0.04178376 -0.06790307 -0.0659131   0.93195122 -0.06647641
  -0.06601778 -0.06650701 -0.06688306 -0.06765644 -0.06731018 -0.06792977
  -0.04824954 -0.04771176 -0.04817014 -0.04903834 -0.05278188]]
Epoch: 4410	Loss: 2.78379635811	Example Output: 32	Example Reward:  1
[[ 0.04161739  0.0417515   0.06790739  0.06596608  0.06805238  0.06650668
   0.06600115  0.06654824  0.06691695  0.06763174  0.06729329  0.06795917
   0.04822914  0.04768282  0.04816309  0.04901447  0.0527584 ]]
2.805

Epoch: 4421	Loss: 3.07079150677	Example Output: 0+	Example Reward:  1
[[ 0.04149567  0.04146329  0.06793027  0.06599631  0.06818558  0.06644388
   0.06601329  0.06690225  0.06710714  0.06763949  0.06743429  0.06814475
   0.04812927  0.04761713  0.04801418  0.04884668  0.05263652]]
2.82174
[[-0.04149567 -0.04146329  0.93206972 -0.06599631 -0.06818558 -0.06644388
  -0.06601329 -0.06690225 -0.06710714 -0.06763949 -0.06743429 -0.06814475
  -0.04812927 -0.04761713 -0.04801418 -0.04884668 -0.05263652]
 [-0.04149567 -0.04146329 -0.06793027 -0.06599631 -0.06818558 -0.06644388
  -0.06601329 -0.06690225 -0.06710714 -0.06763949 -0.06743429 -0.06814475
   0.95187074 -0.04761713 -0.04801418 -0.04884668 -0.05263652]]
Epoch: 4422	Loss: 3.06621117592	Example Output: 88	Example Reward:  1
[[ 0.04149392  0.04147191  0.06793869  0.06597294  0.06815688  0.06646679
   0.06599384  0.06690504  0.06709778  0.06764948  0.06741693  0.06816515
   0.04815674  0.04762191  0.04800669  0.0488492   0.05263612]]
2.805

Epoch: 4433	Loss: 2.37911064625	Example Output: 0-	Example Reward:  1
[[ 0.04167055  0.04160563  0.06777345  0.06594146  0.06790508  0.06657635
   0.06590611  0.06681058  0.06700027  0.06753512  0.06739887  0.06833507
   0.04816771  0.04760752  0.04813147  0.04898848  0.05264633]]
2.82262
[[-0.04167055 -0.04160563  0.93222654 -0.06594146 -0.06790508 -0.06657635
  -0.06590611 -0.06681058 -0.06700027 -0.06753512 -0.06739887 -0.06833507
  -0.04816771 -0.04760752 -0.04813147 -0.04898848 -0.05264633]
 [-0.04167055 -0.04160563 -0.06777345 -0.06594146 -0.06790508 -0.06657635
  -0.06590611 -0.06681058 -0.06700027 -0.06753512 -0.06739887 -0.06833507
  -0.04816771  0.95239246 -0.04813147 -0.04898848 -0.05264633]]
Epoch: 4434	Loss: 3.19730563164	Example Output: 3	Example Reward:  1
[[ 0.04167199  0.04160388  0.06776758  0.06595992  0.0678781   0.06659906
   0.06591927  0.06681766  0.06698564  0.0675018   0.06739536  0.06833567
   0.0481562   0.04762032  0.04814989  0.04898789  0.05264978]]
2.8184

Epoch: 4445	Loss: 2.76256349087	Example Output: YX	Example Reward:  -0.3
4.09085
[[ 0.28751543 -0.01245562  0.27965257  0.28016254  0.27966124  0.27996105
   0.28018713  0.27991638  0.27987099  0.2798073   0.27977639  0.27951747
   0.285588    0.28571361  0.2855432   0.28535378  0.28422874]
 [-0.01248458  0.2875444   0.27965257  0.28016254  0.27966124  0.27996105
   0.28018713  0.27991638  0.27987099  0.2798073   0.27977639  0.27951747
   0.285588    0.28571361  0.2855432   0.28535378  0.28422874]]
Epoch: 4446	Loss: 2.93702116013	Example Output: 14	Example Reward:  1
[[ 0.04159732  0.04150913  0.06781109  0.06609491  0.06780318  0.06677392
   0.06609789  0.06694087  0.06711573  0.06734326  0.06738049  0.06831442
   0.0480511   0.04761598  0.04818532  0.04879482  0.05257056]]
2.80732
[[-0.04159732 -0.04150913 -0.06781109  0.93390507 -0.06780318 -0.06677392
  -0.06609789 -0.06694087 -0.06711573 -0.06734326 -0.06738049 -0.06831442
  -0.0480511  -0.04761598 -0.04818532 -0.04879482 -0.05257

Epoch: 4460	Loss: 3.07114937305	Example Output: 11	Example Reward:  1
[[ 0.0414896   0.04135231  0.06801274  0.06588521  0.06781922  0.06672692
   0.06606431  0.06692621  0.06731799  0.06762725  0.06740779  0.06859498
   0.04799948  0.04753545  0.04795864  0.04875834  0.05252357]]
2.80738
[[-0.0414896  -0.04135231 -0.06801274  0.93411481 -0.06781922 -0.06672692
  -0.06606431 -0.06692621 -0.06731799 -0.06762725 -0.06740779 -0.06859498
  -0.04799948 -0.04753545 -0.04795864 -0.04875834 -0.05252357]
 [-0.0414896  -0.04135231 -0.06801274  0.93411481 -0.06781922 -0.06672692
  -0.06606431 -0.06692621 -0.06731799 -0.06762725 -0.06740779 -0.06859498
  -0.04799948 -0.04753545 -0.04795864 -0.04875834 -0.05252357]]
Saving Weight
Epoch: 4461	Loss: 3.17261488438	Example Output: /0	Example Reward:  -0.3
[[ 0.04148839  0.04139463  0.06800987  0.06592377  0.06776002  0.06675247
   0.06604166  0.06688104  0.06731408  0.06760231  0.06742783  0.06857161
   0.04800007  0.04753685  0.04797712  0.0487938   0

Epoch: 4472	Loss: 3.19620535374	Example Output: *0	Example Reward:  -0.3
[[ 0.04144831  0.04141043  0.06801131  0.06607421  0.06779512  0.06679257
   0.06601036  0.06684706  0.06723958  0.06743879  0.0675469   0.06859589
   0.04804781  0.04756695  0.04790904  0.04878029  0.05248541]]
4.10025
[[ 0.28756553  0.28757688  0.27959663  0.28017774  0.27966148  0.27996224
   0.28019691  0.27994588  0.27982813  0.27976838  0.27973595  0.27942124
   0.28558567  0.28572991 -0.01437271  0.28536594  0.2842544 ]
 [ 0.28756553  0.28757688 -0.02040339  0.28017774  0.27966148  0.27996224
   0.28019691  0.27994588  0.27982813  0.27976838  0.27973595  0.27942124
   0.28558567  0.28572991  0.28562731  0.28536594  0.2842544 ]]
Epoch: 4473	Loss: 3.19650199413	Example Output: 9+	Example Reward:  1
[[ 0.0414362   0.04140277  0.06800848  0.0661284   0.06781802  0.06675632
   0.06601756  0.06685387  0.06723841  0.06740807  0.06756251  0.06859094
   0.04805338  0.04758725  0.04787558  0.0487841   0.05247828]]
2.

Epoch: 4484	Loss: 3.45675935745	Example Output: 1	Example Reward:  1
[[ 0.04142334  0.04137938  0.06810566  0.06623691  0.06772769  0.0665307
   0.06601692  0.06693357  0.06743085  0.06735656  0.06752226  0.06859484
   0.04814577  0.04768114  0.04772557  0.04883393  0.05235489]]
2.8186
[[-0.04142334 -0.04137938 -0.06810566  0.93376309 -0.06772769 -0.0665307
  -0.06601692 -0.06693357 -0.06743085 -0.06735656 -0.06752226 -0.06859484
  -0.04814577 -0.04768114 -0.04772557 -0.04883393 -0.05235489]
 [-0.04142334 -0.04137938 -0.06810566 -0.06623691 -0.06772769 -0.0665307
  -0.06601692 -0.06693357 -0.06743085 -0.06735656 -0.06752226 -0.06859484
  -0.04814577 -0.04768114 -0.04772557 -0.04883393  0.94764513]]
Epoch: 4485	Loss: 2.91468496323	Example Output: -*	Example Reward:  -0.3
[[ 0.04142842  0.04140292  0.06807719  0.06624283  0.06770313  0.06650979
   0.06598658  0.06691623  0.06740437  0.06735352  0.067521    0.06857709
   0.04816972  0.04771449  0.04775098  0.04886487  0.05237691]]
4.09489

Epoch: 4499	Loss: 3.32766819	Example Output: /4	Example Reward:  -0.3
[[ 0.04136517  0.04136253  0.06818537  0.06641772  0.06787657  0.06662188
   0.06575836  0.06709884  0.06755096  0.06728898  0.06736801  0.06839773
   0.04811196  0.04756898  0.04773849  0.04894597  0.05234257]]
4.10003
[[ 0.28759047  0.28759125  0.27954438  0.28007472  0.27963704  0.28001344
   0.28027251  0.27987036  0.27973473  0.27981332  0.2797896   0.2794807
   0.28556642  0.28572932  0.28567848 -0.01468379  0.28429723]
 [ 0.28759047  0.28759125  0.27954438  0.28007472  0.27963704  0.28001344
  -0.01972751  0.27987036  0.27973473  0.27981332  0.2797896   0.2794807
   0.28556642  0.28572932  0.28567848  0.28531623  0.28429723]]
Epoch: 4500	Loss: 3.06563367844	Example Output: 03	Example Reward:  1
[[ 0.04138105  0.04138149  0.06819215  0.06636707  0.06788324  0.0666094
   0.06573807  0.06708067  0.06753512  0.06731972  0.06735642  0.06838384
   0.0481223   0.04756089  0.04780646  0.04894451  0.05233764]]
2.80509


Epoch: 4511	Loss: 3.06872596741	Example Output: 6/	Example Reward:  1
[[ 0.04116745  0.04120153  0.06834484  0.06647038  0.06799944  0.06651875
   0.06598309  0.06705701  0.06760124  0.0674134   0.06767686  0.06845227
   0.04798796  0.04750783  0.04760393  0.0487856   0.05222845]]
2.82073
[[-0.04116745 -0.04120153 -0.06834484 -0.06647038 -0.06799944 -0.06651875
  -0.06598309 -0.06705701  0.93239874 -0.0674134  -0.06767686 -0.06845227
  -0.04798796 -0.04750783 -0.04760393 -0.0487856  -0.05222845]
 [-0.04116745 -0.04120153 -0.06834484 -0.06647038 -0.06799944 -0.06651875
  -0.06598309 -0.06705701 -0.06760124 -0.0674134  -0.06767686 -0.06845227
  -0.04798796 -0.04750783 -0.04760393  0.95121437 -0.05222845]]
Epoch: 4512	Loss: 3.06812503338	Example Output: 43	Example Reward:  1
[[ 0.04116552  0.04121324  0.06831089  0.0664783   0.06795432  0.06651495
   0.06597474  0.06700771  0.06765804  0.06745608  0.06764239  0.06844804
   0.04798477  0.04750276  0.04761818  0.04881575  0.0522543 ]]
2.806

Epoch: 4523	Loss: 3.32226405144	Example Output: 12	Example Reward:  1
[[ 0.04105214  0.0412677   0.06824906  0.06684613  0.06767745  0.06638296
   0.06612382  0.06688068  0.06763731  0.06715722  0.06804559  0.06846049
   0.04808849  0.04754201  0.04759986  0.04883932  0.05214972]]
2.80495
[[-0.04105214 -0.0412677  -0.06824906  0.93315387 -0.06767745 -0.06638296
  -0.06612382 -0.06688068 -0.06763731 -0.06715722 -0.06804559 -0.06846049
  -0.04808849 -0.04754201 -0.04759986 -0.04883932 -0.05214972]
 [-0.04105214 -0.0412677  -0.06824906 -0.06684613  0.93232256 -0.06638296
  -0.06612382 -0.06688068 -0.06763731 -0.06715722 -0.06804559 -0.06846049
  -0.04808849 -0.04754201 -0.04759986 -0.04883932 -0.05214972]]
Epoch: 4524	Loss: 3.19587776661	Example Output: +X	Example Reward:  -0.3
[[ 0.04103394  0.04124719  0.06822641  0.06683039  0.06774693  0.06634629
   0.06614338  0.06695582  0.06760654  0.06715889  0.06805065  0.06845968
   0.04810286  0.04754166  0.04757044  0.04883346  0.05214556]]
4.

Epoch: 4535	Loss: 2.24846782684	Example Output: 82	Example Reward:  1
[[ 0.0409526   0.04113927  0.068254    0.06687979  0.06814483  0.0663022
   0.06614594  0.06690353  0.06769742  0.06740865  0.06794538  0.06845129
   0.04801833  0.04739471  0.04747794  0.0487844   0.05209965]]
2.80355
[[-0.0409526  -0.04113927 -0.068254   -0.06687979 -0.06814483 -0.0663022
  -0.06614594 -0.06690353 -0.06769742 -0.06740865  0.93205464 -0.06845129
  -0.04801833 -0.04739471 -0.04747794 -0.0487844  -0.05209965]
 [-0.0409526  -0.04113927 -0.068254   -0.06687979  0.9318552  -0.0663022
  -0.06614594 -0.06690353 -0.06769742 -0.06740865 -0.06794538 -0.06845129
  -0.04801833 -0.04739471 -0.04747794 -0.0487844  -0.05209965]]
Epoch: 4536	Loss: 2.91116445065	Example Output: 32	Example Reward:  1
[[ 0.04092443  0.04110036  0.06824751  0.06694597  0.06819249  0.06629302
   0.06618403  0.06691122  0.06769182  0.06736882  0.06802404  0.06845246
   0.04799742  0.04739245  0.04745353  0.04875329  0.05206718]]
2.80468


Epoch: 4547	Loss: 3.07022764683	Example Output: 86	Example Reward:  1
[[ 0.04088192  0.04106673  0.06814884  0.06706399  0.0681329   0.06658794
   0.06608215  0.06684811  0.06774223  0.06732821  0.06804174  0.06848502
   0.04796391  0.04742042  0.04741589  0.04871695  0.05207299]]
2.80366
[[-0.04088192 -0.04106673 -0.06814884 -0.06706399 -0.0681329  -0.06658794
  -0.06608215 -0.06684811 -0.06774223 -0.06732821  0.93195826 -0.06848502
  -0.04796391 -0.04742042 -0.04741589 -0.04871695 -0.05207299]
 [-0.04088192 -0.04106673 -0.06814884 -0.06706399 -0.0681329  -0.06658794
  -0.06608215 -0.06684811  0.93225777 -0.06732821 -0.06804174 -0.06848502
  -0.04796391 -0.04742042 -0.04741589 -0.04871695 -0.05207299]]
Epoch: 4548	Loss: 3.17350802422	Example Output: XY	Example Reward:  -0.3
[[ 0.04090586  0.04108218  0.06813677  0.06708725  0.06807724  0.06657142
   0.06605862  0.06681117  0.0677797   0.06732268  0.06803345  0.06848229
   0.04798935  0.04742445  0.04742081  0.04874763  0.05206906]]
4.

Epoch: 4559	Loss: 2.6598929882	Example Output: 3*	Example Reward:  1
[[ 0.04077136  0.04107858  0.06834779  0.06711809  0.06810549  0.06643365
   0.06614876  0.0666306   0.06803191  0.06736219  0.06806961  0.06844078
   0.04804419  0.0474371   0.04731514  0.04871487  0.05194984]]
2.82272
[[-0.04077136 -0.04107858 -0.06834779 -0.06711809 -0.06810549  0.93356633
  -0.06614876 -0.0666306  -0.06803191 -0.06736219 -0.06806961 -0.06844078
  -0.04804419 -0.0474371  -0.04731514 -0.04871487 -0.05194984]
 [-0.04077136 -0.04107858 -0.06834779 -0.06711809 -0.06810549 -0.06643365
  -0.06614876 -0.0666306  -0.06803191 -0.06736219 -0.06806961 -0.06844078
  -0.04804419 -0.0474371   0.95268488 -0.04871487 -0.05194984]]
Epoch: 4560	Loss: 3.06762475967	Example Output: 56	Example Reward:  1
[[ 0.04074894  0.04104896  0.06831517  0.06715247  0.06810866  0.06639943
   0.06619555  0.0666275   0.06808375  0.06736407  0.06804249  0.06847876
   0.04802986  0.04744339  0.04731242  0.04868962  0.05195895]]
2.8043

Epoch: 4571	Loss: 3.30135874748	Example Output: 0	Example Reward:  1
[[ 0.04066895  0.04108572  0.06837655  0.06721042  0.0680531   0.06662065
   0.06620765  0.06658933  0.06810064  0.06732548  0.06800376  0.06841808
   0.04798963  0.04745135  0.0473172   0.04864377  0.05193777]]
2.81654
[[-0.04066895 -0.04108572  0.93162346 -0.06721042 -0.0680531  -0.06662065
  -0.06620765 -0.06658933 -0.06810064 -0.06732548 -0.06800376 -0.06841808
  -0.04798963 -0.04745135 -0.0473172  -0.04864377 -0.05193777]
 [-0.04066895 -0.04108572 -0.06837655 -0.06721042 -0.0680531  -0.06662065
  -0.06620765 -0.06658933 -0.06810064 -0.06732548 -0.06800376 -0.06841808
  -0.04798963 -0.04745135 -0.0473172  -0.04864377  0.94806224]]
Epoch: 4572	Loss: 3.19182701111	Example Output: -Y	Example Reward:  -0.3
[[ 0.04068944  0.04110844  0.06837338  0.06722423  0.06804547  0.0666642
   0.06618109  0.06658496  0.06807538  0.06729855  0.06800399  0.06839877
   0.04798052  0.04743271  0.04733752  0.04865106  0.05195035]]
4.09

Epoch: 4583	Loss: 3.58551366329	Example Output: -1	Example Reward:  -0.3
[[ 0.04073868  0.04119308  0.06816058  0.0671888   0.06814981  0.06664002
   0.06610087  0.06661922  0.06806955  0.06744953  0.06767719  0.06828316
   0.04799321  0.04745314  0.04733419  0.04880882  0.05214015]]
4.09959
[[ 0.28777841  0.28764209  0.27955183  0.27984336  0.27955508  0.28000802
   0.28016976  0.28001425  0.27957913  0.27976516  0.27969685  0.27951506
   0.28560206 -0.01423594  0.28579974  0.28535736  0.28435796]
 [ 0.28777841  0.28764209  0.27955183 -0.02015664  0.27955508  0.28000802
   0.28016976  0.28001425  0.27957913  0.27976516  0.27969685  0.27951506
   0.28560206  0.28576407  0.28579974  0.28535736  0.28435796]]
Epoch: 4584	Loss: 3.19596617222	Example Output: 29	Example Reward:  1
[[ 0.04077905  0.04122377  0.06813901  0.06716396  0.06814127  0.06662539
   0.06608918  0.06659443  0.06803989  0.06744973  0.06761184  0.06827338
   0.04801409  0.04745631  0.04738787  0.04883144  0.05217936]]
2.

Epoch: 4595	Loss: 2.78198208809	Example Output: 83	Example Reward:  1
[[ 0.04082854  0.04127569  0.06813347  0.06714613  0.06805079  0.06661312
   0.06607566  0.06654271  0.06800966  0.06731471  0.06771545  0.06835447
   0.04801941  0.04746534  0.04748657  0.0488308   0.05213745]]
2.80491
[[-0.04082854 -0.04127569 -0.06813347 -0.06714613 -0.06805079 -0.06661312
  -0.06607566 -0.06654271 -0.06800966 -0.06731471  0.93228453 -0.06835447
  -0.04801941 -0.04746534 -0.04748657 -0.0488308  -0.05213745]
 [-0.04082854 -0.04127569 -0.06813347 -0.06714613 -0.06805079  0.93338686
  -0.06607566 -0.06654271 -0.06800966 -0.06731471 -0.06771545 -0.06835447
  -0.04801941 -0.04746534 -0.04748657 -0.0488308  -0.05213745]]
Epoch: 4596	Loss: 2.91702523232	Example Output: X9	Example Reward:  -0.3
[[ 0.04081871  0.04125729  0.06812229  0.06716118  0.06804025  0.06663183
   0.06609198  0.06651346  0.0680275   0.06734935  0.06774934  0.06837378
   0.04799397  0.04746371  0.04746094  0.04881006  0.05213446]]
4.

Epoch: 4607	Loss: 3.06633000374	Example Output: /5	Example Reward:  -0.3
[[ 0.04071641  0.04124823  0.0682961   0.0671263   0.06789017  0.06666054
   0.06626066  0.06632979  0.06797612  0.06753593  0.06791163  0.0686426
   0.04792752  0.04736928  0.04734817  0.04870668  0.05205394]]
4.09975
[[ 0.28778508  0.28762555  0.27951118  0.27986214  0.27963296  0.28000185
   0.28012183  0.28010109  0.27960718  0.27973923  0.27962652  0.27940723
   0.28562176  0.28578922  0.28579557 -0.014612    0.28438383]
 [ 0.28778508  0.28762555  0.27951118  0.27986214  0.27963296  0.28000185
   0.28012183 -0.01989894  0.27960718  0.27973923  0.27962652  0.27940723
   0.28562176  0.28578922  0.28579557  0.28538802  0.28438383]]
Epoch: 4608	Loss: 3.32363319397	Example Output: 36	Example Reward:  1
[[ 0.04071401  0.04125721  0.06825326  0.06714336  0.06786612  0.0666329
   0.06627893  0.06627849  0.06798583  0.06759496  0.06788924  0.06869323
   0.04791947  0.04738194  0.04732572  0.04871376  0.05207156]]
2.80

Epoch: 4619	Loss: 2.94093587399	Example Output: 64	Example Reward:  1
[[ 0.04064234  0.0411068   0.06814725  0.06705443  0.06813779  0.06653018
   0.06641793  0.06647332  0.06785195  0.06778817  0.06788072  0.06876475
   0.04794177  0.04738208  0.04720777  0.0484792   0.05219354]]
2.80457
[[-0.04064234 -0.0411068  -0.06814725 -0.06705443 -0.06813779 -0.06653018
  -0.06641793 -0.06647332  0.93214804 -0.06778817 -0.06788072 -0.06876475
  -0.04794177 -0.04738208 -0.04720777 -0.0484792  -0.05219354]
 [-0.04064234 -0.0411068  -0.06814725 -0.06705443 -0.06813779 -0.06653018
   0.93358207 -0.06647332 -0.06785195 -0.06778817 -0.06788072 -0.06876475
  -0.04794177 -0.04738208 -0.04720777 -0.0484792  -0.05219354]]
Epoch: 4620	Loss: 3.17136809826	Example Output: Y9	Example Reward:  -0.3
[[ 0.04062961  0.04109396  0.06811095  0.06707479  0.06813694  0.06654793
   0.06644763  0.06648098  0.06790499  0.06777676  0.06787384  0.06875236
   0.04791785  0.04737816  0.04720842  0.04846158  0.05220326]]
4.

Epoch: 4631	Loss: 2.78385784626	Example Output: 14	Example Reward:  1
[[ 0.04072148  0.04118793  0.06793165  0.06700142  0.06799145  0.06677346
   0.06635336  0.06647676  0.06769209  0.06788879  0.06785844  0.06872223
   0.04797801  0.04737919  0.047343    0.04849104  0.05220974]]
2.80538
[[-0.04072148 -0.04118793 -0.06793165  0.9329986  -0.06799145 -0.06677346
  -0.06635336 -0.06647676 -0.06769209 -0.06788879 -0.06785844 -0.06872223
  -0.04797801 -0.04737919 -0.047343   -0.04849104 -0.05220974]
 [-0.04072148 -0.04118793 -0.06793165 -0.06700142 -0.06799145 -0.06677346
   0.93364662 -0.06647676 -0.06769209 -0.06788879 -0.06785844 -0.06872223
  -0.04797801 -0.04737919 -0.047343   -0.04849104 -0.05220974]]
Epoch: 4632	Loss: 3.45233633518	Example Output: 9-	Example Reward:  1
[[ 0.04071528  0.04119039  0.06794794  0.06706338  0.06794889  0.06678103
   0.06636693  0.06644742  0.06772117  0.06789351  0.06785876  0.06871848
   0.04796265  0.04737023  0.04732797  0.0484942   0.05219179]]
2.820

Epoch: 4643	Loss: 3.19620249271	Example Output: 43	Example Reward:  1
[[ 0.04072707  0.04130816  0.06792021  0.06697845  0.06804202  0.06670752
   0.06650054  0.06633396  0.06758184  0.06784654  0.06786135  0.06871534
   0.0480715   0.04740549  0.04733861  0.04851646  0.052145  ]]
2.80558
[[-0.04072707 -0.04130816 -0.06792021 -0.06697845 -0.06804202 -0.06670752
   0.93349946 -0.06633396 -0.06758184 -0.06784654 -0.06786135 -0.06871534
  -0.0480715  -0.04740549 -0.04733861 -0.04851646 -0.052145  ]
 [-0.04072707 -0.04130816 -0.06792021 -0.06697845 -0.06804202  0.93329251
  -0.06650054 -0.06633396 -0.06758184 -0.06784654 -0.06786135 -0.06871534
  -0.0480715  -0.04740549 -0.04733861 -0.04851646 -0.052145  ]]
Epoch: 4644	Loss: 2.52892036438	Example Output: 64	Example Reward:  1
[[ 0.04071196  0.04131554  0.06796918  0.06694579  0.06806921  0.06677201
   0.06647623  0.06634063  0.06757787  0.06784275  0.06783751  0.06868237
   0.04808086  0.04737584  0.04734351  0.04853639  0.05212231]]
2.804

Epoch: 4655	Loss: 3.06804196835	Example Output: 81	Example Reward:  1
[[ 0.04062202  0.04125868  0.06800508  0.06675384  0.06801763  0.06682362
   0.06660382  0.06626535  0.06762305  0.0681004   0.06780426  0.06878492
   0.04803354  0.04743413  0.04725734  0.04847699  0.05213536]]
2.80445
[[-0.04062202 -0.04125868 -0.06800508 -0.06675384 -0.06801763 -0.06682362
  -0.06660382 -0.06626535 -0.06762305 -0.0681004   0.93219572 -0.06878492
  -0.04803354 -0.04743413 -0.04725734 -0.04847699 -0.05213536]
 [-0.04062202 -0.04125868 -0.06800508  0.93324614 -0.06801763 -0.06682362
  -0.06660382 -0.06626535 -0.06762305 -0.0681004  -0.06780426 -0.06878492
  -0.04803354 -0.04743413 -0.04725734 -0.04847699 -0.05213536]]
Epoch: 4656	Loss: 2.93981645107	Example Output: 47	Example Reward:  1
[[ 0.04061906  0.04126663  0.06796764  0.06678139  0.06800036  0.0668468
   0.06662295  0.06624215  0.06759726  0.0680704   0.06787165  0.06879751
   0.04801288  0.04742169  0.0473001   0.04846163  0.05211981]]
2.8043

Epoch: 4667	Loss: 3.06643862724	Example Output: 00	Example Reward:  1
[[ 0.04053967  0.04118527  0.06802279  0.06708089  0.06796494  0.06671595
   0.06665933  0.06633458  0.06774727  0.06804784  0.06791373  0.06867376
   0.04800065  0.04736971  0.04729148  0.04840406  0.05204806]]
2.80322
[[-0.04053967 -0.04118527  0.93197721 -0.06708089 -0.06796494 -0.06671595
  -0.06665933 -0.06633458 -0.06774727 -0.06804784 -0.06791373 -0.06867376
  -0.04800065 -0.04736971 -0.04729148 -0.04840406 -0.05204806]
 [-0.04053967 -0.04118527  0.93197721 -0.06708089 -0.06796494 -0.06671595
  -0.06665933 -0.06633458 -0.06774727 -0.06804784 -0.06791373 -0.06867376
  -0.04800065 -0.04736971 -0.04729148 -0.04840406 -0.05204806]]
Epoch: 4668	Loss: 2.91558372974	Example Output: -2	Example Reward:  -0.3
[[ 0.04051796  0.04117232  0.06808468  0.0670972   0.06799044  0.06671778
   0.06666891  0.06633039  0.06773615  0.06803816  0.06794249  0.06866004
   0.04799943  0.04734667  0.04729485  0.0483865   0.052016  ]]
4.

Epoch: 4679	Loss: 2.37426891327	Example Output: 73	Example Reward:  1
[[ 0.04038039  0.04107266  0.06813262  0.06714555  0.06802085  0.06673073
   0.06682874  0.06642703  0.06785873  0.06814621  0.06786878  0.06858505
   0.04795541  0.04729708  0.04726675  0.04831881  0.0519647 ]]
2.80388
[[-0.04038039 -0.04107266 -0.06813262 -0.06714555 -0.06802085 -0.06673073
  -0.06682874 -0.06642703 -0.06785873  0.93185377 -0.06786878 -0.06858505
  -0.04795541 -0.04729708 -0.04726675 -0.04831881 -0.0519647 ]
 [-0.04038039 -0.04107266 -0.06813262 -0.06714555 -0.06802085  0.93326926
  -0.06682874 -0.06642703 -0.06785873 -0.06814621 -0.06786878 -0.06858505
  -0.04795541 -0.04729708 -0.04726675 -0.04831881 -0.0519647 ]]
Epoch: 4680	Loss: 2.93823945522	Example Output: 34	Example Reward:  1
[[ 0.04035423  0.04106121  0.06812096  0.06716102  0.06805626  0.06674583
   0.06686407  0.06639635  0.06787369  0.06819977  0.06783279  0.06858188
   0.04795052  0.04727511  0.04725279  0.04829912  0.05197444]]
2.804

Epoch: 4691	Loss: 3.04571731091	Example Output: +8	Example Reward:  -0.3
[[ 0.04040679  0.04117246  0.06827337  0.06700902  0.06799573  0.06692624
   0.0666642   0.0663733   0.06777202  0.06808634  0.06775141  0.06832843
   0.04806622  0.0473563   0.04740681  0.04842546  0.05198598]]
4.09978
[[ 0.28787798  0.28764829  0.27951801  0.2798973   0.27960131  0.27992213
   0.28000075  0.28008804  0.27966839  0.27957413  0.27967459  0.27950147
  -0.01441987  0.28579313  0.28577799  0.28547239  0.28440422]
 [ 0.28787798  0.28764829  0.27951801  0.2798973   0.27960131  0.27992213
   0.28000075  0.28008804  0.27966839  0.27957413 -0.02032542  0.27950147
   0.28558016  0.28579313  0.28577799  0.28547239  0.28440422]]
Epoch: 4692	Loss: 3.71390321255	Example Output: +/	Example Reward:  -0.3
[[ 0.04045192  0.04121521  0.06827714  0.06695503  0.06799127  0.0669554
   0.06662188  0.06635316  0.06772884  0.06806221  0.06772031  0.06829742
   0.04810598  0.04736707  0.04744522  0.0484529   0.05199901]]


Epoch: 4703	Loss: 2.78448944092	Example Output: Y8	Example Reward:  -0.3
[[ 0.04064486  0.04142442  0.06821461  0.06675286  0.06783976  0.06716958
   0.06653313  0.06619081  0.06754525  0.0680095   0.06761964  0.06831508
   0.04823918  0.04750154  0.04755958  0.04843018  0.05201008]]
4.09769
[[ 0.28780654 -0.01242733  0.27953562  0.27997416  0.2796481   0.27984914
   0.28004006  0.28014275  0.27973643  0.27959716  0.27971414  0.27950549
   0.28552827  0.28574955  0.28573215  0.28547096  0.28439701]
 [ 0.28780654  0.28757268  0.27953562  0.27997416  0.2796481   0.27984914
   0.28004006  0.28014275  0.27973643  0.27959716 -0.02028589  0.27950549
   0.28552827  0.28574955  0.28573215  0.28547096  0.28439701]]
Epoch: 4704	Loss: 2.78836534023	Example Output: 1	Example Reward:  1
[[ 0.04064004  0.04142264  0.06823343  0.06673937  0.06782669  0.06723458
   0.06650548  0.06618727  0.06748989  0.06800033  0.0676896   0.06831897
   0.04823866  0.04749211  0.0475618   0.04841469  0.05200449]]
2.8

Epoch: 4715	Loss: 3.06858267784	Example Output: 58	Example Reward:  1
[[ 0.04069256  0.04137266  0.0681546   0.06681923  0.06774572  0.06735026
   0.06636765  0.0662054   0.06755728  0.06796445  0.06765167  0.06818891
   0.04820277  0.04754617  0.04764856  0.04844751  0.05208462]]
2.80526
[[-0.04069256 -0.04137266 -0.0681546  -0.06681923 -0.06774572 -0.06735026
  -0.06636765  0.93379462 -0.06755728 -0.06796445 -0.06765167 -0.06818891
  -0.04820277 -0.04754617 -0.04764856 -0.04844751 -0.05208462]
 [-0.04069256 -0.04137266 -0.0681546  -0.06681923 -0.06774572 -0.06735026
  -0.06636765 -0.0662054  -0.06755728 -0.06796445  0.93234831 -0.06818891
  -0.04820277 -0.04754617 -0.04764856 -0.04844751 -0.05208462]]
Epoch: 4716	Loss: 3.04091792107	Example Output: X4	Example Reward:  -0.3
[[ 0.04067787  0.04135463  0.06816166  0.06685344  0.06775509  0.06732433
   0.06637682  0.06622094  0.06756291  0.06794374  0.06770078  0.06817286
   0.04821178  0.04753901  0.04763508  0.04844388  0.05206526]]
4.

Epoch: 4727	Loss: 3.04463453293	Example Output: 5Y	Example Reward:  -0.3
[[ 0.04083626  0.04148207  0.06798878  0.06680706  0.06764624  0.06711616
   0.06634348  0.06603646  0.06786834  0.06798669  0.06735375  0.06797735
   0.04832492  0.04766594  0.04775536  0.0486194   0.05219176]]
4.09752
[[ 0.28774914  0.2875554   0.27960339  0.27995789  0.27970612  0.27986518
   0.28009698 -0.01981094  0.27963951  0.27960402  0.27979389  0.27960679
   0.28550252  0.28570023  0.28567341  0.28541419  0.2843425 ]
 [ 0.28774914 -0.01244462  0.27960339  0.27995789  0.27970612  0.27986518
   0.28009698  0.28018907  0.27963951  0.27960402  0.27979389  0.27960679
   0.28550252  0.28570023  0.28567341  0.28541419  0.2843425 ]]
Epoch: 4728	Loss: 3.19422698021	Example Output: 74	Example Reward:  1
[[ 0.04084721  0.04149501  0.06801185  0.06677561  0.0676496   0.06710638
   0.06631467  0.06600274  0.06789877  0.06798622  0.06732824  0.06795119
   0.04834606  0.0476734   0.04777555  0.04865106  0.05218643]]
2.

Epoch: 4739	Loss: 3.19291460514	Example Output: 43	Example Reward:  1
[[ 0.04097907  0.04160735  0.06793636  0.06677208  0.06735558  0.06706005
   0.0661581   0.0660345   0.06775025  0.06789478  0.06736748  0.06786668
   0.04854637  0.0478003   0.04787882  0.04884057  0.05215167]]
2.80635
[[-0.04097907 -0.04160735 -0.06793636 -0.06677208 -0.06735558 -0.06706005
   0.93384188 -0.0660345  -0.06775025 -0.06789478 -0.06736748 -0.06786668
  -0.04854637 -0.0478003  -0.04787882 -0.04884057 -0.05215167]
 [-0.04097907 -0.04160735 -0.06793636 -0.06677208 -0.06735558  0.93293995
  -0.0661581  -0.0660345  -0.06775025 -0.06789478 -0.06736748 -0.06786668
  -0.04854637 -0.0478003  -0.04787882 -0.04884057 -0.05215167]]
Epoch: 4740	Loss: 3.04348709583	Example Output: /5	Example Reward:  -0.3
[[ 0.04097858  0.0416092   0.06791949  0.06677657  0.06738202  0.06705978
   0.06615801  0.06602944  0.06771012  0.067886    0.0674116   0.06786905
   0.0485518   0.04780383  0.04787364  0.0488339   0.05214696]]
4.

Epoch: 4751	Loss: 3.04429388046	Example Output: 5/	Example Reward:  1
2.82254
[[-0.04107924 -0.04181419 -0.06766106 -0.0667292  -0.06720529 -0.067256
  -0.06605938  0.93401504 -0.06768315 -0.06783668 -0.06725364 -0.06773552
  -0.0486098  -0.04791408 -0.04811539 -0.04891083 -0.05215161]
 [-0.04107924 -0.04181419 -0.06766106 -0.0667292  -0.06720529 -0.067256
  -0.06605938 -0.06598496 -0.06768315 -0.06783668 -0.06725364 -0.06773552
  -0.0486098  -0.04791408 -0.04811539  0.95108914 -0.05215161]]
Epoch: 4752	Loss: 3.4533295393	Example Output: 24	Example Reward:  1
[[ 0.04110368  0.04182516  0.06765158  0.06672422  0.06719559  0.06723399
   0.06603592  0.06604169  0.06767856  0.06782036  0.06722043  0.06769161
   0.04861798  0.04792224  0.04812566  0.04895797  0.05215335]]
2.80666
[[-0.04110368 -0.04182516 -0.06765158 -0.06672422  0.93280441 -0.06723399
  -0.06603592 -0.06604169 -0.06767856 -0.06782036 -0.06722043 -0.06769161
  -0.04861798 -0.04792224 -0.04812566 -0.04895797 -0.05215335]
 [-

Epoch: 4766	Loss: 3.06441884041	Example Output: 61	Example Reward:  1
[[ 0.04106551  0.04170094  0.06772481  0.06685627  0.06698313  0.06751607
   0.06622602  0.06604993  0.0674971   0.06779724  0.06741417  0.06784523
   0.04853161  0.04783564  0.04802524  0.04882301  0.05210806]]
2.80562
[[-0.04106551 -0.04170094 -0.06772481 -0.06685627 -0.06698313 -0.06751607
  -0.06622602 -0.06604993  0.93250293 -0.06779724 -0.06741417 -0.06784523
  -0.04853161 -0.04783564 -0.04802524 -0.04882301 -0.05210806]
 [-0.04106551 -0.04170094 -0.06772481  0.93314373 -0.06698313 -0.06751607
  -0.06622602 -0.06604993 -0.0674971  -0.06779724 -0.06741417 -0.06784523
  -0.04853161 -0.04783564 -0.04802524 -0.04882301 -0.05210806]]
Epoch: 4767	Loss: 3.32323870659	Example Output: +2	Example Reward:  -0.3
[[ 0.04104013  0.0416647   0.06773102  0.06690413  0.06700293  0.06752487
   0.06627595  0.06604587  0.06757058  0.06780473  0.06741004  0.06785301
   0.04849212  0.04780978  0.04798383  0.04879055  0.05209571]]
4.

Epoch: 4778	Loss: 2.63405354023	Example Output: X2	Example Reward:  -0.3
[[ 0.04097752  0.04163364  0.06782454  0.06694207  0.06694697  0.06749658
   0.06628807  0.06609108  0.06771365  0.06775928  0.06746553  0.06774191
   0.04841605  0.04769989  0.04809706  0.04882307  0.05208306]]
4.09769
[[-0.01229326  0.28750992  0.27965266  0.27991739  0.27991593  0.27975103
   0.28011361  0.28017271  0.27968591  0.27967224  0.27976036  0.27967742
   0.28547519  0.28569004  0.28557089  0.28535309  0.2843751 ]
 [ 0.28770676  0.28750992  0.27965266  0.27991739 -0.02008409  0.27975103
   0.28011361  0.28017271  0.27968591  0.27967224  0.27976036  0.27967742
   0.28547519  0.28569004  0.28557089  0.28535309  0.2843751 ]]
Epoch: 4779	Loss: 3.04445252419	Example Output: 6	Example Reward:  1
[[ 0.04098668  0.04164604  0.06780893  0.06694844  0.06693035  0.06747776
   0.06627431  0.06606568  0.06768035  0.06778572  0.06746095  0.06773928
   0.04841991  0.0477198   0.04811442  0.0488437   0.05209764]]
2.8

Epoch: 4793	Loss: 3.19875948429	Example Output: 75	Example Reward:  1
[[ 0.0411243   0.04167321  0.06764636  0.06707209  0.06680448  0.0675496
   0.06619709  0.06598367  0.06759144  0.06773554  0.06749673  0.06766433
   0.04835771  0.04779405  0.04819867  0.04893163  0.05217916]]
2.80615
[[-0.0411243  -0.04167321 -0.06764636 -0.06707209 -0.06680448 -0.0675496
  -0.06619709 -0.06598367 -0.06759144  0.93226445 -0.06749673 -0.06766433
  -0.04835771 -0.04779405 -0.04819867 -0.04893163 -0.05217916]
 [-0.0411243  -0.04167321 -0.06764636 -0.06707209 -0.06680448 -0.0675496
  -0.06619709  0.93401635 -0.06759144 -0.06773554 -0.06749673 -0.06766433
  -0.04835771 -0.04779405 -0.04819867 -0.04893163 -0.05217916]]
Epoch: 4794	Loss: 2.6653824091	Example Output: 4*	Example Reward:  1
[[ 0.04113103  0.04167176  0.06764991  0.06706287  0.06678435  0.06754483
   0.06617601  0.06598143  0.06757078  0.06778133  0.06750211  0.06765537
   0.04834704  0.04782093  0.04820206  0.04893122  0.05218701]]
2.82302
[

Epoch: 4805	Loss: 3.17298057079	Example Output: -3	Example Reward:  -0.3
[[ 0.04098812  0.04158933  0.06747437  0.06712176  0.06689814  0.06738205
   0.06661917  0.06599953  0.06758101  0.06775365  0.06753586  0.067785
   0.04826187  0.04789431  0.04809861  0.04876572  0.05225153]]
4.10014
[[ 0.28770357  0.28752321  0.27975771  0.27986348  0.27993056  0.27978539
   0.28001428  0.28020015  0.2797257   0.2796739   0.27973926  0.27966452
   0.28552145 -0.01436829  0.28557041  0.28537029  0.28432456]
 [ 0.28770357  0.28752321  0.27975771  0.27986348  0.27993056 -0.02021462
   0.28001428  0.28020015  0.2797257   0.2796739   0.27973926  0.27966452
   0.28552145  0.28563172  0.28557041  0.28537029  0.28432456]]
Epoch: 4806	Loss: 3.06796104908	Example Output: 67	Example Reward:  1
[[ 0.04099086  0.0415954   0.06747977  0.06714512  0.06688322  0.06736585
   0.06661581  0.06600402  0.06757976  0.0677456   0.06752355  0.06778219
   0.04825522  0.04790312  0.04808982  0.04877099  0.05226964]]
2.80

Epoch: 4817	Loss: 3.19801347256	Example Output: 7*	Example Reward:  1
[[ 0.04083467  0.04140558  0.06748571  0.06748683  0.06684989  0.06719916
   0.06686702  0.06613439  0.06782717  0.06762625  0.06758135  0.06785484
   0.04818321  0.04791022  0.04782939  0.04873622  0.05218809]]
2.8219
[[-0.04083467 -0.04140558 -0.06748571 -0.06748683 -0.06684989 -0.06719916
  -0.06686702 -0.06613439 -0.06782717  0.93237376 -0.06758135 -0.06785484
  -0.04818321 -0.04791022 -0.04782939 -0.04873622 -0.05218809]
 [-0.04083467 -0.04140558 -0.06748571 -0.06748683 -0.06684989 -0.06719916
  -0.06686702 -0.06613439 -0.06782717 -0.06762625 -0.06758135 -0.06785484
  -0.04818321 -0.04791022  0.95217061 -0.04873622 -0.05218809]]
Epoch: 4818	Loss: 3.19563586712	Example Output: 44	Example Reward:  1
[[ 0.0408357   0.04139708  0.06746574  0.06750087  0.06681345  0.06718355
   0.06688895  0.06615064  0.06783177  0.0676066   0.06757446  0.06787535
   0.04819211  0.04790905  0.0478481   0.04874906  0.05217746]]
2.8056

Epoch: 4829	Loss: 3.07058928013	Example Output: 0+	Example Reward:  1
[[ 0.04085507  0.04142206  0.06744656  0.06769034  0.06683304  0.0671676
   0.06692244  0.06632316  0.06781987  0.06755559  0.06742957  0.06764586
   0.04824679  0.04787727  0.0478607   0.04873509  0.05216905]]
2.82163
[[-0.04085507 -0.04142206  0.93255341 -0.06769034 -0.06683304 -0.0671676
  -0.06692244 -0.06632316 -0.06781987 -0.06755559 -0.06742957 -0.06764586
  -0.04824679 -0.04787727 -0.0478607  -0.04873509 -0.05216905]
 [-0.04085507 -0.04142206 -0.06744656 -0.06769034 -0.06683304 -0.0671676
  -0.06692244 -0.06632316 -0.06781987 -0.06755559 -0.06742957 -0.06764586
   0.9517532  -0.04787727 -0.0478607  -0.04873509 -0.05216905]]
Epoch: 4830	Loss: 3.33120186329	Example Output: Y0	Example Reward:  -0.3
[[ 0.04086547  0.04145567  0.06748357  0.06773268  0.06679758  0.06718207
   0.06688012  0.06630538  0.06778324  0.0675009   0.06742042  0.06758957
   0.0482918   0.04786812  0.04790572  0.04878037  0.05215734]]
4.097

Epoch: 4841	Loss: 2.22577366829	Example Output: 21	Example Reward:  1
[[ 0.04092683  0.04137031  0.06762986  0.06793308  0.06678891  0.06700803
   0.0669538   0.06645466  0.06791642  0.06735361  0.06737695  0.06754838
   0.04825553  0.04776649  0.04791602  0.0487326   0.05206855]]
2.80498
[[-0.04092683 -0.04137031 -0.06762986 -0.06793308  0.93321109 -0.06700803
  -0.0669538  -0.06645466 -0.06791642 -0.06735361 -0.06737695 -0.06754838
  -0.04825553 -0.04776649 -0.04791602 -0.0487326  -0.05206855]
 [-0.04092683 -0.04137031 -0.06762986  0.93206692 -0.06678891 -0.06700803
  -0.0669538  -0.06645466 -0.06791642 -0.06735361 -0.06737695 -0.06754838
  -0.04825553 -0.04776649 -0.04791602 -0.0487326  -0.05206855]]
Epoch: 4842	Loss: 2.93804423809	Example Output: 4-	Example Reward:  1
[[ 0.0409271   0.0413497   0.06764527  0.06792335  0.0668193   0.06701451
   0.06696544  0.06649388  0.06791288  0.06734352  0.06735685  0.06756562
   0.04826787  0.04774694  0.04791781  0.04870196  0.05204796]]
2.822

Epoch: 4856	Loss: 3.32228403091	Example Output: +/	Example Reward:  -0.3
[[ 0.04102908  0.04151997  0.06754231  0.06782016  0.06665742  0.0670224
   0.06697257  0.06678082  0.06771313  0.06720056  0.06705811  0.0672829
   0.04843348  0.04793906  0.04806809  0.04879964  0.05216028]]
4.09549
[[ 0.2876913   0.28754404  0.27973732  0.27965397  0.28000277  0.27989331
   0.27990824  0.27996576  0.27968606  0.27983984  0.27988258  0.27981514
  -0.01453004  0.28561831  0.28557959  0.28536013  0.28435194]
 [ 0.2876913   0.28754404  0.27973732  0.27965397  0.28000277  0.27989331
   0.27990824  0.27996576  0.27968606  0.27983984  0.27988258  0.27981514
   0.28546998  0.28561831  0.28557959 -0.01463989  0.28435194]]
Epoch: 4857	Loss: 3.07266118526	Example Output: 6	Example Reward:  1
[[ 0.04103821  0.04150108  0.06750412  0.06782496  0.06666356  0.06698062
   0.0670204   0.06682686  0.06770817  0.06719989  0.0670542   0.06727903
   0.04843422  0.04795597  0.04806462  0.04878276  0.05216132]]
2.817

Epoch: 4868	Loss: 3.32480611801	Example Output: +9	Example Reward:  -0.3
[[ 0.04106864  0.04149738  0.06750572  0.06782279  0.06658521  0.06702613
   0.06709176  0.0668155   0.0676424   0.06716561  0.06715737  0.06720605
   0.04846226  0.04798954  0.04812894  0.04876227  0.05207241]]
4.10031
[[ 0.2876794   0.28755081  0.27974829  0.27965316  0.28002447  0.27989218
   0.27987248  0.27995536  0.27970728  0.27985033  0.27985281  0.2798382
  -0.01453868  0.28560314  0.28556132  0.28537133  0.28437829]
 [ 0.2876794   0.28755081  0.27974829  0.27965316  0.28002447  0.27989218
   0.27987248  0.27995536  0.27970728  0.27985033  0.27985281 -0.02016182
   0.28546134  0.28560314  0.28556132  0.28537133  0.28437829]]
Epoch: 4869	Loss: 2.65599250793	Example Output: 08	Example Reward:  1
2.80532
[[-0.04106271 -0.04148262  0.932482   -0.06778413 -0.06664017 -0.06707015
  -0.06709272 -0.06680619 -0.06764164 -0.06719377 -0.06715017 -0.06720878
  -0.0484508  -0.04796705 -0.0481231  -0.0487479  -0.052060

Epoch: 4880	Loss: 3.45864861012	Example Output: /4	Example Reward:  -0.3
[[ 0.04096429  0.0412798   0.06743184  0.06800622  0.06647363  0.06696121
   0.06740198  0.06679002  0.06772603  0.06721861  0.06744945  0.06769087
   0.04832761  0.04788286  0.04783731  0.04856935  0.05198905]]
4.1002
[[ 0.28771073  0.28761607  0.27977046  0.27959815  0.28005794  0.27991164
   0.2797794   0.27996299  0.27968222  0.27983442  0.27976519  0.27969277
   0.28550172  0.28563514  0.28564882 -0.01457081  0.28440329]
 [ 0.28771073  0.28761607  0.27977046  0.27959815  0.28005794  0.27991164
  -0.0202206   0.27996299  0.27968222  0.27983442  0.27976519  0.27969277
   0.28550172  0.28563514  0.28564882  0.28542921  0.28440329]]
Saving Weight
Epoch: 4881	Loss: 3.19496917725	Example Output: 61	Example Reward:  1
[[ 0.04099102  0.04131653  0.06742235  0.06798154  0.06643762  0.0669463
   0.06737269  0.06675141  0.06768648  0.06721937  0.06745508  0.06767937
   0.04836084  0.04792163  0.04786442  0.04859524  0.0

Epoch: 4892	Loss: 3.20061476231	Example Output: 8Y	Example Reward:  -0.3
[[ 0.04102874  0.04137425  0.06764556  0.06800476  0.06632178  0.06716905
   0.06723969  0.06668468  0.06771936  0.06706375  0.06750815  0.06745597
   0.04838029  0.04783295  0.04801113  0.04864765  0.05191223]]
4.09788
[[ 0.28769138  0.28758773  0.27970636  0.27959856  0.28010347  0.27984929
   0.2798281   0.27999461  0.27968422  0.27988088 -0.02025245  0.27976322
   0.28548592  0.28565013  0.28559667  0.28540573  0.28442633]
 [ 0.28769138 -0.01241228  0.27970636  0.27959856  0.28010347  0.27984929
   0.2798281   0.27999461  0.27968422  0.27988088  0.27974758  0.27976322
   0.28548592  0.28565013  0.28559667  0.28540573  0.28442633]]
Epoch: 4893	Loss: 3.32423963547	Example Output: +3	Example Reward:  -0.3
[[ 0.04104797  0.04136271  0.0676036   0.0680235   0.06630642  0.06716223
   0.06723886  0.06670345  0.06767899  0.06702828  0.06754857  0.06745386
   0.04839373  0.04786693  0.04803228  0.04864088  0.05190771]]

Epoch: 4904	Loss: 2.25287578106	Example Output: 0*	Example Reward:  1
[[ 0.04108059  0.04137408  0.06769697  0.06814626  0.06608161  0.06713293
   0.06719352  0.06670105  0.06754508  0.06685059  0.06778815  0.0675616
   0.04851088  0.04785153  0.04805997  0.04860592  0.05181927]]
2.82172
[[-0.04108059 -0.04137408  0.93230301 -0.06814626 -0.06608161 -0.06713293
  -0.06719352 -0.06670105 -0.06754508 -0.06685059 -0.06778815 -0.0675616
  -0.04851088 -0.04785153 -0.04805997 -0.04860592 -0.05181927]
 [-0.04108059 -0.04137408 -0.06769697 -0.06814626 -0.06608161 -0.06713293
  -0.06719352 -0.06670105 -0.06754508 -0.06685059 -0.06778815 -0.0675616
  -0.04851088 -0.04785153  0.95194006 -0.04860592 -0.05181927]]
Epoch: 4905	Loss: 3.32316241264	Example Output: 81	Example Reward:  1
[[ 0.04108939  0.04139011  0.06773385  0.06812148  0.0660554   0.06713597
   0.06715827  0.06667688  0.06751406  0.06686607  0.06779308  0.0675617
   0.04852466  0.04784242  0.04806671  0.04863338  0.05183665]]
2.80424
[

Epoch: 4916	Loss: 3.06686491966	Example Output: 50	Example Reward:  1
[[ 0.04106136  0.04146316  0.06777936  0.0679045   0.06608078  0.06714489
   0.06703487  0.06665928  0.06764267  0.06696276  0.0676273   0.06753669
   0.04864344  0.04778303  0.04809241  0.04876092  0.0518226 ]]
2.80541
[[-0.04106136 -0.04146316 -0.06777936 -0.0679045  -0.06608078 -0.06714489
  -0.06703487  0.93334073 -0.06764267 -0.06696276 -0.0676273  -0.06753669
  -0.04864344 -0.04778303 -0.04809241 -0.04876092 -0.0518226 ]
 [-0.04106136 -0.04146316  0.93222064 -0.0679045  -0.06608078 -0.06714489
  -0.06703487 -0.06665928 -0.06764267 -0.06696276 -0.0676273  -0.06753669
  -0.04864344 -0.04778303 -0.04809241 -0.04876092 -0.0518226 ]]
Epoch: 4917	Loss: 2.92153217793	Example Output: 02	Example Reward:  1
[[ 0.04105902  0.04143997  0.06779605  0.06789988  0.06611473  0.06712142
   0.06702974  0.066714    0.06768779  0.06694021  0.06758686  0.06751737
   0.04865982  0.04776704  0.04810147  0.04875339  0.05181119]]
2.805

Epoch: 4928	Loss: 3.19938495159	Example Output: /5	Example Reward:  -0.3
[[ 0.04120707  0.04136007  0.0676207   0.06761664  0.0661296   0.06718452
   0.06680957  0.0671863   0.06748762  0.06682138  0.06756864  0.0676076
   0.04867873  0.0477613   0.04824229  0.04878943  0.05192858]]
4.1004
[[ 0.28763789  0.28759199  0.27971381  0.27971503  0.28016111  0.27984467
   0.27995715  0.27984414  0.27975374  0.2799536   0.27972943  0.27971774
   0.2853964   0.28567162  0.28552732 -0.01463683  0.28442144]
 [ 0.28763789  0.28759199  0.27971381  0.27971503  0.28016111  0.27984467
   0.27995715 -0.02015589  0.27975374  0.2799536   0.27972943  0.27971774
   0.2853964   0.28567162  0.28552732  0.28536317  0.28442144]]
Epoch: 4929	Loss: 3.19470727444	Example Output: 41	Example Reward:  1
[[ 0.04122005  0.04138045  0.06763773  0.06762043  0.0661554   0.06723276
   0.06677203  0.06718277  0.06743824  0.06678393  0.0675694   0.06759147
   0.0486997   0.04774588  0.04826206  0.04879     0.05191779]]
2.80

Epoch: 4940	Loss: 3.0712182045	Example Output: 18	Example Reward:  1
[[ 0.04112272  0.041332    0.06737965  0.06772919  0.0662773   0.0672143
   0.06680693  0.06725767  0.06757664  0.06682948  0.06743457  0.06760864
   0.04870213  0.04782567  0.04817113  0.04876197  0.05197002]]
2.80494
[[-0.04112272 -0.041332   -0.06737965  0.93227082 -0.0662773  -0.0672143
  -0.06680693 -0.06725767 -0.06757664 -0.06682948 -0.06743457 -0.06760864
  -0.04870213 -0.04782567 -0.04817113 -0.04876197 -0.05197002]
 [-0.04112272 -0.041332   -0.06737965 -0.06772919 -0.0662773  -0.0672143
  -0.06680693 -0.06725767 -0.06757664 -0.06682948  0.93256545 -0.06760864
  -0.04870213 -0.04782567 -0.04817113 -0.04876197 -0.05197002]]
Saving Weight
Epoch: 4941	Loss: 3.32655127048	Example Output: 80	Example Reward:  1
[[ 0.04112021  0.04134006  0.06735417  0.06773505  0.06630139  0.06720947
   0.06679357  0.06725655  0.06756949  0.06684977  0.06742764  0.06759968
   0.0487027   0.04781371  0.04819609  0.04875892  0.051971

Epoch: 4952	Loss: 2.94189913273	Example Output: 69	Example Reward:  1
[[ 0.04118592  0.04140069  0.06749596  0.06751027  0.06646502  0.06718133
   0.06673913  0.06710074  0.06742741  0.06701013  0.06743349  0.06760026
   0.04871038  0.04775673  0.04818534  0.04876458  0.05203262]]
2.8051
[[-0.04118592 -0.04140069 -0.06749596 -0.06751027 -0.06646502 -0.06718133
  -0.06673913 -0.06710074  0.9325726  -0.06701013 -0.06743349 -0.06760026
  -0.04871038 -0.04775673 -0.04818534 -0.04876458 -0.05203262]
 [-0.04118592 -0.04140069 -0.06749596 -0.06751027 -0.06646502 -0.06718133
  -0.06673913 -0.06710074 -0.06742741 -0.06701013 -0.06743349  0.93239975
  -0.04871038 -0.04775673 -0.04818534 -0.04876458 -0.05203262]]
Epoch: 4953	Loss: 2.91462974548	Example Output: 09	Example Reward:  1
[[ 0.04119251  0.04137281  0.06746013  0.06754334  0.06649253  0.06711214
   0.06678051  0.06709759  0.06749994  0.0670006   0.06739836  0.06763235
   0.04870369  0.04776022  0.04814795  0.04876004  0.05204533]]
2.8050

Epoch: 4964	Loss: 3.45388123989	Example Output: +3	Example Reward:  -0.3
[[ 0.04128173  0.04146892  0.06737152  0.06745256  0.06631236  0.06727453
   0.06666246  0.06705769  0.06760205  0.0670986   0.06717288  0.06764013
   0.04879497  0.04775346  0.04820732  0.04876307  0.05208574]]
4.10049
[[ 0.28761548  0.28755933  0.27978855  0.27976424  0.28010631  0.27981767
   0.28000128  0.2798827   0.27971941  0.27987042  0.27984816  0.27970797
  -0.01463849  0.28567398  0.28553781  0.28537109  0.2843743 ]
 [ 0.28761548  0.28755933  0.27978855  0.27976424  0.28010631 -0.02018236
   0.28000128  0.2798827   0.27971941  0.27987042  0.27984816  0.27970797
   0.28536153  0.28567398  0.28553781  0.28537109  0.2843743 ]]
Epoch: 4965	Loss: 3.20643863678	Example Output: 66	Example Reward:  1
[[ 0.04131798  0.04148764  0.06735505  0.06744086  0.06629021  0.0672879
   0.06664301  0.06706081  0.06760067  0.06708263  0.06714393  0.06760459
   0.04880292  0.04778756  0.04823144  0.04876855  0.05209428]]
2.8

Epoch: 4976	Loss: 2.50680959225	Example Output: 87	Example Reward:  1
[[ 0.04138698  0.04152365  0.06736688  0.06741708  0.06626049  0.06730516
   0.0667198   0.0669511   0.06756948  0.06705149  0.06704823  0.0675381
   0.0487903   0.04787677  0.04827913  0.0487515   0.05216383]]
2.80604
[[-0.04138698 -0.04152365 -0.06736688 -0.06741708 -0.06626049 -0.06730516
  -0.0667198  -0.0669511  -0.06756948 -0.06705149  0.93295175 -0.0675381
  -0.0487903  -0.04787677 -0.04827913 -0.0487515  -0.05216383]
 [-0.04138698 -0.04152365 -0.06736688 -0.06741708 -0.06626049 -0.06730516
  -0.0667198  -0.0669511  -0.06756948  0.93294853 -0.06704823 -0.0675381
  -0.0487903  -0.04787677 -0.04827913 -0.0487515  -0.05216383]]
Epoch: 4977	Loss: 2.78987047672	Example Output: 56	Example Reward:  1
[[ 0.0413659   0.04151635  0.06737975  0.06739816  0.0662699   0.06727222
   0.06673335  0.06695786  0.0675518   0.06703763  0.06707429  0.06754696
   0.04881103  0.04792143  0.04825919  0.04874723  0.05215697]]
2.80574


Epoch: 4988	Loss: 2.78662700653	Example Output: /+	Example Reward:  -0.3
[[ 0.04131643  0.04148805  0.06719463  0.06729175  0.06627212  0.06712966
   0.0669081   0.06698169  0.06769734  0.06712162  0.06705467  0.06769568
   0.04875188  0.04804832  0.04820917  0.04863881  0.05220009]]
4.09565
[[ 0.28760508  0.28755361  0.27984163  0.27981248  0.28011838  0.27986112
   0.27992758  0.2799055   0.2796908   0.27986354  0.27988359  0.27969131
   0.28537443  0.28558552  0.28553724 -0.01459164  0.28433999]
 [ 0.28760508  0.28755361  0.27984163  0.27981248  0.28011838  0.27986112
   0.27992758  0.2799055   0.2796908   0.27986354  0.27988359  0.27969131
  -0.01462557  0.28558552  0.28553724  0.28540838  0.28433999]]
Epoch: 4989	Loss: 3.32665815353	Example Output: -1	Example Reward:  -0.3
[[ 0.0413231   0.0414798   0.0672085   0.06729989  0.06625094  0.06714974
   0.06688622  0.06703261  0.06768014  0.06712241  0.06705751  0.06767584
   0.04873778  0.0480542   0.0482166   0.04862558  0.0521991 ]]

Epoch: 5000	Loss: 3.04328970909	Example Output: 4Y	Example Reward:  -0.3
[[ 0.04131746  0.04140541  0.06727014  0.06733104  0.06621881  0.06708566
   0.06684836  0.06697809  0.06795271  0.06711813  0.06709843  0.06768926
   0.04869286  0.04796262  0.04820517  0.04865032  0.05217547]]
4.09793
[[ 0.28760478  0.28757837  0.27981895  0.27980071  0.28013438  0.27987429
  -0.02005451  0.27990657  0.27961421  0.27986458  0.27987048  0.27969325
   0.28539214  0.28561124  0.28553846  0.28540492  0.28434739]
 [ 0.28760478 -0.01242162  0.27981895  0.27980071  0.28013438  0.27987429
   0.27994552  0.27990657  0.27961421  0.27986458  0.27987048  0.27969325
   0.28539214  0.28561124  0.28553846  0.28540492  0.28434739]]
Saving Weight
Epoch: 5001	Loss: 3.0689021349	Example Output: 33	Example Reward:  1
[[ 0.04132992  0.04139468  0.06727695  0.06731046  0.06625279  0.06705883
   0.06685646  0.06695195  0.06796499  0.06716294  0.06708505  0.06769011
   0.0486972   0.04797333  0.04818636  0.04863401  0.

Epoch: 5012	Loss: 3.45457215309	Example Output: 13	Example Reward:  1
[[ 0.04133591  0.04139934  0.06742996  0.0673795   0.06621699  0.06728933
   0.06661499  0.06679929  0.06792919  0.06727214  0.06712927  0.06758529
   0.04874455  0.04791196  0.04824149  0.04868176  0.05203911]]
2.80548
[[-0.04133591 -0.04139934 -0.06742996  0.93262053 -0.06621699 -0.06728933
  -0.06661499 -0.06679929 -0.06792919 -0.06727214 -0.06712927 -0.06758529
  -0.04874455 -0.04791196 -0.04824149 -0.04868176 -0.05203911]
 [-0.04133591 -0.04139934 -0.06742996 -0.0673795  -0.06621699  0.93271065
  -0.06661499 -0.06679929 -0.06792919 -0.06727214 -0.06712927 -0.06758529
  -0.04874455 -0.04791196 -0.04824149 -0.04868176 -0.05203911]]
Epoch: 5013	Loss: 3.58128993511	Example Output: -X	Example Reward:  -0.3
[[ 0.04134957  0.04142721  0.06741022  0.06741828  0.06616754  0.06735461
   0.06659634  0.0667725   0.0679005   0.06726844  0.06711488  0.06758574
   0.04873407  0.0479088   0.04826499  0.04868712  0.05203917]]
4.

Epoch: 5024	Loss: 2.78949337006	Example Output: *7	Example Reward:  -0.3
[[ 0.04141261  0.04151062  0.06757932  0.06723475  0.06629295  0.06754521
   0.06653149  0.06668378  0.06776756  0.06722549  0.06696615  0.06742986
   0.04877215  0.04793188  0.04837158  0.04864792  0.0520967 ]]
4.10041
[[ 0.28757623  0.28754681  0.27972621  0.27982959  0.28011212  0.27973643
   0.28004056  0.27999488  0.27966973  0.27983236  0.27991015  0.27977106
   0.28536835  0.28562045 -0.01451148  0.28540564  0.28437099]
 [ 0.28757623  0.28754681  0.27972621  0.27982959  0.28011212  0.27973643
   0.28004056  0.27999488  0.27966973 -0.02016765  0.27991015  0.27977106
   0.28536835  0.28562045  0.28548855  0.28540564  0.28437099]]
Epoch: 5025	Loss: 2.50937488079	Example Output: 08	Example Reward:  1
[[ 0.0414186   0.04151793  0.06755776  0.06724847  0.06627942  0.06752522
   0.06655066  0.06668276  0.0677859   0.06720629  0.06694455  0.06740714
   0.04878892  0.04794798  0.04837053  0.04864955  0.05211839]]
2.

Epoch: 5036	Loss: 2.93801641464	Example Output: 19	Example Reward:  1
[[ 0.04139567  0.04143367  0.06763886  0.06717992  0.06621303  0.0675683
   0.06644586  0.06674914  0.06792688  0.06727327  0.06692057  0.06750076
   0.048792    0.04790037  0.04827566  0.04869229  0.05209371]]
2.80554
[[-0.04139567 -0.04143367 -0.06763886  0.93282008 -0.06621303 -0.0675683
  -0.06644586 -0.06674914 -0.06792688 -0.06727327 -0.06692057 -0.06750076
  -0.048792   -0.04790037 -0.04827566 -0.04869229 -0.05209371]
 [-0.04139567 -0.04143367 -0.06763886 -0.06717992 -0.06621303 -0.0675683
  -0.06644586 -0.06674914 -0.06792688 -0.06727327 -0.06692057  0.93249923
  -0.048792   -0.04790037 -0.04827566 -0.04869229 -0.05209371]]
Epoch: 5037	Loss: 3.19342019558	Example Output: +5	Example Reward:  -0.3
[[ 0.04137369  0.04139333  0.06766877  0.06717277  0.06624646  0.06764349
   0.0664331   0.0667774   0.06794897  0.06731091  0.06691279  0.06753521
   0.04876314  0.04785617  0.04823691  0.04865404  0.05207286]]
4.100

Epoch: 5051	Loss: 3.07186431885	Example Output: 03	Example Reward:  1
[[ 0.04144205  0.04135902  0.06738264  0.06724631  0.0664523   0.06738183
   0.0665689   0.06675988  0.06793434  0.06740374  0.06670225  0.067566
   0.04866557  0.04793615  0.04815179  0.04880156  0.05224566]]
2.80547
[[-0.04144205 -0.04135902  0.93261737 -0.06724631 -0.0664523  -0.06738183
  -0.0665689  -0.06675988 -0.06793434 -0.06740374 -0.06670225 -0.067566
  -0.04866557 -0.04793615 -0.04815179 -0.04880156 -0.05224566]
 [-0.04144205 -0.04135902 -0.06738264 -0.06724631 -0.0664523   0.93261814
  -0.0665689  -0.06675988 -0.06793434 -0.06740374 -0.06670225 -0.067566
  -0.04866557 -0.04793615 -0.04815179 -0.04880156 -0.05224566]]
Epoch: 5052	Loss: 2.91752660275	Example Output: -/	Example Reward:  -0.3
[[ 0.04142235  0.04135206  0.06745208  0.06727771  0.06641915  0.06736366
   0.06654425  0.0667686   0.06791373  0.06738006  0.06673389  0.06757115
   0.0487151   0.04793851  0.04812185  0.04880756  0.05221836]]
4.09543


Epoch: 5063	Loss: 2.94036118984	Example Output: 3*	Example Reward:  1
[[ 0.04153783  0.04145637  0.06739953  0.06719396  0.06643888  0.06754343
   0.06630543  0.06659212  0.06800724  0.06738175  0.06661928  0.06746381
   0.04874043  0.04788941  0.04828404  0.0488854   0.0522612 ]]
2.82217
[[-0.04153783 -0.04145637 -0.06739953 -0.06719396 -0.06643888  0.93245655
  -0.06630543 -0.06659212 -0.06800724 -0.06738175 -0.06661928 -0.06746381
  -0.04874043 -0.04788941 -0.04828404 -0.0488854  -0.0522612 ]
 [-0.04153783 -0.04145637 -0.06739953 -0.06719396 -0.06643888 -0.06754343
  -0.06630543 -0.06659212 -0.06800724 -0.06738175 -0.06661928 -0.06746381
  -0.04874043 -0.04788941  0.95171595 -0.0488854  -0.0522612 ]]
Epoch: 5064	Loss: 2.78541445732	Example Output: 8/	Example Reward:  1
[[ 0.04152065  0.04144404  0.06743319  0.06719573  0.06645894  0.06759185
   0.06628875  0.06658003  0.06801347  0.06740752  0.06663653  0.06745514
   0.04871872  0.04786005  0.0482856   0.04887499  0.05223475]]
2.822

Epoch: 5075	Loss: 3.45253367424	Example Output: 45	Example Reward:  1
[[ 0.04156325  0.04137427  0.0673204   0.06723918  0.06657647  0.06750454
   0.06636219  0.06665596  0.0680049   0.06755122  0.06671345  0.06739586
   0.04860827  0.04788014  0.04814725  0.04889888  0.05220383]]
2.80682
[[-0.04156325 -0.04137427 -0.0673204  -0.06723918 -0.06657647 -0.06750454
   0.9336378  -0.06665596 -0.0680049  -0.06755122 -0.06671345 -0.06739586
  -0.04860827 -0.04788014 -0.04814725 -0.04889888 -0.05220383]
 [-0.04156325 -0.04137427 -0.0673204  -0.06723918 -0.06657647 -0.06750454
  -0.06636219  0.93334407 -0.0680049  -0.06755122 -0.06671345 -0.06739586
  -0.04860827 -0.04788014 -0.04814725 -0.04889888 -0.05220383]]
Epoch: 5076	Loss: 3.04165663719	Example Output: 68	Example Reward:  1
[[ 0.04156828  0.04138322  0.06730776  0.06725421  0.06655614  0.06752504
   0.06637118  0.06666864  0.06800634  0.06753328  0.06671003  0.06737682
   0.04860362  0.04788163  0.04815568  0.04889568  0.05220247]]
2.805

Epoch: 5087	Loss: 3.19537231922	Example Output: 07	Example Reward:  1
[[ 0.04153266  0.04136755  0.06737965  0.06749205  0.0663259   0.06744196
   0.06646073  0.06654339  0.06798264  0.06729019  0.0669567   0.06732679
   0.04861829  0.04801167  0.04808227  0.04894542  0.05224213]]
2.80561
[[-0.04153266 -0.04136755  0.93262035 -0.06749205 -0.0663259  -0.06744196
  -0.06646073 -0.06654339 -0.06798264 -0.06729019 -0.0669567  -0.06732679
  -0.04861829 -0.04801167 -0.04808227 -0.04894542 -0.05224213]
 [-0.04153266 -0.04136755 -0.06737965 -0.06749205 -0.0663259  -0.06744196
  -0.06646073 -0.06654339 -0.06798264  0.93270981 -0.0669567  -0.06732679
  -0.04861829 -0.04801167 -0.04808227 -0.04894542 -0.05224213]]
Epoch: 5088	Loss: 3.45321736336	Example Output: 11	Example Reward:  1
[[ 0.04154529  0.04139557  0.06741451  0.06747051  0.06629971  0.0674488
   0.06644109  0.06651174  0.06794202  0.06731255  0.06697977  0.06733145
   0.04862947  0.04801321  0.04805916  0.04896382  0.05224127]]
2.8054

Epoch: 5099	Loss: 3.19874742031	Example Output: -9	Example Reward:  -0.3
[[ 0.04171365  0.04167997  0.06746638  0.06729429  0.06607206  0.06757423
   0.06618264  0.06631611  0.06783367  0.06722422  0.06689412  0.06720054
   0.04870804  0.04811975  0.04827491  0.04912698  0.05231845]]
4.1005
[[ 0.28748593  0.28749603  0.27976009  0.27981171  0.2801784   0.27972773
   0.28014523  0.28010517  0.27964991  0.27983275  0.27993178  0.27983984
   0.28538761 -0.01443593  0.28551754  0.28526193  0.28430447]
 [ 0.28748593  0.28749603  0.27976009  0.27981171  0.2801784   0.27972773
   0.28014523  0.28010517  0.27964991  0.27983275  0.27993178 -0.02016016
   0.28538761  0.28556409  0.28551754  0.28526193  0.28430447]]
Epoch: 5100	Loss: 3.33001310825	Example Output: 2*	Example Reward:  1
[[ 0.04172947  0.04172012  0.06746297  0.06726439  0.06604122  0.06761503
   0.06614147  0.06630393  0.06783935  0.06720226  0.06686136  0.067173
   0.04873129  0.04813458  0.04831504  0.04913813  0.0523264 ]]
2.823

Epoch: 5111	Loss: 3.58369455338	Example Output: 76	Example Reward:  1
[[ 0.0418183   0.04187518  0.06730487  0.06713573  0.06607311  0.06768667
   0.06611416  0.06617617  0.06780184  0.06715887  0.06665891  0.06717782
   0.04882566  0.04831063  0.04837976  0.04910093  0.0524014 ]]
2.80605
[[-0.0418183  -0.04187518 -0.06730487 -0.06713573 -0.06607311 -0.06768667
  -0.06611416 -0.06617617 -0.06780184  0.93284112 -0.06665891 -0.06717782
  -0.04882566 -0.04831063 -0.04837976 -0.04910093 -0.0524014 ]
 [-0.0418183  -0.04187518 -0.06730487 -0.06713573 -0.06607311 -0.06768667
  -0.06611416 -0.06617617  0.93219817 -0.06715887 -0.06665891 -0.06717782
  -0.04882566 -0.04831063 -0.04837976 -0.04910093 -0.0524014 ]]
Epoch: 5112	Loss: 3.06810481548	Example Output: 03	Example Reward:  1
[[ 0.04182316  0.04186699  0.06726032  0.06715587  0.06610088  0.06765987
   0.06611431  0.06615358  0.06783723  0.06718612  0.06661525  0.06716557
   0.04881485  0.04833139  0.04838218  0.04910515  0.05242738]]
2.806

Epoch: 5123	Loss: 2.94333567619	Example Output: 09	Example Reward:  1
[[ 0.04183626  0.04183207  0.06710307  0.06695158  0.06618702  0.0676825
   0.06617585  0.06616807  0.06787594  0.0674096   0.06651847  0.06718051
   0.04881062  0.04841102  0.04835839  0.04901898  0.05248003]]
2.80655
[[-0.04183626 -0.04183207  0.93289691 -0.06695158 -0.06618702 -0.0676825
  -0.06617585 -0.06616807 -0.06787594 -0.0674096  -0.06651847 -0.06718051
  -0.04881062 -0.04841102 -0.04835839 -0.04901898 -0.05248003]
 [-0.04183626 -0.04183207 -0.06710307 -0.06695158 -0.06618702 -0.0676825
  -0.06617585 -0.06616807 -0.06787594 -0.0674096  -0.06651847  0.93281949
  -0.04881062 -0.04841102 -0.04835839 -0.04901898 -0.05248003]]
Epoch: 5124	Loss: 3.19682629108	Example Output: 18	Example Reward:  1
[[ 0.04183181  0.04181619  0.06710541  0.06696716  0.06617307  0.06767451
   0.06620689  0.06616616  0.06788851  0.06742017  0.06649154  0.06720031
   0.04883252  0.04842681  0.04833177  0.04899089  0.05247633]]
2.80715


Epoch: 5135	Loss: 3.06751801968	Example Output: +X	Example Reward:  -0.3
[[ 0.04189828  0.04188558  0.06712515  0.06706434  0.06611685  0.06757129
   0.06604999  0.06610708  0.06787115  0.06732223  0.06649686  0.06713411
   0.04905962  0.04845933  0.04844319  0.04899146  0.05240356]]
4.09389
[[ 0.28743052  0.28743434  0.27986246  0.2798807   0.28016496  0.27972862
   0.28018501  0.28016788  0.27963868  0.27980334  0.28005096  0.27985978
  -0.01471789  0.2854622   0.28546706  0.28530258  0.28427893]
 [-0.01256948  0.28743434  0.27986246  0.2798807   0.28016496  0.27972862
   0.28018501  0.28016788  0.27963868  0.27980334  0.28005096  0.27985978
   0.28528214  0.2854622   0.28546706  0.28530258  0.28427893]]
Epoch: 5136	Loss: 2.66288311481	Example Output: *2	Example Reward:  -0.3
[[ 0.04189665  0.04187898  0.06710749  0.06709164  0.06613239  0.06761561
   0.06601672  0.06611532  0.06787359  0.06733714  0.06647983  0.06710971
   0.04904176  0.04844559  0.04847413  0.04898407  0.05239938]]

Epoch: 5147	Loss: 2.65642044544	Example Output: 61	Example Reward:  1
[[ 0.04195324  0.04183555  0.06710766  0.06687403  0.06619082  0.06793465
   0.06573953  0.06635985  0.06794322  0.06740849  0.06634903  0.06707136
   0.04896298  0.04830432  0.04860045  0.04894841  0.05241646]]
2.80625
[[-0.04195324 -0.04183555 -0.06710766 -0.06687403 -0.06619082 -0.06793465
  -0.06573953 -0.06635985  0.93205678 -0.06740849 -0.06634903 -0.06707136
  -0.04896298 -0.04830432 -0.04860045 -0.04894841 -0.05241646]
 [-0.04195324 -0.04183555 -0.06710766  0.93312597 -0.06619082 -0.06793465
  -0.06573953 -0.06635985 -0.06794322 -0.06740849 -0.06634903 -0.06707136
  -0.04896298 -0.04830432 -0.04860045 -0.04894841 -0.05241646]]
Epoch: 5148	Loss: 2.65705916882	Example Output: 62	Example Reward:  1
[[ 0.04192727  0.04181692  0.06716697  0.06688981  0.06624237  0.06793543
   0.06571795  0.06636505  0.06798507  0.06743197  0.06632917  0.06706848
   0.04894701  0.04826545  0.04857654  0.04894722  0.05238731]]
2.806

Epoch: 5159	Loss: 2.80865278244	Example Output: 81	Example Reward:  1
[[ 0.04197715  0.04177875  0.06735073  0.06658922  0.06654986  0.06813808
   0.06561352  0.06649972  0.06783178  0.06759067  0.06611235  0.06693424
   0.04890772  0.04812966  0.04865411  0.04889216  0.05245029]]
2.80775
[[-0.04197715 -0.04177875 -0.06735073 -0.06658922 -0.06654986 -0.06813808
  -0.06561352 -0.06649972 -0.06783178 -0.06759067  0.93388766 -0.06693424
  -0.04890772 -0.04812966 -0.04865411 -0.04889216 -0.05245029]
 [-0.04197715 -0.04177875 -0.06735073  0.93341076 -0.06654986 -0.06813808
  -0.06561352 -0.06649972 -0.06783178 -0.06759067 -0.06611235 -0.06693424
  -0.04890772 -0.04812966 -0.04865411 -0.04889216 -0.05245029]]
Epoch: 5160	Loss: 2.76620204449	Example Output: /3	Example Reward:  -0.3
[[ 0.04196909  0.04176724  0.06735367  0.06658187  0.06655069  0.06816925
   0.06562199  0.06651903  0.06782381  0.06758993  0.06614774  0.06691755
   0.04889291  0.04812338  0.04865109  0.04888394  0.05243686]]
4.

Epoch: 5171	Loss: 2.91299209595	Example Output: 39	Example Reward:  1
[[ 0.0419659   0.04170323  0.06719704  0.06640889  0.06664884  0.06818655
   0.06572294  0.06657667  0.06784935  0.0677846   0.06605154  0.06694552
   0.04879079  0.04812804  0.04864758  0.04879575  0.05259679]]
2.80587
[[-0.0419659  -0.04170323 -0.06719704 -0.06640889 -0.06664884  0.93181348
  -0.06572294 -0.06657667 -0.06784935 -0.0677846  -0.06605154 -0.06694552
  -0.04879079 -0.04812804 -0.04864758 -0.04879575 -0.05259679]
 [-0.0419659  -0.04170323 -0.06719704 -0.06640889 -0.06664884 -0.06818655
  -0.06572294 -0.06657667 -0.06784935 -0.0677846  -0.06605154  0.93305451
  -0.04879079 -0.04812804 -0.04864758 -0.04879575 -0.05259679]]
Epoch: 5172	Loss: 3.3271987915	Example Output: +X	Example Reward:  -0.3
[[ 0.04196393  0.04170182  0.06718113  0.06639357  0.06665682  0.0681991
   0.06571431  0.06654864  0.06784739  0.06783313  0.06602804  0.06696424
   0.04877688  0.04811521  0.04863703  0.04882139  0.05261747]]
4.09

Epoch: 5186	Loss: 3.19907672405	Example Output: 8	Example Reward:  1
[[ 0.04194639  0.04171889  0.06726061  0.0663468   0.06676907  0.06810401
   0.0656911   0.06654929  0.06801199  0.06793715  0.06570556  0.06708355
   0.04876262  0.0480917   0.04857658  0.04882421  0.05262042]]
2.81972
[[-0.04194639 -0.04171889 -0.06726061 -0.0663468  -0.06676907 -0.06810401
  -0.0656911  -0.06654929 -0.06801199 -0.06793715  0.93429446 -0.06708355
  -0.04876262 -0.0480917  -0.04857658 -0.04882421 -0.05262042]
 [-0.04194639 -0.04171889 -0.06726061 -0.0663468  -0.06676907 -0.06810401
  -0.0656911  -0.06654929 -0.06801199 -0.06793715 -0.06570556 -0.06708355
  -0.04876262 -0.0480917  -0.04857658 -0.04882421  0.94737959]]
Epoch: 5187	Loss: 3.71197664738	Example Output: 23	Example Reward:  1
[[ 0.04197614  0.04173447  0.06722683  0.06634523  0.06675684  0.06809452
   0.06566448  0.06654241  0.06797884  0.06791309  0.06569324  0.06708498
   0.04876877  0.04811994  0.04859062  0.04885421  0.05265528]]
2.8060

Epoch: 5198	Loss: 2.50416989326	Example Output: *7	Example Reward:  -0.3
[[ 0.04199715  0.04182046  0.06737623  0.06617749  0.06707355  0.06799797
   0.06558158  0.06643749  0.06797349  0.06785712  0.0656013   0.0668443
   0.04872386  0.04808753  0.04867641  0.04902268  0.05275141]]
4.10098
[[ 0.28740087  0.28745386  0.27978712  0.28014678  0.27987793  0.27960062
   0.28032553  0.28006876  0.27960795  0.27964288  0.28031963  0.27994671
   0.28538284  0.28557375 -0.01460292  0.28529322  0.28417459]
 [ 0.28740087  0.28745386  0.27978712  0.28014678  0.27987793  0.27960062
   0.28032553  0.28006876  0.27960795 -0.02035714  0.28031963  0.27994671
   0.28538284  0.28557375  0.28539708  0.28529322  0.28417459]]
Epoch: 5199	Loss: 3.46041595936	Example Output: 4	Example Reward:  1
[[ 0.04200173  0.04183093  0.06738032  0.06616173  0.06707825  0.06796366
   0.06558307  0.06642035  0.06797598  0.06790181  0.06558429  0.06685498
   0.04872214  0.04808072  0.04866403  0.04904125  0.0527548 ]]
2.81

Epoch: 5210	Loss: 2.37813301086	Example Output: 8*	Example Reward:  1
[[ 0.04197201  0.041893    0.06758901  0.06608619  0.06691867  0.06796457
   0.06547438  0.06646537  0.06796874  0.06783092  0.06568563  0.06690738
   0.04880579  0.04799047  0.04878005  0.04900194  0.05266593]]
2.82371
[[-0.04197201 -0.041893   -0.06758901 -0.06608619 -0.06691867 -0.06796457
  -0.06547438 -0.06646537 -0.06796874 -0.06783092  0.93431437 -0.06690738
  -0.04880579 -0.04799047 -0.04878005 -0.04900194 -0.05266593]
 [-0.04197201 -0.041893   -0.06758901 -0.06608619 -0.06691867 -0.06796457
  -0.06547438 -0.06646537 -0.06796874 -0.06783092 -0.06568563 -0.06690738
  -0.04880579 -0.04799047  0.95121998 -0.04900194 -0.05266593]]
Saving Weight
Epoch: 5211	Loss: 3.33460519314	Example Output: +1	Example Reward:  -0.3
[[ 0.04197215  0.04190436  0.06758443  0.06607043  0.06692238  0.06796605
   0.06546192  0.06647344  0.06796481  0.06778087  0.06572103  0.06687947
   0.04882727  0.04797173  0.04884994  0.04900213  0

Epoch: 5222	Loss: 3.06499652863	Example Output: 02	Example Reward:  1
[[ 0.0419979   0.04202014  0.06774474  0.06599662  0.0667389   0.06823591
   0.06528458  0.06639493  0.06793694  0.06768485  0.06587595  0.06687314
   0.04885702  0.04786235  0.04898524  0.04899575  0.05251511]]
2.80655
[[-0.0419979  -0.04202014  0.93225527 -0.06599662 -0.0667389  -0.06823591
  -0.06528458 -0.06639493 -0.06793694 -0.06768485 -0.06587595 -0.06687314
  -0.04885702 -0.04786235 -0.04898524 -0.04899575 -0.05251511]
 [-0.0419979  -0.04202014 -0.06774474 -0.06599662  0.9332611  -0.06823591
  -0.06528458 -0.06639493 -0.06793694 -0.06768485 -0.06587595 -0.06687314
  -0.04885702 -0.04786235 -0.04898524 -0.04899575 -0.05251511]]
Epoch: 5223	Loss: 3.71104295254	Example Output: +	Example Reward:  -0.3
[[ 0.04201149  0.04202974  0.06779136  0.06594753  0.06675055  0.06836138
   0.06523769  0.0664268   0.0678876   0.06766492  0.06587981  0.06683565
   0.04884977  0.04783445  0.04901209  0.0489782   0.05250094]]
4.0

Epoch: 5234	Loss: 3.32328927517	Example Output: */	Example Reward:  -0.3
[[ 0.04198215  0.04187369  0.06795564  0.06565396  0.06698844  0.06842569
   0.06532335  0.06645028  0.06782571  0.06776205  0.06609105  0.06699596
   0.04873296  0.04779484  0.04890733  0.04881962  0.05241723]]
4.09603
[[ 0.28740537  0.28743792  0.27961332  0.28030381  0.27990347  0.27947229
   0.28040302  0.28006491  0.2796523   0.2796714   0.28017271  0.27990121
   0.28538013  0.28566158 -0.0146722   0.28535414  0.28427485]
 [ 0.28740537  0.28743792  0.27961332  0.28030381  0.27990347  0.27947229
   0.28040302  0.28006491  0.2796523   0.2796714   0.28017271  0.27990121
   0.28538013  0.28566158  0.28532782 -0.01464589  0.28427485]]
Epoch: 5235	Loss: 3.19619112015	Example Output: 5/	Example Reward:  1
[[ 0.0419648   0.04184057  0.06794208  0.06567144  0.06699084  0.06840233
   0.06535773  0.06647358  0.06788131  0.06776302  0.06612068  0.06700947
   0.0487146   0.04779245  0.04887695  0.04879494  0.0524032 ]]
2.

Epoch: 5249	Loss: 3.203383708	Example Output: Y0	Example Reward:  -0.3
[[ 0.0419322   0.04183862  0.06826868  0.06546695  0.06685773  0.06872771
   0.06512713  0.06634919  0.06772947  0.06783527  0.06640298  0.06719828
   0.04869608  0.04769898  0.04883477  0.0487019   0.05233404]]
4.09864
[[ 0.28742033 -0.01255159  0.27951941  0.28035992  0.27994269  0.27938169
   0.28046188  0.28009525  0.27968118  0.27964944  0.28007913  0.27984053
   0.28539118  0.28569031  0.28534958  0.28538945  0.28429979]
 [ 0.28742033  0.28744841 -0.0204806   0.28035992  0.27994269  0.27938169
   0.28046188  0.28009525  0.27968118  0.27964944  0.28007913  0.27984053
   0.28539118  0.28569031  0.28534958  0.28538945  0.28429979]]
Epoch: 5250	Loss: 3.45346910954	Example Output: *+	Example Reward:  -0.3
[[ 0.041957    0.04183091  0.0682506   0.06549925  0.06683657  0.06870708
   0.06511232  0.06639418  0.06774866  0.06779034  0.06639694  0.06717762
   0.04870744  0.04771662  0.0488432   0.04870342  0.05232792]]
4

Epoch: 5261	Loss: 3.07148106098	Example Output: 7+	Example Reward:  1
[[ 0.04185408  0.04172703  0.06822305  0.06582721  0.06694253  0.06858699
   0.06525476  0.06643841  0.06798091  0.06774142  0.06632757  0.06722532
   0.04865026  0.04768872  0.04872567  0.04861756  0.05218858]]
2.82179
[[-0.04185408 -0.04172703 -0.06822305 -0.06582721 -0.06694253 -0.06858699
  -0.06525476 -0.06643841 -0.06798091  0.93225861 -0.06632757 -0.06722532
  -0.04865026 -0.04768872 -0.04872567 -0.04861756 -0.05218858]
 [-0.04185408 -0.04172703 -0.06822305 -0.06582721 -0.06694253 -0.06858699
  -0.06525476 -0.06643841 -0.06798091 -0.06774142 -0.06632757 -0.06722532
   0.95134974 -0.04768872 -0.04872567 -0.04861756 -0.05218858]]
Epoch: 5262	Loss: 3.58266506195	Example Output: /	Example Reward:  -0.3
[[ 0.04185437  0.04174659  0.06824018  0.06582896  0.06695683  0.06855175
   0.06526065  0.06640816  0.06799066  0.06773749  0.06629822  0.06719714
   0.04866687  0.04770005  0.04873115  0.04863139  0.05219953]]
4.0

Epoch: 5273	Loss: 3.06875100136	Example Output: 87	Example Reward:  1
[[ 0.04175639  0.04164696  0.06816379  0.06586684  0.06689914  0.06883404
   0.0652719   0.06648877  0.06807668  0.06772064  0.06650151  0.06711937
   0.04857613  0.04765186  0.04868244  0.04859856  0.05214506]]
2.80604
[[-0.04175639 -0.04164696 -0.06816379 -0.06586684 -0.06689914 -0.06883404
  -0.0652719  -0.06648877 -0.06807668 -0.06772064  0.9334985  -0.06711937
  -0.04857613 -0.04765186 -0.04868244 -0.04859856 -0.05214506]
 [-0.04175639 -0.04164696 -0.06816379 -0.06586684 -0.06689914 -0.06883404
  -0.0652719  -0.06648877 -0.06807668  0.93227935 -0.06650151 -0.06711937
  -0.04857613 -0.04765186 -0.04868244 -0.04859856 -0.05214506]]
Epoch: 5274	Loss: 3.07079181671	Example Output: -3	Example Reward:  -0.3
[[ 0.04172658  0.04161423  0.06816585  0.06591159  0.06690921  0.06883206
   0.06531621  0.06650005  0.06811994  0.06771366  0.06651458  0.06713215
   0.04854504  0.04763983  0.04864535  0.04856773  0.05214585]]
4.

Epoch: 5285	Loss: 3.06998999119	Example Output: 68	Example Reward:  1
[[ 0.04166725  0.04161692  0.0683365   0.06575964  0.06664705  0.06894509
   0.0653587   0.06676903  0.06812221  0.06773375  0.06652227  0.06719971
   0.04864588  0.04752657  0.04860182  0.04853755  0.05201014]]
2.80559
[[-0.04166725 -0.04161692 -0.0683365  -0.06575964 -0.06664705 -0.06894509
  -0.0653587  -0.06676903  0.93187779 -0.06773375 -0.06652227 -0.06719971
  -0.04864588 -0.04752657 -0.04860182 -0.04853755 -0.05201014]
 [-0.04166725 -0.04161692 -0.0683365  -0.06575964 -0.06664705 -0.06894509
  -0.0653587  -0.06676903 -0.06812221 -0.06773375  0.93347776 -0.06719971
  -0.04864588 -0.04752657 -0.04860182 -0.04853755 -0.05201014]]
Epoch: 5286	Loss: 2.91789450645	Example Output: *Y	Example Reward:  -0.3
[[ 0.04165576  0.04162449  0.06835575  0.06575356  0.06660798  0.06894669
   0.06534981  0.0667594   0.0681031   0.06772775  0.06656318  0.06723296
   0.04866211  0.04752663  0.04857919  0.04852949  0.05202216]]
4.

Epoch: 5297	Loss: 2.65529689789	Example Output: 91	Example Reward:  1
[[ 0.04156756  0.04168172  0.06823755  0.06581705  0.06634835  0.06923535
   0.06542704  0.06662799  0.06816416  0.06782894  0.0665585   0.067141
   0.04862838  0.04758127  0.04850379  0.04849085  0.05216056]]
2.80682
[[-0.04156756 -0.04168172 -0.06823755 -0.06581705 -0.06634835 -0.06923535
  -0.06542704 -0.06662799 -0.06816416 -0.06782894 -0.0665585   0.932859
  -0.04862838 -0.04758127 -0.04850379 -0.04849085 -0.05216056]
 [-0.04156756 -0.04168172 -0.06823755  0.93418294 -0.06634835 -0.06923535
  -0.06542704 -0.06662799 -0.06816416 -0.06782894 -0.0665585  -0.067141
  -0.04862838 -0.04758127 -0.04850379 -0.04849085 -0.05216056]]
Epoch: 5298	Loss: 2.63747444153	Example Output: 7+	Example Reward:  1
[[ 0.0415494   0.04164497  0.06822868  0.06588949  0.06636395  0.0692152
   0.06545424  0.06666068  0.06815688  0.06779285  0.06660441  0.0671508
   0.04860872  0.04758716  0.04847025  0.04847148  0.05215085]]
2.82145
[[-0.

Epoch: 5312	Loss: 3.32838697433	Example Output: /9	Example Reward:  -0.3
[[ 0.0416665   0.04190126  0.06834447  0.06568736  0.06627005  0.06921269
   0.06518933  0.06653516  0.0678135   0.06774782  0.06650648  0.06703034
   0.04878142  0.04773036  0.04866645  0.04869435  0.05222249]]
4.10057
[[ 0.28750005  0.28742963  0.27949667  0.28029379  0.280119    0.2792362
   0.28044319  0.28003946  0.27965596  0.27967566  0.28004807  0.27989092
   0.28536558  0.28568089  0.28540006 -0.0146083   0.28433326]
 [ 0.28750005  0.28742963  0.27949667  0.28029379  0.280119    0.2792362
   0.28044319  0.28003946  0.27965596  0.27967566  0.28004807 -0.0201091
   0.28536558  0.28568089  0.28540006  0.28539169  0.28433326]]
Epoch: 5313	Loss: 3.2009585619	Example Output: 5*	Example Reward:  1
[[ 0.04168031  0.04193028  0.06835121  0.06565845  0.06626331  0.06923262
   0.06514894  0.06655233  0.06779256  0.0677346   0.06647601  0.06700575
   0.04880236  0.04773893  0.04867955  0.04871694  0.05223591]]
2.8227

Epoch: 5324	Loss: 3.06630961895	Example Output: 01	Example Reward:  1
[[ 0.04157399  0.0418983   0.06834969  0.0655993   0.06641002  0.06906994
   0.06518575  0.06665577  0.06780145  0.06782521  0.06637089  0.06706066
   0.04885609  0.04772307  0.04868146  0.0487319   0.0522065 ]]
2.80643
[[-0.04157399 -0.0418983   0.93165028 -0.0655993  -0.06641002 -0.06906994
  -0.06518575 -0.06665577 -0.06780145 -0.06782521 -0.06637089 -0.06706066
  -0.04885609 -0.04772307 -0.04868146 -0.0487319  -0.0522065 ]
 [-0.04157399 -0.0418983  -0.06834969  0.93440068 -0.06641002 -0.06906994
  -0.06518575 -0.06665577 -0.06780145 -0.06782521 -0.06637089 -0.06706066
  -0.04885609 -0.04772307 -0.04868146 -0.0487319  -0.0522065 ]]
Epoch: 5325	Loss: 3.17243101597	Example Output: 33	Example Reward:  1
[[ 0.04157126  0.04189742  0.06837562  0.06561606  0.06641804  0.06907246
   0.06517581  0.06666269  0.06779534  0.06781758  0.06637301  0.06705286
   0.04885134  0.04771809  0.04867069  0.0487423   0.05218942]]
2.803

Epoch: 5336	Loss: 2.94146420956	Example Output: 8+	Example Reward:  1
[[ 0.04164267  0.04200991  0.06810483  0.06575201  0.06613793  0.06904485
   0.06517236  0.06650534  0.06760448  0.06776473  0.06645663  0.06721081
   0.04890919  0.04786463  0.04855755  0.04894292  0.05231911]]
2.82271
[[-0.04164267 -0.04200991 -0.06810483 -0.06575201 -0.06613793 -0.06904485
  -0.06517236 -0.06650534 -0.06760448 -0.06776473  0.93354338 -0.06721081
  -0.04890919 -0.04786463 -0.04855755 -0.04894292 -0.05231911]
 [-0.04164267 -0.04200991 -0.06810483 -0.06575201 -0.06613793 -0.06904485
  -0.06517236 -0.06650534 -0.06760448 -0.06776473 -0.06645663 -0.06721081
   0.95109081 -0.04786463 -0.04855755 -0.04894292 -0.05231911]]
Epoch: 5337	Loss: 3.19616324902	Example Output: Y2	Example Reward:  -0.3
[[ 0.04161866  0.04198232  0.06810517  0.06577379  0.0661405   0.06901488
   0.06517874  0.06654986  0.06759824  0.06776672  0.0665254   0.0672268
   0.04891444  0.04786652  0.04851699  0.04892782  0.05229313]]
4.0

Epoch: 5348	Loss: 2.91456429958	Example Output: 1Y	Example Reward:  -0.3
[[ 0.04158949  0.04195331  0.06812569  0.06588472  0.06621265  0.06878933
   0.06519504  0.06661812  0.06768145  0.06766396  0.06645823  0.06726917
   0.0490919   0.04792129  0.04841676  0.04891678  0.05221215]]
4.09815
[[ 0.28752315  0.28741401  0.27956232 -0.01976542  0.28013623  0.27936321
   0.28044149  0.28001457  0.27969557  0.27970082  0.28006256  0.27981928
   0.28527245  0.28562361  0.28547499  0.28532499  0.28433639]
 [ 0.28752315 -0.01258599  0.27956232  0.28023461  0.28013623  0.27936321
   0.28044149  0.28001457  0.27969557  0.27970082  0.28006256  0.27981928
   0.28527245  0.28562361  0.28547499  0.28532499  0.28433639]]
Epoch: 5349	Loss: 2.94055569172	Example Output: 34	Example Reward:  1
[[ 0.04157621  0.04193999  0.06817292  0.0658872   0.06620163  0.06878266
   0.06522986  0.06663906  0.06772012  0.06765643  0.06642903  0.06724572
   0.0490958   0.04792216  0.04838838  0.04891862  0.05219429]]
2.

Epoch: 5360	Loss: 3.1966837883	Example Output: X5	Example Reward:  -0.3
[[ 0.04152901  0.04198819  0.06818443  0.0657496   0.06650908  0.06877864
   0.06525681  0.06648759  0.06764106  0.06758241  0.06648423  0.06715596
   0.04911179  0.04796872  0.04851785  0.04888295  0.05217169]]
4.09815
[[-0.01245871  0.28740355  0.27954468  0.28027514  0.2800473   0.27936643
   0.28042296  0.28005373  0.2797077   0.27972528  0.28005475  0.27985322
   0.28526649  0.28560939  0.28544468  0.28533512  0.28434849]
 [ 0.2875413   0.28740355  0.27954468  0.28027514  0.2800473   0.27936643
   0.28042296 -0.01994628  0.2797077   0.27972528  0.28005475  0.27985322
   0.28526649  0.28560939  0.28544468  0.28533512  0.28434849]]
Saving Weight
Epoch: 5361	Loss: 3.45397083759	Example Output: 31	Example Reward:  1
[[ 0.04152748  0.04200594  0.06817772  0.06572693  0.06652187  0.06877682
   0.06523936  0.06644306  0.06768037  0.06761694  0.06643623  0.06717843
   0.04911365  0.04795084  0.04852961  0.04890221  0.

Epoch: 5372	Loss: 3.06931796074	Example Output: 2Y	Example Reward:  -0.3
[[ 0.04150076  0.04206509  0.06821722  0.06561581  0.06647147  0.06886646
   0.06524875  0.06628083  0.06780822  0.06786476  0.06631445  0.06706344
   0.04903747  0.04793271  0.04853784  0.04892064  0.05225411]]
4.09834
[[ 0.28754979  0.28738049  0.27953485  0.28031525 -0.01994144  0.27934006
   0.2804254   0.28011575  0.27965754  0.27964059  0.28010568  0.27988097
   0.28528878  0.28562021  0.28543866  0.28532383  0.28432378]
 [ 0.28754979 -0.01261953  0.27953485  0.28031525  0.28005856  0.27934006
   0.2804254   0.28011575  0.27965754  0.27964059  0.28010568  0.27988097
   0.28528878  0.28562021  0.28543866  0.28532383  0.28432378]]
Epoch: 5373	Loss: 2.78422133923	Example Output: 53	Example Reward:  1
2.8057
[[-0.04148091 -0.04204869 -0.06822838 -0.06567141 -0.06646021 -0.06886808
  -0.06528845  0.93374383 -0.06783003 -0.06787837 -0.06631816 -0.06706642
  -0.04901234 -0.04793    -0.04850192 -0.04891379 -0.052246

Epoch: 5384	Loss: 3.19931662083	Example Output: 0Y	Example Reward:  -0.3
[[ 0.04159414  0.04209933  0.06848709  0.06574087  0.06623984  0.06908673
   0.06511158  0.06627039  0.0678959   0.06779496  0.06606849  0.06686588
   0.04902492  0.04782984  0.04869382  0.0489894   0.05220687]]
4.09882
[[ 0.28752178  0.2873702  -0.02054613  0.28027776  0.28012806  0.27927399
   0.28046653  0.28011888  0.27963126  0.27966151  0.28017947  0.27994025
   0.28529254  0.28565106  0.28539187  0.28530318  0.28433794]
 [ 0.28752178 -0.0126298   0.27945387  0.28027776  0.28012806  0.27927399
   0.28046653  0.28011888  0.27963126  0.27966151  0.28017947  0.27994025
   0.28529254  0.28565106  0.28539187  0.28530318  0.28433794]]
Epoch: 5385	Loss: 3.19699509144	Example Output: 60	Example Reward:  1
[[ 0.0416279   0.04212627  0.06851313  0.06570949  0.0662367   0.06911642
   0.06508031  0.06625707  0.06790035  0.06781562  0.0660088   0.06683505
   0.04903097  0.04780753  0.04871267  0.04900463  0.05221709]]
2.

Epoch: 5396	Loss: 3.19574830532	Example Output: 28	Example Reward:  1
[[ 0.04161814  0.04199094  0.0683951   0.06575532  0.0662847   0.06909233
   0.06511663  0.0664408   0.06802613  0.06793635  0.06595864  0.06683929
   0.04896356  0.04772709  0.04868629  0.04895122  0.05221754]]
2.80784
[[-0.04161814 -0.04199094 -0.0683951  -0.06575532  0.93371528 -0.06909233
  -0.06511663 -0.0664408  -0.06802613 -0.06793635 -0.06595864 -0.06683929
  -0.04896356 -0.04772709 -0.04868629 -0.04895122 -0.05221754]
 [-0.04161814 -0.04199094 -0.0683951  -0.06575532 -0.0662847  -0.06909233
  -0.06511663 -0.0664408  -0.06802613 -0.06793635  0.93404138 -0.06683929
  -0.04896356 -0.04772709 -0.04868629 -0.04895122 -0.05221754]]
Epoch: 5397	Loss: 2.50386924744	Example Output: 47	Example Reward:  1
[[ 0.04160654  0.04196459  0.06839309  0.06576118  0.06631982  0.06908297
   0.06513763  0.06646013  0.06801548  0.06795868  0.06597339  0.06685623
   0.04894076  0.04771154  0.04867646  0.04893168  0.05220986]]
2.807

Epoch: 5408	Loss: 3.19945652485	Example Output: 45	Example Reward:  1
[[ 0.04166624  0.04201026  0.06818158  0.06563488  0.06638508  0.06890097
   0.06516961  0.06648244  0.06817846  0.06805656  0.06569964  0.06685842
   0.04898442  0.04774236  0.04878449  0.0489329   0.05233176]]
2.80838
[[-0.04166624 -0.04201026 -0.06818158 -0.06563488 -0.06638508 -0.06890097
   0.93483037 -0.06648244 -0.06817846 -0.06805656 -0.06569964 -0.06685842
  -0.04898442 -0.04774236 -0.04878449 -0.0489329  -0.05233176]
 [-0.04166624 -0.04201026 -0.06818158 -0.06563488 -0.06638508 -0.06890097
  -0.06516961  0.93351758 -0.06817846 -0.06805656 -0.06569964 -0.06685842
  -0.04898442 -0.04774236 -0.04878449 -0.0489329  -0.05233176]]
Epoch: 5409	Loss: 2.78560988903	Example Output: 28	Example Reward:  1
[[ 0.04167266  0.04201332  0.06815538  0.0656574   0.06635458  0.06889766
   0.06517964  0.06648274  0.06822262  0.06804587  0.06569716  0.06686302
   0.04896875  0.0477409   0.04878772  0.04892261  0.05233799]]
2.808

Epoch: 5420	Loss: 3.06443669796	Example Output: 24	Example Reward:  1
[[ 0.04162526  0.04197139  0.06808623  0.0656234   0.06638569  0.06884155
   0.06525577  0.06650472  0.06838384  0.06812253  0.06566532  0.06683304
   0.04898269  0.04764566  0.04887056  0.04891621  0.05228617]]
2.80833
[[-0.04162526 -0.04197139 -0.06808623 -0.0656234   0.93361431 -0.06884155
  -0.06525577 -0.06650472 -0.06838384 -0.06812253 -0.06566532 -0.06683304
  -0.04898269 -0.04764566 -0.04887056 -0.04891621 -0.05228617]
 [-0.04162526 -0.04197139 -0.06808623 -0.0656234  -0.06638569 -0.06884155
   0.93474424 -0.06650472 -0.06838384 -0.06812253 -0.06566532 -0.06683304
  -0.04898269 -0.04764566 -0.04887056 -0.04891621 -0.05228617]]
Saving Weight
Epoch: 5421	Loss: 3.32803459167	Example Output: +1	Example Reward:  -0.3
[[ 0.04159573  0.04194998  0.0681409   0.06561812  0.06641853  0.06889135
   0.0652556   0.06651947  0.06838107  0.06813448  0.06567706  0.06682418
   0.04896593  0.04761442  0.04884883  0.04890762  0

Epoch: 5432	Loss: 3.19816675186	Example Output: XY	Example Reward:  -0.3
[[ 0.04168661  0.04208145  0.06813986  0.06572119  0.06640738  0.06875165
   0.06513943  0.06631608  0.06831372  0.0680264   0.06567843  0.06686473
   0.04899567  0.04760324  0.04890269  0.04910573  0.05226583]]
4.0914
[[-0.01250598  0.28737557  0.27955806  0.28028366  0.28007779  0.27937451
   0.28045818  0.2801052   0.27950591  0.2795921   0.28029647  0.27994061
   0.2853013   0.28571904  0.28532919  0.28526831  0.28432027]
 [ 0.28749403 -0.01262444  0.27955806  0.28028366  0.28007779  0.27937451
   0.28045818  0.2801052   0.27950591  0.2795921   0.28029647  0.27994061
   0.2853013   0.28571904  0.28532919  0.28526831  0.28432027]]
Epoch: 5433	Loss: 3.45300853252	Example Output: 47	Example Reward:  1
[[ 0.04170357  0.0420908   0.06812096  0.06573678  0.06638604  0.06877719
   0.06513518  0.06628221  0.06829391  0.06800674  0.06567649  0.06691381
   0.04899146  0.04759325  0.04890027  0.04911452  0.05227682]]
2.8

Epoch: 5444	Loss: 2.91867713928	Example Output: 6*	Example Reward:  1
[[ 0.04178815  0.04216013  0.06822332  0.06571735  0.06629818  0.06885285
   0.06507477  0.06618495  0.06823562  0.06793639  0.06575235  0.06697112
   0.04897939  0.04751553  0.04900483  0.04906425  0.05224086]]
2.82145
[[-0.04178815 -0.04216013 -0.06822332 -0.06571735 -0.06629818 -0.06885285
  -0.06507477 -0.06618495  0.93176436 -0.06793639 -0.06575235 -0.06697112
  -0.04897939 -0.04751553 -0.04900483 -0.04906425 -0.05224086]
 [-0.04178815 -0.04216013 -0.06822332 -0.06571735 -0.06629818 -0.06885285
  -0.06507477 -0.06618495 -0.06823562 -0.06793639 -0.06575235 -0.06697112
  -0.04897939 -0.04751553  0.95099515 -0.04906425 -0.05224086]]
Epoch: 5445	Loss: 3.07568831444	Example Output: 9/	Example Reward:  1
[[ 0.04178665  0.04215066  0.06820197  0.06573077  0.06629094  0.06885134
   0.06508595  0.06622258  0.068246    0.06791639  0.06572885  0.0669678
   0.04897462  0.0475067   0.04901088  0.04908321  0.05224468]]
2.8223

Epoch: 5456	Loss: 3.45308837891	Example Output: 56	Example Reward:  1
[[ 0.04191682  0.04232699  0.0681188   0.06556798  0.0662051   0.06858053
   0.06507552  0.06615069  0.06806437  0.06789256  0.06580532  0.06708463
   0.04903816  0.04771049  0.04897419  0.04918224  0.05230552]]
2.80682
[[-0.04191682 -0.04232699 -0.0681188  -0.06556798 -0.0662051  -0.06858053
  -0.06507552  0.93384933 -0.06806437 -0.06789256 -0.06580532 -0.06708463
  -0.04903816 -0.04771049 -0.04897419 -0.04918224 -0.05230552]
 [-0.04191682 -0.04232699 -0.0681188  -0.06556798 -0.0662051  -0.06858053
  -0.06507552 -0.06615069  0.93193561 -0.06789256 -0.06580532 -0.06708463
  -0.04903816 -0.04771049 -0.04897419 -0.04918224 -0.05230552]]
Epoch: 5457	Loss: 2.89388377666	Example Output: *+	Example Reward:  -0.3
[[ 0.04192423  0.04232856  0.06809699  0.06554207  0.06619024  0.06860604
   0.06505898  0.06618393  0.06807852  0.06788749  0.06578584  0.06707267
   0.0490464   0.0477178   0.04898307  0.04917775  0.05231946]]
4.

Epoch: 5468	Loss: 2.91880440712	Example Output: 8+	Example Reward:  1
[[ 0.04187862  0.0422937   0.06811478  0.06559134  0.06620389  0.06865362
   0.06504606  0.06611387  0.06797495  0.0677242   0.06602345  0.06716838
   0.04907378  0.04781329  0.04896978  0.0490972   0.05225904]]
2.82325
[[-0.04187862 -0.0422937  -0.06811478 -0.06559134 -0.06620389 -0.06865362
  -0.06504606 -0.06611387 -0.06797495 -0.0677242   0.93397653 -0.06716838
  -0.04907378 -0.04781329 -0.04896978 -0.0490972  -0.05225904]
 [-0.04187862 -0.0422937  -0.06811478 -0.06559134 -0.06620389 -0.06865362
  -0.06504606 -0.06611387 -0.06797495 -0.0677242  -0.06602345 -0.06716838
   0.95092624 -0.04781329 -0.04896978 -0.0490972  -0.05225904]]
Epoch: 5469	Loss: 2.91881520748	Example Output: 1/	Example Reward:  1
[[ 0.04187178  0.04228538  0.06809842  0.06561018  0.06617831  0.06862143
   0.06505544  0.06610425  0.06794219  0.06769649  0.06610709  0.06718539
   0.04909567  0.04782209  0.04899674  0.04909062  0.05223859]]
2.823

Epoch: 5480	Loss: 3.07240731716	Example Output: *2	Example Reward:  -0.3
[[ 0.0417079   0.04211878  0.06811924  0.06579351  0.06613743  0.06863017
   0.06524342  0.06621006  0.0681433   0.06776875  0.06613898  0.06703592
   0.04899447  0.04785857  0.04895251  0.04898594  0.05216103]]
4.10063
[[ 0.28748766  0.28736436  0.27956423  0.28026196  0.28015879  0.27941096
   0.28042698  0.280137    0.27955702  0.27966937  0.28015831  0.27988923
   0.28530166  0.28564245 -0.01468575  0.28530422  0.28435171]
 [ 0.28748766  0.28736436  0.27956423  0.28026196 -0.01984123  0.27941096
   0.28042698  0.280137    0.27955702  0.27966937  0.28015831  0.27988923
   0.28530166  0.28564245  0.28531426  0.28530422  0.28435171]]
Saving Weight
Epoch: 5481	Loss: 2.50774538517	Example Output: +8	Example Reward:  -0.3
[[ 0.04170338  0.04210058  0.06811863  0.06584742  0.06612124  0.06861541
   0.06528162  0.06622822  0.06816734  0.06774122  0.06612497  0.06701739
   0.04899141  0.04786805  0.04893738  0.04897102

Epoch: 5492	Loss: 3.1939435482	Example Output: 16	Example Reward:  1
[[ 0.04158226  0.04200284  0.06803434  0.06596014  0.06614603  0.06842336
   0.06541822  0.06635533  0.06846171  0.06774905  0.06595971  0.06701478
   0.04903812  0.04788185  0.04893379  0.04884152  0.05219693]]
2.80634
[[-0.04158226 -0.04200284 -0.06803434  0.93403983 -0.06614603 -0.06842336
  -0.06541822 -0.06635533 -0.06846171 -0.06774905 -0.06595971 -0.06701478
  -0.04903812 -0.04788185 -0.04893379 -0.04884152 -0.05219693]
 [-0.04158226 -0.04200284 -0.06803434 -0.06596014 -0.06614603 -0.06842336
  -0.06541822 -0.06635533  0.93153828 -0.06774905 -0.06595971 -0.06701478
  -0.04903812 -0.04788185 -0.04893379 -0.04884152 -0.05219693]]
Epoch: 5493	Loss: 3.06789238453	Example Output: 1Y	Example Reward:  -0.3
[[ 0.0415526   0.04197052  0.0680582   0.06602613  0.06617532  0.06840924
   0.06544872  0.06634525  0.06851746  0.06773805  0.06599856  0.06700312
   0.049008    0.04785086  0.0489196   0.0488161   0.05216222]]
4.0

Epoch: 5504	Loss: 3.32932367325	Example Output: 4X	Example Reward:  -0.3
[[ 0.04159166  0.04208063  0.06813301  0.06593192  0.06618897  0.06836321
   0.06541067  0.06618269  0.06851088  0.06772333  0.06584612  0.06678563
   0.04896041  0.04800401  0.04900275  0.04894891  0.05233517]]
4.09803
[[ 0.28752252  0.28737581  0.27956012  0.28022045  0.28014332  0.27949107
  -0.0196232   0.2801452   0.27944675  0.27968302  0.2802462   0.27996433
   0.28531191  0.28559881  0.28529918  0.28531533  0.28429946]
 [-0.0124775   0.28737581  0.27956012  0.28022045  0.28014332  0.27949107
   0.28037682  0.2801452   0.27944675  0.27968302  0.2802462   0.27996433
   0.28531191  0.28559881  0.28529918  0.28531533  0.28429946]]
Epoch: 5505	Loss: 2.91759822369	Example Output: 5	Example Reward:  1
[[ 0.04160113  0.04210161  0.06811763  0.06592957  0.0661739   0.06840544
   0.06537329  0.06616208  0.06848419  0.06771593  0.06584181  0.06677922
   0.04896737  0.04801891  0.04901244  0.04895947  0.05235602]]
2.8

Epoch: 5516	Loss: 3.32389140129	Example Output: 31	Example Reward:  1
[[ 0.04158499  0.04210525  0.06817088  0.06584345  0.06655528  0.06835731
   0.06541781  0.06599741  0.06826758  0.06780983  0.0658592   0.06702478
   0.04892346  0.04794205  0.04893917  0.04883633  0.05236517]]
2.80657
[[-0.04158499 -0.04210525 -0.06817088 -0.06584345 -0.06655528  0.93164271
  -0.06541781 -0.06599741 -0.06826758 -0.06780983 -0.0658592  -0.06702478
  -0.04892346 -0.04794205 -0.04893917 -0.04883633 -0.05236517]
 [-0.04158499 -0.04210525 -0.06817088  0.93415654 -0.06655528 -0.06835731
  -0.06541781 -0.06599741 -0.06826758 -0.06780983 -0.0658592  -0.06702478
  -0.04892346 -0.04794205 -0.04893917 -0.04883633 -0.05236517]]
Epoch: 5517	Loss: 2.78950419426	Example Output: 97	Example Reward:  1
[[ 0.04158712  0.0420997   0.06815129  0.06585944  0.06657401  0.06838725
   0.06542236  0.06598582  0.06823438  0.06779802  0.06586479  0.06706369
   0.04890738  0.04792435  0.04892849  0.04885277  0.05235915]]
2.806

Epoch: 5528	Loss: 3.20004277229	Example Output: 7-	Example Reward:  1
[[ 0.0416561   0.04219277  0.06796943  0.06576468  0.06656369  0.0684159
   0.06544079  0.06591906  0.06804638  0.067716    0.06599088  0.06709094
   0.04884286  0.04792791  0.04906695  0.04894611  0.05244951]]
2.82305
[[-0.0416561  -0.04219277 -0.06796943 -0.06576468 -0.06656369 -0.0684159
  -0.06544079 -0.06591906 -0.06804638  0.932284   -0.06599088 -0.06709094
  -0.04884286 -0.04792791 -0.04906695 -0.04894611 -0.05244951]
 [-0.0416561  -0.04219277 -0.06796943 -0.06576468 -0.06656369 -0.0684159
  -0.06544079 -0.06591906 -0.06804638 -0.067716   -0.06599088 -0.06709094
  -0.04884286  0.95207208 -0.04906695 -0.04894611 -0.05244951]]
Epoch: 5529	Loss: 3.32717165947	Example Output: -3	Example Reward:  -0.3
[[ 0.04167421  0.04221028  0.06797162  0.06573901  0.06654342  0.06846542
   0.06539151  0.06589893  0.06798356  0.06770338  0.06602374  0.06709673
   0.04884663  0.04792978  0.04910778  0.04895729  0.0524568 ]]
4.100

Epoch: 5540	Loss: 3.45943763256	Example Output: *6	Example Reward:  -0.3
[[ 0.04176548  0.04220014  0.06795932  0.06553723  0.06672668  0.06857457
   0.06530513  0.06586908  0.06782721  0.06782098  0.06604858  0.06705765
   0.04878559  0.04793373  0.04922569  0.04886803  0.05249488]]
4.10116
[[ 0.28747037  0.28733996  0.27961221  0.28033885  0.279982    0.27942765
   0.28040847  0.28023928  0.27965185  0.27965373  0.28018543  0.2798827
   0.28536433  0.28561988 -0.01476771  0.28533962  0.28425154]
 [ 0.28747037  0.28733996  0.27961221  0.28033885  0.279982    0.27942765
   0.28040847  0.28023928 -0.02034816  0.27965373  0.28018543  0.2798827
   0.28536433  0.28561988  0.28523231  0.28533962  0.28425154]]
Saving Weight
Epoch: 5541	Loss: 3.19574587345	Example Output: 1X	Example Reward:  -0.3
[[ 0.04177598  0.04223125  0.06797384  0.06554521  0.06670199  0.06861182
   0.06526529  0.06583447  0.06780759  0.06781699  0.06603382  0.06703608
   0.04880114  0.04793315  0.04924004  0.04889088  

Epoch: 5552	Loss: 3.04589672089	Example Output: 53	Example Reward:  1
[[ 0.04181787  0.04233717  0.06804547  0.06551435  0.06655344  0.06854955
   0.06517548  0.06595035  0.06770778  0.06777174  0.0659726   0.0669876
   0.04889863  0.04793812  0.04924394  0.04900384  0.05253215]]
2.8067
[[-0.04181787 -0.04233717 -0.06804547 -0.06551435 -0.06655344 -0.06854955
  -0.06517548  0.93404967 -0.06770778 -0.06777174 -0.0659726  -0.0669876
  -0.04889863 -0.04793812 -0.04924394 -0.04900384 -0.05253215]
 [-0.04181787 -0.04233717 -0.06804547 -0.06551435 -0.06655344  0.93145043
  -0.06517548 -0.06595035 -0.06770778 -0.06777174 -0.0659726  -0.0669876
  -0.04889863 -0.04793812 -0.04924394 -0.04900384 -0.05253215]]
Epoch: 5553	Loss: 2.78694221973	Example Output: -4	Example Reward:  -0.3
[[ 0.04182614  0.04233691  0.06802438  0.06551255  0.06653721  0.06859247
   0.06519033  0.06595706  0.06768631  0.06776584  0.06596452  0.06698103
   0.04889529  0.04793505  0.04925773  0.04900059  0.05253659]]
4.1002

Epoch: 5564	Loss: 3.17445344925	Example Output: -7	Example Reward:  -0.3
[[ 0.04173315  0.04223424  0.06801543  0.06572677  0.06638316  0.0688244
   0.0652191   0.06605304  0.06752673  0.06770638  0.06629263  0.06694917
   0.04877828  0.04789405  0.04923578  0.04896003  0.05246756]]
4.10073
[[ 0.28748006  0.28732973  0.27959538  0.28028199  0.28008506  0.27935269
   0.28043428  0.28018409  0.279742    0.27968812  0.28011221  0.27991524
   0.28536654 -0.01436822  0.2852293   0.285312    0.28425974]
 [ 0.28748006  0.28732973  0.27959538  0.28028199  0.28008506  0.27935269
   0.28043428  0.28018409  0.279742   -0.02031191  0.28011221  0.27991524
   0.28536654  0.28563181  0.2852293   0.285312    0.28425974]]
Epoch: 5565	Loss: 3.45472717285	Example Output: 4*	Example Reward:  1
[[ 0.04175107  0.04225839  0.06806098  0.065724    0.06635083  0.0688415
   0.06518468  0.06604729  0.06750511  0.06766659  0.06630048  0.06696305
   0.04879222  0.04788729  0.04923386  0.04896884  0.05246385]]
2.82

Epoch: 5576	Loss: 3.06635332108	Example Output: 01	Example Reward:  1
[[ 0.04171552  0.04214272  0.06810527  0.06565695  0.06651784  0.06882682
   0.06531636  0.06594143  0.06768594  0.06789692  0.06615261  0.06702515
   0.0486343   0.04784848  0.04910162  0.04885207  0.05257994]]
2.80695
[[-0.04171552 -0.04214272  0.93189472 -0.06565695 -0.06651784 -0.06882682
  -0.06531636 -0.06594143 -0.06768594 -0.06789692 -0.06615261 -0.06702515
  -0.0486343  -0.04784848 -0.04910162 -0.04885207 -0.05257994]
 [-0.04171552 -0.04214272 -0.06810527  0.93434304 -0.06651784 -0.06882682
  -0.06531636 -0.06594143 -0.06768594 -0.06789692 -0.06615261 -0.06702515
  -0.0486343  -0.04784848 -0.04910162 -0.04885207 -0.05257994]]
Epoch: 5577	Loss: 3.45589234829	Example Output: 5/	Example Reward:  1
[[ 0.0417145   0.04214074  0.06813241  0.06567208  0.06650117  0.06881016
   0.06529551  0.06593911  0.06770901  0.06792228  0.06616569  0.06701605
   0.0486277   0.04784554  0.04908334  0.04885093  0.05257376]]
2.823

Epoch: 5588	Loss: 2.65648388863	Example Output: 11	Example Reward:  1
[[ 0.04156493  0.0419455   0.0683413   0.06592623  0.06655715  0.06865242
   0.06526569  0.06604639  0.06788864  0.06800418  0.06620897  0.06721991
   0.04850102  0.04764424  0.04879374  0.04889126  0.05254835]]
2.80804
[[-0.04156493 -0.0419455  -0.0683413   0.93407375 -0.06655715 -0.06865242
  -0.06526569 -0.06604639 -0.06788864 -0.06800418 -0.06620897 -0.06721991
  -0.04850102 -0.04764424 -0.04879374 -0.04889126 -0.05254835]
 [-0.04156493 -0.0419455  -0.0683413   0.93407375 -0.06655715 -0.06865242
  -0.06526569 -0.06604639 -0.06788864 -0.06800418 -0.06620897 -0.06721991
  -0.04850102 -0.04764424 -0.04879374 -0.04889126 -0.05254835]]
Epoch: 5589	Loss: 3.32582046986	Example Output: 2*	Example Reward:  1
[[ 0.04154253  0.04192001  0.06833318  0.06597237  0.06659622  0.06859883
   0.06530739  0.06605038  0.06792033  0.06798315  0.06619652  0.06722082
   0.04852021  0.04764037  0.04877243  0.04888656  0.05253866]]
2.822

Epoch: 5600	Loss: 3.20202682018	Example Output: *2	Example Reward:  -0.3
[[ 0.04142126  0.04177798  0.0684308   0.06615061  0.06666602  0.06842844
   0.06544049  0.06596901  0.06794283  0.0678235   0.06663934  0.06746257
   0.04856777  0.04759965  0.04858088  0.04873137  0.0523675 ]]
4.10036
[[ 0.28757364  0.28746662  0.27947077  0.28015482  0.28000021  0.27947149
   0.28036788  0.2802093   0.27961716  0.27965295  0.2800082   0.27976125
   0.28542969  0.28572011 -0.01457426  0.2853806   0.28428975]
 [ 0.28757364  0.28746662  0.27947077  0.28015482 -0.01999981  0.27947149
   0.28036788  0.2802093   0.27961716  0.27965295  0.2800082   0.27976125
   0.28542969  0.28572011  0.28542575  0.2853806   0.28428975]]
Saving Weight
Epoch: 5601	Loss: 2.78789310455	Example Output: 28	Example Reward:  1
[[ 0.04143757  0.04178772  0.06846993  0.06611516  0.06669345  0.0683839
   0.06542474  0.06593222  0.06791521  0.06782357  0.06663897  0.06749633
   0.04858607  0.04760892  0.04856742  0.04873642  0.

Epoch: 5612	Loss: 2.91412026882	Example Output: 96	Example Reward:  1
[[ 0.04134944  0.04185433  0.06841829  0.06611318  0.06677186  0.06832141
   0.06562258  0.06575197  0.0679263   0.06792316  0.06646325  0.06759613
   0.0486002   0.04777205  0.04839005  0.04864058  0.05248526]]
2.80504
[[-0.04134944 -0.04185433 -0.06841829 -0.06611318 -0.06677186 -0.06832141
  -0.06562258 -0.06575197 -0.0679263  -0.06792316 -0.06646325  0.93240386
  -0.0486002  -0.04777205 -0.04839005 -0.04864058 -0.05248526]
 [-0.04134944 -0.04185433 -0.06841829 -0.06611318 -0.06677186 -0.06832141
  -0.06562258 -0.06575197  0.93207371 -0.06792316 -0.06646325 -0.06759613
  -0.0486002  -0.04777205 -0.04839005 -0.04864058 -0.05248526]]
Epoch: 5613	Loss: 3.45323512554	Example Output: 35	Example Reward:  1
[[ 0.04134861  0.04184671  0.06839792  0.06609729  0.06676409  0.06834514
   0.06560401  0.06580672  0.06796022  0.06791849  0.06643549  0.06761669
   0.04860097  0.04775727  0.04838883  0.04863312  0.0524785 ]]
2.806

Epoch: 5624	Loss: 2.94166548252	Example Output: 2-	Example Reward:  1
[[ 0.04143089  0.04193621  0.06857816  0.06576391  0.06673431  0.06858397
   0.06544012  0.06580842  0.06795099  0.0678736   0.06643724  0.06744239
   0.04859787  0.04773225  0.04860302  0.04861804  0.05246859]]
2.82342
[[-0.04143089 -0.04193621 -0.06857816 -0.06576391  0.93326569 -0.06858397
  -0.06544012 -0.06580842 -0.06795099 -0.0678736  -0.06643724 -0.06744239
  -0.04859787 -0.04773225 -0.04860302 -0.04861804 -0.05246859]
 [-0.04143089 -0.04193621 -0.06857816 -0.06576391 -0.06673431 -0.06858397
  -0.06544012 -0.06580842 -0.06795099 -0.0678736  -0.06643724 -0.06744239
  -0.04859787  0.95226777 -0.04860302 -0.04861804 -0.05246859]]
Epoch: 5625	Loss: 3.32350568771	Example Output: 86	Example Reward:  1
[[ 0.04141286  0.04194034  0.06859646  0.06572039  0.0667342   0.06859341
   0.06543624  0.06578746  0.06797326  0.06794236  0.06640881  0.06743127
   0.04857853  0.04774234  0.04860586  0.04862009  0.05247609]]
2.805

Epoch: 5636	Loss: 3.58357989788	Example Output: 60	Example Reward:  1
[[ 0.0413855   0.04188268  0.0684502   0.06589239  0.06660321  0.06839694
   0.06547827  0.06600644  0.06809686  0.06802821  0.0663471   0.06738905
   0.04855252  0.0478574   0.0484613   0.04870449  0.05246739]]
2.80435
[[-0.0413855  -0.04188268 -0.0684502  -0.06589239 -0.06660321 -0.06839694
  -0.06547827 -0.06600644  0.93190312 -0.06802821 -0.0663471  -0.06738905
  -0.04855252 -0.0478574  -0.0484613  -0.04870449 -0.05246739]
 [-0.0413855  -0.04188268  0.93154979 -0.06589239 -0.06660321 -0.06839694
  -0.06547827 -0.06600644 -0.06809686 -0.06802821 -0.0663471  -0.06738905
  -0.04855252 -0.0478574  -0.0484613  -0.04870449 -0.05246739]]
Epoch: 5637	Loss: 3.45703310966	Example Output: Y2	Example Reward:  -0.3
[[ 0.04140187  0.04190993  0.06846705  0.06586625  0.06659982  0.06838082
   0.06544003  0.06599683  0.06810229  0.06800435  0.06631529  0.06737183
   0.04858312  0.04786362  0.04848917  0.04873671  0.05247106]]
4.

Epoch: 5648	Loss: 2.93838105202	Example Output: 3-	Example Reward:  1
[[ 0.04150785  0.04196854  0.06829178  0.06597839  0.06653745  0.06804886
   0.06560572  0.06586124  0.06792542  0.06809384  0.06630902  0.06744255
   0.04862896  0.04808965  0.04829693  0.04883352  0.05258023]]
2.82225
[[-0.04150785 -0.04196854 -0.06829178 -0.06597839 -0.06653745  0.93195117
  -0.06560572 -0.06586124 -0.06792542 -0.06809384 -0.06630902 -0.06744255
  -0.04862896 -0.04808965 -0.04829693 -0.04883352 -0.05258023]
 [-0.04150785 -0.04196854 -0.06829178 -0.06597839 -0.06653745 -0.06804886
  -0.06560572 -0.06586124 -0.06792542 -0.06809384 -0.06630902 -0.06744255
  -0.04862896  0.95191038 -0.04829693 -0.04883352 -0.05258023]]
Epoch: 5649	Loss: 2.94252994061	Example Output: 73	Example Reward:  1
[[ 0.0414805   0.04192617  0.06827968  0.06600937  0.06654409  0.06802272
   0.06565908  0.06584398  0.06791655  0.06812881  0.06636339  0.06751074
   0.04860645  0.04811034  0.04823709  0.04878998  0.05257104]]
2.804

Epoch: 5660	Loss: 3.32837133408	Example Output: Y	Example Reward:  1
[[ 0.0414629   0.04187164  0.06827121  0.06591374  0.06659173  0.06799767
   0.06567805  0.0657359   0.06785658  0.06816714  0.06655033  0.06763664
   0.0485395   0.04818317  0.04826333  0.0487433   0.05253725]]
2.842
[[-0.0414629   0.95812833 -0.06827121 -0.06591374 -0.06659173 -0.06799767
  -0.06567805 -0.0657359  -0.06785658 -0.06816714 -0.06655033 -0.06763664
  -0.0485395  -0.04818317 -0.04826333 -0.0487433  -0.05253725]
 [-0.0414629  -0.04187164 -0.06827121 -0.06591374 -0.06659173 -0.06799767
  -0.06567805 -0.0657359  -0.06785658 -0.06816714 -0.06655033 -0.06763664
  -0.0485395  -0.04818317 -0.04826333 -0.0487433   0.94746274]]
Saving Weight
Epoch: 5661	Loss: 2.66032876968	Example Output: 68	Example Reward:  1
[[ 0.0414762   0.04186892  0.06825967  0.06588192  0.06663118  0.06801003
   0.06566817  0.06575789  0.06783485  0.06816172  0.06654452  0.06764235
   0.04854393  0.04817545  0.04826751  0.04873122  0.05254

Epoch: 5674	Loss: 3.32449023724	Example Output: 2X	Example Reward:  -0.3
[[ 0.04148645  0.04168832  0.06809125  0.06607649  0.06681003  0.06796287
   0.06565501  0.06607498  0.06784493  0.0678525   0.06668772  0.06785981
   0.04847331  0.04806236  0.04823177  0.04866711  0.05247515]]
4.09804
[[ 0.28755409  0.28749353  0.27957264  0.28017706 -0.02004301  0.27961114
   0.28030351  0.28017753  0.27964655  0.27964425  0.27999371  0.27964208
   0.28545803  0.28558129  0.28553048  0.28539988  0.28425747]
 [-0.01244593  0.28749353  0.27957264  0.28017706  0.279957    0.27961114
   0.28030351  0.28017753  0.27964655  0.27964425  0.27999371  0.27964208
   0.28545803  0.28558129  0.28553048  0.28539988  0.28425747]]
Epoch: 5675	Loss: 2.93877325058	Example Output: 8Y	Example Reward:  -0.3
[[ 0.04147464  0.04167255  0.06810863  0.06610442  0.06687248  0.06791807
   0.06566142  0.06608761  0.0678203   0.06783807  0.06668707  0.06787749
   0.04847693  0.04804797  0.04820892  0.04868069  0.05246267]]

Epoch: 5686	Loss: 2.95180399418	Example Output: 27	Example Reward:  1
[[ 0.04148372  0.04172242  0.06814592  0.0660838   0.06686346  0.06804221
   0.06563743  0.06590368  0.0678314   0.06793464  0.06664894  0.06794436
   0.04845508  0.04797206  0.04829079  0.04862799  0.05241215]]
2.80556
[[-0.04148372 -0.04172242 -0.06814592 -0.0660838   0.93313652 -0.06804221
  -0.06563743 -0.06590368 -0.0678314  -0.06793464 -0.06664894 -0.06794436
  -0.04845508 -0.04797206 -0.04829079 -0.04862799 -0.05241215]
 [-0.04148372 -0.04172242 -0.06814592 -0.0660838  -0.06686346 -0.06804221
  -0.06563743 -0.06590368 -0.0678314   0.93206537 -0.06664894 -0.06794436
  -0.04845508 -0.04797206 -0.04829079 -0.04862799 -0.05241215]]
Epoch: 5687	Loss: 3.32352676392	Example Output: 89	Example Reward:  1
[[ 0.04149599  0.04177266  0.06811994  0.06603326  0.06686938  0.06805466
   0.06564216  0.06586209  0.06779747  0.06797279  0.06659748  0.06792783
   0.04846158  0.04797112  0.04834298  0.04864765  0.05243102]]
2.805

Epoch: 5698	Loss: 3.32167305946	Example Output: 94	Example Reward:  1
[[ 0.04150224  0.04178105  0.06791224  0.0660319   0.06675841  0.06800693
   0.06588042  0.06569557  0.06788485  0.06803614  0.06655202  0.06816605
   0.04840769  0.04809277  0.04822673  0.04861125  0.05245378]]
2.80617
[[-0.04150224 -0.04178105 -0.06791224 -0.0660319  -0.06675841 -0.06800693
  -0.06588042 -0.06569557 -0.06788485 -0.06803614 -0.06655202  0.93183392
  -0.04840769 -0.04809277 -0.04822673 -0.04861125 -0.05245378]
 [-0.04150224 -0.04178105 -0.06791224 -0.0660319  -0.06675841 -0.06800693
   0.93411958 -0.06569557 -0.06788485 -0.06803614 -0.06655202 -0.06816605
  -0.04840769 -0.04809277 -0.04822673 -0.04861125 -0.05245378]]
Epoch: 5699	Loss: 2.91367940903	Example Output: Y6	Example Reward:  -0.3
[[ 0.0414896   0.0417805   0.06793678  0.06604876  0.06675538  0.06802001
   0.06588926  0.06568902  0.06785496  0.06801601  0.06658562  0.06818632
   0.04840221  0.04808624  0.04821261  0.04860759  0.05243915]]
4.

Epoch: 5710	Loss: 2.78473920822	Example Output: 93	Example Reward:  1
[[ 0.04156385  0.04193289  0.06763529  0.06609743  0.066646    0.0681692
   0.065805    0.06550041  0.06784303  0.06798497  0.0664753   0.06811354
   0.0484521   0.0482766   0.04833568  0.04867411  0.05249467]]
2.80472
[[-0.04156385 -0.04193289 -0.06763529 -0.06609743 -0.066646   -0.0681692
  -0.065805   -0.06550041 -0.06784303 -0.06798497 -0.0664753   0.93188643
  -0.0484521  -0.0482766  -0.04833568 -0.04867411 -0.05249467]
 [-0.04156385 -0.04193289 -0.06763529 -0.06609743 -0.066646    0.93183082
  -0.065805   -0.06550041 -0.06784303 -0.06798497 -0.0664753  -0.06811354
  -0.0484521  -0.0482766  -0.04833568 -0.04867411 -0.05249467]]
Saving Weight
Epoch: 5711	Loss: 3.45578210354	Example Output: +5	Example Reward:  -0.3
[[ 0.041557    0.04192848  0.06762429  0.06607642  0.06665549  0.06820089
   0.06578305  0.06551597  0.0678134   0.0679834   0.06648895  0.06813677
   0.04847335  0.04828449  0.04833217  0.04865693  0.0

Epoch: 5725	Loss: 3.32387628555	Example Output: 18	Example Reward:  1
[[ 0.04139332  0.04177144  0.06765363  0.0660403   0.06686807  0.0680501
   0.06580724  0.06566038  0.0675796   0.06792677  0.06703552  0.06836322
   0.04855141  0.04828019  0.04812524  0.04850909  0.05238445]]
2.80686
[[-0.04139332 -0.04177144 -0.06765363  0.93395972 -0.06686807 -0.0680501
  -0.06580724 -0.06566038 -0.0675796  -0.06792677 -0.06703552 -0.06836322
  -0.04855141 -0.04828019 -0.04812524 -0.04850909 -0.05238445]
 [-0.04139332 -0.04177144 -0.06765363 -0.0660403  -0.06686807 -0.0680501
  -0.06580724 -0.06566038 -0.0675796  -0.06792677  0.9329645  -0.06836322
  -0.04855141 -0.04828019 -0.04812524 -0.04850909 -0.05238445]]
Epoch: 5726	Loss: 3.04852056503	Example Output: /1	Example Reward:  -0.3
[[ 0.04138483  0.04174753  0.06762485  0.06605949  0.06688266  0.06800381
   0.06583172  0.06569425  0.06758741  0.06790005  0.06706195  0.06839004
   0.04855356  0.04827601  0.0481072   0.04850258  0.05239198]]
4.100

Epoch: 5737	Loss: 2.78871119022	Example Output: 3Y	Example Reward:  -0.3
[[ 0.0414726   0.04179043  0.06751908  0.06615035  0.06677559  0.06805038
   0.06570594  0.06589261  0.06747349  0.06782673  0.0668371   0.06833272
   0.04856841  0.0484803   0.04815575  0.04845539  0.05251312]]
4.09848
[[ 0.28755823  0.28746289  0.2797443   0.28015491  0.27996734 -0.02041511
   0.28028822  0.28023225  0.27975798  0.279652    0.27994889  0.27950019
   0.28542948  0.28545594  0.28555328  0.28546339  0.28424609]
 [ 0.28755823 -0.01253713  0.2797443   0.28015491  0.27996734  0.27958488
   0.28028822  0.28023225  0.27975798  0.279652    0.27994889  0.27950019
   0.28542948  0.28545594  0.28555328  0.28546339  0.28424609]]
Epoch: 5738	Loss: 3.32594575882	Example Output: +5	Example Reward:  -0.3
[[ 0.04146667  0.04176747  0.06750355  0.06616594  0.06679282  0.06805809
   0.06572063  0.06589673  0.06748683  0.06780766  0.066832    0.06833921
   0.04855379  0.04849364  0.04813916  0.04843762  0.05253817]]

Epoch: 5749	Loss: 3.32725851536	Example Output: +6	Example Reward:  -0.3
[[ 0.04143592  0.04167869  0.06734356  0.06611438  0.06697882  0.06815404
   0.06574962  0.06592312  0.06744377  0.06783824  0.06697185  0.06833426
   0.04841601  0.04846311  0.04824511  0.04836259  0.05254693]]
4.1005
[[ 0.28756925  0.28749642  0.27979693  0.2801657   0.27990636  0.2795538
   0.28027511  0.28022307  0.27976689  0.27964854  0.27990845  0.27949974
  -0.0145248   0.28546107  0.28552648  0.28549123  0.28423592]
 [ 0.28756925  0.28749642  0.27979693  0.2801657   0.27990636  0.2795538
   0.28027511  0.28022307 -0.02023313  0.27964854  0.27990845  0.27949974
   0.28547519  0.28546107  0.28552648  0.28549123  0.28423592]]
Epoch: 5750	Loss: 3.06677367687	Example Output: 3-	Example Reward:  1
[[ 0.04143227  0.04170382  0.06733368  0.06608099  0.06695404  0.06816351
   0.06573519  0.06588407  0.06742791  0.06792274  0.06695366  0.06837602
   0.04840468  0.04846621  0.04825054  0.04836332  0.05254732]]
2.821

Epoch: 5764	Loss: 3.07142410278	Example Output: 8Y	Example Reward:  -0.3
[[ 0.0414007   0.04167379  0.06737161  0.06631526  0.06677893  0.06790365
   0.06584773  0.06590145  0.06747591  0.06779075  0.06716596  0.06825193
   0.04835355  0.04860187  0.04824793  0.04838927  0.05252978]]
4.0982
[[ 0.2875798   0.28749788  0.27978852  0.28010541  0.27996635  0.27962893
   0.28024569  0.28022957  0.27975723  0.27966279 -0.02014979  0.27952445
   0.28549394  0.28541946  0.28552562  0.28548324  0.28424108]
 [ 0.2875798  -0.01250214  0.27978852  0.28010541  0.27996635  0.27962893
   0.28024569  0.28022957  0.27975723  0.27966279  0.27985021  0.27952445
   0.28549394  0.28541946  0.28552562  0.28548324  0.28424108]]
Epoch: 5765	Loss: 3.06642620564	Example Output: 61	Example Reward:  1
[[ 0.04138622  0.04164083  0.06732853  0.06634368  0.06681926  0.06789045
   0.06589721  0.06592756  0.06750943  0.06776986  0.06715308  0.06822882
   0.04833352  0.04859341  0.04825291  0.04837998  0.05254539]]
2.8

Epoch: 5776	Loss: 3.19887604713	Example Output: 5/	Example Reward:  1
[[ 0.04138814  0.04171476  0.06738835  0.06635837  0.06683891  0.06779851
   0.06585982  0.06579098  0.06748754  0.06764755  0.06726791  0.06807815
   0.04832548  0.04855671  0.0483788   0.04847949  0.05264058]]
2.82338
[[-0.04138814 -0.04171476 -0.06738835 -0.06635837 -0.06683891 -0.06779851
  -0.06585982  0.93420899 -0.06748754 -0.06764755 -0.06726791 -0.06807815
  -0.04832548 -0.04855671 -0.0483788  -0.04847949 -0.05264058]
 [-0.04138814 -0.04171476 -0.06738835 -0.06635837 -0.06683891 -0.06779851
  -0.06585982 -0.06579098 -0.06748754 -0.06764755 -0.06726791 -0.06807815
  -0.04832548 -0.04855671 -0.0483788   0.9515205  -0.05264058]]
Epoch: 5777	Loss: 3.5840446949	Example Output: 5X	Example Reward:  -0.3
[[ 0.04139183  0.04171821  0.06738918  0.06635454  0.06684277  0.06775269
   0.06585967  0.06578258  0.06751158  0.06763484  0.06725013  0.06806979
   0.04832681  0.04855358  0.04838313  0.0485201   0.05265851]]
4.0

Epoch: 5788	Loss: 2.78787412643	Example Output: 2/	Example Reward:  1
[[ 0.04144159  0.04193916  0.06739289  0.06624775  0.06682703  0.06760367
   0.06583332  0.06559589  0.06741466  0.06754933  0.06715797  0.0678923
   0.04847854  0.04867658  0.04851125  0.04865049  0.05278759]]
2.82274
[[-0.04144159 -0.04193916 -0.06739289 -0.06624775  0.93317294 -0.06760367
  -0.06583332 -0.06559589 -0.06741466 -0.06754933 -0.06715797 -0.0678923
  -0.04847854 -0.04867658 -0.04851125 -0.04865049 -0.05278759]
 [-0.04144159 -0.04193916 -0.06739289 -0.06624775 -0.06682703 -0.06760367
  -0.06583332 -0.06559589 -0.06741466 -0.06754933 -0.06715797 -0.0678923
  -0.04847854 -0.04867658 -0.04851125  0.9513495  -0.05278759]]
Epoch: 5789	Loss: 3.20261888504	Example Output: -5	Example Reward:  -0.3
[[ 0.04141573  0.04190651  0.06739193  0.06626899  0.06687647  0.0675435
   0.06582957  0.06561559  0.06744342  0.06759793  0.06712773  0.06791142
   0.04848433  0.04867178  0.04846646  0.048664    0.05278466]]
4.1003

Epoch: 5800	Loss: 3.32641761303	Example Output: 1-	Example Reward:  1
[[ 0.04149999  0.04197653  0.06733927  0.06602745  0.06690092  0.06737988
   0.06589532  0.06581473  0.06732842  0.06736632  0.06707726  0.06790797
   0.04873006  0.04878246  0.04849041  0.04860492  0.05287806]]
2.82336
[[-0.04149999 -0.04197653 -0.06733927  0.93397254 -0.06690092 -0.06737988
  -0.06589532 -0.06581473 -0.06732842 -0.06736632 -0.06707726 -0.06790797
  -0.04873006 -0.04878246 -0.04849041 -0.04860492 -0.05287806]
 [-0.04149999 -0.04197653 -0.06733927 -0.06602745 -0.06690092 -0.06737988
  -0.06589532 -0.06581473 -0.06732842 -0.06736632 -0.06707726 -0.06790797
  -0.04873006  0.95121753 -0.04849041 -0.04860492 -0.05287806]]
Saving Weight
Epoch: 5801	Loss: 2.66069264412	Example Output: 1/	Example Reward:  1
[[ 0.04148966  0.04196002  0.0673368   0.06601334  0.06695149  0.06735807
   0.06594343  0.06583457  0.06734582  0.06733872  0.06706809  0.06787743
   0.0487261   0.04878906  0.04850174  0.04858665  0.05

Epoch: 5812	Loss: 2.91550531387	Example Output: 58	Example Reward:  1
[[ 0.04160534  0.04201782  0.06712639  0.0661132   0.06700195  0.06722208
   0.06596714  0.06608314  0.06723344  0.0671588   0.06686813  0.06766292
   0.04873221  0.04893262  0.0484999   0.04879318  0.05298174]]
2.80775
[[-0.04160534 -0.04201782 -0.06712639 -0.0661132  -0.06700195 -0.06722208
  -0.06596714  0.93391687 -0.06723344 -0.0671588  -0.06686813 -0.06766292
  -0.04873221 -0.04893262 -0.0484999  -0.04879318 -0.05298174]
 [-0.04160534 -0.04201782 -0.06712639 -0.0661132  -0.06700195 -0.06722208
  -0.06596714 -0.06608314 -0.06723344 -0.0671588   0.93313187 -0.06766292
  -0.04873221 -0.04893262 -0.0484999  -0.04879318 -0.05298174]]
Epoch: 5813	Loss: 2.50537567139	Example Output: 5+	Example Reward:  1
2.82349
[[-0.04160004 -0.04198739 -0.06710848 -0.06610402 -0.06703746 -0.06719025
  -0.06599083  0.93383992 -0.06724447 -0.06715579 -0.06686915 -0.06765786
  -0.04871907 -0.04893034 -0.04848159 -0.04878561 -0.05297771

Epoch: 5827	Loss: 3.19773106575	Example Output: 50	Example Reward:  1
[[ 0.04158941  0.0418582   0.06695096  0.06628583  0.0668642   0.06713243
   0.06621338  0.06631105  0.06733311  0.06716026  0.06677399  0.06779196
   0.04870216  0.04903193  0.04825333  0.0487287   0.05301913]]
2.80738
[[-0.04158941 -0.0418582  -0.06695096 -0.06628583 -0.0668642  -0.06713243
  -0.06621338  0.93368894 -0.06733311 -0.06716026 -0.06677399 -0.06779196
  -0.04870216 -0.04903193 -0.04825333 -0.0487287  -0.05301913]
 [-0.04158941 -0.0418582   0.93304902 -0.06628583 -0.0668642  -0.06713243
  -0.06621338 -0.06631105 -0.06733311 -0.06716026 -0.06677399 -0.06779196
  -0.04870216 -0.04903193 -0.04825333 -0.0487287  -0.05301913]]
Epoch: 5828	Loss: 3.19700217247	Example Output: 31	Example Reward:  1
[[ 0.04157262  0.04185505  0.06695978  0.06632522  0.0668525   0.06714427
   0.06621419  0.06630935  0.06738149  0.06715187  0.0667638   0.06775898
   0.0486853   0.04901455  0.04825637  0.04873992  0.0530147 ]]
2.807

Epoch: 5839	Loss: 3.07177121639	Example Output: 4	Example Reward:  1
[[ 0.04174135  0.04202422  0.06669569  0.06647266  0.06658563  0.06698599
   0.0661876   0.0662519   0.0674388   0.06726674  0.06644128  0.06763369
   0.04876261  0.04913065  0.04833502  0.04887692  0.05316926]]
2.81927
[[-0.04174135 -0.04202422 -0.06669569 -0.06647266 -0.06658563 -0.06698599
   0.93381238 -0.0662519  -0.0674388  -0.06726674 -0.06644128 -0.06763369
  -0.04876261 -0.04913065 -0.04833502 -0.04887692 -0.05316926]
 [-0.04174135 -0.04202422 -0.06669569 -0.06647266 -0.06658563 -0.06698599
  -0.0661876  -0.0662519  -0.0674388  -0.06726674 -0.06644128 -0.06763369
  -0.04876261 -0.04913065 -0.04833502 -0.04887692  0.94683075]]
Epoch: 5840	Loss: 2.37495031357	Example Output: 59	Example Reward:  1
2.80716
[[-0.04172453 -0.04200746 -0.06669351 -0.06648931 -0.0665926  -0.06693803
  -0.06624852  0.93375605 -0.06745072 -0.06725955 -0.06645979 -0.06765198
  -0.04875602 -0.04913829 -0.04830489 -0.04885957 -0.05318127]

Epoch: 5851	Loss: 3.45621848106	Example Output: 66	Example Reward:  1
[[ 0.04165109  0.04198879  0.06661178  0.06663041  0.066429    0.06677888
   0.06653582  0.06622598  0.06753345  0.06734483  0.0664879   0.06770776
   0.04870506  0.04918282  0.04818665  0.04882343  0.05317635]]
2.8062
[[-0.04165109 -0.04198879 -0.06661178 -0.06663041 -0.066429   -0.06677888
  -0.06653582 -0.06622598  0.93246657 -0.06734483 -0.0664879  -0.06770776
  -0.04870506 -0.04918282 -0.04818665 -0.04882343 -0.05317635]
 [-0.04165109 -0.04198879 -0.06661178 -0.06663041 -0.066429   -0.06677888
  -0.06653582 -0.06622598  0.93246657 -0.06734483 -0.0664879  -0.06770776
  -0.04870506 -0.04918282 -0.04818665 -0.04882343 -0.05317635]]
Epoch: 5852	Loss: 3.1969291687	Example Output: 4+	Example Reward:  1
[[ 0.04167513  0.04201119  0.06658035  0.06660149  0.0664065   0.06680669
   0.06652085  0.06621564  0.06754926  0.06734439  0.06645765  0.06770692
   0.04870071  0.04917222  0.04821022  0.04884094  0.05319983]]
2.82333

Epoch: 5865	Loss: 2.7628374815	Example Output: 03	Example Reward:  1
2.80781
[[-0.04178335 -0.04210826  0.933635   -0.06648949 -0.06631641 -0.06680886
  -0.06641034 -0.06631051 -0.06738985 -0.06722673 -0.06649695 -0.06787687
  -0.04882371 -0.04916999 -0.0483291  -0.04890825 -0.05318635]
 [-0.04178335 -0.04210826 -0.066365   -0.06648949 -0.06631641  0.93319112
  -0.06641034 -0.06631051 -0.06738985 -0.06722673 -0.06649695 -0.06787687
  -0.04882371 -0.04916999 -0.0483291  -0.04890825 -0.05318635]]
Epoch: 5866	Loss: 3.43123655319	Example Output: /8	Example Reward:  -0.3
4.10093
[[ 0.28746316  0.28736132  0.28008994  0.28005105  0.28011391  0.27994391
   0.28008413  0.28011099  0.27977946  0.2798354   0.28005484  0.27964357
   0.28535232  0.28525043  0.28549528 -0.01467591  0.28404647]
 [ 0.28746316  0.28736132  0.28008994  0.28005105  0.28011391  0.27994391
   0.28008413  0.28011099  0.27977946  0.2798354  -0.01994518  0.27964357
   0.28535232  0.28525043  0.28549528  0.2853241   0.2840464

Epoch: 5880	Loss: 3.06775624752	Example Output: 14	Example Reward:  1
[[ 0.04192067  0.04226424  0.06634667  0.06638809  0.06638765  0.06704583
   0.06612734  0.06616779  0.06746065  0.06724472  0.06614348  0.06770135
   0.04881113  0.0491133   0.0484669   0.04906277  0.05334741]]
2.80852
[[-0.04192067 -0.04226424 -0.06634667  0.93361193 -0.06638765 -0.06704583
  -0.06612734 -0.06616779 -0.06746065 -0.06724472 -0.06614348 -0.06770135
  -0.04881113 -0.0491133  -0.0484669  -0.04906277 -0.05334741]
 [-0.04192067 -0.04226424 -0.06634667 -0.06638809 -0.06638765 -0.06704583
   0.93387264 -0.06616779 -0.06746065 -0.06724472 -0.06614348 -0.06770135
  -0.04881113 -0.0491133  -0.0484669  -0.04906277 -0.05334741]]
Saving Weight
Epoch: 5881	Loss: 2.8933401823	Example Output: 42	Example Reward:  1
[[ 0.04192321  0.04225596  0.06631722  0.06640439  0.06638768  0.06702747
   0.06613514  0.0661971   0.06745943  0.06721008  0.0661604   0.06769899
   0.04882282  0.04912706  0.04847518  0.04905584  0.053

Epoch: 5894	Loss: 2.91929943562	Example Output: 74	Example Reward:  1
2.80803
[[-0.04199097 -0.04229592 -0.06638619 -0.06624824 -0.06648057 -0.06708785
  -0.06609984 -0.06619311 -0.06736376  0.93283886 -0.06609333 -0.06774104
  -0.04893106 -0.0490851  -0.04857662 -0.04900352 -0.05326174]
 [-0.04199097 -0.04229592 -0.06638619 -0.06624824 -0.06648057 -0.06708785
   0.93390018 -0.06619311 -0.06736376 -0.06716114 -0.06609333 -0.06774104
  -0.04893106 -0.0490851  -0.04857662 -0.04900352 -0.05326174]]
Epoch: 5895	Loss: 3.20260264874	Example Output: 54	Example Reward:  1
[[ 0.04199826  0.04231911  0.06638549  0.06621401  0.06647029  0.06712116
   0.06608851  0.06618997  0.06732049  0.06714121  0.06612433  0.06773163
   0.04894345  0.04907605  0.04860927  0.04900604  0.05326079]]
2.80879
[[-0.04199826 -0.04231911 -0.06638549 -0.06621401 -0.06647029 -0.06712116
  -0.06608851  0.93381    -0.06732049 -0.06714121 -0.06612433 -0.06773163
  -0.04894345 -0.04907605 -0.04860927 -0.04900604 -0.05326079

Epoch: 5906	Loss: 2.94025959969	Example Output: 05	Example Reward:  1
[[ 0.04183473  0.04214718  0.06647181  0.06633948  0.06655891  0.06701978
   0.06614565  0.06658199  0.06748076  0.06701386  0.06624366  0.06770451
   0.04894407  0.04897729  0.04860703  0.04890881  0.05302049]]
2.80796
[[-0.04183473 -0.04214718  0.93352818 -0.06633948 -0.06655891 -0.06701978
  -0.06614565 -0.06658199 -0.06748076 -0.06701386 -0.06624366 -0.06770451
  -0.04894407 -0.04897729 -0.04860703 -0.04890881 -0.05302049]
 [-0.04183473 -0.04214718 -0.06647181 -0.06633948 -0.06655891 -0.06701978
  -0.06614565  0.93341804 -0.06748076 -0.06701386 -0.06624366 -0.06770451
  -0.04894407 -0.04897729 -0.04860703 -0.04890881 -0.05302049]]
Epoch: 5907	Loss: 2.65577905178	Example Output: 26	Example Reward:  1
[[ 0.04179166  0.04209487  0.06648465  0.066396    0.06663058  0.06701533
   0.06621338  0.06661536  0.06751388  0.06704543  0.06623482  0.06769007
   0.04890639  0.04894153  0.04856643  0.04887095  0.05298866]]
2.807

Epoch: 5920	Loss: 3.19994721413	Example Output: 76	Example Reward:  1
[[ 0.0417543   0.04193651  0.06633488  0.06643438  0.06667544  0.06700825
   0.06634441  0.0668487   0.06766756  0.06694055  0.06621984  0.06775773
   0.04884529  0.04890995  0.04857855  0.0488246   0.05291901]]
2.80658
[[-0.0417543  -0.04193651 -0.06633488 -0.06643438 -0.06667544 -0.06700825
  -0.06634441 -0.0668487  -0.06766756  0.93305945 -0.06621984 -0.06775773
  -0.04884529 -0.04890995 -0.04857855 -0.0488246  -0.05291901]
 [-0.0417543  -0.04193651 -0.06633488 -0.06643438 -0.06667544 -0.06700825
  -0.06634441 -0.0668487   0.93233246 -0.06694055 -0.06621984 -0.06775773
  -0.04884529 -0.04890995 -0.04857855 -0.0488246  -0.05291901]]
Saving Weight
Epoch: 5921	Loss: 2.6557996273	Example Output: 76	Example Reward:  1
[[ 0.04173275  0.04190573  0.06632183  0.06647045  0.06666504  0.0669768
   0.06640419  0.06686484  0.06771473  0.06697448  0.06621712  0.06776838
   0.04881924  0.04890992  0.04854856  0.04880185  0.0529

Epoch: 5932	Loss: 3.06788039207	Example Output: 38	Example Reward:  1
[[ 0.04168726  0.04175424  0.06637992  0.06650795  0.06681261  0.06721532
   0.0663633   0.06708634  0.06778631  0.06692781  0.06620213  0.06757536
   0.04863926  0.04879151  0.0487485   0.04869328  0.05282893]]
2.80727
[[-0.04168726 -0.04175424 -0.06637992 -0.06650795 -0.06681261  0.93278468
  -0.0663633  -0.06708634 -0.06778631 -0.06692781 -0.06620213 -0.06757536
  -0.04863926 -0.04879151 -0.0487485  -0.04869328 -0.05282893]
 [-0.04168726 -0.04175424 -0.06637992 -0.06650795 -0.06681261 -0.06721532
  -0.0663633  -0.06708634 -0.06778631 -0.06692781  0.9337979  -0.06757536
  -0.04863926 -0.04879151 -0.0487485  -0.04869328 -0.05282893]]
Epoch: 5933	Loss: 3.0450574398	Example Output: 83	Example Reward:  1
[[ 0.04167773  0.04173116  0.06639221  0.06651063  0.06683329  0.06725062
   0.06635946  0.0671066   0.0677623   0.06694526  0.06623656  0.06757091
   0.04861406  0.04877763  0.04873241  0.04867864  0.05282055]]
2.8071

Epoch: 5947	Loss: 2.93773236275	Example Output: 87	Example Reward:  1
[[ 0.04157558  0.04155015  0.06646524  0.06644185  0.06718496  0.06732284
   0.0663683   0.06721038  0.06785335  0.06702163  0.06643382  0.06758583
   0.04848249  0.04862115  0.04867903  0.04853037  0.05267302]]
2.80691
[[-0.04157558 -0.04155015 -0.06646524 -0.06644185 -0.06718496 -0.06732284
  -0.0663683  -0.06721038 -0.06785335 -0.06702163  0.93356615 -0.06758583
  -0.04848249 -0.04862115 -0.04867903 -0.04853037 -0.05267302]
 [-0.04157558 -0.04155015 -0.06646524 -0.06644185 -0.06718496 -0.06732284
  -0.0663683  -0.06721038 -0.06785335  0.93297839 -0.06643382 -0.06758583
  -0.04848249 -0.04862115 -0.04867903 -0.04853037 -0.05267302]]
Epoch: 5948	Loss: 3.19711613655	Example Output: 29	Example Reward:  1
[[ 0.04155532  0.04154367  0.06648511  0.06642091  0.0671808   0.0673859
   0.06637858  0.06720258  0.06782833  0.06710202  0.06643747  0.0675763
   0.04846018  0.04859411  0.04867478  0.04851767  0.05265632]]
2.8059


Epoch: 5960	Loss: 3.04403173923	Example Output: 57	Example Reward:  1
[[ 0.04156382  0.04156084  0.06652448  0.06648222  0.06709933  0.0673725
   0.06650535  0.0671679   0.06775203  0.06721759  0.06634469  0.06776404
   0.04845953  0.04854956  0.04855264  0.04846339  0.05262005]]
2.80612
[[-0.04156382 -0.04156084 -0.06652448 -0.06648222 -0.06709933 -0.0673725
  -0.06650535  0.93283212 -0.06775203 -0.06721759 -0.06634469 -0.06776404
  -0.04845953 -0.04854956 -0.04855264 -0.04846339 -0.05262005]
 [-0.04156382 -0.04156084 -0.06652448 -0.06648222 -0.06709933 -0.0673725
  -0.06650535 -0.0671679  -0.06775203  0.93278241 -0.06634469 -0.06776404
  -0.04845953 -0.04854956 -0.04855264 -0.04846339 -0.05262005]]
Saving Weight
Epoch: 5961	Loss: 2.78671295643	Example Output: 94	Example Reward:  1
2.8062
[[-0.04156818 -0.04154414 -0.06649256 -0.06647838 -0.06710296 -0.06736203
  -0.06650549 -0.06720956 -0.0677719  -0.06725276 -0.06631257  0.93223727
  -0.04844195 -0.04854764 -0.04855484 -0.04845581 -

Epoch: 5974	Loss: 3.06940805912	Example Output: 49	Example Reward:  1
[[ 0.04141177  0.04149842  0.06651788  0.06669781  0.06715038  0.06725196
   0.06677117  0.06702533  0.06792996  0.06728737  0.06618627  0.06795172
   0.04836622  0.04844771  0.04839922  0.0484719   0.05263498]]
2.80568
[[-0.04141177 -0.04149842 -0.06651788 -0.06669781 -0.06715038 -0.06725196
   0.93322885 -0.06702533 -0.06792996 -0.06728737 -0.06618627 -0.06795172
  -0.04836622 -0.04844771 -0.04839922 -0.0484719  -0.05263498]
 [-0.04141177 -0.04149842 -0.06651788 -0.06669781 -0.06715038 -0.06725196
  -0.06677117 -0.06702533 -0.06792996 -0.06728737 -0.06618627  0.93204826
  -0.04836622 -0.04844771 -0.04839922 -0.0484719  -0.05263498]]
Epoch: 5975	Loss: 2.79129090309	Example Output: 1*	Example Reward:  1
[[ 0.04140896  0.04150115  0.06653588  0.06667479  0.06714663  0.06724071
   0.06677317  0.06697653  0.06792486  0.06733847  0.06618875  0.06800081
   0.04837419  0.04842888  0.04837742  0.04847998  0.05262876]]
2.822

Epoch: 5988	Loss: 3.58204092979	Example Output: Y9	Example Reward:  -0.3
[[ 0.04146426  0.04166083  0.06644308  0.06672969  0.06701116  0.06717708
   0.06682231  0.06666571  0.06765934  0.06736565  0.06633481  0.06820943
   0.04836321  0.04851637  0.04832134  0.04853701  0.05271877]]
4.09849
[[ 0.28756073 -0.01249825  0.28006709  0.27998111  0.27989665  0.27984691
   0.27995333  0.2800003   0.27970222  0.27979031  0.28009957  0.2795372
   0.28549105  0.28544509  0.2855036   0.2854389   0.2841844 ]
 [ 0.28756073  0.28750175  0.28006709  0.27998111  0.27989665  0.27984691
   0.27995333  0.2800003   0.27970222  0.27979031  0.28009957 -0.02046283
   0.28549105  0.28544509  0.2855036   0.2854389   0.2841844 ]]
Epoch: 5989	Loss: 2.89171090126	Example Output: 09	Example Reward:  1
[[ 0.04148541  0.04168695  0.06644613  0.06671464  0.06700648  0.06720014
   0.06680722  0.06666938  0.06761675  0.06734077  0.06633675  0.06818021
   0.04837108  0.04852656  0.04834214  0.04854551  0.05272389]]
2.8

Epoch: 6000	Loss: 2.78722224236	Example Output: 8X	Example Reward:  -0.3
4.09807
[[ 0.28755122  0.28746468  0.28008112  0.27995116  0.27988315  0.27984402
   0.27996927  0.28006324  0.27972057  0.27978873 -0.01988852  0.27958226
   0.28550693  0.28541839  0.28548679  0.28540373  0.28417343]
 [-0.01244878  0.28746468  0.28008112  0.27995116  0.27988315  0.27984402
   0.27996927  0.28006324  0.27972057  0.27978873  0.28011149  0.27958226
   0.28550693  0.28541839  0.28548679  0.28540373  0.28417343]]
Saving Weight
Epoch: 6001	Loss: 3.04384126663	Example Output: 2*	Example Reward:  1
[[ 0.04148805  0.04177156  0.06638531  0.06682802  0.06707793  0.06715559
   0.06676228  0.06646963  0.06762046  0.06740998  0.06627799  0.06806601
   0.04829539  0.04860061  0.04836616  0.04866445  0.05276062]]
2.8227
[[-0.04148805 -0.04177156 -0.06638531 -0.06682802  0.93292207 -0.06715559
  -0.06676228 -0.06646963 -0.06762046 -0.06740998 -0.06627799 -0.06806601
  -0.04829539 -0.04860061 -0.04836616 -0.0486

Epoch: 6015	Loss: 2.78520891666	Example Output: 60	Example Reward:  1
[[ 0.04141087  0.04157895  0.06641317  0.06699988  0.06724062  0.06724485
   0.06694001  0.06675922  0.06764638  0.0672627   0.06629556  0.06807363
   0.04816083  0.04840308  0.04836629  0.04851239  0.05269165]]
2.80615
[[-0.04141087 -0.04157895 -0.06641317 -0.06699988 -0.06724062 -0.06724485
  -0.06694001 -0.06675922  0.93235362 -0.0672627  -0.06629556 -0.06807363
  -0.04816083 -0.04840308 -0.04836629 -0.04851239 -0.05269165]
 [-0.04141087 -0.04157895  0.93358684 -0.06699988 -0.06724062 -0.06724485
  -0.06694001 -0.06675922 -0.06764638 -0.0672627  -0.06629556 -0.06807363
  -0.04816083 -0.04840308 -0.04836629 -0.04851239 -0.05269165]]
Epoch: 6016	Loss: 3.2023039341	Example Output: 71	Example Reward:  1
[[ 0.04139459  0.04159922  0.06646103  0.06695998  0.06724297  0.06720695
   0.06695507  0.06673572  0.0676382   0.06730483  0.06627145  0.06807797
   0.04819843  0.04838856  0.04835387  0.04852281  0.05268836]]
2.806


Epoch: 6027	Loss: 2.94108188152	Example Output: 9-	Example Reward:  1
[[ 0.04130643  0.04154123  0.06634901  0.06706188  0.06725407  0.067137
   0.06713242  0.0666685   0.06773926  0.06728644  0.06621091  0.06824996
   0.04812383  0.04833659  0.0483225   0.04852999  0.05275001]]
2.8215
[[-0.04130643 -0.04154123 -0.06634901 -0.06706188 -0.06725407 -0.067137
  -0.06713242 -0.0666685  -0.06773926 -0.06728644 -0.06621091  0.93175006
  -0.04812383 -0.04833659 -0.0483225  -0.04852999 -0.05275001]
 [-0.04130643 -0.04154123 -0.06634901 -0.06706188 -0.06725407 -0.067137
  -0.06713242 -0.0666685  -0.06773926 -0.06728644 -0.06621091 -0.06824996
  -0.04812383  0.95166343 -0.0483225  -0.04852999 -0.05275001]]
Epoch: 6028	Loss: 3.3270606041	Example Output: 18	Example Reward:  1
[[ 0.04129256  0.04154875  0.06641935  0.06706589  0.06723635  0.06709657
   0.06717548  0.06664977  0.06770685  0.06727209  0.06623114  0.06825714
   0.04814391  0.04836399  0.04829011  0.04851663  0.05273345]]
2.80662
[[-0.

Epoch: 6039	Loss: 3.19477031231	Example Output: 12	Example Reward:  1
[[ 0.04120614  0.04139262  0.06636921  0.06744589  0.0670988   0.06692684
   0.06745744  0.06677172  0.06780478  0.06714991  0.06640246  0.06810508
   0.04808152  0.04846853  0.04817965  0.04839564  0.05274381]]
2.80553
[[-0.04120614 -0.04139262 -0.06636921  0.93255413 -0.0670988  -0.06692684
  -0.06745744 -0.06677172 -0.06780478 -0.06714991 -0.06640246 -0.06810508
  -0.04808152 -0.04846853 -0.04817965 -0.04839564 -0.05274381]
 [-0.04120614 -0.04139262 -0.06636921 -0.06744589  0.9329012  -0.06692684
  -0.06745744 -0.06677172 -0.06780478 -0.06714991 -0.06640246 -0.06810508
  -0.04808152 -0.04846853 -0.04817965 -0.04839564 -0.05274381]]
Epoch: 6040	Loss: 2.91861941814	Example Output: -7	Example Reward:  -0.3
[[ 0.04120022  0.04138956  0.06635704  0.0674979   0.06711148  0.06689586
   0.06749388  0.06674086  0.06782068  0.06715638  0.06638653  0.06810585
   0.04806266  0.04847334  0.04816178  0.04839048  0.05275543]]
4.

Epoch: 6051	Loss: 3.45302689075	Example Output: *+	Example Reward:  -0.3
[[ 0.04131261  0.04151922  0.06635183  0.06732824  0.06707062  0.06682501
   0.06736702  0.06680981  0.0676995   0.0669529   0.0664947   0.06790976
   0.04822532  0.04856743  0.04828269  0.04850081  0.05278257]]
4.09544
[[ 0.28760621  0.28754425  0.28009447  0.27980155  0.27987882  0.2799525
   0.27978989  0.27995706  0.27969018  0.27991414  0.28005159  0.27962708
   0.28553241  0.28542978 -0.01448481  0.28544977  0.28416526]
 [ 0.28760621  0.28754425  0.28009447  0.27980155  0.27987882  0.2799525
   0.27978989  0.27995706  0.27969018  0.27991414  0.28005159  0.27962708
  -0.0144676   0.28542978  0.28551522  0.28544977  0.28416526]]
Epoch: 6052	Loss: 2.93887460232	Example Output: 8-	Example Reward:  1
[[ 0.0413046   0.04152255  0.06634878  0.0673179   0.06708592  0.06687757
   0.06737556  0.06679342  0.06769083  0.06694029  0.06651063  0.06792264
   0.04820244  0.04857756  0.04827601  0.04847961  0.05277374]]
2.82

Epoch: 6063	Loss: 3.07234761715	Example Output: X*	Example Reward:  1
[[ 0.04116174  0.04139259  0.06632401  0.06748404  0.06706873  0.06687098
   0.06736013  0.06693351  0.06785448  0.06696569  0.06643396  0.0680466
   0.04820217  0.04853589  0.04821152  0.04839455  0.05275935]]
2.8468
[[ 0.95883828 -0.04139259 -0.06632401 -0.06748404 -0.06706873 -0.06687098
  -0.06736013 -0.06693351 -0.06785448 -0.06696569 -0.06643396 -0.0680466
  -0.04820217 -0.04853589 -0.04821152 -0.04839455 -0.05275935]
 [-0.04116174 -0.04139259 -0.06632401 -0.06748404 -0.06706873 -0.06687098
  -0.06736013 -0.06693351 -0.06785448 -0.06696569 -0.06643396 -0.0680466
  -0.04820217 -0.04853589  0.95178849 -0.04839455 -0.05275935]]
Epoch: 6064	Loss: 3.45398106575	Example Output: X3	Example Reward:  -0.3
[[ 0.0411949   0.04138405  0.06631289  0.06747227  0.06706181  0.0668687
   0.06735474  0.06694072  0.06789208  0.06696668  0.06639908  0.06802876
   0.04819481  0.04852507  0.04823327  0.04840392  0.05276632]]
4.09787

Epoch: 6075	Loss: 2.63255934715	Example Output: +2	Example Reward:  -0.3
[[ 0.0412428   0.04138112  0.06623636  0.06750868  0.06708676  0.06680082
   0.0673845   0.06697262  0.06798546  0.06679005  0.06639583  0.06798836
   0.0481701   0.04855089  0.04826704  0.04843164  0.05280703]]
4.10029
[[ 0.28762719  0.28758568  0.2801291   0.2797474   0.279874    0.27995977
   0.27978468  0.27990824  0.27960438  0.27996299  0.28008127  0.27960351
  -0.01445103  0.28543475  0.2855199   0.28547052  0.2841579 ]
 [ 0.28762719  0.28758568  0.2801291   0.2797474  -0.02012603  0.27995977
   0.27978468  0.27990824  0.27960438  0.27996299  0.28008127  0.27960351
   0.28554899  0.28543475  0.2855199   0.28547052  0.2841579 ]]
Epoch: 6076	Loss: 3.58632736206	Example Output: /6	Example Reward:  -0.3
[[ 0.04124979  0.04139605  0.06626615  0.06749404  0.06706884  0.06679525
   0.06739347  0.06694612  0.06798942  0.06678426  0.06637513  0.06798312
   0.04818041  0.04857484  0.04826033  0.04843456  0.05280818]]

Epoch: 6087	Loss: 3.45140571594	Example Output: /+	Example Reward:  -0.3
[[ 0.0413244   0.04149834  0.06617343  0.06756613  0.06702109  0.06678665
   0.06729953  0.0668505   0.06802763  0.06680045  0.06622773  0.06773935
   0.04824113  0.04864473  0.04833704  0.04859652  0.05286543]]
4.09558
[[ 0.28760269  0.28755051  0.28014797  0.27973017  0.2798937   0.27996403
   0.27981016  0.27994487  0.27959174  0.27995986  0.2801317   0.2796782
   0.28552768  0.28540659  0.28549889 -0.01457896  0.28414038]
 [ 0.28760269  0.28755051  0.28014797  0.27973017  0.2798937   0.27996403
   0.27981016  0.27994487  0.27959174  0.27995986  0.2801317   0.2796782
  -0.01447234  0.28540659  0.28549889  0.28542107  0.28414038]]
Epoch: 6088	Loss: 2.80771253109	Example Output: 65	Example Reward:  1
[[ 0.04130781  0.04147085  0.06616303  0.06760605  0.06703992  0.06682101
   0.0673042   0.06685822  0.06807641  0.06678455  0.06622639  0.06775502
   0.04822014  0.04862304  0.0483187   0.04857756  0.05284716]]
2.80

Epoch: 6099	Loss: 2.91285655499	Example Output: +7	Example Reward:  -0.3
4.10006
[[ 0.28764081  0.28763455  0.28013891  0.27966335  0.27984476  0.27991354
   0.27977037  0.27990243  0.27956101  0.28002968  0.28001809  0.27965537
  -0.01442024  0.28544426  0.28552771  0.28549144  0.2841841 ]
 [ 0.28764081  0.28763455  0.28013891  0.27966335  0.27984476  0.27991354
   0.27977037  0.27990243  0.27956101 -0.01997032  0.28001809  0.27965537
   0.28557977  0.28544426  0.28552771  0.28549144  0.2841841 ]]
Epoch: 6100	Loss: 2.66001400948	Example Output: 2-	Example Reward:  1
[[ 0.04119084  0.04121773  0.06619161  0.06782464  0.06718335  0.06696629
   0.06742164  0.06701765  0.06817646  0.06654317  0.06659116  0.06779724
   0.0480705   0.04850598  0.04824166  0.04835907  0.05270103]]
2.82187
[[-0.04119084 -0.04121773 -0.06619161 -0.06782464  0.93281662 -0.06696629
  -0.06742164 -0.06701765 -0.06817646 -0.06654317 -0.06659116 -0.06779724
  -0.0480705  -0.04850598 -0.04824166 -0.04835907 -0.05270

Epoch: 6111	Loss: 2.65844581127	Example Output: 76	Example Reward:  1
[[ 0.04145073  0.04151974  0.06631645  0.06774489  0.0670555   0.06710333
   0.06710506  0.06692138  0.06809599  0.06646642  0.06635918  0.06755242
   0.04802162  0.04853677  0.04841599  0.04850149  0.05283307]]
2.80581
[[-0.04145073 -0.04151974 -0.06631645 -0.06774489 -0.0670555  -0.06710333
  -0.06710506 -0.06692138 -0.06809599  0.93353355 -0.06635918 -0.06755242
  -0.04802162 -0.04853677 -0.04841599 -0.04850149 -0.05283307]
 [-0.04145073 -0.04151974 -0.06631645 -0.06774489 -0.0670555  -0.06710333
  -0.06710506 -0.06692138  0.93190402 -0.06646642 -0.06635918 -0.06755242
  -0.04802162 -0.04853677 -0.04841599 -0.04850149 -0.05283307]]
Epoch: 6112	Loss: 3.45502097607	Example Output: +5	Example Reward:  -0.3
[[ 0.04144816  0.041513    0.06635168  0.06776483  0.06708134  0.0670848
   0.06709207  0.06690713  0.06814326  0.06646179  0.06635123  0.06751397
   0.04801061  0.0485288   0.04841347  0.04850595  0.0528279 ]]
4.1

Epoch: 6125	Loss: 3.06897838116	Example Output: 6	Example Reward:  1
[[ 0.04145316  0.04144059  0.06632039  0.0676169   0.06724901  0.06736899
   0.06714457  0.066865    0.06791812  0.06659275  0.06643423  0.06762661
   0.04796265  0.04833503  0.04848006  0.04832616  0.05286581]]
2.81725
[[-0.04145316 -0.04144059 -0.06632039 -0.0676169  -0.06724901 -0.06736899
  -0.06714457 -0.066865    0.93208188 -0.06659275 -0.06643423 -0.06762661
  -0.04796265 -0.04833503 -0.04848006 -0.04832616 -0.05286581]
 [-0.04145316 -0.04144059 -0.06632039 -0.0676169  -0.06724901 -0.06736899
  -0.06714457 -0.066865   -0.06791812 -0.06659275 -0.06643423 -0.06762661
  -0.04796265 -0.04833503 -0.04848006 -0.04832616  0.9471342 ]]
Epoch: 6126	Loss: 3.04433064461	Example Output: 48	Example Reward:  1
[[ 0.04144869  0.04144323  0.06628745  0.06763774  0.06721672  0.06735311
   0.06714527  0.06687796  0.06791202  0.06660323  0.06642418  0.06763571
   0.0479615   0.04835368  0.04848115  0.04833964  0.05287877]]
2.8064

Epoch: 6137	Loss: 3.19378728867	Example Output: 25	Example Reward:  1
[[ 0.04134585  0.04135345  0.06639237  0.06763902  0.06732133  0.06736361
   0.06728619  0.06677211  0.06805634  0.06677073  0.06639963  0.06767514
   0.04782161  0.0482915   0.04834149  0.04832738  0.05284229]]
2.80583
[[-0.04134585 -0.04135345 -0.06639237 -0.06763902  0.9326787  -0.06736361
  -0.06728619 -0.06677211 -0.06805634 -0.06677073 -0.06639963 -0.06767514
  -0.04782161 -0.0482915  -0.04834149 -0.04832738 -0.05284229]
 [-0.04134585 -0.04135345 -0.06639237 -0.06763902 -0.06732133 -0.06736361
  -0.06728619  0.9332279  -0.06805634 -0.06677073 -0.06639963 -0.06767514
  -0.04782161 -0.0482915  -0.04834149 -0.04832738 -0.05284229]]
Epoch: 6138	Loss: 3.07674891949	Example Output: 05	Example Reward:  1
[[ 0.04136509  0.04134692  0.06638302  0.06760897  0.0673241   0.06738478
   0.06726971  0.06678579  0.0680931   0.06681194  0.06636828  0.0676759
   0.04780114  0.04827096  0.04834017  0.04833489  0.05283529]]
2.8065

Epoch: 6149	Loss: 3.32274954319	Example Output: YY	Example Reward:  -0.3
[[ 0.04146796  0.0414813   0.06628922  0.06758002  0.06721462  0.06729016
   0.06705024  0.06700647  0.06798162  0.06681588  0.06623961  0.06744119
   0.04794572  0.04833654  0.04853548  0.04846785  0.05285606]]
4.09089
[[ 0.28755963 -0.01244439  0.28011325  0.279726    0.27983564  0.27981296
   0.27988493  0.27989808  0.27960554  0.27995527  0.28012812  0.27976766
   0.28561628  0.28549907  0.28543937  0.28545964  0.28414318]
 [ 0.28755963 -0.01244439  0.28011325  0.279726    0.27983564  0.27981296
   0.27988493  0.27989808  0.27960554  0.27995527  0.28012812  0.27976766
   0.28561628  0.28549907  0.28543937  0.28545964  0.28414318]]
Epoch: 6150	Loss: 2.91658260822	Example Output: 1*	Example Reward:  1
[[ 0.04147431  0.04146048  0.06628333  0.06759135  0.06719384  0.06728838
   0.06705058  0.06704976  0.06795632  0.06680921  0.06628016  0.06747776
   0.04793804  0.04833885  0.04850768  0.04845592  0.05284405]]
2.

Epoch: 6161	Loss: 2.66353256702	Example Output: Y/	Example Reward:  1
2.84621
[[-0.04141266  0.95851189 -0.06626947 -0.06787189 -0.06703031 -0.06731064
  -0.0670311  -0.06710473 -0.0679711  -0.06668435 -0.06633712 -0.06739445
  -0.0479106  -0.04823431 -0.04861763 -0.04853453 -0.05279696]
 [-0.04141266 -0.04148814 -0.06626947 -0.06787189 -0.06703031 -0.06731064
  -0.0670311  -0.06710473 -0.0679711  -0.06668435 -0.06633712 -0.06739445
  -0.0479106  -0.04823431 -0.04861763  0.95146549 -0.05279696]]
Epoch: 6162	Loss: 3.32651665211	Example Output: *3	Example Reward:  -0.3
[[ 0.0414014   0.04149792  0.06627486  0.06789871  0.06699076  0.06731629
   0.06704285  0.06707507  0.06796148  0.06668214  0.06636475  0.06742523
   0.04789605  0.04823114  0.04861367  0.04854057  0.05278716]]
4.10051
[[ 0.2875796   0.28755063  0.28011754  0.27963039  0.27990279  0.27980512
   0.27988717  0.27987748  0.27961159  0.27999535  0.28009057  0.27977243
   0.28563121  0.28553069 -0.0145841   0.28543782  0.28416

Epoch: 6175	Loss: 2.50831050873	Example Output: 27	Example Reward:  1
[[ 0.04134868  0.04151415  0.06624856  0.06792609  0.06702191  0.06717543
   0.06713118  0.06703913  0.06794702  0.06680813  0.06637266  0.0673476
   0.04790645  0.04833449  0.04853404  0.04858608  0.05275849]]
2.80625
[[-0.04134868 -0.04151415 -0.06624856 -0.06792609  0.93297809 -0.06717543
  -0.06713118 -0.06703913 -0.06794702 -0.06680813 -0.06637266 -0.0673476
  -0.04790645 -0.04833449 -0.04853404 -0.04858608 -0.05275849]
 [-0.04134868 -0.04151415 -0.06624856 -0.06792609 -0.06702191 -0.06717543
  -0.06713118 -0.06703913 -0.06794702  0.9331919  -0.06637266 -0.0673476
  -0.04790645 -0.04833449 -0.04853404 -0.04858608 -0.05275849]]
Epoch: 6176	Loss: 2.37485909462	Example Output: 31	Example Reward:  1
[[ 0.04135292  0.04152047  0.06627436  0.06790534  0.06702885  0.06721405
   0.0671253   0.06702148  0.06793457  0.06683101  0.06636552  0.06733024
   0.04788939  0.04832264  0.04852873  0.04858561  0.05276958]]
2.80529


Epoch: 6187	Loss: 3.04603934288	Example Output: 1Y	Example Reward:  -0.3
[[ 0.04138061  0.0416681   0.06623332  0.06770103  0.06680674  0.06742059
   0.0670771   0.06696308  0.0676863   0.06682706  0.06629338  0.06733442
   0.04815048  0.04848049  0.04863309  0.04855926  0.05278493]]
4.09839
[[ 0.28758582  0.28749958  0.28013    -0.02031031  0.27995798  0.27977383
   0.27987689  0.2799111   0.27969411  0.2799519   0.280112    0.2797997
   0.28555486  0.28545585  0.28541008  0.28543225  0.28416455]
 [ 0.28758582 -0.01250043  0.28013     0.2796897   0.27995798  0.27977383
   0.27987689  0.2799111   0.27969411  0.2799519   0.280112    0.2797997
   0.28555486  0.28545585  0.28541008  0.28543225  0.28416455]]
Epoch: 6188	Loss: 2.94067904949	Example Output: 30	Example Reward:  1
[[ 0.04137778  0.04164918  0.06624915  0.06768695  0.06679729  0.06742162
   0.06707717  0.06698769  0.06766532  0.06678543  0.0663508   0.06734849
   0.04816185  0.04849232  0.04863442  0.04855072  0.05276388]]
2.80

Epoch: 6199	Loss: 2.35335261822	Example Output: *3	Example Reward:  -0.3
[[ 0.0412127   0.04145838  0.06612082  0.06766459  0.066933    0.06743912
   0.06735674  0.06698957  0.06776877  0.06687318  0.06653354  0.06757765
   0.04797726  0.0484622   0.04847731  0.04842687  0.05272834]]
4.10046
[[ 0.28763622  0.28756249  0.28016376  0.27970064  0.27992013  0.27976826
   0.27979299  0.27990314  0.27966937  0.27993804  0.28003994  0.27972671
   0.28560683  0.28546134 -0.01454319  0.28547195  0.28418151]
 [ 0.28763622  0.28756249  0.28016376  0.27970064  0.27992013 -0.02023173
   0.27979299  0.27990314  0.27966937  0.27993804  0.28003994  0.27972671
   0.28560683  0.28546134  0.28545684  0.28547195  0.28418151]]
Epoch: 6200	Loss: 2.91570568085	Example Output: 4/	Example Reward:  1
[[ 0.04121982  0.04145342  0.06611809  0.06764895  0.06693663  0.06740966
   0.06736295  0.06699919  0.06775872  0.06685618  0.06654074  0.06759755
   0.04797832  0.04846722  0.04849453  0.0484239   0.05273421]]
2.

Epoch: 6211	Loss: 3.1977288723	Example Output: *5	Example Reward:  -0.3
[[ 0.04135244  0.04159536  0.06612232  0.06765904  0.06677953  0.06742309
   0.06735366  0.0667666   0.06774668  0.06694714  0.06637698  0.06742027
   0.04801428  0.04849729  0.04855237  0.04854525  0.05284772]]
4.10043
[[ 0.28759429  0.28752142  0.28016332  0.27970231  0.27996615  0.27977309
   0.27979392  0.27997002  0.27967599  0.27991587  0.2800869   0.27977395
   0.28559572  0.28545082 -0.01456571  0.28543645  0.28414568]
 [ 0.28759429  0.28752142  0.28016332  0.27970231  0.27996615  0.27977309
   0.27979392 -0.02002998  0.27967599  0.27991587  0.2800869   0.27977395
   0.28559572  0.28545082  0.28543431  0.28543645  0.28414568]]
Epoch: 6212	Loss: 2.94405694008	Example Output: X-	Example Reward:  1
[[ 0.04134521  0.04161409  0.06614813  0.06767265  0.06674404  0.06747644
   0.06731823  0.0667448   0.06777029  0.06696244  0.06636801  0.06741262
   0.04800104  0.04847681  0.04853607  0.04855753  0.05285163]]
2.8

Epoch: 6226	Loss: 2.94405055046	Example Output: 07	Example Reward:  1
[[ 0.04145009  0.04167082  0.06607875  0.0678406   0.06650057  0.06735447
   0.06725384  0.06664928  0.06761808  0.06676864  0.06669111  0.06743399
   0.04795918  0.04865385  0.04860882  0.04861055  0.0528574 ]]
2.80726
[[-0.04145009 -0.04167082  0.93392122 -0.0678406  -0.06650057 -0.06735447
  -0.06725384 -0.06664928 -0.06761808 -0.06676864 -0.06669111 -0.06743399
  -0.04795918 -0.04865385 -0.04860882 -0.04861055 -0.0528574 ]
 [-0.04145009 -0.04167082 -0.06607875 -0.0678406  -0.06650057 -0.06735447
  -0.06725384 -0.06664928 -0.06761808  0.93323135 -0.06669111 -0.06743399
  -0.04795918 -0.04865385 -0.04860882 -0.04861055 -0.0528574 ]]
Epoch: 6227	Loss: 3.06714997292	Example Output: 63	Example Reward:  1
[[ 0.04143459  0.04168203  0.06608701  0.06784108  0.0665068   0.06732262
   0.06728187  0.06661326  0.06761518  0.06679693  0.06668065  0.06743592
   0.0479482   0.04865715  0.04858244  0.0486345   0.05287966]]
2.805

Epoch: 6238	Loss: 3.45273039341	Example Output: 4*	Example Reward:  1
[[ 0.04132236  0.04171562  0.06620983  0.06774185  0.06670108  0.06752861
   0.06729952  0.06661575  0.06774338  0.06681778  0.06641794  0.0673816
   0.04791936  0.0486173   0.04848189  0.04861587  0.0528703 ]]
2.82225
[[-0.04132236 -0.04171562 -0.06620983 -0.06774185 -0.06670108 -0.06752861
   0.93270046 -0.06661575 -0.06774338 -0.06681778 -0.06641794 -0.0673816
  -0.04791936 -0.0486173  -0.04848189 -0.04861587 -0.0528703 ]
 [-0.04132236 -0.04171562 -0.06620983 -0.06774185 -0.06670108 -0.06752861
  -0.06729952 -0.06661575 -0.06774338 -0.06681778 -0.06641794 -0.0673816
  -0.04791936 -0.0486173   0.95151812 -0.04861587 -0.0528703 ]]
Epoch: 6239	Loss: 3.3333712101	Example Output: 8*	Example Reward:  1
[[ 0.04131916  0.04177155  0.06622492  0.06769373  0.06671517  0.06752551
   0.06730823  0.06656012  0.06770781  0.06684843  0.06637544  0.06734893
   0.04793798  0.04861723  0.04851096  0.04864822  0.05288655]]
2.82297
[

Epoch: 6250	Loss: 2.65658152103	Example Output: 78	Example Reward:  1
2.80701
[[-0.04136354 -0.04189598 -0.06639597 -0.06748848 -0.0666324  -0.06757167
  -0.06717782 -0.0664813  -0.06744874  0.93309814 -0.06641375 -0.0674211
  -0.04802521 -0.04854231 -0.04863157 -0.04878482 -0.05282345]
 [-0.04136354 -0.04189598 -0.06639597 -0.06748848 -0.0666324  -0.06757167
  -0.06717782 -0.0664813  -0.06744874 -0.06690186  0.93358624 -0.0674211
  -0.04802521 -0.04854231 -0.04863157 -0.04878482 -0.05282345]]
Saving Weight
Epoch: 6251	Loss: 2.7869799614	Example Output: 79	Example Reward:  1
[[ 0.04134308  0.04185366  0.06638834  0.06748263  0.06662738  0.06754746
   0.06722634  0.0665061   0.06751685  0.06691294  0.06642209  0.06746095
   0.04801371  0.04852619  0.04861403  0.04875267  0.0528056 ]]
2.80616
[[-0.04134308 -0.04185366 -0.06638834 -0.06748263 -0.06662738 -0.06754746
  -0.06722634 -0.0665061  -0.06751685  0.93308705 -0.06642209 -0.06746095
  -0.04801371 -0.04852619 -0.04861403 -0.04875267 

Epoch: 6265	Loss: 2.91877169609	Example Output: *8	Example Reward:  -0.3
4.10049
[[ 0.28760841  0.28746897  0.28010494  0.27979162  0.27999908  0.2796436
   0.27983931  0.28001642  0.27978754  0.27992374  0.28001881  0.27975538
   0.28563043  0.28545603 -0.014622    0.28540444  0.28417349]
 [ 0.28760841  0.28746897  0.28010494  0.27979162  0.27999908  0.2796436
   0.27983931  0.28001642  0.27978754  0.27992374 -0.0199812   0.27975538
   0.28563043  0.28545603  0.28537801  0.28540444  0.28417349]]
Epoch: 6266	Loss: 2.93890521526	Example Output: 91	Example Reward:  1
[[ 0.04129907  0.0417398   0.0663023   0.06740698  0.06668277  0.06782148
   0.06720122  0.06666186  0.06735756  0.06690988  0.06662888  0.06750587
   0.04790203  0.04848463  0.04871393  0.04864091  0.0527408 ]]
2.80563
[[-0.04129907 -0.0417398  -0.0663023  -0.06740698 -0.06668277 -0.06782148
  -0.06720122 -0.06666186 -0.06735756 -0.06690988 -0.06662888  0.9324941
  -0.04790203 -0.04848463 -0.04871393 -0.04864091 -0.0527408 

Epoch: 6280	Loss: 2.91736733913	Example Output: 40	Example Reward:  1
[[ 0.04101174  0.04136677  0.06658081  0.0677002   0.06684689  0.06794425
   0.06741902  0.06689718  0.06739824  0.06691305  0.06708083  0.06760696
   0.0476356   0.04824874  0.04858047  0.04829765  0.05247157]]
2.80568
[[-0.04101174 -0.04136677 -0.06658081 -0.0677002  -0.06684689 -0.06794425
   0.93258095 -0.06689718 -0.06739824 -0.06691305 -0.06708083 -0.06760696
  -0.0476356  -0.04824874 -0.04858047 -0.04829765 -0.05247157]
 [-0.04101174 -0.04136677  0.93341917 -0.0677002  -0.06684689 -0.06794425
  -0.06741902 -0.06689718 -0.06739824 -0.06691305 -0.06708083 -0.06760696
  -0.0476356  -0.04824874 -0.04858047 -0.04829765 -0.05247157]]
Saving Weight
Epoch: 6281	Loss: 3.04351410866	Example Output: *5	Example Reward:  -0.3
[[ 0.04102059  0.04139382  0.0666075   0.06769157  0.06683463  0.06794614
   0.06742806  0.06684762  0.06735926  0.06689958  0.06709401  0.06759865
   0.04764654  0.04825277  0.04860526  0.04830118  0

Epoch: 6294	Loss: 3.06727266312	Example Output: 90	Example Reward:  1
[[ 0.04088861  0.04120419  0.06654274  0.06777668  0.0669257   0.06782935
   0.06765873  0.06680834  0.06777113  0.06709254  0.06697275  0.06774525
   0.04740704  0.04817629  0.04841795  0.04827065  0.05251212]]
2.8052
[[-0.04088861 -0.04120419 -0.06654274 -0.06777668 -0.0669257  -0.06782935
  -0.06765873 -0.06680834 -0.06777113 -0.06709254 -0.06697275  0.93225473
  -0.04740704 -0.04817629 -0.04841795 -0.04827065 -0.05251212]
 [-0.04088861 -0.04120419  0.93345726 -0.06777668 -0.0669257  -0.06782935
  -0.06765873 -0.06680834 -0.06777113 -0.06709254 -0.06697275 -0.06774525
  -0.04740704 -0.04817629 -0.04841795 -0.04827065 -0.05251212]]
Epoch: 6295	Loss: 3.06818220615	Example Output: 84	Example Reward:  1
[[ 0.04087003  0.04121529  0.06659927  0.06779892  0.06690513  0.06784779
   0.0676615   0.06675898  0.06775155  0.06707734  0.0670116   0.06778902
   0.04740214  0.04818131  0.0483828   0.04825961  0.05248773]]
2.8048

Epoch: 6306	Loss: 2.35217154026	Example Output: 08	Example Reward:  1
[[ 0.04070699  0.04092461  0.06667675  0.06781758  0.06729815  0.06773096
   0.06776281  0.06703357  0.06774444  0.0670464   0.06724107  0.06799323
   0.04727581  0.04802408  0.04823566  0.04811432  0.05237353]]
2.80504
[[-0.04070699 -0.04092461  0.93332326 -0.06781758 -0.06729815 -0.06773096
  -0.06776281 -0.06703357 -0.06774444 -0.0670464  -0.06724107 -0.06799323
  -0.04727581 -0.04802408 -0.04823566 -0.04811432 -0.05237353]
 [-0.04070699 -0.04092461 -0.06667675 -0.06781758 -0.06729815 -0.06773096
  -0.06776281 -0.06703357 -0.06774444 -0.0670464   0.93275893 -0.06799323
  -0.04727581 -0.04802408 -0.04823566 -0.04811432 -0.05237353]]
Epoch: 6307	Loss: 2.78462402821	Example Output: 55	Example Reward:  1
[[ 0.04070484  0.04093178  0.066752    0.06783537  0.06728162  0.06776211
   0.06771878  0.06703307  0.06770837  0.06703306  0.06727923  0.06798632
   0.04728563  0.04801067  0.0482288   0.04810613  0.05234218]]
2.804

Epoch: 6318	Loss: 2.94007065296	Example Output: 20	Example Reward:  1
[[ 0.04057865  0.0407938   0.06695315  0.06775437  0.0673756   0.06781456
   0.0677553   0.06731392  0.06767102  0.06703522  0.06733741  0.06801195
   0.0473128   0.04798005  0.04809462  0.04796731  0.05225031]]
2.80451
[[-0.04057865 -0.0407938  -0.06695315 -0.06775437  0.9326244  -0.06781456
  -0.0677553  -0.06731392 -0.06767102 -0.06703522 -0.06733741 -0.06801195
  -0.0473128  -0.04798005 -0.04809462 -0.04796731 -0.05225031]
 [-0.04057865 -0.0407938   0.93304682 -0.06775437 -0.0673756  -0.06781456
  -0.0677553  -0.06731392 -0.06767102 -0.06703522 -0.06733741 -0.06801195
  -0.0473128  -0.04798005 -0.04809462 -0.04796731 -0.05225031]]
Epoch: 6319	Loss: 3.19454746246	Example Output: 08	Example Reward:  1
[[ 0.04054954  0.04076597  0.06696851  0.0677855   0.06742323  0.06778652
   0.06776252  0.06731481  0.06768229  0.0670776   0.06734761  0.06800304
   0.04729025  0.04798464  0.04806158  0.04795695  0.05223948]]
2.804

Epoch: 6333	Loss: 2.91686565876	Example Output: 2	Example Reward:  1
[[ 0.04048827  0.04071381  0.06712412  0.06777682  0.06757868  0.06793122
   0.06774888  0.06720914  0.06735501  0.06709568  0.06756683  0.06828345
   0.0473644   0.04787815  0.04795083  0.04784629  0.05208836]]
2.81669
[[-0.04048827 -0.04071381 -0.06712412 -0.06777682  0.93242133 -0.06793122
  -0.06774888 -0.06720914 -0.06735501 -0.06709568 -0.06756683 -0.06828345
  -0.0473644  -0.04787815 -0.04795083 -0.04784629 -0.05208836]
 [-0.04048827 -0.04071381 -0.06712412 -0.06777682 -0.06757868 -0.06793122
  -0.06774888 -0.06720914 -0.06735501 -0.06709568 -0.06756683 -0.06828345
  -0.0473644  -0.04787815 -0.04795083 -0.04784629  0.94791162]]
Epoch: 6334	Loss: 2.78378884792	Example Output: 60	Example Reward:  1
[[ 0.0404834   0.04072103  0.06714789  0.06776061  0.06759617  0.06794821
   0.06773243  0.06717072  0.06737939  0.06709641  0.06754723  0.06828333
   0.04736616  0.04786251  0.04796585  0.04783989  0.05209878]]
2.8041

Epoch: 6345	Loss: 3.06539883614	Example Output: 0X	Example Reward:  -0.3
[[ 0.04041791  0.04070836  0.06723554  0.0680626   0.06752641  0.06790535
   0.06774317  0.06702393  0.06729131  0.06710222  0.06784604  0.06835999
   0.04725629  0.04784793  0.04783183  0.04783038  0.05201085]]
4.09692
[[ 0.28787464  0.2877875  -0.02017066  0.27958122  0.27974209  0.2796284
   0.27967706  0.27989283  0.2798126   0.27986935  0.27964619  0.27949202
   0.28582314  0.28564563  0.28565046  0.28565088  0.28439677]
 [-0.01212537  0.2877875   0.27982935  0.27958122  0.27974209  0.2796284
   0.27967706  0.27989283  0.2798126   0.27986935  0.27964619  0.27949202
   0.28582314  0.28564563  0.28565046  0.28565088  0.28439677]]
Epoch: 6346	Loss: 3.20032641888	Example Output: 83	Example Reward:  1
[[ 0.0404224   0.04070123  0.0672365   0.06805541  0.06758256  0.06786987
   0.06776378  0.06705073  0.0672778   0.06707905  0.06781608  0.06834942
   0.04726257  0.04785061  0.04782991  0.04783862  0.0520135 ]]
2.80

Epoch: 6357	Loss: 3.32663269043	Example Output: Y*	Example Reward:  1
[[ 0.04050594  0.04064831  0.06701439  0.0680111   0.06756213  0.06794063
   0.0678308   0.06703004  0.06737749  0.06710183  0.06765831  0.06833932
   0.04722208  0.04795784  0.04790458  0.04778472  0.05211055]]
2.84622
[[-0.04050594  0.95935172 -0.06701439 -0.0680111  -0.06756213 -0.06794063
  -0.0678308  -0.06703004 -0.06737749 -0.06710183 -0.06765831 -0.06833932
  -0.04722208 -0.04795784 -0.04790458 -0.04778472 -0.05211055]
 [-0.04050594 -0.04064831 -0.06701439 -0.0680111  -0.06756213 -0.06794063
  -0.0678308  -0.06703004 -0.06737749 -0.06710183 -0.06765831 -0.06833932
  -0.04722208 -0.04795784  0.95209545 -0.04778472 -0.05211055]]
Epoch: 6358	Loss: 3.06358246803	Example Output: 79	Example Reward:  1
[[ 0.04050476  0.04068626  0.06702574  0.06800773  0.06751415  0.06793438
   0.06780764  0.06703024  0.06737571  0.06709912  0.06764213  0.06830213
   0.04725522  0.04797043  0.04793118  0.04780195  0.05211121]]
2.803

Epoch: 6369	Loss: 2.50393855572	Example Output: 36	Example Reward:  1
2.80385
[[-0.04057073 -0.04072789 -0.06703758 -0.06789464 -0.06748018  0.93202472
  -0.06769708 -0.06723288 -0.06713954 -0.0669143  -0.06769322 -0.06819444
  -0.04743692 -0.04813163 -0.04796432 -0.04780143 -0.052108  ]
 [-0.04057073 -0.04072789 -0.06703758 -0.06789464 -0.06748018 -0.06797527
  -0.06769708 -0.06723288  0.93286043 -0.0669143  -0.06769322 -0.06819444
  -0.04743692 -0.04813163 -0.04796432 -0.04780143 -0.052108  ]]
Epoch: 6370	Loss: 2.783355546	Example Output: 5Y	Example Reward:  -0.3
[[ 0.04055881  0.04070598  0.06703824  0.06790006  0.06746334  0.06802547
   0.06770378  0.06724797  0.06716325  0.066894    0.06771937  0.06820057
   0.04742135  0.04812567  0.04795938  0.04777376  0.05209899]]
4.09714
[[ 0.28783238  0.28778821  0.27988854  0.27963001  0.27976102  0.27959237
   0.27968886 -0.02017439  0.27985105  0.27993181  0.27968422  0.27953982
   0.28577361  0.28556231  0.2856122   0.28566787  0.2843703

Epoch: 6383	Loss: 3.04361031055	Example Output: 15	Example Reward:  1
[[ 0.04050496  0.0405034   0.06708149  0.06799265  0.06749433  0.06806071
   0.06788912  0.06759255  0.0671024   0.06671341  0.06786451  0.06828919
   0.04741008  0.04801124  0.04792714  0.04758641  0.05197642]]
2.80321
[[-0.04050496 -0.0405034  -0.06708149  0.93200737 -0.06749433 -0.06806071
  -0.06788912 -0.06759255 -0.0671024  -0.06671341 -0.06786451 -0.06828919
  -0.04741008 -0.04801124 -0.04792714 -0.04758641 -0.05197642]
 [-0.04050496 -0.0405034  -0.06708149 -0.06799265 -0.06749433 -0.06806071
  -0.06788912  0.93240744 -0.0671024  -0.06671341 -0.06786451 -0.06828919
  -0.04741008 -0.04801124 -0.04792714 -0.04758641 -0.05197642]]
Epoch: 6384	Loss: 3.3218637228	Example Output: 61	Example Reward:  1
[[ 0.04050843  0.04051559  0.06710663  0.06801077  0.06747493  0.06808618
   0.06787949  0.0675842   0.06707592  0.06669021  0.06783803  0.06828015
   0.0474118   0.04801141  0.04793492  0.04759546  0.05199583]]
2.8035

Epoch: 6395	Loss: 3.32192952633	Example Output: 46	Example Reward:  1
[[ 0.04047545  0.04050246  0.06716307  0.06784751  0.06767334  0.06833899
   0.06773376  0.06767727  0.06708334  0.06669426  0.06766917  0.06818955
   0.04739003  0.04790909  0.04806693  0.0475445   0.05204132]]
2.80377
[[-0.04047545 -0.04050246 -0.06716307 -0.06784751 -0.06767334 -0.06833899
   0.93226624 -0.06767727 -0.06708334 -0.06669426 -0.06766917 -0.06818955
  -0.04739003 -0.04790909 -0.04806693 -0.0475445  -0.05204132]
 [-0.04047545 -0.04050246 -0.06716307 -0.06784751 -0.06767334 -0.06833899
  -0.06773376 -0.06767727  0.93291664 -0.06669426 -0.06766917 -0.06818955
  -0.04739003 -0.04790909 -0.04806693 -0.0475445  -0.05204132]]
Epoch: 6396	Loss: 2.88952174187	Example Output: 4X	Example Reward:  -0.3
[[ 0.04048382  0.04049746  0.06715263  0.06785765  0.06768677  0.06829812
   0.06776663  0.0676596   0.06711026  0.06670211  0.06764405  0.06821012
   0.04738208  0.04790483  0.04805456  0.04754286  0.05204636]]
4.

Epoch: 6407	Loss: 3.06747448444	Example Output: 83	Example Reward:  1
[[ 0.04049119  0.04055884  0.0672404   0.06760906  0.06775033  0.06842712
   0.06761104  0.06777754  0.06700037  0.06690312  0.06740583  0.06810439
   0.04736038  0.04787999  0.04805048  0.04762587  0.052204  ]]
2.80309
[[-0.04049119 -0.04055884 -0.0672404  -0.06760906 -0.06775033 -0.06842712
  -0.06761104 -0.06777754 -0.06700037 -0.06690312  0.93259418 -0.06810439
  -0.04736038 -0.04787999 -0.04805048 -0.04762587 -0.052204  ]
 [-0.04049119 -0.04055884 -0.0672404  -0.06760906 -0.06775033  0.93157291
  -0.06761104 -0.06777754 -0.06700037 -0.06690312 -0.06740583 -0.06810439
  -0.04736038 -0.04787999 -0.04805048 -0.04762587 -0.052204  ]]
Epoch: 6408	Loss: 2.76238088608	Example Output: *3	Example Reward:  -0.3
4.0998
[[ 0.28785434  0.28783435  0.27982959  0.27972066  0.27967191  0.27947357
   0.27971354  0.2796641   0.27989507  0.27992487  0.27978268  0.27957422
   0.28579652  0.28563175 -0.01441137  0.28570783  0.284336

Epoch: 6421	Loss: 3.04280760288	Example Output: 6/	Example Reward:  1
[[ 0.04050886  0.04049656  0.06710478  0.06783921  0.06795889  0.06836221
   0.06762308  0.06767911  0.06730207  0.06701156  0.06720733  0.06794882
   0.04724266  0.04791313  0.04796138  0.04761223  0.0522281 ]]
2.82123
[[-0.04050886 -0.04049656 -0.06710478 -0.06783921 -0.06795889 -0.06836221
  -0.06762308 -0.06767911  0.93269795 -0.06701156 -0.06720733 -0.06794882
  -0.04724266 -0.04791313 -0.04796138 -0.04761223 -0.0522281 ]
 [-0.04050886 -0.04049656 -0.06710478 -0.06783921 -0.06795889 -0.06836221
  -0.06762308 -0.06767911 -0.06730207 -0.06701156 -0.06720733 -0.06794882
  -0.04724266 -0.04791313 -0.04796138  0.95238775 -0.0522281 ]]
Epoch: 6422	Loss: 3.0449868679	Example Output: 2+	Example Reward:  1
[[ 0.0405082   0.04049792  0.06710575  0.0678286   0.06796759  0.06830925
   0.06763455  0.06769321  0.06733745  0.06703199  0.06716099  0.0679184
   0.04724768  0.04791398  0.04795617  0.04764887  0.05223947]]
2.82114

Epoch: 6435	Loss: 2.91251802444	Example Output: 05	Example Reward:  1
[[ 0.04040962  0.04039725  0.06694874  0.06788697  0.06812756  0.06850952
   0.06785628  0.06767629  0.0672373   0.06720696  0.06719591  0.06797263
   0.04709817  0.04781884  0.0479242   0.04747887  0.0522549 ]]
2.8037
[[-0.04040962 -0.04039725  0.93305123 -0.06788697 -0.06812756 -0.06850952
  -0.06785628 -0.06767629 -0.0672373  -0.06720696 -0.06719591 -0.06797263
  -0.04709817 -0.04781884 -0.0479242  -0.04747887 -0.0522549 ]
 [-0.04040962 -0.04039725 -0.06694874 -0.06788697 -0.06812756 -0.06850952
  -0.06785628  0.93232369 -0.0672373  -0.06720696 -0.06719591 -0.06797263
  -0.04709817 -0.04781884 -0.0479242  -0.04747887 -0.0522549 ]]
Epoch: 6436	Loss: 3.19169700146	Example Output: 50	Example Reward:  1
[[ 0.04040188  0.04037381  0.06696886  0.06790134  0.06812323  0.06850995
   0.06785077  0.06769323  0.06724034  0.06720167  0.06724425  0.0680076
   0.04707982  0.04782014  0.04789538  0.04745044  0.05223728]]
2.80363

Epoch: 6447	Loss: 3.32240080833	Example Output: 88	Example Reward:  1
[[ 0.04035885  0.04026683  0.06697628  0.06790841  0.06820741  0.06853704
   0.06788836  0.0679157   0.06701674  0.06705862  0.06744817  0.06815
   0.04711269  0.0478237   0.04785796  0.04732345  0.05214983]]
2.80332
[[-0.04035885 -0.04026683 -0.06697628 -0.06790841 -0.06820741 -0.06853704
  -0.06788836 -0.0679157  -0.06701674 -0.06705862  0.93255186 -0.06815
  -0.04711269 -0.0478237  -0.04785796 -0.04732345 -0.05214983]
 [-0.04035885 -0.04026683 -0.06697628 -0.06790841 -0.06820741 -0.06853704
  -0.06788836 -0.0679157  -0.06701674 -0.06705862  0.93255186 -0.06815
  -0.04711269 -0.0478237  -0.04785796 -0.04732345 -0.05214983]]
Epoch: 6448	Loss: 3.19904415607	Example Output: -0	Example Reward:  -0.3
[[ 0.04035253  0.04026996  0.06697942  0.06794087  0.06818351  0.06851427
   0.06789029  0.06796654  0.06697001  0.06704529  0.06750797  0.06811944
   0.04713194  0.04781511  0.04784339  0.04734915  0.05212031]]
4.09919
[[ 

Epoch: 6459	Loss: 2.91832482815	Example Output: 6+	Example Reward:  1
[[ 0.04032012  0.04022767  0.06693004  0.06806202  0.06797655  0.0683734
   0.06783286  0.06812299  0.06690399  0.06710143  0.06772912  0.06820612
   0.04712159  0.04780681  0.04781009  0.04745417  0.0520211 ]]
2.82161
[[-0.04032012 -0.04022767 -0.06693004 -0.06806202 -0.06797655 -0.0683734
  -0.06783286 -0.06812299  0.93309599 -0.06710143 -0.06772912 -0.06820612
  -0.04712159 -0.04780681 -0.04781009 -0.04745417 -0.0520211 ]
 [-0.04032012 -0.04022767 -0.06693004 -0.06806202 -0.06797655 -0.0683734
  -0.06783286 -0.06812299 -0.06690399 -0.06710143 -0.06772912 -0.06820612
   0.95287842 -0.04780681 -0.04781009 -0.04745417 -0.0520211 ]]
Epoch: 6460	Loss: 2.91150391102	Example Output: 30	Example Reward:  1
[[ 0.0403224   0.0402388   0.0669024   0.06811371  0.06794608  0.06834319
   0.06783938  0.06810603  0.06692958  0.06708001  0.06771596  0.068179
   0.04714173  0.04782549  0.04781843  0.04747911  0.05201875]]
2.80305
[[

Epoch: 6471	Loss: 2.94505209923	Example Output: 5X	Example Reward:  -0.3
[[ 0.04043151  0.0402869   0.06710722  0.06787813  0.06791819  0.06855498
   0.06770703  0.0679347   0.06679633  0.06712812  0.06768472  0.06814958
   0.04711617  0.04786029  0.04793505  0.04745609  0.05205495]]
4.09693
[[ 0.28787056  0.28791395  0.27986786  0.27963656  0.27962455  0.27943352
   0.27968788 -0.02038041  0.27996111  0.27986157  0.27969459  0.27955514
   0.28586516  0.28564194  0.2856195   0.28576317  0.28438354]
 [-0.01212945  0.28791395  0.27986786  0.27963656  0.27962455  0.27943352
   0.27968788  0.2796196   0.27996111  0.27986157  0.27969459  0.27955514
   0.28586516  0.28564194  0.2856195   0.28576317  0.28438354]]
Epoch: 6472	Loss: 3.19284374714	Example Output: *3	Example Reward:  -0.3
[[ 0.04044915  0.04028833  0.0671109   0.06787635  0.06790371  0.06852745
   0.06769993  0.06789977  0.06682059  0.06714404  0.06768068  0.06816599
   0.04711226  0.04786142  0.04792587  0.04748149  0.05205212]]

Epoch: 6483	Loss: 2.50311682224	Example Output: 33	Example Reward:  1
[[ 0.04038526  0.04017296  0.06719638  0.0677626   0.06801624  0.06848548
   0.0677704   0.06786817  0.06667354  0.06720532  0.06802024  0.06830727
   0.04712771  0.04792176  0.04773669  0.04738794  0.05196205]]
2.80173
[[-0.04038526 -0.04017296 -0.06719638 -0.0677626  -0.06801624  0.9315145
  -0.0677704  -0.06786817 -0.06667354 -0.06720532 -0.06802024 -0.06830727
  -0.04712771 -0.04792176 -0.04773669 -0.04738794 -0.05196205]
 [-0.04038526 -0.04017296 -0.06719638 -0.0677626  -0.06801624  0.9315145
  -0.0677704  -0.06786817 -0.06667354 -0.06720532 -0.06802024 -0.06830727
  -0.04712771 -0.04792176 -0.04773669 -0.04738794 -0.05196205]]
Epoch: 6484	Loss: 2.78323082924	Example Output: 53	Example Reward:  1
[[ 0.04037277  0.04017589  0.06721646  0.06780767  0.06803946  0.06851915
   0.06776098  0.06782064  0.06668342  0.06722994  0.06800579  0.06830084
   0.0471111   0.04790461  0.04771661  0.04738877  0.05194594]]
2.80217

Epoch: 6495	Loss: 2.92190475464	Example Output: Y-	Example Reward:  1
[[ 0.04031805  0.04011856  0.06722423  0.06786419  0.06809571  0.06851561
   0.06780222  0.06784138  0.06669916  0.06722745  0.06805237  0.06823213
   0.04706492  0.04788369  0.0477047   0.04737286  0.05198285]]
2.84626
[[-0.04031805  0.95988142 -0.06722423 -0.06786419 -0.06809571 -0.06851561
  -0.06780222 -0.06784138 -0.06669916 -0.06722745 -0.06805237 -0.06823213
  -0.04706492 -0.04788369 -0.0477047  -0.04737286 -0.05198285]
 [-0.04031805 -0.04011856 -0.06722423 -0.06786419 -0.06809571 -0.06851561
  -0.06780222 -0.06784138 -0.06669916 -0.06722745 -0.06805237 -0.06823213
  -0.04706492  0.95211631 -0.0477047  -0.04737286 -0.05198285]]
Epoch: 6496	Loss: 3.32306978703	Example Output: /4	Example Reward:  -0.3
[[ 0.04034207  0.04018763  0.06724674  0.0678478   0.06807061  0.06851839
   0.06776419  0.06780812  0.06668375  0.06718869  0.06800685  0.06820847
   0.04711164  0.04792182  0.04771544  0.04738858  0.05198921]]
4.

Epoch: 6507	Loss: 3.3241673708	Example Output: 51	Example Reward:  1
[[ 0.04046783  0.04030708  0.06723305  0.06770924  0.06798875  0.06871282
   0.06743719  0.06778708  0.06649372  0.0671147   0.06808332  0.06836087
   0.04716471  0.04791817  0.04782753  0.04740538  0.05198851]]
2.80296
[[-0.04046783 -0.04030708 -0.06723305 -0.06770924 -0.06798875 -0.06871282
  -0.06743719  0.93221295 -0.06649372 -0.0671147  -0.06808332 -0.06836087
  -0.04716471 -0.04791817 -0.04782753 -0.04740538 -0.05198851]
 [-0.04046783 -0.04030708 -0.06723305  0.93229079 -0.06798875 -0.06871282
  -0.06743719 -0.06778708 -0.06649372 -0.0671147  -0.06808332 -0.06836087
  -0.04716471 -0.04791817 -0.04782753 -0.04740538 -0.05198851]]
Epoch: 6508	Loss: 2.65193600655	Example Output: 25	Example Reward:  1
[[ 0.04045937  0.04029138  0.06722011  0.06775538  0.06800393  0.06871463
   0.06744161  0.06779793  0.06652024  0.06709067  0.06808102  0.06836261
   0.0471498   0.047929    0.0478216   0.04738558  0.05197516]]
2.8027

Epoch: 6521	Loss: 3.19562675953	Example Output: 17	Example Reward:  1
[[ 0.04037659  0.04024361  0.06721183  0.06811488  0.06788966  0.06853414
   0.0674716   0.06797601  0.06652566  0.06697494  0.06812132  0.06833091
   0.04716922  0.04796059  0.04762906  0.04749675  0.0519732 ]]
2.80317
[[-0.04037659 -0.04024361 -0.06721183  0.93188512 -0.06788966 -0.06853414
  -0.0674716  -0.06797601 -0.06652566 -0.06697494 -0.06812132 -0.06833091
  -0.04716922 -0.04796059 -0.04762906 -0.04749675 -0.0519732 ]
 [-0.04037659 -0.04024361 -0.06721183 -0.06811488 -0.06788966 -0.06853414
  -0.0674716  -0.06797601 -0.06652566  0.93302506 -0.06812132 -0.06833091
  -0.04716922 -0.04796059 -0.04762906 -0.04749675 -0.0519732 ]]
Epoch: 6522	Loss: 3.04546830654	Example Output: 1*	Example Reward:  1
[[ 0.0403797   0.04025749  0.06719049  0.06816264  0.06786296  0.06851419
   0.06745826  0.06798536  0.06650931  0.06698813  0.06810579  0.06830668
   0.04718676  0.0479726   0.04762445  0.04751775  0.05197742]]
2.820

Epoch: 6533	Loss: 3.0674200058	Example Output: 98	Example Reward:  1
[[ 0.0405619   0.04044576  0.06708501  0.06803674  0.06782395  0.06840525
   0.06725865  0.06783145  0.06645339  0.06716984  0.06783753  0.068214
   0.04723844  0.04807211  0.04773379  0.04766005  0.05217215]]
2.80283
[[-0.0405619  -0.04044576 -0.06708501 -0.06803674 -0.06782395 -0.06840525
  -0.06725865 -0.06783145 -0.06645339 -0.06716984 -0.06783753  0.931786
  -0.04723844 -0.04807211 -0.04773379 -0.04766005 -0.05217215]
 [-0.0405619  -0.04044576 -0.06708501 -0.06803674 -0.06782395 -0.06840525
  -0.06725865 -0.06783145 -0.06645339 -0.06716984  0.93216246 -0.068214
  -0.04723844 -0.04807211 -0.04773379 -0.04766005 -0.05217215]]
Epoch: 6534	Loss: 2.65434992313	Example Output: 44	Example Reward:  1
[[ 0.04053282  0.04041895  0.06712807  0.06802548  0.06783088  0.06841403
   0.06727216  0.06782678  0.06645966  0.06719719  0.06786175  0.06825933
   0.04722869  0.04806795  0.04769222  0.04763546  0.05214864]]
2.80389
[[-0

Epoch: 6545	Loss: 3.19345090389	Example Output: 41	Example Reward:  1
[[ 0.04056376  0.04053042  0.06715539  0.06796407  0.06779756  0.06850847
   0.06714498  0.06764467  0.06646601  0.06738093  0.06768957  0.06833892
   0.04728079  0.04800047  0.04770656  0.04767656  0.0521509 ]]
2.80355
[[-0.04056376 -0.04053042 -0.06715539 -0.06796407 -0.06779756 -0.06850847
   0.93285501 -0.06764467 -0.06646601 -0.06738093 -0.06768957 -0.06833892
  -0.04728079 -0.04800047 -0.04770656 -0.04767656 -0.0521509 ]
 [-0.04056376 -0.04053042 -0.06715539  0.93203592 -0.06779756 -0.06850847
  -0.06714498 -0.06764467 -0.06646601 -0.06738093 -0.06768957 -0.06833892
  -0.04728079 -0.04800047 -0.04770656 -0.04767656 -0.0521509 ]]
Epoch: 6546	Loss: 3.45379090309	Example Output: 6	Example Reward:  1
[[ 0.04056156  0.04052392  0.06717583  0.06795748  0.06782732  0.06850116
   0.06715069  0.06765845  0.06645596  0.06736647  0.06767984  0.06831024
   0.04729346  0.0480001   0.04772383  0.04766911  0.05214457]]
2.8173

Epoch: 6557	Loss: 3.58070964813	Example Output: 11	Example Reward:  1
[[ 0.04071904  0.04075766  0.06710464  0.06783744  0.06763731  0.06835277
   0.06704847  0.06752856  0.06642372  0.06735105  0.06755577  0.0682212
   0.04743455  0.04818977  0.04778979  0.04777971  0.05226852]]
2.8035
[[-0.04071904 -0.04075766 -0.06710464  0.93216258 -0.06763731 -0.06835277
  -0.06704847 -0.06752856 -0.06642372 -0.06735105 -0.06755577 -0.0682212
  -0.04743455 -0.04818977 -0.04778979 -0.04777971 -0.05226852]
 [-0.04071904 -0.04075766 -0.06710464  0.93216258 -0.06763731 -0.06835277
  -0.06704847 -0.06752856 -0.06642372 -0.06735105 -0.06755577 -0.0682212
  -0.04743455 -0.04818977 -0.04778979 -0.04777971 -0.05226852]]
Epoch: 6558	Loss: 3.17215089798	Example Output: X8	Example Reward:  -0.3
[[ 0.04073733  0.04078198  0.06709479  0.06785595  0.06761828  0.06833118
   0.06701981  0.06754581  0.06641914  0.06732929  0.06754506  0.06818554
   0.04745885  0.04820719  0.04780804  0.047794    0.05226788]]
4.0972

Epoch: 6569	Loss: 3.45220477581	Example Output: 14	Example Reward:  1
[[ 0.04065685  0.04070345  0.06730307  0.06784949  0.06762598  0.06821515
   0.06701723  0.06774296  0.06649288  0.06718734  0.06765143  0.06815169
   0.04756637  0.04825733  0.04773132  0.0477232   0.05212424]]
2.80404
[[-0.04065685 -0.04070345 -0.06730307  0.93215048 -0.06762598 -0.06821515
  -0.06701723 -0.06774296 -0.06649288 -0.06718734 -0.06765143 -0.06815169
  -0.04756637 -0.04825733 -0.04773132 -0.0477232  -0.05212424]
 [-0.04065685 -0.04070345 -0.06730307 -0.06784949 -0.06762598 -0.06821515
   0.9329828  -0.06774296 -0.06649288 -0.06718734 -0.06765143 -0.06815169
  -0.04756637 -0.04825733 -0.04773132 -0.0477232  -0.05212424]]
Epoch: 6570	Loss: 3.71155633926	Example Output: -2	Example Reward:  -0.3
[[ 0.04066439  0.04070585  0.06731994  0.06784189  0.06760783  0.06817788
   0.06702926  0.06775591  0.06647756  0.06715594  0.06768052  0.06814056
   0.04759584  0.04826726  0.04773228  0.04772974  0.05211738]]
4.

Epoch: 6582	Loss: 3.06528503895	Example Output: 02	Example Reward:  1
[[ 0.04060835  0.0407042   0.06754195  0.06770245  0.06794176  0.06817249
   0.06704077  0.0677451   0.06653171  0.06706402  0.06752736  0.0681219
   0.04767283  0.0481828   0.0477705   0.04758682  0.05208501]]
2.80353
[[-0.04060835 -0.0407042   0.93245804 -0.06770245 -0.06794176 -0.06817249
  -0.06704077 -0.0677451  -0.06653171 -0.06706402 -0.06752736 -0.0681219
  -0.04767283 -0.0481828  -0.0477705  -0.04758682 -0.05208501]
 [-0.04060835 -0.0407042  -0.06754195 -0.06770245  0.93205822 -0.06817249
  -0.06704077 -0.0677451  -0.06653171 -0.06706402 -0.06752736 -0.0681219
  -0.04767283 -0.0481828  -0.0477705  -0.04758682 -0.05208501]]
Epoch: 6583	Loss: 2.65211234093	Example Output: 92	Example Reward:  1
[[ 0.04057262  0.04066657  0.06755905  0.06774987  0.06799003  0.0681304
   0.067053    0.06784033  0.06655266  0.06705776  0.06751639  0.0681221
   0.04767113  0.04815808  0.0477418   0.04756343  0.05205479]]
2.803
[[-0

Epoch: 6594	Loss: 2.37847750187	Example Output: 12	Example Reward:  1
[[ 0.04046987  0.04057073  0.06765641  0.06783934  0.06791328  0.06820586
   0.06712336  0.06784906  0.06678753  0.06699004  0.06750859  0.06832249
   0.04762655  0.04807969  0.04759193  0.04747569  0.05198955]]
2.80305
[[-0.04046987 -0.04057073 -0.06765641  0.93216068 -0.06791328 -0.06820586
  -0.06712336 -0.06784906 -0.06678753 -0.06699004 -0.06750859 -0.06832249
  -0.04762655 -0.04807969 -0.04759193 -0.04747569 -0.05198955]
 [-0.04046987 -0.04057073 -0.06765641 -0.06783934  0.93208671 -0.06820586
  -0.06712336 -0.06784906 -0.06678753 -0.06699004 -0.06750859 -0.06832249
  -0.04762655 -0.04807969 -0.04759193 -0.04747569 -0.05198955]]
Epoch: 6595	Loss: 2.50496468544	Example Output: 57	Example Reward:  1
[[ 0.0404682   0.04056663  0.0676671   0.06781661  0.06795725  0.0682129
   0.0671223   0.06781997  0.06678551  0.06701589  0.06748238  0.06833488
   0.04761435  0.04807451  0.04759068  0.04747237  0.05199848]]
2.8037

Epoch: 6606	Loss: 3.19529664516	Example Output: 33	Example Reward:  1
[[ 0.04060629  0.04071242  0.06756815  0.0677511   0.06781173  0.06845601
   0.0670609   0.06777174  0.06664179  0.06698623  0.06745792  0.06809783
   0.04764238  0.04807205  0.0477883   0.04755035  0.05202487]]
2.80242
[[-0.04060629 -0.04071242 -0.06756815 -0.0677511  -0.06781173  0.93154401
  -0.0670609  -0.06777174 -0.06664179 -0.06698623 -0.06745792 -0.06809783
  -0.04764238 -0.04807205 -0.0477883  -0.04755035 -0.05202487]
 [-0.04060629 -0.04071242 -0.06756815 -0.0677511  -0.06781173  0.93154401
  -0.0670609  -0.06777174 -0.06664179 -0.06698623 -0.06745792 -0.06809783
  -0.04764238 -0.04807205 -0.0477883  -0.04755035 -0.05202487]]
Epoch: 6607	Loss: 2.6527451992	Example Output: 12	Example Reward:  1
2.80335
[[-0.04060023 -0.04069529 -0.06755097  0.93218559 -0.06779026 -0.06850185
  -0.06709987 -0.06778043 -0.06663322 -0.06695896 -0.06747829 -0.06809278
  -0.04762843 -0.04805463 -0.04778513 -0.04752782 -0.05200745]

Epoch: 6621	Loss: 3.32236762047	Example Output: X3	Example Reward:  -0.3
[[ 0.04055303  0.04069936  0.06748513  0.0678181   0.06795072  0.06843749
   0.06732335  0.06757291  0.06678981  0.06692208  0.06755346  0.06812936
   0.04756318  0.04805385  0.04769332  0.04751169  0.05194322]]
4.09726
[[-0.01216591  0.28779021  0.27975446  0.27965459  0.27961481  0.27946874
   0.27980301  0.27972814  0.27996308  0.27992338  0.27973399  0.27956119
   0.28573105  0.28558385  0.28569201  0.28574651  0.28441703]
 [ 0.28783411  0.28779021  0.27975446  0.27965459  0.27961481 -0.02053125
   0.27980301  0.27972814  0.27996308  0.27992338  0.27973399  0.27956119
   0.28573105  0.28558385  0.28569201  0.28574651  0.28441703]]
Epoch: 6622	Loss: 3.20404729843	Example Output: 6-	Example Reward:  1
[[ 0.04057259  0.04071068  0.06744062  0.06779598  0.06796467  0.06839593
   0.06734616  0.06756889  0.06678191  0.06693891  0.06752449  0.06808618
   0.04757116  0.04807561  0.04771396  0.04754531  0.051967  ]]
2.

Epoch: 6636	Loss: 3.45314180851	Example Output: 8	Example Reward:  1
[[ 0.04056262  0.04070639  0.06745628  0.0677086   0.0681573   0.06811068
   0.06737474  0.06760821  0.06677703  0.06700286  0.06748806  0.06787166
   0.04763147  0.04807416  0.04780342  0.04764527  0.05202131]]
2.81687
[[-0.04056262 -0.04070639 -0.06745628 -0.0677086  -0.0681573  -0.06811068
  -0.06737474 -0.06760821 -0.06677703 -0.06700286  0.93251193 -0.06787166
  -0.04763147 -0.04807416 -0.04780342 -0.04764527 -0.05202131]
 [-0.04056262 -0.04070639 -0.06745628 -0.0677086  -0.0681573  -0.06811068
  -0.06737474 -0.06760821 -0.06677703 -0.06700286 -0.06748806 -0.06787166
  -0.04763147 -0.04807416 -0.04780342 -0.04764527  0.94797868]]
Epoch: 6637	Loss: 3.06638336182	Example Output: X+	Example Reward:  1
[[ 0.04055883  0.04070041  0.06747421  0.06768433  0.06821273  0.06807813
   0.06739693  0.06757998  0.06675431  0.06699384  0.06750207  0.06786478
   0.04762887  0.04808639  0.04779994  0.04763814  0.05204609]]
2.8467

Epoch: 6648	Loss: 2.76169111729	Example Output: 16	Example Reward:  1
2.80408
[[-0.04060042 -0.04066698 -0.06745713  0.93204594 -0.06821389 -0.06822938
  -0.06747738 -0.06740641 -0.06671216 -0.06691299 -0.06751994 -0.06767914
  -0.0475393  -0.04802762 -0.0479474  -0.04758735 -0.05206855]
 [-0.04060042 -0.04066698 -0.06745713 -0.06795403 -0.06821389 -0.06822938
  -0.06747738 -0.06740641  0.93328786 -0.06691299 -0.06751994 -0.06767914
  -0.0475393  -0.04802762 -0.0479474  -0.04758735 -0.05206855]]
Epoch: 6649	Loss: 3.20010771751	Example Output: 31	Example Reward:  1
[[ 0.04064306  0.04067616  0.06741201  0.06798852  0.06819355  0.06818038
   0.0674801   0.06743816  0.06671868  0.06688013  0.06750041  0.06764419
   0.04755004  0.04804201  0.04796576  0.04760428  0.05208253]]
2.80302
[[-0.04064306 -0.04067616 -0.06741201 -0.06798852 -0.06819355  0.93181962
  -0.0674801  -0.06743816 -0.06671868 -0.06688013 -0.06750041 -0.06764419
  -0.04755004 -0.04804201 -0.04796576 -0.04760428 -0.05208253

Epoch: 6663	Loss: 3.32518253326	Example Output: /-	Example Reward:  -0.3
[[ 0.04091918  0.04083006  0.06753613  0.06772894  0.0682823   0.06823274
   0.06723323  0.06745963  0.06642976  0.0667455   0.06758413  0.06737094
   0.04776699  0.04804004  0.04810079  0.04771458  0.05202517]]
4.09461
[[ 0.28772426  0.28775099  0.27973917  0.27968132  0.27951533  0.27953017
   0.27983004  0.27976212  0.28007108  0.27997637  0.27972478  0.27978873
   0.28566992  0.285588    0.28556979 -0.01431437  0.28439245]
 [ 0.28772426  0.28775099  0.27973917  0.27968132  0.27951533  0.27953017
   0.27983004  0.27976212  0.28007108  0.27997637  0.27972478  0.27978873
   0.28566992 -0.01441201  0.28556979  0.28568563  0.28439245]]
Epoch: 6664	Loss: 2.91236598492	Example Output: /7	Example Reward:  -0.3
[[ 0.04092649  0.0408337   0.06753954  0.0677236   0.06830929  0.06825161
   0.06722864  0.06747086  0.06643365  0.06673213  0.06757541  0.06734797
   0.04776039  0.04802578  0.04812456  0.04770161  0.05201483]]

Epoch: 6675	Loss: 3.4539151907	Example Output: 29	Example Reward:  1
[[ 0.04083533  0.04069768  0.06754091  0.0677615   0.06844803  0.06823651
   0.06744998  0.06761328  0.06649563  0.06669414  0.0675992   0.06741755
   0.04760054  0.04800798  0.04803397  0.04759435  0.05197348]]
2.80333
[[-0.04083533 -0.04069768 -0.06754091 -0.0677615   0.93155199 -0.06823651
  -0.06744998 -0.06761328 -0.06649563 -0.06669414 -0.0675992  -0.06741755
  -0.04760054 -0.04800798 -0.04803397 -0.04759435 -0.05197348]
 [-0.04083533 -0.04069768 -0.06754091 -0.0677615  -0.06844803 -0.06823651
  -0.06744998 -0.06761328 -0.06649563 -0.06669414 -0.0675992   0.93258244
  -0.04760054 -0.04800798 -0.04803397 -0.04759435 -0.05197348]]
Epoch: 6676	Loss: 3.04185085297	Example Output: -4	Example Reward:  -0.3
[[ 0.04085078  0.04071315  0.06751672  0.06774852  0.06846193  0.06825104
   0.06744292  0.06758552  0.06647018  0.06669611  0.06757869  0.06741682
   0.04758899  0.04801754  0.04805176  0.04759917  0.05201018]]
4.0

Epoch: 6687	Loss: 3.71074635983	Example Output: 8Y	Example Reward:  -0.3
[[ 0.04094016  0.04078455  0.06745712  0.06755289  0.06839205  0.06823646
   0.06737807  0.06762461  0.06648215  0.06679931  0.06736499  0.0672628
   0.04763331  0.04805611  0.04817904  0.04764413  0.05221224]]
4.09733
[[ 0.28771797  0.28776464  0.27976286  0.27973416  0.27948239  0.27952906
   0.27978659  0.27971262  0.28005537  0.27996022 -0.0202095   0.27982119
   0.28571004  0.28558317  0.2855463   0.28570676  0.28433633]
 [ 0.28771797 -0.01223536  0.27976286  0.27973416  0.27948239  0.27952906
   0.27978659  0.27971262  0.28005537  0.27996022  0.27979052  0.27982119
   0.28571004  0.28558317  0.2855463   0.28570676  0.28433633]]
Epoch: 6688	Loss: 3.0520252943	Example Output: 0*	Example Reward:  1
[[ 0.04098436  0.04082888  0.06743409  0.06752772  0.06836648  0.06820604
   0.06733971  0.0676025   0.06647314  0.06683531  0.06730283  0.06723876
   0.04765309  0.04807941  0.04820271  0.04769014  0.05223488]]
2.82

Epoch: 6701	Loss: 3.32717216015	Example Output: 93	Example Reward:  1
[[ 0.0409906   0.04085227  0.06769864  0.06747392  0.06826716  0.06823201
   0.06717804  0.06755064  0.06664845  0.06686612  0.06713956  0.06725524
   0.04760506  0.04798977  0.04826101  0.04780962  0.0521819 ]]
2.80393
[[-0.0409906  -0.04085227 -0.06769864 -0.06747392 -0.06826716 -0.06823201
  -0.06717804 -0.06755064 -0.06664845 -0.06686612 -0.06713956  0.93274474
  -0.04760506 -0.04798977 -0.04826101 -0.04780962 -0.0521819 ]
 [-0.0409906  -0.04085227 -0.06769864 -0.06747392 -0.06826716  0.931768
  -0.06717804 -0.06755064 -0.06664845 -0.06686612 -0.06713956 -0.06725524
  -0.04760506 -0.04798977 -0.04826101 -0.04780962 -0.0521819 ]]
Epoch: 6702	Loss: 3.32225840092	Example Output: -4	Example Reward:  -0.3
[[ 0.04099092  0.04083767  0.06766325  0.0674724   0.06828091  0.06823391
   0.067184    0.06759132  0.06665491  0.06688191  0.06710546  0.06728716
   0.04760605  0.04797999  0.04824615  0.04780137  0.05218263]]
4.09

Epoch: 6713	Loss: 2.78430554867	Example Output: -Y	Example Reward:  -0.3
[[ 0.04117592  0.0410968   0.06768145  0.06724912  0.06823792  0.06809445
   0.06713606  0.06722365  0.06646612  0.06686416  0.06694441  0.06725587
   0.04780354  0.04812906  0.04838777  0.04797103  0.05228272]]
4.09264
[[ 0.28764725  0.28767097  0.27969557  0.27982527  0.27952865  0.27957168
   0.27985919  0.2798329   0.28006017  0.27994078  0.27991667  0.27982324
   0.28565896 -0.01443872  0.28548369  0.28560871  0.2843152 ]
 [ 0.28764725 -0.01232904  0.27969557  0.27982527  0.27952865  0.27957168
   0.27985919  0.2798329   0.28006017  0.27994078  0.27991667  0.27982324
   0.28565896  0.28556129  0.28548369  0.28560871  0.2843152 ]]
Epoch: 6714	Loss: 2.66467707157	Example Output: 1-	Example Reward:  1
[[ 0.041185    0.0410945   0.06766417  0.06727328  0.06823608  0.06814553
   0.06713799  0.06720396  0.06648166  0.06684815  0.06694032  0.06723933
   0.04778776  0.04810748  0.04842458  0.0479605   0.05226975]]
2.

Epoch: 6727	Loss: 2.65859951973	Example Output: Y2	Example Reward:  -0.3
[[ 0.04125969  0.04116759  0.0674455   0.06733072  0.06804333  0.06820133
   0.06710603  0.06706888  0.06644808  0.06672542  0.06694408  0.06730465
   0.04770473  0.0483332   0.04851865  0.04797983  0.05241834]]
4.09794
[[ 0.28762209 -0.01235028  0.27976635  0.2798008   0.279587    0.27953961
   0.27986822  0.27987936  0.2800656   0.27998239  0.27991679  0.27980861
   0.28568858  0.28550005  0.28544441  0.28560606  0.28427452]
 [ 0.28762209  0.28764972  0.27976635  0.2798008  -0.020413    0.27953961
   0.27986822  0.27987936  0.2800656   0.27998239  0.27991679  0.27980861
   0.28568858  0.28550005  0.28544441  0.28560606  0.28427452]]
Epoch: 6728	Loss: 3.19617581367	Example Output: 1*	Example Reward:  1
[[ 0.04125209  0.04113945  0.06744291  0.06731252  0.06802902  0.06820666
   0.06711864  0.06711604  0.06646639  0.06671204  0.06696729  0.06731212
   0.04769451  0.04834552  0.04850902  0.0479563   0.05241941]]
2.

Epoch: 6741	Loss: 3.06865894794	Example Output: 3-	Example Reward:  1
[[ 0.04110802  0.04107336  0.06750131  0.06731623  0.0682226   0.06816241
   0.06718601  0.06712461  0.06651038  0.0668309   0.06707392  0.06728499
   0.04756057  0.04830202  0.04843925  0.04793794  0.0523655 ]]
2.8209
[[-0.04110802 -0.04107336 -0.06750131 -0.06731623 -0.0682226   0.93183756
  -0.06718601 -0.06712461 -0.06651038 -0.0668309  -0.06707392 -0.06728499
  -0.04756057 -0.04830202 -0.04843925 -0.04793794 -0.0523655 ]
 [-0.04110802 -0.04107336 -0.06750131 -0.06731623 -0.0682226  -0.06816241
  -0.06718601 -0.06712461 -0.06651038 -0.0668309  -0.06707392 -0.06728499
  -0.04756057  0.95169801 -0.04843925 -0.04793794 -0.0523655 ]]
Epoch: 6742	Loss: 3.0655705452	Example Output: 60	Example Reward:  1
[[ 0.0410871   0.04105984  0.06751347  0.06731245  0.0682067   0.06820111
   0.067174    0.06714799  0.0665195   0.06684133  0.06707315  0.06728162
   0.047553    0.04830801  0.04842993  0.04792516  0.05236567]]
2.80536

Epoch: 6755	Loss: 3.0681593895	Example Output: --	Example Reward:  -0.3
[[ 0.04120427  0.04102742  0.06742792  0.06743708  0.06811569  0.06795821
   0.06703156  0.0671979   0.06660344  0.0667927   0.06700038  0.06743214
   0.04756191  0.0484291   0.04833348  0.04802541  0.05242137]]
4.09521
[[ 0.28763872  0.28769177  0.27977163  0.27976888  0.2795653   0.27961254
   0.27989054  0.27984065  0.28001899  0.27996218  0.2798999   0.27977037
   0.28573143 -0.01452873  0.28549996  0.28559238  0.28427359]
 [ 0.28763872  0.28769177  0.27977163  0.27976888  0.2795653   0.27961254
   0.27989054  0.27984065  0.28001899  0.27996218  0.2798999   0.27977037
   0.28573143 -0.01452873  0.28549996  0.28559238  0.28427359]]
Epoch: 6756	Loss: 3.32831993103	Example Output: 58	Example Reward:  1
[[ 0.04121237  0.04103999  0.06743616  0.06745522  0.06808532  0.06800763
   0.06702577  0.06717113  0.06660082  0.06677485  0.06701213  0.06740902
   0.04755145  0.04842885  0.04834596  0.04802092  0.05242239]]
2.8

Epoch: 6767	Loss: 2.91821277142	Example Output: Y1	Example Reward:  -0.3
[[ 0.04112944  0.04087287  0.067448    0.06743357  0.06814982  0.06807112
   0.06711467  0.06726492  0.06674477  0.06683223  0.06712709  0.06744347
   0.04745829  0.04835619  0.04840818  0.0478549   0.05229046]]
4.09753
[[ 0.28766116 -0.01226186  0.27976561  0.27976993  0.27955508  0.27957869
   0.27986562  0.27982053  0.27997658  0.27995035  0.27986187  0.27976698
   0.28576252  0.28549317  0.28547758  0.28564355  0.28431287]
 [ 0.28766116  0.28773814  0.27976561 -0.02023007  0.27955508  0.27957869
   0.27986562  0.27982053  0.27997658  0.27995035  0.27986187  0.27976698
   0.28576252  0.28549317  0.28547758  0.28564355  0.28431287]]
Epoch: 6768	Loss: 2.91583864689	Example Output: 02	Example Reward:  1
2.80411
[[-0.04113394 -0.04086696  0.93257684 -0.0674151  -0.06814604 -0.06805182
  -0.06713615 -0.06728061 -0.06676187 -0.06682169 -0.06709877 -0.0674582
  -0.04747495 -0.04836649 -0.04840771 -0.04784836 -0.052308

Epoch: 6779	Loss: 2.93856363297	Example Output: 5-	Example Reward:  1
[[ 0.04122446  0.04091586  0.06737508  0.06743163  0.06798843  0.0679692
   0.06724807  0.06714832  0.06661231  0.06662793  0.06733274  0.06756612
   0.04744241  0.04849872  0.04839031  0.04782917  0.05239929]]
2.82142
[[-0.04122446 -0.04091586 -0.06737508 -0.06743163 -0.06798843 -0.0679692
  -0.06724807  0.93285167 -0.06661231 -0.06662793 -0.06733274 -0.06756612
  -0.04744241 -0.04849872 -0.04839031 -0.04782917 -0.05239929]
 [-0.04122446 -0.04091586 -0.06737508 -0.06743163 -0.06798843 -0.0679692
  -0.06724807 -0.06714832 -0.06661231 -0.06662793 -0.06733274 -0.06756612
  -0.04744241  0.95150125 -0.04839031 -0.04782917 -0.05239929]]
Epoch: 6780	Loss: 3.32727599144	Example Output: /3	Example Reward:  -0.3
[[ 0.04120447  0.04090155  0.0673954   0.06743433  0.067976    0.06795268
   0.06724163  0.06714001  0.06665058  0.06666254  0.06730993  0.06757905
   0.04742563  0.04849685  0.04838998  0.04783469  0.05240461]]
4.100

Epoch: 6791	Loss: 2.50222730637	Example Output: 37	Example Reward:  1
[[ 0.04119192  0.04094446  0.06742038  0.06732037  0.06800488  0.06795994
   0.06708025  0.06718845  0.06665327  0.06679102  0.06727459  0.06756969
   0.04743872  0.0484656   0.04836101  0.04791388  0.0524216 ]]
2.80482
[[-0.04119192 -0.04094446 -0.06742038 -0.06732037 -0.06800488  0.93204004
  -0.06708025 -0.06718845 -0.06665327 -0.06679102 -0.06727459 -0.06756969
  -0.04743872 -0.0484656  -0.04836101 -0.04791388 -0.0524216 ]
 [-0.04119192 -0.04094446 -0.06742038 -0.06732037 -0.06800488 -0.06795994
  -0.06708025 -0.06718845 -0.06665327  0.933209   -0.06727459 -0.06756969
  -0.04743872 -0.0484656  -0.04836101 -0.04791388 -0.0524216 ]]
Epoch: 6792	Loss: 2.78490798473	Example Output: 97	Example Reward:  1
2.80507
[[-0.04118892 -0.0409618  -0.06745677 -0.0672823  -0.06799141 -0.06799151
  -0.06707474 -0.06716336 -0.06665889 -0.06683908 -0.06723684  0.93242425
  -0.0474348  -0.04846099 -0.0483523  -0.04791543 -0.05241515

Epoch: 6803	Loss: 2.6580388546	Example Output: 2/	Example Reward:  1
2.82135
[[-0.04121743 -0.04092504 -0.06754264 -0.06731777  0.9320153  -0.06795593
  -0.06718379 -0.06718396 -0.06656028 -0.06692722 -0.06717964 -0.06773891
  -0.04743621 -0.04840301 -0.04820615 -0.04789181 -0.05234553]
 [-0.04121743 -0.04092504 -0.06754264 -0.06731777 -0.06798468 -0.06795593
  -0.06718379 -0.06718396 -0.06656028 -0.06692722 -0.06717964 -0.06773891
  -0.04743621 -0.04840301 -0.04820615  0.9521082  -0.05234553]]
Epoch: 6804	Loss: 3.4516402483	Example Output: 71	Example Reward:  1
[[ 0.04120563  0.04090812  0.06759781  0.06731623  0.06798936  0.06794138
   0.06716481  0.06720988  0.06651699  0.066923    0.06725766  0.06773571
   0.04743467  0.04838149  0.04819021  0.04790437  0.05232281]]
2.80509
[[-0.04120563 -0.04090812 -0.06759781 -0.06731623 -0.06798936 -0.06794138
  -0.06716481 -0.06720988 -0.06651699  0.93307698 -0.06725766 -0.06773571
  -0.04743467 -0.04838149 -0.04819021 -0.04790437 -0.05232281]


Epoch: 6818	Loss: 3.19488623142	Example Output: -8	Example Reward:  -0.3
[[ 0.04135188  0.0410439   0.06754132  0.06726831  0.06795783  0.0679893
   0.06696403  0.06728987  0.06653903  0.06685741  0.06706578  0.06766071
   0.04752203  0.04838137  0.04831232  0.04794917  0.05230568]]
4.10007
[[ 0.28759447  0.28768685  0.27973762  0.27981952  0.27961266  0.27960321
   0.2799108   0.27981305  0.2800383   0.27994278  0.27988029  0.2797018
   0.28574342 -0.01451441  0.28550631  0.28561527  0.28430831]
 [ 0.28759447  0.28768685  0.27973762  0.27981952  0.27961266  0.27960321
   0.2799108   0.27981305  0.2800383   0.27994278 -0.02011974  0.2797018
   0.28574342  0.2854856   0.28550631  0.28561527  0.28430831]]
Epoch: 6819	Loss: 2.91454620361	Example Output: 59	Example Reward:  1
[[ 0.04133597  0.04102866  0.06754379  0.067268    0.06799769  0.06796431
   0.06695571  0.0673232   0.06658089  0.06685913  0.06705783  0.06764195
   0.04752591  0.04836443  0.04830518  0.04795709  0.05229024]]
2.804

Epoch: 6830	Loss: 2.93897855282	Example Output: 2-	Example Reward:  1
[[ 0.04112023  0.04075444  0.06733904  0.06757932  0.06821537  0.06777619
   0.06718759  0.06747908  0.0668337   0.06691968  0.06714305  0.06780196
   0.04735178  0.04841109  0.04800908  0.04782608  0.0522523 ]]
2.8204
[[-0.04112023 -0.04075444 -0.06733904 -0.06757932  0.93178463 -0.06777619
  -0.06718759 -0.06747908 -0.0668337  -0.06691968 -0.06714305 -0.06780196
  -0.04735178 -0.04841109 -0.04800908 -0.04782608 -0.0522523 ]
 [-0.04112023 -0.04075444 -0.06733904 -0.06757932 -0.06821537 -0.06777619
  -0.06718759 -0.06747908 -0.0668337  -0.06691968 -0.06714305 -0.06780196
  -0.04735178  0.95158893 -0.04800908 -0.04782608 -0.0522523 ]]
Saving Weight
Epoch: 6831	Loss: 3.17490787506	Example Output: /2	Example Reward:  -0.3
[[ 0.04110601  0.04074834  0.06734246  0.06756292  0.06824533  0.06775866
   0.06718393  0.06747216  0.06681272  0.06692916  0.06717253  0.06780943
   0.04736369  0.04844556  0.04798925  0.04781076  0.

Epoch: 6842	Loss: 2.65377707481	Example Output: 68	Example Reward:  1
[[ 0.04120373  0.04076206  0.06734254  0.06744661  0.06827997  0.06765007
   0.06736727  0.06750344  0.06676113  0.06682581  0.06709604  0.06779052
   0.0474224   0.04849523  0.04800282  0.04774798  0.05230239]]
2.80523
[[-0.04120373 -0.04076206 -0.06734254 -0.06744661 -0.06827997 -0.06765007
  -0.06736727 -0.06750344  0.93323886 -0.06682581 -0.06709604 -0.06779052
  -0.0474224  -0.04849523 -0.04800282 -0.04774798 -0.05230239]
 [-0.04120373 -0.04076206 -0.06734254 -0.06744661 -0.06827997 -0.06765007
  -0.06736727 -0.06750344 -0.06676113 -0.06682581  0.93290395 -0.06779052
  -0.0474224  -0.04849523 -0.04800282 -0.04774798 -0.05230239]]
Epoch: 6843	Loss: 3.17312357426	Example Output: 42	Example Reward:  1
[[ 0.04119504  0.04075039  0.06735497  0.06749118  0.06828125  0.0676442
   0.06735279  0.06752157  0.06679188  0.0668231   0.06710214  0.06778593
   0.04741711  0.04847876  0.0479846   0.04774222  0.05228292]]
2.8038

Epoch: 6854	Loss: 3.45237345695	Example Output: *7	Example Reward:  -0.3
[[ 0.04125436  0.0407575   0.06716494  0.06736757  0.06844042  0.06751305
   0.06735182  0.06754125  0.06675169  0.06700109  0.06686749  0.06784987
   0.04740684  0.048531    0.04802148  0.04778295  0.05239671]]
4.09981
[[ 0.2876237   0.28777277  0.27985051  0.27978975  0.27946788  0.27974609
   0.27979445  0.27973765  0.27997449  0.27989969  0.27993977  0.27964506
   0.28577796  0.28544071 -0.01440644  0.28566512  0.28428099]
 [ 0.2876237   0.28777277  0.27985051  0.27978975  0.27946788  0.27974609
   0.27979445  0.27973765  0.27997449 -0.02010033  0.27993977  0.27964506
   0.28577796  0.28544071  0.28559357  0.28566512  0.28428099]]
Epoch: 6855	Loss: 3.71605095863	Example Output: -1	Example Reward:  -0.3
[[ 0.04127857  0.04079685  0.06712143  0.06737773  0.06842537  0.06746864
   0.06733128  0.06751996  0.0667972   0.06701663  0.06678557  0.06780928
   0.04742179  0.04855161  0.04803411  0.04783333  0.0524307 ]]

Epoch: 6868	Loss: 3.06627628803	Example Output: 2	Example Reward:  1
[[ 0.04133648  0.04099203  0.06693699  0.06738751  0.06847187  0.06740906
   0.06744318  0.0672366   0.06685337  0.06711227  0.06663911  0.06755555
   0.04737993  0.04859352  0.04813852  0.04801593  0.0524981 ]]
2.81657
[[-0.04133648 -0.04099203 -0.06693699 -0.06738751  0.93152815 -0.06740906
  -0.06744318 -0.0672366  -0.06685337 -0.06711227 -0.06663911 -0.06755555
  -0.04737993 -0.04859352 -0.04813852 -0.04801593 -0.0524981 ]
 [-0.04133648 -0.04099203 -0.06693699 -0.06738751 -0.06847187 -0.06740906
  -0.06744318 -0.0672366  -0.06685337 -0.06711227 -0.06663911 -0.06755555
  -0.04737993 -0.04859352 -0.04813852 -0.04801593  0.9475019 ]]
Epoch: 6869	Loss: 3.19425022602	Example Output: Y0	Example Reward:  -0.3
[[ 0.04131123  0.04097505  0.06693649  0.06736411  0.06851938  0.06741922
   0.06746913  0.06719752  0.066849    0.0671433   0.06667126  0.06757136
   0.04735306  0.04857726  0.04812168  0.04799397  0.05252698]]
4.0

Epoch: 6880	Loss: 2.79012897015	Example Output: X/	Example Reward:  1
[[ 0.04128083  0.04095968  0.06684203  0.06724997  0.06840331  0.06732358
   0.06771325  0.06699511  0.06692042  0.06740211  0.06661493  0.06792111
   0.04736834  0.04868267  0.04789708  0.04785113  0.05257439]]
2.84638
[[ 0.95871919 -0.04095968 -0.06684203 -0.06724997 -0.06840331 -0.06732358
  -0.06771325 -0.06699511 -0.06692042 -0.06740211 -0.06661493 -0.06792111
  -0.04736834 -0.04868267 -0.04789708 -0.04785113 -0.05257439]
 [-0.04128083 -0.04095968 -0.06684203 -0.06724997 -0.06840331 -0.06732358
  -0.06771325 -0.06699511 -0.06692042 -0.06740211 -0.06661493 -0.06792111
  -0.04736834 -0.04868267 -0.04789708  0.95214885 -0.05257439]]
Saving Weight
Epoch: 6881	Loss: 3.19483137131	Example Output: 99	Example Reward:  1
[[ 0.04129325  0.04093626  0.06683835  0.06721622  0.06844269  0.06730786
   0.06769279  0.06704204  0.06691276  0.06742764  0.06659268  0.0679309
   0.04735088  0.04867159  0.04789898  0.04785771  0.052

Epoch: 6895	Loss: 2.78603184223	Example Output: 27	Example Reward:  1
[[ 0.04131027  0.04098115  0.06670617  0.06719186  0.06823681  0.06715224
   0.06770889  0.06689519  0.0669168   0.06747404  0.06674986  0.06801561
   0.04734345  0.04879035  0.0479683   0.04790188  0.05265717]]
2.80417
[[-0.04131027 -0.04098115 -0.06670617 -0.06719186  0.93176317 -0.06715224
  -0.06770889 -0.06689519 -0.0669168  -0.06747404 -0.06674986 -0.06801561
  -0.04734345 -0.04879035 -0.0479683  -0.04790188 -0.05265717]
 [-0.04131027 -0.04098115 -0.06670617 -0.06719186 -0.06823681 -0.06715224
  -0.06770889 -0.06689519 -0.0669168   0.93252593 -0.06674986 -0.06801561
  -0.04734345 -0.04879035 -0.0479683  -0.04790188 -0.05265717]]
Epoch: 6896	Loss: 3.17532656193	Example Output: X+	Example Reward:  1
[[ 0.04131182  0.04098352  0.06670699  0.06715342  0.06829756  0.06712639
   0.06769908  0.06688635  0.06691086  0.06751814  0.06673095  0.06799394
   0.0473405   0.04879212  0.04798067  0.04790471  0.05266299]]
2.846

Epoch: 6907	Loss: 3.45567572117	Example Output: -3	Example Reward:  -0.3
[[ 0.04137323  0.04107469  0.06677577  0.06700544  0.06844308  0.06726782
   0.067615    0.06681961  0.06675504  0.06740351  0.06671153  0.06797428
   0.04732898  0.04883763  0.04800236  0.04786998  0.052742  ]]
4.10029
[[ 0.28758803  0.28767762  0.27996728  0.27989838  0.27946711  0.27981967
   0.27971551  0.27995414  0.27997351  0.27977896  0.27998656  0.27960774
   0.28580132 -0.01465129  0.28559929  0.28563902  0.28417742]
 [ 0.28758803  0.28767762  0.27996728  0.27989838  0.27946711 -0.02018035
   0.27971551  0.27995414  0.27997351  0.27977896  0.27998656  0.27960774
   0.28580132  0.28534871  0.28559929  0.28563902  0.28417742]]
Epoch: 6908	Loss: 3.1980479002	Example Output: 19	Example Reward:  1
[[ 0.04138536  0.04109948  0.06674908  0.06696558  0.06844954  0.06723224
   0.06759769  0.06679767  0.06678355  0.06739761  0.06668247  0.06795809
   0.04734905  0.04884889  0.04803546  0.04790317  0.0527651 ]]
2.8

Epoch: 6919	Loss: 3.19848446846	Example Output: 36	Example Reward:  1
[[ 0.04125153  0.04088348  0.06670126  0.06700222  0.06846283  0.06732974
   0.06772487  0.06706145  0.06688124  0.06747767  0.06682459  0.06808235
   0.04715254  0.04872804  0.04801571  0.04772448  0.05269603]]
2.8051
[[-0.04125153 -0.04088348 -0.06670126 -0.06700222 -0.06846283  0.93267024
  -0.06772487 -0.06706145 -0.06688124 -0.06747767 -0.06682459 -0.06808235
  -0.04715254 -0.04872804 -0.04801571 -0.04772448 -0.05269603]
 [-0.04125153 -0.04088348 -0.06670126 -0.06700222 -0.06846283 -0.06732974
  -0.06772487 -0.06706145  0.93311876 -0.06747767 -0.06682459 -0.06808235
  -0.04715254 -0.04872804 -0.04801571 -0.04772448 -0.05269603]]
Epoch: 6920	Loss: 2.93386831284	Example Output: 32	Example Reward:  1
[[ 0.04121773  0.04084745  0.06671625  0.06703974  0.06846207  0.06735469
   0.06776246  0.06706963  0.06693038  0.06745959  0.06686229  0.06807818
   0.04711725  0.04871191  0.04798975  0.04770466  0.05267604]]
2.8038

Epoch: 6932	Loss: 3.06618771553	Example Output: 69	Example Reward:  1
[[ 0.0411591   0.04071942  0.06663579  0.0672246   0.06844788  0.06723001
   0.06800824  0.06714026  0.06683187  0.06731463  0.06709426  0.06823289
   0.04705295  0.04875996  0.04783618  0.04762037  0.05269154]]
2.80424
[[-0.0411591  -0.04071942 -0.06663579 -0.0672246  -0.06844788 -0.06723001
  -0.06800824 -0.06714026  0.93316811 -0.06731463 -0.06709426 -0.06823289
  -0.04705295 -0.04875996 -0.04783618 -0.04762037 -0.05269154]
 [-0.0411591  -0.04071942 -0.06663579 -0.0672246  -0.06844788 -0.06723001
  -0.06800824 -0.06714026 -0.06683187 -0.06731463 -0.06709426  0.93176711
  -0.04705295 -0.04875996 -0.04783618 -0.04762037 -0.05269154]]
Epoch: 6933	Loss: 2.65514335632	Example Output: 18	Example Reward:  1
[[ 0.0411449   0.0406944   0.06664331  0.06723321  0.06846033  0.06725533
   0.06799721  0.06712811  0.06682563  0.06731825  0.06714272  0.06829799
   0.0470293   0.04872844  0.04781863  0.04760414  0.05267809]]
2.804

Epoch: 6947	Loss: 3.04102096558	Example Output: -	Example Reward:  -0.3
[[ 0.04115064  0.04065477  0.06661986  0.0677      0.06829738  0.06730087
   0.06786864  0.06689224  0.06679377  0.06718785  0.06744928  0.06848627
   0.04699805  0.04868546  0.04769622  0.04760439  0.05261428]]
4.09626
[[ 0.28765482  0.28780359  0.28001404  0.27969     0.2795108   0.27980974
   0.27963942  0.27993232  0.27996188  0.27984366  0.27976522  0.27945414
   0.28590059 -0.01460564  0.28569114  0.28571871  0.28421572]
 [ 0.28765482  0.28780359  0.28001404  0.27969     0.2795108   0.27980974
   0.27963942  0.27993232  0.27996188  0.27984366  0.27976522  0.27945414
   0.28590059  0.28539437  0.28569114  0.28571871 -0.01578429]]
Epoch: 6948	Loss: 2.6563529253	Example Output: 3+	Example Reward:  1
[[ 0.04115267  0.04063154  0.06661825  0.067706    0.06829355  0.0673505
   0.06784713  0.06695907  0.06676579  0.06717864  0.06746976  0.06850893
   0.04698811  0.04868121  0.0476797   0.04757883  0.05259034]]
2.822

Epoch: 6961	Loss: 3.0630354166	Example Output: 11	Example Reward:  1
[[ 0.04120017  0.04077433  0.06692743  0.0675975   0.06828339  0.06751905
   0.0675495   0.06683731  0.06677838  0.06717009  0.06745567  0.06847782
   0.04709315  0.04855522  0.04771375  0.04764346  0.05242385]]
2.80405
[[-0.04120017 -0.04077433 -0.06692743  0.93240249 -0.06828339 -0.06751905
  -0.0675495  -0.06683731 -0.06677838 -0.06717009 -0.06745567 -0.06847782
  -0.04709315 -0.04855522 -0.04771375 -0.04764346 -0.05242385]
 [-0.04120017 -0.04077433 -0.06692743  0.93240249 -0.06828339 -0.06751905
  -0.0675495  -0.06683731 -0.06677838 -0.06717009 -0.06745567 -0.06847782
  -0.04709315 -0.04855522 -0.04771375 -0.04764346 -0.05242385]]
Epoch: 6962	Loss: 3.19430396557	Example Output: 32	Example Reward:  1
[[ 0.04118791  0.0407592   0.06693646  0.0676631   0.06827745  0.06758432
   0.06755847  0.06685016  0.06678835  0.06717117  0.06746101  0.06846064
   0.04706972  0.04853085  0.04769174  0.04761897  0.05239046]]
2.8035

Epoch: 6975	Loss: 3.45928089619	Example Output: 4-	Example Reward:  1
[[ 0.04124415  0.04102188  0.06690134  0.0674139   0.06833319  0.06762632
   0.0673987   0.06680682  0.06680848  0.067348    0.06703995  0.06811283
   0.04718776  0.04851098  0.0479062   0.0478042   0.05253529]]
2.82107
[[-0.04124415 -0.04102188 -0.06690134 -0.0674139  -0.06833319 -0.06762632
   0.93260133 -0.06680682 -0.06680848 -0.067348   -0.06703995 -0.06811283
  -0.04718776 -0.04851098 -0.0479062  -0.0478042  -0.05253529]
 [-0.04124415 -0.04102188 -0.06690134 -0.0674139  -0.06833319 -0.06762632
  -0.0673987  -0.06680682 -0.06680848 -0.067348   -0.06703995 -0.06811283
  -0.04718776  0.95148903 -0.0479062  -0.0478042  -0.05253529]]
Epoch: 6976	Loss: 3.32897503376	Example Output: *Y	Example Reward:  -0.3
[[ 0.04126579  0.04110013  0.06688235  0.06737489  0.0683048   0.0676045
   0.06737316  0.06674831  0.06683531  0.06735929  0.06696445  0.06807414
   0.04724101  0.04855349  0.04792536  0.04784152  0.05255149]]
4.0

Epoch: 6987	Loss: 3.58237211704	Example Output: +	Example Reward:  -0.3
[[ 0.04127111  0.0412978   0.06702375  0.06749237  0.06816538  0.06761961
   0.06726487  0.06645482  0.0667759   0.06731648  0.06680164  0.06794377
   0.04732366  0.04854023  0.04804321  0.0480769   0.05258853]]
4.09613
[[ 0.2876187   0.28761068  0.27989289  0.27975231  0.2795504   0.27971414
   0.27982056  0.28006357  0.27996725  0.27980506  0.2799595   0.27961689
  -0.0141971   0.28543794  0.28558704  0.28557694  0.28422347]
 [ 0.2876187   0.28761068  0.27989289  0.27975231  0.2795504   0.27971414
   0.27982056  0.28006357  0.27996725  0.27980506  0.2799595   0.27961689
   0.28580293  0.28543794  0.28558704  0.28557694 -0.01577656]]
Epoch: 6988	Loss: 3.20488107204	Example Output: Y	Example Reward:  1
[[ 0.04130406  0.04137415  0.06700087  0.06743997  0.06811372  0.06762473
   0.06722973  0.06640664  0.06674309  0.06737539  0.0667529   0.06792539
   0.04735116  0.04855772  0.04806425  0.04811975  0.05261648]]
2.84

Epoch: 6999	Loss: 2.78506453037	Example Output: 47	Example Reward:  1
[[ 0.04130608  0.04140872  0.06689218  0.0673491   0.06814037  0.06756471
   0.0672297   0.06659273  0.06682043  0.0674369   0.06655893  0.06800975
   0.0474068   0.04856047  0.04796663  0.04808272  0.05267375]]
2.80514
[[-0.04130608 -0.04140872 -0.06689218 -0.0673491  -0.06814037 -0.06756471
   0.93277031 -0.06659273 -0.06682043 -0.0674369  -0.06655893 -0.06800975
  -0.0474068  -0.04856047 -0.04796663 -0.04808272 -0.05267375]
 [-0.04130608 -0.04140872 -0.06689218 -0.0673491  -0.06814037 -0.06756471
  -0.0672297  -0.06659273 -0.06682043  0.93256307 -0.06655893 -0.06800975
  -0.0474068  -0.04856047 -0.04796663 -0.04808272 -0.05267375]]
Epoch: 7000	Loss: 3.04528977871	Example Output: 0-	Example Reward:  1
[[ 0.04129     0.04139007  0.06685687  0.06742262  0.06813404  0.06754577
   0.06726076  0.06657883  0.06684995  0.06742355  0.06658088  0.06802154
   0.04738887  0.04857275  0.04795246  0.0480676   0.05266348]]
2.821

Epoch: 7011	Loss: 3.04337527752	Example Output: 53	Example Reward:  1
[[ 0.04122531  0.04126038  0.06668463  0.06745331  0.06826329  0.06757252
   0.06732479  0.06690844  0.0667929   0.06723803  0.06667894  0.06800004
   0.04735783  0.04862614  0.04793543  0.04802458  0.05265337]]
2.80515
[[-0.04122531 -0.04126038 -0.06668463 -0.06745331 -0.06826329 -0.06757252
  -0.06732479  0.93309158 -0.0667929  -0.06723803 -0.06667894 -0.06800004
  -0.04735783 -0.04862614 -0.04793543 -0.04802458 -0.05265337]
 [-0.04122531 -0.04126038 -0.06668463 -0.06745331 -0.06826329  0.93242747
  -0.06732479 -0.06690844 -0.0667929  -0.06723803 -0.06667894 -0.06800004
  -0.04735783 -0.04862614 -0.04793543 -0.04802458 -0.05265337]]
Epoch: 7012	Loss: 2.50850925446	Example Output: 3/	Example Reward:  1
[[ 0.04125471  0.0412766   0.06669306  0.06741064  0.06826024  0.06761656
   0.06730261  0.06691455  0.06676506  0.06724843  0.06664538  0.06799662
   0.04736565  0.04861721  0.04795027  0.04802607  0.05265628]]
2.821

Epoch: 7025	Loss: 2.78812558651	Example Output: 9+	Example Reward:  1
[[ 0.04133168  0.04125071  0.0667002   0.06722307  0.06826215  0.06773643
   0.06722505  0.06685329  0.06662127  0.06715956  0.06684259  0.06843578
   0.04731796  0.048525    0.04792831  0.04799879  0.05258815]]
2.82181
[[-0.04133168 -0.04125071 -0.0667002  -0.06722307 -0.06826215 -0.06773643
  -0.06722505 -0.06685329 -0.06662127 -0.06715956 -0.06684259  0.93156421
  -0.04731796 -0.048525   -0.04792831 -0.04799879 -0.05258815]
 [-0.04133168 -0.04125071 -0.0667002  -0.06722307 -0.06826215 -0.06773643
  -0.06722505 -0.06685329 -0.06662127 -0.06715956 -0.06684259 -0.06843578
   0.95268202 -0.048525   -0.04792831 -0.04799879 -0.05258815]]
Epoch: 7026	Loss: 2.37611932755	Example Output: Y3	Example Reward:  -0.3
[[ 0.0413246   0.0412287   0.06667913  0.06724878  0.06823763  0.06771569
   0.06720925  0.06688514  0.06663933  0.06716642  0.0668451   0.06848817
   0.0473192   0.04851785  0.04791037  0.04800006  0.05258458]]
4.

Epoch: 7037	Loss: 3.32669930458	Example Output: 4	Example Reward:  1
[[ 0.04123669  0.04105907  0.06659701  0.06743249  0.06817508  0.067738
   0.06735715  0.06700959  0.06680607  0.06708551  0.06703505  0.06858937
   0.04716279  0.04853716  0.04773741  0.04791067  0.05253093]]
2.8171
[[-0.04123669 -0.04105907 -0.06659701 -0.06743249 -0.06817508 -0.067738
   0.93264282 -0.06700959 -0.06680607 -0.06708551 -0.06703505 -0.06858937
  -0.04716279 -0.04853716 -0.04773741 -0.04791067 -0.05253093]
 [-0.04123669 -0.04105907 -0.06659701 -0.06743249 -0.06817508 -0.067738
  -0.06735715 -0.06700959 -0.06680607 -0.06708551 -0.06703505 -0.06858937
  -0.04716279 -0.04853716 -0.04773741 -0.04791067  0.94746906]]
Epoch: 7038	Loss: 3.1989552021	Example Output: 9*	Example Reward:  1
[[ 0.04124835  0.04108736  0.0665576   0.06745264  0.06814186  0.06772739
   0.06737399  0.06698477  0.06677907  0.06705641  0.06703955  0.06857061
   0.04717695  0.04856822  0.04774316  0.0479303   0.0525618 ]]
2.82104
[[-0.0

Epoch: 7049	Loss: 3.19849736691	Example Output: 0+	Example Reward:  1
[[ 0.04128185  0.04109581  0.06647743  0.06752387  0.06826406  0.06786134
   0.06739201  0.06713142  0.06674485  0.0668427   0.0668645   0.06838424
   0.04723563  0.04851362  0.04784627  0.04793925  0.05260124]]
2.82318
[[-0.04128185 -0.04109581  0.93352258 -0.06752387 -0.06826406 -0.06786134
  -0.06739201 -0.06713142 -0.06674485 -0.0668427  -0.0668645  -0.06838424
  -0.04723563 -0.04851362 -0.04784627 -0.04793925 -0.05260124]
 [-0.04128185 -0.04109581 -0.06647743 -0.06752387 -0.06826406 -0.06786134
  -0.06739201 -0.06713142 -0.06674485 -0.0668427  -0.0668645  -0.06838424
   0.95276439 -0.04851362 -0.04784627 -0.04793925 -0.05260124]]
Epoch: 7050	Loss: 3.04145131111	Example Output: /X	Example Reward:  -0.3
[[ 0.04127628  0.04110182  0.06651949  0.06750478  0.06828253  0.0678559
   0.06740155  0.06711575  0.06675603  0.06682836  0.06685817  0.0683635
   0.04726401  0.04849783  0.04784759  0.04793872  0.05258765]]
4.09

Epoch: 7062	Loss: 3.32929775715	Example Output: 60	Example Reward:  1
[[ 0.04122308  0.04103863  0.06651264  0.06750197  0.06818691  0.06777152
   0.06741682  0.06720903  0.06695545  0.06693926  0.0667779   0.0684813
   0.0472855   0.04849128  0.0477341   0.04795797  0.05251661]]
2.80562
[[-0.04122308 -0.04103863 -0.06651264 -0.06750197 -0.06818691 -0.06777152
  -0.06741682 -0.06720903  0.93304455 -0.06693926 -0.0667779  -0.0684813
  -0.0472855  -0.04849128 -0.0477341  -0.04795797 -0.05251661]
 [-0.04122308 -0.04103863  0.93348736 -0.06750197 -0.06818691 -0.06777152
  -0.06741682 -0.06720903 -0.06695545 -0.06693926 -0.0667779  -0.0684813
  -0.0472855  -0.04849128 -0.0477341  -0.04795797 -0.05251661]]
Epoch: 7063	Loss: 2.78827197552	Example Output: 30	Example Reward:  1
[[ 0.04121963  0.04105463  0.06655373  0.06750904  0.06816418  0.06773062
   0.06739522  0.0671721   0.06698589  0.06692937  0.06676009  0.06848539
   0.04733558  0.04848537  0.04773342  0.04798738  0.05249832]]
2.80504


Epoch: 7074	Loss: 3.45404064655	Example Output: 8*	Example Reward:  1
[[ 0.04117442  0.04107786  0.06665463  0.06741452  0.06832626  0.06749403
   0.06742076  0.06695635  0.06708246  0.06701829  0.06670441  0.0686537
   0.04735567  0.04852012  0.04758065  0.04802144  0.05254444]]
2.82256
[[-0.04117442 -0.04107786 -0.06665463 -0.06741452 -0.06832626 -0.06749403
  -0.06742076 -0.06695635 -0.06708246 -0.06701829  0.93329561 -0.0686537
  -0.04735567 -0.04852012 -0.04758065 -0.04802144 -0.05254444]
 [-0.04117442 -0.04107786 -0.06665463 -0.06741452 -0.06832626 -0.06749403
  -0.06742076 -0.06695635 -0.06708246 -0.06701829 -0.06670441 -0.0686537
  -0.04735567 -0.04852012  0.95241934 -0.04802144 -0.05254444]]
Epoch: 7075	Loss: 3.32683446407	Example Output: 97	Example Reward:  1
[[ 0.0411914   0.04110683  0.06664806  0.06736658  0.06831028  0.06748234
   0.06738915  0.06691746  0.06707058  0.06705347  0.06668501  0.06864291
   0.04736399  0.04853768  0.04762207  0.04803979  0.05257237]]
2.80403


Epoch: 7086	Loss: 3.45384001732	Example Output: +Y	Example Reward:  -0.3
[[ 0.04122091  0.04118267  0.06654889  0.0673271   0.06817781  0.06746554
   0.06737801  0.06693774  0.06706101  0.06694833  0.06665009  0.06863194
   0.0474674   0.04865438  0.04775825  0.04800649  0.05258344]]
4.09245
[[ 0.28763375  0.28764522  0.28003535  0.27980188  0.27954668  0.27976036
   0.27978662  0.2799187   0.27988172  0.27991551  0.28000498  0.27941042
  -0.01424022  0.2854037   0.28567255  0.28559807  0.28422499]
 [ 0.28763375 -0.0123548   0.28003535  0.27980188  0.27954668  0.27976036
   0.27978662  0.2799187   0.27988172  0.27991551  0.28000498  0.27941042
   0.28575978  0.2854037   0.28567255  0.28559807  0.28422499]]
Epoch: 7087	Loss: 3.17355413437	Example Output: 3	Example Reward:  1
[[ 0.04124693  0.04119393  0.06650873  0.06733543  0.06815848  0.06746309
   0.0673557   0.06691851  0.06703785  0.06694846  0.06663864  0.06862349
   0.04747788  0.04867069  0.04779029  0.04802397  0.05260796]]
2.8

Epoch: 7098	Loss: 2.94137728214	Example Output: X+	Example Reward:  1
[[ 0.04124331  0.04112679  0.0664925   0.06758002  0.06804743  0.06737386
   0.0674892   0.06697045  0.06695636  0.06683814  0.06684036  0.06861366
   0.04742227  0.04869256  0.04780334  0.0479563   0.05255349]]
2.84695
[[ 0.95875669 -0.04112679 -0.0664925  -0.06758002 -0.06804743 -0.06737386
  -0.0674892  -0.06697045 -0.06695636 -0.06683814 -0.06684036 -0.06861366
  -0.04742227 -0.04869256 -0.04780334 -0.0479563  -0.05255349]
 [-0.04124331 -0.04112679 -0.0664925  -0.06758002 -0.06804743 -0.06737386
  -0.0674892  -0.06697045 -0.06695636 -0.06683814 -0.06684036 -0.06861366
   0.95257771 -0.04869256 -0.04780334 -0.0479563  -0.05255349]]
Epoch: 7099	Loss: 2.91169114113	Example Output: 4Y	Example Reward:  -0.3
[[ 0.04123043  0.04108647  0.06652299  0.06756631  0.06809118  0.06734292
   0.06747667  0.06704549  0.06698595  0.06684391  0.06683905  0.06862433
   0.04744554  0.04866934  0.04777646  0.04793009  0.05252287]]
4.

Epoch: 7110	Loss: 2.66177685261	Example Output: 93	Example Reward:  1
[[ 0.04122157  0.04099711  0.06657307  0.06773746  0.06824589  0.06740224
   0.06732307  0.06718549  0.0670591   0.06675831  0.06673746  0.06840905
   0.04741099  0.0486478   0.04792946  0.04787774  0.05248417]]
2.80398
[[-0.04122157 -0.04099711 -0.06657307 -0.06773746 -0.06824589 -0.06740224
  -0.06732307 -0.06718549 -0.0670591  -0.06675831 -0.06673746  0.93159097
  -0.04741099 -0.0486478  -0.04792946 -0.04787774 -0.05248417]
 [-0.04122157 -0.04099711 -0.06657307 -0.06773746 -0.06824589  0.93259776
  -0.06732307 -0.06718549 -0.0670591  -0.06675831 -0.06673746 -0.06840905
  -0.04741099 -0.0486478  -0.04792946 -0.04787774 -0.05248417]]
Saving Weight
Epoch: 7111	Loss: 3.04438979626	Example Output: 3X	Example Reward:  -0.3
[[ 0.04121976  0.04098629  0.06656566  0.06773756  0.06822676  0.06741625
   0.06729401  0.06720488  0.06703904  0.066721    0.06679325  0.06840912
   0.04740666  0.0486521   0.04796321  0.04786998  0

Epoch: 7124	Loss: 3.45433568954	Example Output: *+	Example Reward:  -0.3
[[ 0.041093    0.040868    0.06646016  0.06779506  0.06841469  0.067499
   0.0673281   0.06722806  0.06718467  0.06688625  0.06667882  0.06844568
   0.04736243  0.04864693  0.04784162  0.04770808  0.05255943]]
4.09453
[[ 0.2876721   0.2877396   0.28006196  0.27966151  0.2794756   0.27975032
   0.27980158  0.27983159  0.27984461  0.27993414  0.27999637  0.2794663
   0.28579128  0.28540593 -0.01435249  0.2856876   0.28423217]
 [ 0.2876721   0.2877396   0.28006196  0.27966151  0.2794756   0.27975032
   0.27980158  0.27983159  0.27984461  0.27993414  0.27999637  0.2794663
  -0.01420873  0.28540593  0.28564754  0.2856876   0.28423217]]
Epoch: 7125	Loss: 2.61030180454	Example Output: 1X	Example Reward:  -0.3
4.09765
[[ 0.28766465  0.28773147  0.28006706 -0.02033235  0.27947795  0.27974641
   0.27980974  0.27982989  0.27985391  0.2799381   0.28000113  0.2794728
   0.28578469  0.28540349  0.28564164  0.28568214  0.2842274

Epoch: 7138	Loss: 2.79301006794	Example Output: Y/	Example Reward:  1
[[ 0.04116241  0.04092272  0.0666371   0.06761087  0.06847633  0.06749474
   0.06715005  0.0673191   0.06700594  0.06689236  0.06676064  0.06833537
   0.04749171  0.04864128  0.04789026  0.04773471  0.05247443]]
2.84683
[[-0.04116241  0.9590773  -0.0666371  -0.06761087 -0.06847633 -0.06749474
  -0.06715005 -0.0673191  -0.06700594 -0.06689236 -0.06676064 -0.06833537
  -0.04749171 -0.04864128 -0.04789026 -0.04773471 -0.05247443]
 [-0.04116241 -0.04092272 -0.0666371  -0.06761087 -0.06847633 -0.06749474
  -0.06715005 -0.0673191  -0.06700594 -0.06689236 -0.06676064 -0.06833537
  -0.04749171 -0.04864128 -0.04789026  0.95226526 -0.05247443]]
Epoch: 7139	Loss: 3.57950212955	Example Output: 42	Example Reward:  1
[[ 0.04117293  0.04098376  0.06661723  0.0675821   0.06847446  0.06750537
   0.0670994   0.06729832  0.06697994  0.066884    0.06675618  0.06832185
   0.04750254  0.04864855  0.04793739  0.04776262  0.05247332]]
2.804

Epoch: 7150	Loss: 2.63523666859	Example Output: 0/	Example Reward:  1
2.8226
[[-0.04126476 -0.04106816  0.93351275 -0.06775975 -0.06828905 -0.06740726
  -0.06698018 -0.06731641 -0.06692924 -0.06683017 -0.06672508 -0.0683926
  -0.04747616 -0.0486396  -0.04797677 -0.04788345 -0.05257415]
 [-0.04126476 -0.04106816 -0.06648727 -0.06775975 -0.06828905 -0.06740726
  -0.06698018 -0.06731641 -0.06692924 -0.06683017 -0.06672508 -0.0683926
  -0.04747616 -0.0486396  -0.04797677  0.95211655 -0.05257415]]
Saving Weight
Epoch: 7151	Loss: 2.22230577469	Example Output: +3	Example Reward:  -0.3
[[ 0.04126301  0.04107156  0.06647456  0.06778514  0.06827449  0.06738156
   0.06698038  0.06730302  0.06691291  0.06683196  0.06673144  0.06841897
   0.04747079  0.04864652  0.0479596   0.04790299  0.05259107]]
4.09984
[[ 0.28762111  0.28767854  0.28005764  0.27966446  0.27951765  0.27978554
   0.27990592  0.27980912  0.27992615  0.27995044  0.27998057  0.27947432
  -0.01424124  0.28540605  0.28561214  0.285629

Epoch: 7162	Loss: 2.78623957634	Example Output: 0X	Example Reward:  -0.3
[[ 0.04124368  0.04103204  0.06627995  0.06785046  0.06835885  0.06708658
   0.06707507  0.0674229   0.06694044  0.06673384  0.06683391  0.06841408
   0.04751737  0.04875542  0.04791321  0.04790023  0.05264197]]
4.09749
[[ 0.28762692  0.2876904  -0.01988398  0.27964488  0.27949235  0.27987403
   0.27987748  0.27977315  0.2799179   0.27997985  0.27994984  0.27947578
   0.28574482  0.28537339  0.28562605  0.28562996  0.2842074 ]
 [-0.01237311  0.2876904   0.28011602  0.27964488  0.27949235  0.27987403
   0.27987748  0.27977315  0.2799179   0.27997985  0.27994984  0.27947578
   0.28574482  0.28537339  0.28562605  0.28562996  0.2842074 ]]
Epoch: 7163	Loss: 2.78410995007	Example Output: 28	Example Reward:  1
[[ 0.04122613  0.0410263   0.06623963  0.06788569  0.06835251  0.06706259
   0.06709299  0.06742939  0.06692871  0.06673988  0.06686494  0.06841782
   0.04752277  0.04875151  0.04791838  0.04790614  0.05263457]]
2.

Epoch: 7174	Loss: 2.79069919586	Example Output: 24	Example Reward:  1
[[ 0.04114245  0.04104489  0.06608164  0.06777585  0.06851394  0.06689066
   0.06740548  0.06741276  0.06680574  0.06690553  0.06688335  0.06847549
   0.04755821  0.04874594  0.04784105  0.04791177  0.05260528]]
2.80396
[[-0.04114245 -0.04104489 -0.06608164 -0.06777585  0.93148607 -0.06689066
  -0.06740548 -0.06741276 -0.06680574 -0.06690553 -0.06688335 -0.06847549
  -0.04755821 -0.04874594 -0.04784105 -0.04791177 -0.05260528]
 [-0.04114245 -0.04104489 -0.06608164 -0.06777585 -0.06851394 -0.06689066
   0.93259454 -0.06741276 -0.06680574 -0.06690553 -0.06688335 -0.06847549
  -0.04755821 -0.04874594 -0.04784105 -0.04791177 -0.05260528]]
Epoch: 7175	Loss: 2.78600363731	Example Output: 24	Example Reward:  1
[[ 0.04115858  0.04102365  0.06609029  0.06775551  0.06853972  0.06688565
   0.06741197  0.06747308  0.0667773   0.06688321  0.0668755   0.06850001
   0.04755409  0.04872876  0.04786023  0.04789011  0.0525924 ]]
2.803

Epoch: 7188	Loss: 2.94487373829	Example Output: Y*	Example Reward:  1
[[ 0.04121114  0.04102469  0.06619085  0.06757926  0.06860889  0.06694475
   0.06747731  0.06756733  0.06693172  0.06691525  0.06670652  0.06846702
   0.04749564  0.04848294  0.04800607  0.04790954  0.05248107]]
2.84652
[[-0.04121114  0.95897532 -0.06619085 -0.06757926 -0.06860889 -0.06694475
  -0.06747731 -0.06756733 -0.06693172 -0.06691525 -0.06670652 -0.06846702
  -0.04749564 -0.04848294 -0.04800607 -0.04790954 -0.05248107]
 [-0.04121114 -0.04102469 -0.06619085 -0.06757926 -0.06860889 -0.06694475
  -0.06747731 -0.06756733 -0.06693172 -0.06691525 -0.06670652 -0.06846702
  -0.04749564 -0.04848294  0.95199394 -0.04790954 -0.05248107]]
Epoch: 7189	Loss: 3.06453037262	Example Output: 89	Example Reward:  1
[[ 0.0412111   0.04103279  0.06618512  0.06756105  0.06857984  0.06702355
   0.06746513  0.06756691  0.06691251  0.06690621  0.0667261   0.06847705
   0.04748044  0.04847348  0.04802496  0.04790365  0.05247008]]
2.804

Epoch: 7200	Loss: 2.9352517128	Example Output: 73	Example Reward:  1
[[ 0.04103225  0.04079435  0.06643585  0.06755722  0.06872478  0.06718454
   0.0675379   0.06789391  0.0671327   0.06703801  0.06676026  0.06849512
   0.04729972  0.048225    0.04779516  0.04778872  0.05230446]]
2.8047
[[-0.04103225 -0.04079435 -0.06643585 -0.06755722 -0.06872478 -0.06718454
  -0.0675379  -0.06789391 -0.0671327   0.932962   -0.06676026 -0.06849512
  -0.04729972 -0.048225   -0.04779516 -0.04778872 -0.05230446]
 [-0.04103225 -0.04079435 -0.06643585 -0.06755722 -0.06872478  0.93281543
  -0.0675379  -0.06789391 -0.0671327  -0.06703801 -0.06676026 -0.06849512
  -0.04729972 -0.048225   -0.04779516 -0.04778872 -0.05230446]]
Saving Weight
Epoch: 7201	Loss: 3.32245676517	Example Output: 72	Example Reward:  1
[[ 0.0410083   0.04075854  0.06640515  0.06759494  0.06875879  0.06718594
   0.06757964  0.06791034  0.06713114  0.06706927  0.06678954  0.06849506
   0.04727059  0.04820149  0.04777369  0.04777952  0.0522

Epoch: 7212	Loss: 2.91108822823	Example Output: 37	Example Reward:  1
[[ 0.04098802  0.04078022  0.06629531  0.06800243  0.06860526  0.06741169
   0.06753416  0.06783585  0.06712717  0.06688695  0.06691991  0.06845109
   0.04715499  0.04818171  0.04780937  0.04782743  0.05218852]]
2.80455
[[-0.04098802 -0.04078022 -0.06629531 -0.06800243 -0.06860526  0.93258834
  -0.06753416 -0.06783585 -0.06712717 -0.06688695 -0.06691991 -0.06845109
  -0.04715499 -0.04818171 -0.04780937 -0.04782743 -0.05218852]
 [-0.04098802 -0.04078022 -0.06629531 -0.06800243 -0.06860526 -0.06741169
  -0.06753416 -0.06783585 -0.06712717  0.93311304 -0.06691991 -0.06845109
  -0.04715499 -0.04818171 -0.04780937 -0.04782743 -0.05218852]]
Epoch: 7213	Loss: 3.06567709446	Example Output: +6	Example Reward:  -0.3
[[ 0.04095406  0.04075304  0.06625905  0.06801721  0.06860243  0.06741072
   0.06758913  0.0678499   0.06718139  0.06694411  0.06690583  0.0684646
   0.04714227  0.04815926  0.04778152  0.04780651  0.05217903]]
4.0

Epoch: 7225	Loss: 3.45996935368	Example Output: 4-	Example Reward:  1
[[ 0.0409917   0.04077683  0.06632801  0.06795967  0.06851255  0.06746151
   0.06763906  0.06770399  0.06715803  0.06699568  0.06687765  0.06865078
   0.04714215  0.04808845  0.04775781  0.04782573  0.05213029]]
2.82082
[[-0.0409917  -0.04077683 -0.06632801 -0.06795967 -0.06851255 -0.06746151
   0.93236095 -0.06770399 -0.06715803 -0.06699568 -0.06687765 -0.06865078
  -0.04714215 -0.04808845 -0.04775781 -0.04782573 -0.05213029]
 [-0.0409917  -0.04077683 -0.06632801 -0.06795967 -0.06851255 -0.06746151
  -0.06763906 -0.06770399 -0.06715803 -0.06699568 -0.06687765 -0.06865078
  -0.04714215  0.95191157 -0.04775781 -0.04782573 -0.05213029]]
Epoch: 7226	Loss: 2.91193296909	Example Output: -8	Example Reward:  -0.3
[[ 0.04099688  0.04078847  0.06632933  0.06794183  0.0684893   0.06745311
   0.06765892  0.06768216  0.06711443  0.06699686  0.06693338  0.06865088
   0.04715873  0.04810169  0.04775882  0.04782895  0.05211625]]
4.

Epoch: 7239	Loss: 3.33123345375	Example Output: X/	Example Reward:  1
[[ 0.04086999  0.04079168  0.06641059  0.06787656  0.06837751  0.06760131
   0.0677161   0.06751183  0.06716767  0.06707849  0.06716231  0.06870969
   0.04719379  0.04805502  0.0476861   0.04779376  0.05199764]]
2.84621
[[ 0.95912999 -0.04079168 -0.06641059 -0.06787656 -0.06837751 -0.06760131
  -0.0677161  -0.06751183 -0.06716767 -0.06707849 -0.06716231 -0.06870969
  -0.04719379 -0.04805502 -0.0476861  -0.04779376 -0.05199764]
 [-0.04086999 -0.04079168 -0.06641059 -0.06787656 -0.06837751 -0.06760131
  -0.0677161  -0.06751183 -0.06716767 -0.06707849 -0.06716231 -0.06870969
  -0.04719379 -0.04805502 -0.0476861   0.95220625 -0.05199764]]
Epoch: 7240	Loss: 2.91486020088	Example Output: 2+	Example Reward:  1
[[ 0.04089313  0.04082076  0.06641926  0.06783514  0.06834069  0.06762522
   0.06770803  0.06747948  0.0671424   0.06709553  0.06715111  0.0686997
   0.04720162  0.04805709  0.04769662  0.04781973  0.05201455]]
2.8211

Epoch: 7251	Loss: 2.7852858305	Example Output: 74	Example Reward:  1
[[ 0.04093069  0.04083053  0.06630405  0.06784591  0.06826538  0.06776299
   0.06754465  0.06751864  0.06719958  0.06716611  0.06702592  0.06881956
   0.04715608  0.04799146  0.04769281  0.0479106   0.05203499]]
2.80414
[[-0.04093069 -0.04083053 -0.06630405 -0.06784591 -0.06826538 -0.06776299
  -0.06754465 -0.06751864 -0.06719958  0.93283391 -0.06702592 -0.06881956
  -0.04715608 -0.04799146 -0.04769281 -0.0479106  -0.05203499]
 [-0.04093069 -0.04083053 -0.06630405 -0.06784591 -0.06826538 -0.06776299
   0.93245536 -0.06751864 -0.06719958 -0.06716611 -0.06702592 -0.06881956
  -0.04715608 -0.04799146 -0.04769281 -0.0479106  -0.05203499]]
Epoch: 7252	Loss: 3.19549577236	Example Output: 8Y	Example Reward:  -0.3
[[ 0.04091897  0.04084238  0.06627144  0.06785657  0.06824443  0.06779353
   0.06757174  0.0674818   0.06720192  0.06718805  0.06702399  0.06885459
   0.04714561  0.04798239  0.04769661  0.04789861  0.05202737]]
4.0

Epoch: 7263	Loss: 3.32188160419	Example Output: 6*	Example Reward:  1
[[ 0.04088141  0.04078597  0.0662557   0.06775919  0.0682167   0.06788751
   0.0678039   0.06771734  0.06712288  0.06717919  0.06712442  0.06877424
   0.04712909  0.04793294  0.04761242  0.0478088   0.05200836]]
2.82152
[[-0.04088141 -0.04078597 -0.0662557  -0.06775919 -0.0682167  -0.06788751
  -0.0678039  -0.06771734  0.93287712 -0.06717919 -0.06712442 -0.06877424
  -0.04712909 -0.04793294 -0.04761242 -0.0478088  -0.05200836]
 [-0.04088141 -0.04078597 -0.0662557  -0.06775919 -0.0682167  -0.06788751
  -0.0678039  -0.06771734 -0.06712288 -0.06717919 -0.06712442 -0.06877424
  -0.04712909 -0.04793294  0.95238757 -0.0478088  -0.05200836]]
Epoch: 7264	Loss: 2.93746716976	Example Output: 17	Example Reward:  1
[[ 0.04085591  0.04076664  0.06625444  0.06775811  0.06825699  0.0678528
   0.06784284  0.06772751  0.06720896  0.06718906  0.06709495  0.0687463
   0.04711337  0.04791436  0.04760649  0.04780545  0.0520058 ]]
2.8038


Epoch: 7275	Loss: 3.19838991165	Example Output: 2	Example Reward:  1
[[ 0.04087138  0.04076541  0.06617575  0.06777932  0.06826513  0.06777927
   0.06789447  0.06758367  0.06748006  0.06727501  0.06679789  0.06886908
   0.04700104  0.04792052  0.04750554  0.04790261  0.0521339 ]]
2.8161
[[-0.04087138 -0.04076541 -0.06617575 -0.06777932  0.93173486 -0.06777927
  -0.06789447 -0.06758367 -0.06748006 -0.06727501 -0.06679789 -0.06886908
  -0.04700104 -0.04792052 -0.04750554 -0.04790261 -0.0521339 ]
 [-0.04087138 -0.04076541 -0.06617575 -0.06777932 -0.06826513 -0.06777927
  -0.06789447 -0.06758367 -0.06748006 -0.06727501 -0.06679789 -0.06886908
  -0.04700104 -0.04792052 -0.04750554 -0.04790261  0.94786608]]
Epoch: 7276	Loss: 2.66241927147	Example Output: 8*	Example Reward:  1
[[ 0.04087691  0.04076499  0.06615286  0.06775941  0.06829314  0.06777143
   0.06789508  0.06760165  0.06745774  0.06724001  0.06680354  0.06886862
   0.04700085  0.04792161  0.04754347  0.04790463  0.05214412]]
2.82181

Epoch: 7289	Loss: 3.45412111282	Example Output: 3-	Example Reward:  1
[[ 0.04101491  0.04083688  0.06619833  0.06791805  0.06825051  0.06771482
   0.06774861  0.06770657  0.06736757  0.06699328  0.0668559   0.06875236
   0.04707056  0.04786171  0.04770393  0.0479552   0.05205085]]
2.82095
[[-0.04101491 -0.04083688 -0.06619833 -0.06791805 -0.06825051  0.93228519
  -0.06774861 -0.06770657 -0.06736757 -0.06699328 -0.0668559  -0.06875236
  -0.04707056 -0.04786171 -0.04770393 -0.0479552  -0.05205085]
 [-0.04101491 -0.04083688 -0.06619833 -0.06791805 -0.06825051 -0.06771482
  -0.06774861 -0.06770657 -0.06736757 -0.06699328 -0.0668559  -0.06875236
  -0.04707056  0.9521383  -0.04770393 -0.0479552  -0.05205085]]
Epoch: 7290	Loss: 3.04425957203	Example Output: -3	Example Reward:  -0.3
[[ 0.0410337   0.04085626  0.06618796  0.06788671  0.06826168  0.06775614
   0.06773229  0.067656    0.06732882  0.06698597  0.06685358  0.06872743
   0.04707779  0.04788346  0.04772477  0.04796251  0.05208488]]
4.

Epoch: 7302	Loss: 3.06307356358	Example Output: 00	Example Reward:  1
[[ 0.04103447  0.04082613  0.06623156  0.06793892  0.06825738  0.067731
   0.06766533  0.06750701  0.06752956  0.06697252  0.06681588  0.06868863
   0.04705556  0.04794483  0.04777193  0.04793002  0.05209924]]
2.80586
[[-0.04103447 -0.04082613  0.93376845 -0.06793892 -0.06825738 -0.067731
  -0.06766533 -0.06750701 -0.06752956 -0.06697252 -0.06681588 -0.06868863
  -0.04705556 -0.04794483 -0.04777193 -0.04793002 -0.05209924]
 [-0.04103447 -0.04082613  0.93376845 -0.06793892 -0.06825738 -0.067731
  -0.06766533 -0.06750701 -0.06752956 -0.06697252 -0.06681588 -0.06868863
  -0.04705556 -0.04794483 -0.04777193 -0.04793002 -0.05209924]]
Epoch: 7303	Loss: 3.32305862904	Example Output: 9*	Example Reward:  1
[[ 0.04100784  0.04081278  0.06631207  0.06790617  0.06830456  0.06775668
   0.06769374  0.06747706  0.06754977  0.067008    0.06683917  0.06866869
   0.04703008  0.04790739  0.04775047  0.04790445  0.05207114]]
2.82036
[[-

Epoch: 7314	Loss: 2.91328909397	Example Output: 6Y	Example Reward:  -0.3
[[ 0.04122251  0.04098212  0.06632935  0.06765696  0.06838364  0.06791821
   0.06758118  0.06717674  0.06736062  0.06694645  0.0666829   0.06854192
   0.04705618  0.04802607  0.04796166  0.04799445  0.05217908]]
4.09741
[[ 0.28763327  0.28770536  0.28010121  0.2797029   0.27948493  0.27962455
   0.27972567  0.279847   -0.02020819  0.27991608  0.27999514  0.27943742
   0.28588316  0.2855922   0.28561151  0.28560168  0.28434628]
 [ 0.28763327 -0.01229464  0.28010121  0.2797029   0.27948493  0.27962455
   0.27972567  0.279847    0.27979183  0.27991608  0.27999514  0.27943742
   0.28588316  0.2855922   0.28561151  0.28560168  0.28434628]]
Epoch: 7315	Loss: 3.04397614002	Example Output: 34	Example Reward:  1
2.80393
[[-0.04122463 -0.04099532 -0.06631204 -0.06768593 -0.06834549  0.93210512
  -0.06756781 -0.06716326 -0.06739327 -0.06695188 -0.06666079 -0.06852606
  -0.04705806 -0.04805962 -0.04795279 -0.04802104 -0.05218

Epoch: 7328	Loss: 3.07219743729	Example Output: 65	Example Reward:  1
[[ 0.04111507  0.04094634  0.06615362  0.06762955  0.06826542  0.06787831
   0.06754462  0.06736971  0.0673948   0.06700823  0.06675362  0.06851525
   0.04710075  0.04826014  0.0478254   0.04806582  0.05217335]]
2.80442
[[-0.04111507 -0.04094634 -0.06615362 -0.06762955 -0.06826542 -0.06787831
  -0.06754462 -0.06736971  0.93260521 -0.06700823 -0.06675362 -0.06851525
  -0.04710075 -0.04826014 -0.0478254  -0.04806582 -0.05217335]
 [-0.04111507 -0.04094634 -0.06615362 -0.06762955 -0.06826542 -0.06787831
  -0.06754462  0.9326303  -0.0673948  -0.06700823 -0.06675362 -0.06851525
  -0.04710075 -0.04826014 -0.0478254  -0.04806582 -0.05217335]]
Epoch: 7329	Loss: 3.06960561275	Example Output: 37	Example Reward:  1
[[ 0.0411186   0.04094807  0.06611116  0.06765845  0.06821514  0.06784088
   0.06755748  0.06736483  0.06741773  0.06700114  0.06672873  0.06853529
   0.04713878  0.04828624  0.04780718  0.04807313  0.05219718]]
2.804

Epoch: 7340	Loss: 3.3219096899	Example Output: +1	Example Reward:  -0.3
[[ 0.04102028  0.04084078  0.0660205   0.06796169  0.06818496  0.06770648
   0.06767143  0.06728225  0.06731369  0.0668551   0.06716926  0.06885085
   0.04701513  0.04838215  0.04760028  0.04798291  0.0521423 ]]
4.09952
[[ 0.28769392  0.28774777  0.28019387  0.2796115   0.27954453  0.27968806
   0.27969858  0.27981535  0.2798059   0.2799435   0.27984923  0.27934474
  -0.01410454  0.28548536  0.28571993  0.28560513  0.28435731]
 [ 0.28769392  0.28774777  0.28019387 -0.02038851  0.27954453  0.27968806
   0.27969858  0.27981535  0.2798059   0.2799435   0.27984923  0.27934474
   0.28589547  0.28548536  0.28571993  0.28560513  0.28435731]]
Saving Weight
Epoch: 7341	Loss: 3.32877483368	Example Output: 2-	Example Reward:  1
[[ 0.04102905  0.0408638   0.06602009  0.06797216  0.06819696  0.06769691
   0.06763472  0.06725433  0.06730402  0.06684596  0.06715053  0.06882717
   0.0470171   0.04841465  0.04761215  0.04800531  0.

Epoch: 7354	Loss: 3.32096903324	Example Output: +	Example Reward:  -0.3
[[ 0.04117168  0.04103835  0.06585908  0.06763573  0.06816901  0.06754742
   0.06753113  0.06739528  0.06709521  0.06677517  0.0670792   0.06881897
   0.04724894  0.04859241  0.04779402  0.04801941  0.05222907]]
4.09583
[[ 0.2876485   0.28768852  0.28024229  0.27970931  0.2795493   0.27973577
   0.27974069  0.27978143  0.27987143  0.27996746  0.27987626  0.2793543
  -0.01417468  0.2854223   0.28566179  0.2855942   0.28433129]
 [ 0.2876485   0.28768852  0.28024229  0.27970931  0.2795493   0.27973577
   0.27974069  0.27978143  0.27987143  0.27996746  0.27987626  0.2793543
   0.28582531  0.2854223   0.28566179  0.2855942  -0.01566872]]
Epoch: 7355	Loss: 2.91348938942	Example Output: 06	Example Reward:  1
[[ 0.04116897  0.04101709  0.06583077  0.06761243  0.06816943  0.06753567
   0.06756386  0.0674235   0.06706834  0.06675738  0.06712898  0.06887431
   0.04724441  0.04860178  0.04778324  0.04800092  0.05221888]]
2.805

Epoch: 7368	Loss: 2.91755464077	Example Output: 43	Example Reward:  1
[[ 0.04119768  0.04114042  0.06587633  0.0674691   0.06806569  0.06759557
   0.06743743  0.06731674  0.06696555  0.06681589  0.06697354  0.06888796
   0.04737256  0.04857213  0.04789297  0.04812504  0.05229543]]
2.80458
[[-0.04119768 -0.04114042 -0.06587633 -0.0674691  -0.06806569 -0.06759557
   0.93256259 -0.06731674 -0.06696555 -0.06681589 -0.06697354 -0.06888796
  -0.04737256 -0.04857213 -0.04789297 -0.04812504 -0.05229543]
 [-0.04119768 -0.04114042 -0.06587633 -0.0674691  -0.06806569  0.9324044
  -0.06743743 -0.06731674 -0.06696555 -0.06681589 -0.06697354 -0.06888796
  -0.04737256 -0.04857213 -0.04789297 -0.04812504 -0.05229543]]
Epoch: 7369	Loss: 2.656509161	Example Output: 69	Example Reward:  1
[[ 0.0411944   0.04112665  0.06587174  0.06747379  0.06807784  0.06760672
   0.0674342   0.06733209  0.06692886  0.06679633  0.06704026  0.06888404
   0.04735296  0.04857359  0.04788241  0.04811851  0.05230558]]
2.804
[[

Epoch: 7380	Loss: 3.58105421066	Example Output: 14	Example Reward:  1
[[ 0.04127736  0.04125041  0.0657475   0.06745756  0.06800262  0.06764053
   0.06731331  0.06747322  0.06681882  0.06670146  0.06688158  0.0688417
   0.04740318  0.04859051  0.04793375  0.04827707  0.05238932]]
2.80495
[[-0.04127736 -0.04125041 -0.0657475   0.93254244 -0.06800262 -0.06764053
  -0.06731331 -0.06747322 -0.06681882 -0.06670146 -0.06688158 -0.0688417
  -0.04740318 -0.04859051 -0.04793375 -0.04827707 -0.05238932]
 [-0.04127736 -0.04125041 -0.0657475  -0.06745756 -0.06800262 -0.06764053
   0.93268669 -0.06747322 -0.06681882 -0.06670146 -0.06688158 -0.0688417
  -0.04740318 -0.04859051 -0.04793375 -0.04827707 -0.05238932]]
Saving Weight
Epoch: 7381	Loss: 3.32542572021	Example Output: /+	Example Reward:  -0.3
[[ 0.0412822   0.04127519  0.06572326  0.06747065  0.06797706  0.06769659
   0.06733954  0.06745347  0.06679389  0.06670925  0.06684574  0.06881876
   0.04741439  0.04858727  0.04794689  0.04827598  0.05

Epoch: 7394	Loss: 3.06552250385	Example Output: *4	Example Reward:  -0.3
[[ 0.04136332  0.04149095  0.06583828  0.06747897  0.06791212  0.06784216
   0.06710654  0.06716771  0.06657643  0.0666464   0.06693738  0.06866348
   0.04746168  0.04865245  0.04811468  0.04834274  0.05240478]]
4.10014
[[ 0.28759101  0.28755271  0.28024852  0.27975634  0.27962637  0.27964735
   0.27986804  0.27984971  0.28002709  0.28000608  0.27991879  0.27940097
   0.28576151  0.28540426 -0.0144344   0.28549719  0.28427857]
 [ 0.28759101  0.28755271  0.28024852  0.27975634  0.27962637  0.27964735
  -0.02013196  0.27984971  0.28002709  0.28000608  0.27991879  0.27940097
   0.28576151  0.28540426  0.28556561  0.28549719  0.28427857]]
Epoch: 7395	Loss: 3.71403195858	Example Output: +9	Example Reward:  -0.3
[[ 0.04137624  0.04151038  0.06583584  0.0674743   0.06791979  0.06784681
   0.06705808  0.06720055  0.06653921  0.06662285  0.06694543  0.06862218
   0.0474862   0.04865144  0.04815508  0.0483544   0.05240121]]

Epoch: 7406	Loss: 3.19864802361	Example Output: *+	Example Reward:  -0.3
[[ 0.04161996  0.0418131   0.06578551  0.06751967  0.06753306  0.06798557
   0.06679449  0.06702441  0.06647629  0.06642339  0.06682073  0.06840356
   0.04766554  0.04874269  0.04832411  0.0485628   0.05250512]]
4.0953
[[ 0.28751403  0.2874561   0.28026435  0.27974412  0.2797401   0.27960435
   0.27996165  0.27989268  0.28005713  0.28007299  0.27995378  0.27947894
   0.28570035  0.2853772  -0.01449723  0.28543118  0.28424847]
 [ 0.28751403  0.2874561   0.28026435  0.27974412  0.2797401   0.27960435
   0.27996165  0.27989268  0.28005713  0.28007299  0.27995378  0.27947894
  -0.01429966  0.2853772   0.28550279  0.28543118  0.28424847]]
Epoch: 7407	Loss: 2.93831455708	Example Output: 85	Example Reward:  1
[[ 0.04161076  0.04179379  0.06581022  0.06755626  0.06751181  0.06801651
   0.06678379  0.06701203  0.06649414  0.06641439  0.06685031  0.06842406
   0.0476453   0.04872106  0.04831188  0.04854985  0.05249387]]
2.8

Epoch: 7420	Loss: 3.32936375141	Example Output: +1	Example Reward:  -0.3
[[ 0.04169171  0.04182619  0.06587694  0.06766026  0.0675493   0.06796616
   0.06666375  0.06700688  0.06637431  0.06627043  0.06687672  0.06847749
   0.04770275  0.04871999  0.0482929   0.04861594  0.05242834]]
4.10037
[[ 0.28749248  0.28745216  0.28023693  0.27970192  0.27973524  0.27961016
   0.2800009   0.27989796  0.28008771  0.28011888  0.279937    0.27945676
  -0.01431082  0.285384    0.28551215  0.28541523  0.28427151]
 [ 0.28749248  0.28745216  0.28023693 -0.02029808  0.27973524  0.27961016
   0.2800009   0.27989796  0.28008771  0.28011888  0.279937    0.27945676
   0.2856892   0.285384    0.28551215  0.28541523  0.28427151]]
Saving Weight
Epoch: 7421	Loss: 2.92038574219	Example Output: 93	Example Reward:  1
[[ 0.04171271  0.04186952  0.06586552  0.06764088  0.06753708  0.06795523
   0.06665076  0.06696074  0.06633598  0.06623858  0.06689139  0.06844825
   0.04773825  0.0487371   0.04831862  0.04865293  0

Epoch: 7434	Loss: 3.20234978199	Example Output: 21	Example Reward:  1
[[ 0.04178938  0.04191538  0.06595514  0.06766801  0.06736214  0.06823915
   0.06658191  0.066928    0.0662275   0.0660864   0.06698169  0.06857895
   0.04775292  0.04868464  0.04826372  0.04861226  0.05237281]]
2.80559
[[-0.04178938 -0.04191538 -0.06595514 -0.06766801  0.93263787 -0.06823915
  -0.06658191 -0.066928   -0.0662275  -0.0660864  -0.06698169 -0.06857895
  -0.04775292 -0.04868464 -0.04826372 -0.04861226 -0.05237281]
 [-0.04178938 -0.04191538 -0.06595514  0.93233198 -0.06736214 -0.06823915
  -0.06658191 -0.066928   -0.0662275  -0.0660864  -0.06698169 -0.06857895
  -0.04775292 -0.04868464 -0.04826372 -0.04861226 -0.05237281]]
Epoch: 7435	Loss: 2.91600887775	Example Output: 75	Example Reward:  1
2.8071
[[-0.04180134 -0.04192552 -0.06592737 -0.06769534 -0.06735919 -0.06822265
  -0.0665793  -0.06695089 -0.06621883  0.93392891 -0.06698606 -0.06856017
  -0.04774486 -0.04869099 -0.04827708 -0.04861628 -0.05237309]

Epoch: 7448	Loss: 2.94237656593	Example Output: 34	Example Reward:  1
[[ 0.04173711  0.04196976  0.06614341  0.06756904  0.06728685  0.06832398
   0.06668834  0.06704312  0.06619702  0.06613579  0.06682237  0.06858162
   0.04783755  0.04854058  0.0482977   0.04855332  0.05227246]]
2.80557
[[-0.04173711 -0.04196976 -0.06614341 -0.06756904 -0.06728685  0.93167603
  -0.06668834 -0.06704312 -0.06619702 -0.06613579 -0.06682237 -0.06858162
  -0.04783755 -0.04854058 -0.0482977  -0.04855332 -0.05227246]
 [-0.04173711 -0.04196976 -0.06614341 -0.06756904 -0.06728685 -0.06832398
   0.93331164 -0.06704312 -0.06619702 -0.06613579 -0.06682237 -0.06858162
  -0.04783755 -0.04854058 -0.0482977  -0.04855332 -0.05227246]]
Epoch: 7449	Loss: 3.32578744888	Example Output: Y7	Example Reward:  -0.3
[[ 0.04171972  0.04197324  0.06615216  0.06753752  0.06728846  0.06836022
   0.06671226  0.06702497  0.06618658  0.06616507  0.06684624  0.06859261
   0.04781268  0.04852368  0.04828234  0.0485453   0.05227691]]
4.

Epoch: 7460	Loss: 3.32838628292	Example Output: 7-	Example Reward:  1
[[ 0.04185122  0.04220505  0.06608595  0.06748353  0.06716092  0.06831728
   0.0666298   0.06683116  0.06610841  0.06624331  0.0666059   0.06834041
   0.04795805  0.04864679  0.04844031  0.04874256  0.05234932]]
2.82322
[[-0.04185122 -0.04220505 -0.06608595 -0.06748353 -0.06716092 -0.06831728
  -0.0666298  -0.06683116 -0.06610841  0.93375671 -0.0666059  -0.06834041
  -0.04795805 -0.04864679 -0.04844031 -0.04874256 -0.05234932]
 [-0.04185122 -0.04220505 -0.06608595 -0.06748353 -0.06716092 -0.06831728
  -0.0666298  -0.06683116 -0.06610841 -0.06624331 -0.0666059  -0.06834041
  -0.04795805  0.95135319 -0.04844031 -0.04874256 -0.05234932]]
Saving Weight
Epoch: 7461	Loss: 3.19861238003	Example Output: 37	Example Reward:  1
[[ 0.04186385  0.04221676  0.06606183  0.06750481  0.0671491   0.0683128
   0.06662901  0.06683639  0.06609803  0.06625307  0.06656711  0.06830423
   0.04795082  0.04867419  0.04844067  0.0487625   0.052

Epoch: 7474	Loss: 3.32709941864	Example Output: 9/	Example Reward:  1
[[ 0.04176491  0.04214049  0.06597333  0.06756815  0.06728615  0.06818175
   0.06656352  0.06705374  0.06624582  0.06647796  0.0664712   0.06820372
   0.04791541  0.04873466  0.04828142  0.04876588  0.05237189]]
2.82155
[[-0.04176491 -0.04214049 -0.06597333 -0.06756815 -0.06728615 -0.06818175
  -0.06656352 -0.06705374 -0.06624582 -0.06647796 -0.0664712   0.93179625
  -0.04791541 -0.04873466 -0.04828142 -0.04876588 -0.05237189]
 [-0.04176491 -0.04214049 -0.06597333 -0.06756815 -0.06728615 -0.06818175
  -0.06656352 -0.06705374 -0.06624582 -0.06647796 -0.0664712  -0.06820372
  -0.04791541 -0.04873466 -0.04828142  0.9512341  -0.05237189]]
Epoch: 7475	Loss: 3.04579370022	Example Output: 42	Example Reward:  1
[[ 0.04176833  0.04216288  0.06597754  0.06756395  0.06726718  0.06817631
   0.06655783  0.06702569  0.06625822  0.06648222  0.06645573  0.06819791
   0.04792406  0.04873635  0.04827304  0.04879958  0.05237319]]
2.806

Epoch: 7488	Loss: 2.91809494495	Example Output: 8Y	Example Reward:  -0.3
[[ 0.04174754  0.04221202  0.06611584  0.06728733  0.06736082  0.06820472
   0.06674341  0.06690969  0.06622571  0.06682388  0.06633797  0.06813656
   0.04794635  0.04861438  0.04822477  0.04873744  0.0523715 ]]
4.09835
[[ 0.28747573  0.28733641  0.28016526  0.27981383  0.27979177  0.2795386
   0.27997699  0.2799271   0.28013229  0.27995285 -0.01990139  0.27955905
   0.2856161   0.28541571  0.28553259  0.28537878  0.28428856]
 [ 0.28747573 -0.01266361  0.28016526  0.27981383  0.27979177  0.2795386
   0.27997699  0.2799271   0.28013229  0.27995285  0.28009862  0.27955905
   0.2856161   0.28541571  0.28553259  0.28537878  0.28428856]]
Epoch: 7489	Loss: 2.37999887466	Example Output: 0X	Example Reward:  -0.3
[[ 0.04177254  0.04222171  0.06610323  0.06727051  0.06734335  0.06819797
   0.06671894  0.06689595  0.06620631  0.06683443  0.06633765  0.06813478
   0.04796613  0.0486154   0.04823743  0.04876041  0.05238319]]
4

Epoch: 7500	Loss: 2.09583852291	Example Output: 84	Example Reward:  1
[[ 0.04175192  0.04217034  0.06618503  0.06747641  0.06726843  0.06846526
   0.06663545  0.06691974  0.06638574  0.06685556  0.0661803   0.06800115
   0.0479121   0.04851904  0.04817067  0.04877529  0.05232757]]
2.80736
[[-0.04175192 -0.04217034 -0.06618503 -0.06747641 -0.06726843 -0.06846526
  -0.06663545 -0.06691974 -0.06638574 -0.06685556  0.93381971 -0.06800115
  -0.0479121  -0.04851904 -0.04817067 -0.04877529 -0.05232757]
 [-0.04175192 -0.04217034 -0.06618503 -0.06747641 -0.06726843 -0.06846526
   0.93336457 -0.06691974 -0.06638574 -0.06685556 -0.0661803  -0.06800115
  -0.0479121  -0.04851904 -0.04817067 -0.04877529 -0.05232757]]
Saving Weight
Epoch: 7501	Loss: 3.19845411777	Example Output: 7-	Example Reward:  1
[[ 0.04172946  0.0421312   0.06616531  0.06748337  0.06729253  0.06842585
   0.06667578  0.0669627   0.06642052  0.06686732  0.06620374  0.0680055
   0.04790697  0.04851623  0.04815935  0.04874846  0.052

Epoch: 7514	Loss: 2.65991287231	Example Output: 54	Example Reward:  1
[[ 0.04176404  0.04222254  0.06602156  0.06735524  0.06726725  0.068448
   0.06663903  0.06709497  0.06632456  0.06679843  0.06626274  0.06794777
   0.04796475  0.04858571  0.04830662  0.04871162  0.05228516]]
2.80674
[[-0.04176404 -0.04222254 -0.06602156 -0.06735524 -0.06726725 -0.068448
  -0.06663903  0.93290502 -0.06632456 -0.06679843 -0.06626274 -0.06794777
  -0.04796475 -0.04858571 -0.04830662 -0.04871162 -0.05228516]
 [-0.04176404 -0.04222254 -0.06602156 -0.06735524 -0.06726725 -0.068448
   0.93336099 -0.06709497 -0.06632456 -0.06679843 -0.06626274 -0.06794777
  -0.04796475 -0.04858571 -0.04830662 -0.04871162 -0.05228516]]
Epoch: 7515	Loss: 3.0444876194	Example Output: Y7	Example Reward:  -0.3
[[ 0.04174818  0.04219973  0.06601928  0.06733648  0.06727086  0.06843086
   0.06666096  0.06710686  0.06632376  0.0668435   0.0662755   0.06799438
   0.04795758  0.04858162  0.04827608  0.04870103  0.05227336]]
4.09845
[

Epoch: 7528	Loss: 2.78423397541	Example Output: 59	Example Reward:  1
[[ 0.04183072  0.04227262  0.06604833  0.067504    0.06691025  0.06855037
   0.06652147  0.06689285  0.06639948  0.06672014  0.0663002   0.06813481
   0.04788904  0.04852095  0.04840997  0.0487635   0.0523313 ]]
2.80584
[[-0.04183072 -0.04227262 -0.06604833 -0.067504   -0.06691025 -0.06855037
  -0.06652147  0.93310714 -0.06639948 -0.06672014 -0.0663002  -0.06813481
  -0.04788904 -0.04852095 -0.04840997 -0.0487635  -0.0523313 ]
 [-0.04183072 -0.04227262 -0.06604833 -0.067504   -0.06691025 -0.06855037
  -0.06652147 -0.06689285 -0.06639948 -0.06672014 -0.0663002   0.93186522
  -0.04788904 -0.04852095 -0.04840997 -0.0487635  -0.0523313 ]]
Epoch: 7529	Loss: 2.50505385399	Example Output: 83	Example Reward:  1
2.80598
[[-0.04182496 -0.04225408 -0.06603329 -0.06749185 -0.06693508 -0.0685285
  -0.0665659  -0.06689709 -0.06640502 -0.06675047  0.93371314 -0.06817818
  -0.04789186 -0.04850601 -0.04838473 -0.04874244 -0.0523237 ]

Epoch: 7540	Loss: 2.78583962917	Example Output: 59	Example Reward:  1
[[ 0.04177563  0.04204908  0.06585504  0.067629    0.0670307   0.06832056
   0.06668541  0.06719845  0.06655346  0.06660722  0.06649964  0.06824742
   0.04782784  0.04846674  0.04835416  0.04865229  0.05224728]]
2.80531
[[-0.04177563 -0.04204908 -0.06585504 -0.067629   -0.0670307  -0.06832056
  -0.06668541  0.93280154 -0.06655346 -0.06660722 -0.06649964 -0.06824742
  -0.04782784 -0.04846674 -0.04835416 -0.04865229 -0.05224728]
 [-0.04177563 -0.04204908 -0.06585504 -0.067629   -0.0670307  -0.06832056
  -0.06668541 -0.06719845 -0.06655346 -0.06660722 -0.06649964  0.93175256
  -0.04782784 -0.04846674 -0.04835416 -0.04865229 -0.05224728]]
Saving Weight
Epoch: 7541	Loss: 2.6590284586	Example Output: 66	Example Reward:  1
[[ 0.04175382  0.04200918  0.06582864  0.06763618  0.06706174  0.06831346
   0.06670938  0.06726421  0.06654743  0.06662595  0.06651635  0.06827568
   0.04780754  0.04846485  0.04832281  0.04862715  0.052

Epoch: 7552	Loss: 2.63575737476	Example Output: 29	Example Reward:  1
[[ 0.04172196  0.04196996  0.06569942  0.06772447  0.06713866  0.06828966
   0.06688838  0.06736082  0.06677331  0.06656389  0.06623339  0.06816661
   0.0478127   0.04852701  0.04833058  0.04856477  0.0522344 ]]
2.80534
[[-0.04172196 -0.04196996 -0.06569942 -0.06772447  0.93286133 -0.06828966
  -0.06688838 -0.06736082 -0.06677331 -0.06656389 -0.06623339 -0.06816661
  -0.0478127  -0.04852701 -0.04833058 -0.04856477 -0.0522344 ]
 [-0.04172196 -0.04196996 -0.06569942 -0.06772447 -0.06713866 -0.06828966
  -0.06688838 -0.06736082 -0.06677331 -0.06656389 -0.06623339  0.93183339
  -0.0478127  -0.04852701 -0.04833058 -0.04856477 -0.0522344 ]]
Epoch: 7553	Loss: 2.50609540939	Example Output: 19	Example Reward:  1
[[ 0.04171053  0.04198791  0.06569883  0.06769767  0.06714094  0.06829668
   0.06689005  0.06736226  0.06674831  0.06655797  0.06621286  0.06816899
   0.04784596  0.0485627   0.04832825  0.04855289  0.05223722]]
2.804

Epoch: 7564	Loss: 3.19571275711	Example Output: 78	Example Reward:  1
[[ 0.04177625  0.04205514  0.06572934  0.06769232  0.06723707  0.06806752
   0.06680121  0.06727855  0.06668606  0.06649283  0.06625284  0.06811453
   0.04791914  0.0486557   0.04832995  0.04861718  0.05229442]]
2.8074
[[-0.04177625 -0.04205514 -0.06572934 -0.06769232 -0.06723707 -0.06806752
  -0.06680121 -0.06727855 -0.06668606  0.9335072  -0.06625284 -0.06811453
  -0.04791914 -0.0486557  -0.04832995 -0.04861718 -0.05229442]
 [-0.04177625 -0.04205514 -0.06572934 -0.06769232 -0.06723707 -0.06806752
  -0.06680121 -0.06727855 -0.06668606 -0.06649283  0.93374717 -0.06811453
  -0.04791914 -0.0486557  -0.04832995 -0.04861718 -0.05229442]]
Epoch: 7565	Loss: 3.32180430889	Example Output: 13	Example Reward:  1
[[ 0.04176061  0.04204531  0.0657419   0.0676899   0.06724782  0.06807745
   0.06679781  0.06728175  0.06664179  0.0664737   0.06635901  0.06812533
   0.04790968  0.04865635  0.04831501  0.0486034   0.05227312]]
2.8051

Epoch: 7578	Loss: 3.0648368597	Example Output: 29	Example Reward:  1
[[ 0.0417152   0.0419967   0.06591884  0.0678027   0.06740374  0.06848947
   0.06668805  0.06722338  0.06669299  0.06633489  0.06645153  0.06794809
   0.04776069  0.04847585  0.04845483  0.04851639  0.05212666]]
2.80528
[[-0.0417152  -0.0419967  -0.06591884 -0.0678027   0.93259627 -0.06848947
  -0.06668805 -0.06722338 -0.06669299 -0.06633489 -0.06645153 -0.06794809
  -0.04776069 -0.04847585 -0.04845483 -0.04851639 -0.05212666]
 [-0.0417152  -0.0419967  -0.06591884 -0.0678027  -0.06740374 -0.06848947
  -0.06668805 -0.06722338 -0.06669299 -0.06633489 -0.06645153  0.9320519
  -0.04776069 -0.04847585 -0.04845483 -0.04851639 -0.05212666]]
Epoch: 7579	Loss: 2.93700606823	Example Output: 97	Example Reward:  1
[[ 0.04167655  0.04193942  0.06592221  0.06783167  0.06747829  0.06849132
   0.06672025  0.06724457  0.06669589  0.06634802  0.06653645  0.06797206
   0.04772003  0.04843803  0.04842491  0.0484729   0.05208748]]
2.80595

Epoch: 7590	Loss: 2.76508374214	Example Output: +4	Example Reward:  -0.3
[[ 0.0417405   0.04193533  0.06588799  0.06779484  0.06736723  0.06876846
   0.06661619  0.06717434  0.06669781  0.06629631  0.0665649   0.06825183
   0.04760424  0.04843967  0.04840855  0.04836784  0.052084  ]]
4.10002
[[ 0.28747788  0.28741941  0.28023362  0.27966157  0.27978987  0.27936947
   0.28001517  0.27984771  0.27999067  0.2801111   0.28003055  0.27952445
  -0.01428127  0.2854681   0.28547743  0.28548965  0.2843748 ]
 [ 0.28747788  0.28741941  0.28023362  0.27966157  0.27978987  0.27936947
  -0.01998486  0.27984771  0.27999067  0.2801111   0.28003055  0.27952445
   0.28571874  0.2854681   0.28547743  0.28548965  0.2843748 ]]
Saving Weight
Epoch: 7591	Loss: 2.52858734131	Example Output: 4/	Example Reward:  1
[[ 0.04174127  0.04193982  0.06589811  0.06783709  0.06733821  0.06882459
   0.06658781  0.06717116  0.06670891  0.06627638  0.06656745  0.06823011
   0.04758966  0.04842947  0.04841154  0.04837453  0

Epoch: 7604	Loss: 3.3284072876	Example Output: 4Y	Example Reward:  -0.3
[[ 0.04183439  0.04211168  0.0657564   0.06791176  0.06708878  0.06881025
   0.06638785  0.0673103   0.06672771  0.06622189  0.06632278  0.06814273
   0.04766006  0.0485032   0.04848173  0.04857026  0.05215822]]
4.09824
[[ 0.28744969  0.28736651  0.28027311  0.27962649  0.27987337  0.27935696
  -0.01991636  0.27980691  0.2799817   0.28013346  0.28010318  0.2795572
   0.28570199  0.28544906  0.2854555   0.28542894  0.28435254]
 [ 0.28744969 -0.0126335   0.28027311  0.27962649  0.27987337  0.27935696
   0.28008366  0.27980691  0.2799817   0.28013346  0.28010318  0.2795572
   0.28570199  0.28544906  0.2854555   0.28542894  0.28435254]]
Epoch: 7605	Loss: 3.07297971249	Example Output: /3	Example Reward:  -0.3
[[ 0.04185107  0.04213143  0.06574327  0.06795939  0.06706254  0.06879099
   0.06634638  0.06729434  0.06673569  0.06621261  0.06629809  0.06811493
   0.0476952   0.04849324  0.04850152  0.04862186  0.05214749]]
4.

Epoch: 7618	Loss: 2.63579537868	Example Output: /2	Example Reward:  -0.3
[[ 0.04203498  0.04222662  0.0656242   0.06765643  0.06679057  0.06871144
   0.06624508  0.0673876   0.06677443  0.06616225  0.06609553  0.06809144
   0.04790379  0.04867931  0.04866428  0.04872973  0.05222233]]
4.1007
[[ 0.28738952  0.28733203  0.28031275  0.27970308  0.27996284  0.27938658
   0.28012648  0.27978373  0.2799677   0.28015134  0.28017136  0.27957258
   0.28562889  0.28539622  0.28540072 -0.01461892  0.28433332]
 [ 0.28738952  0.28733203  0.28031275  0.27970308 -0.02003717  0.27938658
   0.28012648  0.27978373  0.2799677   0.28015134  0.28017136  0.27957258
   0.28562889  0.28539622  0.28540072  0.28538111  0.28433332]]
Epoch: 7619	Loss: 3.32840325832	Example Output: 2X	Example Reward:  -0.3
[[ 0.04202719  0.04224486  0.06567219  0.06760707  0.06676583  0.0687421
   0.06624273  0.06736224  0.06674402  0.066182    0.0661016   0.06805501
   0.04793014  0.04867126  0.0486882   0.04874933  0.05221421]]
4

Epoch: 7630	Loss: 2.78613591194	Example Output: *3	Example Reward:  -0.3
[[ 0.04192774  0.04224681  0.06587674  0.06777565  0.0666794   0.06877099
   0.06640544  0.06736478  0.06680294  0.06625443  0.06597879  0.06792622
   0.04790185  0.04857476  0.04862683  0.04872161  0.05216505]]
4.10106
[[ 0.28742167  0.28732598  0.28023699  0.27966732  0.27999619  0.2793687
   0.28007838  0.27979058  0.27995914  0.28012368  0.28020638  0.27962214
   0.28562945  0.2854276  -0.01458805  0.28538352  0.28435051]
 [ 0.28742167  0.28732598  0.28023699  0.27966732  0.27999619 -0.0206313
   0.28007838  0.27979058  0.27995914  0.28012368  0.28020638  0.27962214
   0.28562945  0.2854276   0.28541195  0.28538352  0.28435051]]
Saving Weight
Epoch: 7631	Loss: 3.05020387173	Example Output: 9Y	Example Reward:  -0.3
[[ 0.04191656  0.04226288  0.06590794  0.06778628  0.06666712  0.06877542
   0.06638635  0.06739216  0.06678119  0.06622878  0.06599996  0.0679018
   0.04793025  0.04856683  0.04861826  0.04874044  0

Epoch: 7644	Loss: 3.19901475906	Example Output: 72	Example Reward:  1
[[ 0.04209792  0.04237005  0.06601184  0.06756517  0.06651706  0.06886668
   0.06629138  0.06754105  0.06657042  0.06608704  0.06594399  0.06774759
   0.04816536  0.04861222  0.04877099  0.04876421  0.05207705]]
2.80794
[[-0.04209792 -0.04237005 -0.06601184 -0.06756517 -0.06651706 -0.06886668
  -0.06629138 -0.06754105 -0.06657042  0.93391293 -0.06594399 -0.06774759
  -0.04816536 -0.04861222 -0.04877099 -0.04876421 -0.05207705]
 [-0.04209792 -0.04237005 -0.06601184 -0.06756517  0.93348294 -0.06886668
  -0.06629138 -0.06754105 -0.06657042 -0.06608704 -0.06594399 -0.06774759
  -0.04816536 -0.04861222 -0.04877099 -0.04876421 -0.05207705]]
Epoch: 7645	Loss: 3.4537866354	Example Output: 32	Example Reward:  1
[[ 0.04210364  0.04236776  0.06601223  0.06755428  0.06651493  0.06886237
   0.06626609  0.06759697  0.06654935  0.06606837  0.06593825  0.06772349
   0.04820292  0.04862528  0.04879087  0.04875783  0.05206541]]
2.8059

Epoch: 7658	Loss: 2.78735389709	Example Output: 67	Example Reward:  1
[[ 0.0420028   0.04217365  0.06602421  0.06760313  0.06658775  0.06900316
   0.06652348  0.06754936  0.06666199  0.06613419  0.0658408   0.0678889
   0.04811855  0.04853211  0.04866346  0.04860884  0.05208366]]
2.80756
[[-0.0420028  -0.04217365 -0.06602421 -0.06760313 -0.06658775 -0.06900316
  -0.06652348 -0.06754936  0.93333799 -0.06613419 -0.0658408  -0.0678889
  -0.04811855 -0.04853211 -0.04866346 -0.04860884 -0.05208366]
 [-0.0420028  -0.04217365 -0.06602421 -0.06760313 -0.06658775 -0.06900316
  -0.06652348 -0.06754936 -0.06666199  0.93386579 -0.0658408  -0.0678889
  -0.04811855 -0.04853211 -0.04866346 -0.04860884 -0.05208366]]
Epoch: 7659	Loss: 3.06833956242	Example Output: 49	Example Reward:  1
[[ 0.04199998  0.04214186  0.06598387  0.06762562  0.06660413  0.06896983
   0.06653987  0.067562    0.06679213  0.06615352  0.06576729  0.06787211
   0.0480895   0.04851631  0.0486494   0.04862963  0.05210288]]
2.80633


Epoch: 7670	Loss: 3.0418810606	Example Output: 99	Example Reward:  1
2.80502
[[-0.04202748 -0.04201104 -0.06567609 -0.06768849 -0.06654664 -0.06902268
  -0.0666667  -0.06742979 -0.06702509 -0.06615283 -0.06551782  0.93192184
  -0.0480014  -0.04866826 -0.04858852 -0.04857204 -0.05232697]
 [-0.04202748 -0.04201104 -0.06567609 -0.06768849 -0.06654664 -0.06902268
  -0.0666667  -0.06742979 -0.06702509 -0.06615283 -0.06551782  0.93192184
  -0.0480014  -0.04866826 -0.04858852 -0.04857204 -0.05232697]]
Saving Weight
Epoch: 7671	Loss: 3.4561445713	Example Output: +3	Example Reward:  -0.3
[[ 0.04203672  0.04200774  0.06567556  0.06768678  0.06653695  0.06903167
   0.06665884  0.06741849  0.06701815  0.06615432  0.06554534  0.0681766
   0.04798286  0.04864245  0.04856326  0.04855349  0.05231077]]
4.10089
[[ 0.28738901  0.28739768  0.28029734  0.27969396  0.28003892  0.27929053
   0.28000236  0.27977446  0.27989456  0.28015372  0.28033641  0.27954704
  -0.01439486  0.28540727  0.28543103  0.285433

Epoch: 7684	Loss: 3.19301128387	Example Output: 91	Example Reward:  1
[[ 0.04212279  0.0422259   0.0658317   0.06764008  0.06637744  0.06905384
   0.06654966  0.06722644  0.06705476  0.06618491  0.06552466  0.06811252
   0.04797975  0.04859392  0.04864134  0.04860711  0.05227316]]
2.80543
[[-0.04212279 -0.0422259  -0.0658317  -0.06764008 -0.06637744 -0.06905384
  -0.06654966 -0.06722644 -0.06705476 -0.06618491 -0.06552466  0.93188751
  -0.04797975 -0.04859392 -0.04864134 -0.04860711 -0.05227316]
 [-0.04212279 -0.0422259  -0.0658317   0.93235993 -0.06637744 -0.06905384
  -0.06654966 -0.06722644 -0.06705476 -0.06618491 -0.06552466 -0.06811252
  -0.04797975 -0.04859392 -0.04864134 -0.04860711 -0.05227316]]
Epoch: 7685	Loss: 2.65510327816	Example Output: 73	Example Reward:  1
[[ 0.04210099  0.04221077  0.06587638  0.06769875  0.06636221  0.06912807
   0.06654001  0.06724139  0.06706513  0.06621734  0.06551795  0.06811211
   0.04794906  0.04855338  0.04861071  0.04858272  0.05223303]]
2.805

Epoch: 7698	Loss: 3.45393497944	Example Output: -8	Example Reward:  -0.3
[[ 0.04215217  0.04218776  0.06585875  0.06773556  0.06615856  0.06955167
   0.0663637   0.06731556  0.06679606  0.0662073   0.06569126  0.06819832
   0.04802841  0.04850725  0.04854787  0.04856623  0.05213358]]
4.10032
[[ 0.28735435  0.28734368  0.28024238  0.27967936  0.28015244  0.27913451
   0.2800909   0.27980533  0.2799612   0.28013784  0.28029263  0.27954051
   0.28559148 -0.01455218  0.28543565  0.28543013  0.28435993]
 [ 0.28735435  0.28734368  0.28024238  0.27967936  0.28015244  0.27913451
   0.2800909   0.27980533  0.2799612   0.28013784 -0.01970738  0.27954051
   0.28559148  0.28544784  0.28543565  0.28543013  0.28435993]]
Epoch: 7699	Loss: 3.19720749855	Example Output: 68	Example Reward:  1
[[ 0.04215793  0.04220709  0.06582627  0.06772788  0.06613212  0.06956231
   0.06634892  0.067315    0.06680785  0.06623278  0.06565004  0.06818742
   0.04804445  0.04850682  0.04855822  0.0485899   0.05214499]]
2.

Epoch: 7711	Loss: 3.07054216862	Example Output: 89	Example Reward:  1
[[ 0.04213146  0.0421073   0.06598285  0.06790923  0.06605931  0.06944406
   0.06650957  0.06730364  0.06677639  0.0660399   0.06596814  0.06822373
   0.04803205  0.04849829  0.04852658  0.0484244   0.05206317]]
2.8064
[[-0.04213146 -0.0421073  -0.06598285 -0.06790923 -0.06605931 -0.06944406
  -0.06650957 -0.06730364 -0.06677639 -0.0660399   0.93403184 -0.06822373
  -0.04803205 -0.04849829 -0.04852658 -0.0484244  -0.05206317]
 [-0.04213146 -0.0421073  -0.06598285 -0.06790923 -0.06605931 -0.06944406
  -0.06650957 -0.06730364 -0.06677639 -0.0660399  -0.06596814  0.93177629
  -0.04803205 -0.04849829 -0.04852658 -0.0484244  -0.05206317]]
Epoch: 7712	Loss: 3.19757435322	Example Output: +2	Example Reward:  -0.3
[[ 0.04212441  0.04211906  0.06601104  0.06790917  0.06604884  0.06944524
   0.06651407  0.06726932  0.06678326  0.06602313  0.06600603  0.06824324
   0.04803364  0.04847535  0.04853131  0.04842389  0.05203903]]
4.1

Epoch: 7725	Loss: 3.06765182018	Example Output: 32	Example Reward:  1
[[ 0.0421317   0.0420634   0.06593897  0.06786864  0.06599552  0.06973912
   0.06656934  0.06720245  0.06654364  0.06583861  0.06638609  0.06850178
   0.04798509  0.04842259  0.04852561  0.04832984  0.05195767]]
2.80516
[[-0.0421317  -0.0420634  -0.06593897 -0.06786864 -0.06599552  0.9302609
  -0.06656934 -0.06720245 -0.06654364 -0.06583861 -0.06638609 -0.06850178
  -0.04798509 -0.04842259 -0.04852561 -0.04832984 -0.05195767]
 [-0.0421317  -0.0420634  -0.06593897 -0.06786864  0.93400449 -0.06973912
  -0.06656934 -0.06720245 -0.06654364 -0.06583861 -0.06638609 -0.06850178
  -0.04798509 -0.04842259 -0.04852561 -0.04832984 -0.05195767]]
Epoch: 7726	Loss: 3.58239939213	Example Output: //	Example Reward:  -0.3
[[ 0.04213496  0.04207231  0.06598786  0.06782161  0.065988    0.06983821
   0.06652975  0.06716408  0.06649281  0.06584461  0.0664302   0.0684944
   0.04797197  0.04839677  0.04855944  0.0483418   0.05193124]]
4.09

Epoch: 7737	Loss: 3.32444329262	Example Output: 72	Example Reward:  1
[[ 0.0421055   0.04202124  0.06599861  0.06771206  0.06603292  0.06986757
   0.06640796  0.06734295  0.06633444  0.06586233  0.06654823  0.06863505
   0.04803906  0.04838632  0.04851651  0.04828506  0.05190428]]
2.80793
[[-0.0421055  -0.04202124 -0.06599861 -0.06771206 -0.06603292 -0.06986757
  -0.06640796 -0.06734295 -0.06633444  0.9341377  -0.06654823 -0.06863505
  -0.04803906 -0.04838632 -0.04851651 -0.04828506 -0.05190428]
 [-0.0421055  -0.04202124 -0.06599861 -0.06771206  0.93396711 -0.06986757
  -0.06640796 -0.06734295 -0.06633444 -0.06586233 -0.06654823 -0.06863505
  -0.04803906 -0.04838632 -0.04851651 -0.04828506 -0.05190428]]
Epoch: 7738	Loss: 2.91455495358	Example Output: 1X	Example Reward:  -0.3
[[ 0.04209996  0.04201738  0.06598908  0.06773137  0.06601901  0.06991831
   0.0664043   0.06730714  0.06632783  0.06587688  0.06657828  0.0686347
   0.04801895  0.04836956  0.04852473  0.04828093  0.05190156]]
4.0

Epoch: 7749	Loss: 3.30184948444	Example Output: 0X	Example Reward:  -0.3
[[ 0.0420037   0.04200609  0.06614812  0.06764187  0.06609233  0.07010593
   0.06634884  0.0672837   0.06639894  0.06586239  0.06655468  0.06881271
   0.0480183   0.04824974  0.04845034  0.04822945  0.05179291]]
4.09805
[[ 0.2873989   0.28739819 -0.01984444  0.27970746  0.28017232  0.27896824
   0.28009537  0.2798149   0.28008035  0.28024128  0.28003362  0.27935618
   0.28559452  0.28552508  0.28546491  0.28553116  0.28446212]
 [-0.01260111  0.28739819  0.28015557  0.27970746  0.28017232  0.27896824
   0.28009537  0.2798149   0.28008035  0.28024128  0.28003362  0.27935618
   0.28559452  0.28552508  0.28546491  0.28553116  0.28446212]]
Epoch: 7750	Loss: 2.78835022449	Example Output: 90	Example Reward:  1
[[ 0.04200424  0.04202347  0.06613401  0.06765189  0.06607058  0.07006405
   0.06634929  0.06729944  0.06638619  0.06583956  0.0665638   0.06883909
   0.04804181  0.04827138  0.04843682  0.04823329  0.05179116]]
2.

Epoch: 7761	Loss: 3.19585032463	Example Output: 3*	Example Reward:  1
[[ 0.04183139  0.04178357  0.0662239   0.06766643  0.06624492  0.07016951
   0.06653672  0.06734807  0.06666566  0.06609423  0.06655653  0.06909491
   0.04781145  0.04806856  0.04820167  0.04804817  0.0516544 ]]
2.81989
[[-0.04183139 -0.04178357 -0.0662239  -0.06766643 -0.06624492  0.92983049
  -0.06653672 -0.06734807 -0.06666566 -0.06609423 -0.06655653 -0.06909491
  -0.04781145 -0.04806856 -0.04820167 -0.04804817 -0.0516544 ]
 [-0.04183139 -0.04178357 -0.0662239  -0.06766643 -0.06624492 -0.07016951
  -0.06653672 -0.06734807 -0.06666566 -0.06609423 -0.06655653 -0.06909491
  -0.04781145 -0.04806856  0.95179832 -0.04804817 -0.0516544 ]]
Epoch: 7762	Loss: 3.04599268436	Example Output: 2-	Example Reward:  1
[[ 0.04183301  0.04178188  0.06624764  0.06766368  0.06622864  0.07019871
   0.06650817  0.06735318  0.06669544  0.06608897  0.06654567  0.06908302
   0.0477982   0.0480525   0.04824277  0.04804664  0.05163196]]
2.822

Epoch: 7776	Loss: 2.50433475971	Example Output: -6	Example Reward:  -0.3
[[ 0.0417621   0.04166617  0.06628132  0.06759231  0.06642505  0.06976932
   0.0665174   0.06747145  0.06696848  0.06614221  0.0665185   0.06910969
   0.04770999  0.04806456  0.04817695  0.04821099  0.05161342]]
4.10002
[[ 0.28747138  0.28750017  0.2801156   0.2797223   0.28007251  0.27906922
   0.28004479  0.27975857  0.27990946  0.28015736  0.28004447  0.2792671
   0.285687   -0.01441937  0.28554693  0.28553671  0.28451598]
 [ 0.28747138  0.28750017  0.2801156   0.2797223   0.28007251  0.27906922
   0.28004479  0.27975857 -0.02009054  0.28015736  0.28004447  0.2792671
   0.285687    0.28558064  0.28554693  0.28553671  0.28451598]]
Epoch: 7777	Loss: 3.0637566328	Example Output: 44	Example Reward:  1
[[ 0.04175409  0.04167016  0.06630555  0.06755438  0.06643812  0.06976779
   0.06654888  0.06743485  0.06693318  0.06616975  0.0665554   0.0691601
   0.04768291  0.04804763  0.04814975  0.04820435  0.0516231 ]]
2.8063

Epoch: 7790	Loss: 3.06726338863	Example Output: 79	Example Reward:  1
[[ 0.04177591  0.04171833  0.0660986   0.06766614  0.06619468  0.06968167
   0.06660012  0.06728741  0.06708021  0.06626053  0.06635411  0.06914789
   0.04771466  0.04811798  0.04823966  0.04832897  0.05173312]]
2.80478
[[-0.04177591 -0.04171833 -0.0660986  -0.06766614 -0.06619468 -0.06968167
  -0.06660012 -0.06728741 -0.06708021  0.93373948 -0.06635411 -0.06914789
  -0.04771466 -0.04811798 -0.04823966 -0.04832897 -0.05173312]
 [-0.04177591 -0.04171833 -0.0660986  -0.06766614 -0.06619468 -0.06968167
  -0.06660012 -0.06728741 -0.06708021 -0.06626053 -0.06635411  0.93085212
  -0.04771466 -0.04811798 -0.04823966 -0.04832897 -0.05173312]]
Saving Weight
Epoch: 7791	Loss: 2.65693256855	Example Output: 4/	Example Reward:  1
[[ 0.04175741  0.04168215  0.06608637  0.0676786   0.06621476  0.06972013
   0.06662808  0.06729572  0.06714448  0.06628098  0.0663055   0.0691575
   0.04768262  0.04809627  0.04821804  0.04830369  0.051

Epoch: 7804	Loss: 2.91352739334	Example Output: 06	Example Reward:  1
[[ 0.0416503   0.04166264  0.06631521  0.06751842  0.06628023  0.0701372
   0.06647456  0.06751586  0.06712827  0.06614038  0.0662873   0.06897261
   0.04771029  0.04796055  0.04824143  0.04837909  0.05162567]]
2.80607
[[-0.0416503  -0.04166264  0.93368477 -0.06751842 -0.06628023 -0.0701372
  -0.06647456 -0.06751586 -0.06712827 -0.06614038 -0.0662873  -0.06897261
  -0.04771029 -0.04796055 -0.04824143 -0.04837909 -0.05162567]
 [-0.0416503  -0.04166264 -0.06631521 -0.06751842 -0.06628023 -0.0701372
  -0.06647456 -0.06751586  0.9328717  -0.06614038 -0.0662873  -0.06897261
  -0.04771029 -0.04796055 -0.04824143 -0.04837909 -0.05162567]]
Epoch: 7805	Loss: 2.63158340454	Example Output: 91	Example Reward:  1
[[ 0.04164325  0.04165583  0.06633816  0.06749484  0.066286    0.07015494
   0.06646246  0.067534    0.06713344  0.06616787  0.06627405  0.06896832
   0.04770324  0.04795387  0.04823609  0.04837747  0.05161617]]
2.80382


Epoch: 7816	Loss: 3.20224032402	Example Output: *0	Example Reward:  -0.3
[[ 0.04161983  0.04156452  0.06633209  0.06768931  0.06621525  0.07006063
   0.06652094  0.06773411  0.06714357  0.06615604  0.06630772  0.06906485
   0.04768923  0.0479353   0.04810552  0.04834945  0.05151165]]
4.09981
[[ 0.28751406  0.28753066  0.28010038  0.27969322  0.28013542  0.27898183
   0.28004372  0.27967978  0.27985695  0.28015321  0.28010771  0.27928054
   0.28569323  0.28561941 -0.01443166  0.28549519  0.28454652]
 [ 0.28751406  0.28753066 -0.01989963  0.27969322  0.28013542  0.27898183
   0.28004372  0.27967978  0.27985695  0.28015321  0.28010771  0.27928054
   0.28569323  0.28561941  0.28556836  0.28549519  0.28454652]]
Epoch: 7817	Loss: 2.91422476768	Example Output: 05	Example Reward:  1
[[ 0.04161845  0.04156874  0.06630592  0.06767764  0.06621497  0.07005637
   0.06651992  0.06775782  0.06714927  0.06614181  0.06628194  0.06907441
   0.04769664  0.04793385  0.04811949  0.0483533   0.05152955]]
2.

Epoch: 7828	Loss: 3.19302003384	Example Output: 96	Example Reward:  1
[[ 0.04167536  0.04158576  0.06624835  0.06759278  0.06608958  0.06993375
   0.06648167  0.06790256  0.06720224  0.06611858  0.06619288  0.06895883
   0.04773911  0.04798302  0.04831301  0.0484155   0.05156697]]
2.80407
[[-0.04167536 -0.04158576 -0.06624835 -0.06759278 -0.06608958 -0.06993375
  -0.06648167 -0.06790256 -0.06720224 -0.06611858 -0.06619288  0.93104118
  -0.04773911 -0.04798302 -0.04831301 -0.0484155  -0.05156697]
 [-0.04167536 -0.04158576 -0.06624835 -0.06759278 -0.06608958 -0.06993375
  -0.06648167 -0.06790256  0.93279779 -0.06611858 -0.06619288 -0.06895883
  -0.04773911 -0.04798302 -0.04831301 -0.0484155  -0.05156697]]
Epoch: 7829	Loss: 3.4544147253	Example Output: 99	Example Reward:  1
[[ 0.04168148  0.04158076  0.06623325  0.06756511  0.06610534  0.06988975
   0.06648166  0.06787914  0.0672064   0.06611946  0.0662187   0.06900018
   0.04774109  0.04798205  0.04831855  0.04841693  0.05158014]]
2.8027

Epoch: 7840	Loss: 2.50462827682	Example Output: 02	Example Reward:  1
[[ 0.04153928  0.04155175  0.0663584   0.06750934  0.06612821  0.06972091
   0.06673272  0.06783176  0.06716286  0.06625357  0.06645042  0.06908311
   0.0477344   0.04795316  0.04819097  0.04828354  0.05151561]]
2.80664
[[-0.04153928 -0.04155175  0.93364161 -0.06750934 -0.06612821 -0.06972091
  -0.06673272 -0.06783176 -0.06716286 -0.06625357 -0.06645042 -0.06908311
  -0.0477344  -0.04795316 -0.04819097 -0.04828354 -0.05151561]
 [-0.04153928 -0.04155175 -0.0663584  -0.06750934  0.93387181 -0.06972091
  -0.06673272 -0.06783176 -0.06716286 -0.06625357 -0.06645042 -0.06908311
  -0.0477344  -0.04795316 -0.04819097 -0.04828354 -0.05151561]]
Saving Weight
Epoch: 7841	Loss: 2.52636203766	Example Output: 29	Example Reward:  1
[[ 0.04149543  0.04149957  0.066388    0.06755431  0.06616067  0.06968479
   0.06677171  0.06786419  0.06719424  0.06624069  0.06653557  0.06909764
   0.04770286  0.04792618  0.04814951  0.04826251  0.05

Epoch: 7854	Loss: 2.78527123928	Example Output: 82	Example Reward:  1
[[ 0.04145763  0.04123873  0.06618156  0.0674369   0.06635325  0.06966226
   0.06694567  0.06840187  0.06715851  0.06610059  0.06674308  0.06911275
   0.04766711  0.04793093  0.0480758   0.04808246  0.05145105]]
2.80587
[[-0.04145763 -0.04123873 -0.06618156 -0.0674369  -0.06635325 -0.06966226
  -0.06694567 -0.06840187 -0.06715851 -0.06610059  0.93325692 -0.06911275
  -0.04766711 -0.04793093 -0.0480758  -0.04808246 -0.05145105]
 [-0.04145763 -0.04123873 -0.06618156 -0.0674369   0.93364674 -0.06966226
  -0.06694567 -0.06840187 -0.06715851 -0.06610059 -0.06674308 -0.06911275
  -0.04766711 -0.04793093 -0.0480758  -0.04808246 -0.05145105]]
Epoch: 7855	Loss: 2.52840163708	Example Output: 26	Example Reward:  1
[[ 0.04143438  0.04119645  0.06618873  0.06741726  0.06640884  0.06965122
   0.06696334  0.06840949  0.06718536  0.06611193  0.06673963  0.06917226
   0.04765167  0.04792409  0.04803929  0.04804175  0.0514644 ]]
2.805

Epoch: 7866	Loss: 2.63310894966	Example Output: 46	Example Reward:  1
[[ 0.04143415  0.0410227   0.06616049  0.06730393  0.06655095  0.06954531
   0.06697707  0.06859419  0.06749987  0.06609737  0.0666257   0.0691779
   0.04757821  0.04789127  0.04797975  0.04800933  0.0515519 ]]
2.80467
[[-0.04143415 -0.0410227  -0.06616049 -0.06730393 -0.06655095 -0.06954531
   0.93302292 -0.06859419 -0.06749987 -0.06609737 -0.0666257  -0.0691779
  -0.04757821 -0.04789127 -0.04797975 -0.04800933 -0.0515519 ]
 [-0.04143415 -0.0410227  -0.06616049 -0.06730393 -0.06655095 -0.06954531
  -0.06697707 -0.06859419  0.93250012 -0.06609737 -0.0666257  -0.0691779
  -0.04757821 -0.04789127 -0.04797975 -0.04800933 -0.0515519 ]]
Epoch: 7867	Loss: 3.04162228107	Example Output: 20	Example Reward:  1
[[ 0.04143973  0.04102947  0.06613531  0.06734454  0.06654101  0.06953233
   0.06699298  0.06858235  0.06752923  0.06610696  0.06658968  0.06915746
   0.04757289  0.04789468  0.04797721  0.04801939  0.05155482]]
2.80602


Epoch: 7878	Loss: 2.91497261524	Example Output: 5/	Example Reward:  1
[[ 0.04140772  0.04100719  0.06635225  0.06740658  0.0667714   0.06951444
   0.06688435  0.06843869  0.06740551  0.06606539  0.06680908  0.06919626
   0.04757228  0.04788079  0.0479166   0.04791159  0.05145997]]
2.82064
[[-0.04140772 -0.04100719 -0.06635225 -0.06740658 -0.0667714  -0.06951444
  -0.06688435  0.93156129 -0.06740551 -0.06606539 -0.06680908 -0.06919626
  -0.04757228 -0.04788079 -0.0479166  -0.04791159 -0.05145997]
 [-0.04140772 -0.04100719 -0.06635225 -0.06740658 -0.0667714  -0.06951444
  -0.06688435 -0.06843869 -0.06740551 -0.06606539 -0.06680908 -0.06919626
  -0.04757228 -0.04788079 -0.0479166   0.95208842 -0.05145997]]
Epoch: 7879	Loss: 3.19419102669	Example Output: 62	Example Reward:  1
[[ 0.04140251  0.04101438  0.06636962  0.06737649  0.06678734  0.06954715
   0.06684221  0.06842817  0.06737178  0.06611139  0.06681992  0.06919997
   0.04755823  0.04785779  0.04792801  0.04793794  0.05144714]]
2.804

Epoch: 7890	Loss: 3.58360819817	Example Output: -0	Example Reward:  -0.3
[[ 0.04146574  0.04101543  0.0662226   0.06716225  0.0667753   0.06951785
   0.06677979  0.06835114  0.06746142  0.06636155  0.06666108  0.0692077
   0.0475123   0.04780101  0.04806265  0.04799385  0.05164839]]
4.09948
[[ 0.28756028  0.28769538  0.28013322  0.27985132  0.27996743  0.27914464
   0.27996609  0.27949467  0.27976158  0.28009155  0.2800017   0.27923772
   0.28574634 -0.0143403   0.28558123  0.28560185  0.28450549]
 [ 0.28756028  0.28769538 -0.01986678  0.27985132  0.27996743  0.27914464
   0.27996609  0.27949467  0.27976158  0.28009155  0.2800017   0.27923772
   0.28574634  0.2856597   0.28558123  0.28560185  0.28450549]]
Saving Weight
Epoch: 7891	Loss: 3.46017451286	Example Output: +/	Example Reward:  -0.3
[[ 0.04148699  0.04105861  0.06616724  0.06711669  0.06676855  0.06949711
   0.06677194  0.06833348  0.06743994  0.0663614   0.06659616  0.0691589
   0.04755261  0.04783555  0.04810719  0.04803998  

Epoch: 7904	Loss: 3.32601749897	Example Output: 95	Example Reward:  1
[[ 0.04160061  0.04121964  0.06605428  0.06719443  0.06651343  0.0694498
   0.06673032  0.06808452  0.06764546  0.06631199  0.06640572  0.06896916
   0.0475369   0.04793742  0.04827678  0.04819561  0.05187389]]
2.80316
[[-0.04160061 -0.04121964 -0.06605428 -0.06719443 -0.06651343 -0.0694498
  -0.06673032 -0.06808452 -0.06764546 -0.06631199 -0.06640572  0.93103087
  -0.0475369  -0.04793742 -0.04827678 -0.04819561 -0.05187389]
 [-0.04160061 -0.04121964 -0.06605428 -0.06719443 -0.06651343 -0.0694498
  -0.06673032  0.93191546 -0.06764546 -0.06631199 -0.06640572 -0.06896916
  -0.0475369  -0.04793742 -0.04827678 -0.04819561 -0.05187389]]
Epoch: 7905	Loss: 3.3259604454	Example Output: X6	Example Reward:  -0.3
[[ 0.04160212  0.04124704  0.06604814  0.06718368  0.06647743  0.06944206
   0.06672677  0.06807431  0.06764279  0.06632682  0.06637865  0.06899002
   0.0475585   0.04793881  0.04827558  0.04821372  0.05187358]]
4.0979

Epoch: 7918	Loss: 3.45183825493	Example Output: Y7	Example Reward:  -0.3
[[ 0.04142144  0.04108257  0.06599342  0.06739233  0.06657834  0.06945095
   0.06694232  0.06811977  0.06765702  0.06637137  0.06660873  0.06915226
   0.04750698  0.04781106  0.04810304  0.04809294  0.05171547]]
4.09727
[[ 0.28757358 -0.01232477  0.28020197  0.2797823   0.28002653  0.27916473
   0.2799173   0.27956408  0.2797029   0.2800886   0.28001741  0.27925435
   0.28574792  0.28565669  0.2855691   0.28557211  0.28448537]
 [ 0.28757358  0.28767523  0.28020197  0.2797823   0.28002653  0.27916473
   0.2799173   0.27956408  0.2797029  -0.01991141  0.28001741  0.27925435
   0.28574792  0.28565669  0.2855691   0.28557211  0.28448537]]
Epoch: 7919	Loss: 3.19864907265	Example Output: 38	Example Reward:  1
[[ 0.04143428  0.04108053  0.06600223  0.06738684  0.06657977  0.06946333
   0.06692959  0.06810967  0.06759978  0.06635197  0.06668419  0.06914533
   0.04750408  0.04782319  0.04811566  0.04808791  0.05170168]]
2.

Epoch: 7930	Loss: 2.91350846291	Example Output: 6	Example Reward:  1
[[ 0.04144438  0.040995    0.06601773  0.06734069  0.066481    0.06946278
   0.06703408  0.06832042  0.06761018  0.06640024  0.06673224  0.06904496
   0.04737928  0.04777803  0.04820577  0.04807438  0.05167889]]
2.81757
[[-0.04144438 -0.040995   -0.06601773 -0.06734069 -0.066481   -0.06946278
  -0.06703408 -0.06832042  0.9323898  -0.06640024 -0.06673224 -0.06904496
  -0.04737928 -0.04777803 -0.04820577 -0.04807438 -0.05167889]
 [-0.04144438 -0.040995   -0.06601773 -0.06734069 -0.066481   -0.06946278
  -0.06703408 -0.06832042 -0.06761018 -0.06640024 -0.06673224 -0.06904496
  -0.04737928 -0.04777803 -0.04820577 -0.04807438  0.9483211 ]]
Saving Weight
Epoch: 7931	Loss: 2.91579492092	Example Output: +5	Example Reward:  -0.3
[[ 0.0414288   0.04099195  0.06601741  0.06733236  0.06646368  0.06946784
   0.06704743  0.06832119  0.06763703  0.06641638  0.06671401  0.06903154
   0.04736925  0.04776977  0.04821873  0.04808335  0.

Epoch: 7942	Loss: 3.19772441387	Example Output: -8	Example Reward:  -0.3
[[ 0.04145021  0.04096236  0.0659475   0.06726762  0.06651182  0.06942748
   0.0670393   0.06845544  0.06783227  0.06655829  0.06638618  0.06892631
   0.0473518   0.04778795  0.04822451  0.0480791   0.05179191]]
4.09953
[[ 0.28756496  0.28771132  0.28021574  0.27981973  0.28004646  0.27917176
   0.27988821  0.27946338  0.27965033  0.28003252  0.28008416  0.27932212
   0.28579447 -0.01433639  0.28553265  0.28557628  0.28446245]
 [ 0.28756496  0.28771132  0.28021574  0.27981973  0.28004646  0.27917176
   0.27988821  0.27946338  0.27965033  0.28003252 -0.01991585  0.27932212
   0.28579447  0.28566363  0.28553265  0.28557628  0.28446245]]
Epoch: 7943	Loss: 3.32347154617	Example Output: 62	Example Reward:  1
[[ 0.04144544  0.04097789  0.06596665  0.06729899  0.06649562  0.06943134
   0.06701235  0.06844693  0.06782419  0.06654261  0.06640778  0.06890913
   0.04735386  0.04778743  0.04822511  0.04808993  0.0517847 ]]
2.

Epoch: 7954	Loss: 2.93746871948	Example Output: 71	Example Reward:  1
[[ 0.04143009  0.04089388  0.06597089  0.06738309  0.06677762  0.06934265
   0.06697002  0.06844198  0.06799066  0.06649415  0.06626786  0.06872564
   0.04734786  0.04776494  0.04824832  0.04810333  0.05184703]]
2.80514
[[-0.04143009 -0.04089388 -0.06597089 -0.06738309 -0.06677762 -0.06934265
  -0.06697002 -0.06844198 -0.06799066  0.93350583 -0.06626786 -0.06872564
  -0.04734786 -0.04776494 -0.04824832 -0.04810333 -0.05184703]
 [-0.04143009 -0.04089388 -0.06597089  0.93261689 -0.06677762 -0.06934265
  -0.06697002 -0.06844198 -0.06799066 -0.06649415 -0.06626786 -0.06872564
  -0.04734786 -0.04776494 -0.04824832 -0.04810333 -0.05184703]]
Epoch: 7955	Loss: 2.35229489803	Example Output: 27	Example Reward:  1
[[ 0.04141063  0.04088799  0.06599442  0.06742017  0.06677073  0.0693192
   0.06696571  0.06844016  0.06799806  0.06651682  0.06628946  0.06871893
   0.0473596   0.04775725  0.04822368  0.04810405  0.0518231 ]]
2.8055

Epoch: 7966	Loss: 3.06489138603	Example Output: 12	Example Reward:  1
[[ 0.04130469  0.04082055  0.06628674  0.06752247  0.06667023  0.06936058
   0.06687842  0.06857134  0.06797559  0.06663492  0.06638761  0.06881949
   0.04734967  0.04758525  0.04804602  0.04812081  0.05166567]]
2.80466
[[-0.04130469 -0.04082055 -0.06628674  0.93247753 -0.06667023 -0.06936058
  -0.06687842 -0.06857134 -0.06797559 -0.06663492 -0.06638761 -0.06881949
  -0.04734967 -0.04758525 -0.04804602 -0.04812081 -0.05166567]
 [-0.04130469 -0.04082055 -0.06628674 -0.06752247  0.93332976 -0.06936058
  -0.06687842 -0.06857134 -0.06797559 -0.06663492 -0.06638761 -0.06881949
  -0.04734967 -0.04758525 -0.04804602 -0.04812081 -0.05166567]]
Epoch: 7967	Loss: 3.32335534096	Example Output: X2	Example Reward:  -0.3
[[ 0.04129335  0.04081762  0.06633241  0.06755078  0.06666813  0.0693531
   0.06687693  0.06855012  0.06802688  0.06663912  0.06636076  0.06883352
   0.04734677  0.04757542  0.04801895  0.04811007  0.05164608]]
4.0

Epoch: 7980	Loss: 2.94313416481	Example Output: 5/	Example Reward:  1
[[ 0.04141487  0.04116396  0.06639466  0.06750347  0.06629602  0.0694534
   0.06652834  0.06831831  0.06792827  0.06674366  0.06612008  0.06863356
   0.04750828  0.04764127  0.04817301  0.04845455  0.05172425]]
2.82045
[[-0.04141487 -0.04116396 -0.06639466 -0.06750347 -0.06629602 -0.0694534
  -0.06652834  0.93168169 -0.06792827 -0.06674366 -0.06612008 -0.06863356
  -0.04750828 -0.04764127 -0.04817301 -0.04845455 -0.05172425]
 [-0.04141487 -0.04116396 -0.06639466 -0.06750347 -0.06629602 -0.0694534
  -0.06652834 -0.06831831 -0.06792827 -0.06674366 -0.06612008 -0.06863356
  -0.04750828 -0.04764127 -0.04817301  0.95154548 -0.05172425]]
Saving Weight
Epoch: 7981	Loss: 2.9112883091	Example Output: 55	Example Reward:  1
[[ 0.0414058   0.04115862  0.06636903  0.06750858  0.06628779  0.06948917
   0.06653002  0.06834102  0.06791883  0.06674635  0.06612396  0.06864778
   0.0475032   0.04763074  0.04816179  0.04846445  0.051712

Epoch: 7994	Loss: 2.93551371098	Example Output: 87	Example Reward:  1
[[ 0.0413634   0.04113632  0.06652963  0.06741885  0.06619097  0.06964266
   0.06634887  0.06833798  0.06768848  0.06671096  0.06637682  0.06896006
   0.04760808  0.04758891  0.0481238   0.04837805  0.05159619]]
2.80581
[[-0.0413634  -0.04113632 -0.06652963 -0.06741885 -0.06619097 -0.06964266
  -0.06634887 -0.06833798 -0.06768848 -0.06671096  0.93362319 -0.06896006
  -0.04760808 -0.04758891 -0.0481238  -0.04837805 -0.05159619]
 [-0.0413634  -0.04113632 -0.06652963 -0.06741885 -0.06619097 -0.06964266
  -0.06634887 -0.06833798 -0.06768848  0.93328905 -0.06637682 -0.06896006
  -0.04760808 -0.04758891 -0.0481238  -0.04837805 -0.05159619]]
Epoch: 7995	Loss: 3.07117311954	Example Output: 2X	Example Reward:  -0.3
[[ 0.04133955  0.04111269  0.06661167  0.06740431  0.06624024  0.06964801
   0.06633607  0.06834758  0.06765351  0.06672131  0.06645463  0.06896464
   0.0476164   0.04756805  0.04809253  0.04834182  0.05154696]]
4.

Epoch: 8008	Loss: 2.78811357021	Example Output: -9	Example Reward:  -0.3
[[ 0.04135339  0.04106621  0.06675866  0.06742661  0.06624536  0.06933539
   0.06650862  0.06837325  0.06771299  0.06667393  0.06647043  0.06891382
   0.04768805  0.04753125  0.04801175  0.04841231  0.05151793]]
4.10001
[[ 0.28759399  0.28768015  0.27997243  0.27977201  0.28012639  0.27919939
   0.28004742  0.27948803  0.27968609  0.27999783  0.28005889  0.27932587
   0.28569359 -0.01425938  0.28559649  0.28547633  0.28454465]
 [ 0.28759399  0.28768015  0.27997243  0.27977201  0.28012639  0.27919939
   0.28004742  0.27948803  0.27968609  0.27999783  0.28005889 -0.02067415
   0.28569359  0.28574064  0.28559649  0.28547633  0.28454465]]
Epoch: 8009	Loss: 2.79197580814	Example Output: 6+	Example Reward:  1
[[ 0.04136058  0.04108054  0.06676812  0.0674029   0.0662102   0.06935011
   0.06650799  0.06836994  0.06769475  0.06666479  0.06646958  0.06888872
   0.04772284  0.04754884  0.04801527  0.0484207   0.05152413]]
2.

Epoch: 8020	Loss: 2.78504960537	Example Output: /2	Example Reward:  -0.3
[[ 0.04133471  0.04096635  0.06648477  0.06723703  0.06636908  0.06949949
   0.06665769  0.0684666   0.06808908  0.06671873  0.0661138   0.06871631
   0.04766154  0.0475673   0.04803742  0.04834319  0.05173689]]
4.09969
[[ 0.28759959  0.2877101   0.2800546   0.27982891  0.28008929  0.27915016
   0.28000271  0.27946004  0.27957329  0.27998438  0.28016585  0.27938512
   0.28570154  0.28572983  0.2855888  -0.01450296  0.28447893]
 [ 0.28759959  0.2877101   0.2800546   0.27982891 -0.01991072  0.27915016
   0.28000271  0.27946004  0.27957329  0.27998438  0.28016585  0.27938512
   0.28570154  0.28572983  0.2855888   0.28549707  0.28447893]]
Saving Weight
Epoch: 8021	Loss: 3.32691984177	Example Output: +1	Example Reward:  -0.3
[[ 0.04134547  0.04095527  0.06647647  0.06722289  0.06639628  0.06948518
   0.06670337  0.06846152  0.06807783  0.06671311  0.06613976  0.06870849
   0.04764981  0.04756396  0.04803089  0.04833186

Epoch: 8034	Loss: 2.50684669018	Example Output: 69	Example Reward:  1
[[ 0.04131927  0.04066499  0.06625815  0.06743024  0.06643823  0.06914017
   0.06702982  0.06872797  0.06831264  0.06656444  0.06628929  0.06884702
   0.04753421  0.04764866  0.04783161  0.04815994  0.05180334]]
2.80246
[[-0.04131927 -0.04066499 -0.06625815 -0.06743024 -0.06643823 -0.06914017
  -0.06702982 -0.06872797  0.93168736 -0.06656444 -0.06628929 -0.06884702
  -0.04753421 -0.04764866 -0.04783161 -0.04815994 -0.05180334]
 [-0.04131927 -0.04066499 -0.06625815 -0.06743024 -0.06643823 -0.06914017
  -0.06702982 -0.06872797 -0.06831264 -0.06656444 -0.06628929  0.931153
  -0.04753421 -0.04764866 -0.04783161 -0.04815994 -0.05180334]]
Epoch: 8035	Loss: 3.32844028473	Example Output: *1	Example Reward:  -0.3
[[ 0.04131458  0.04064479  0.06621107  0.06742197  0.06641866  0.06912785
   0.0670516   0.06876681  0.06832775  0.06655659  0.06626765  0.06889232
   0.04755788  0.04766165  0.04781819  0.04814739  0.05181322]]
4.09

Epoch: 8048	Loss: 3.17227249146	Example Output: 1*	Example Reward:  1
[[ 0.04125525  0.04063344  0.06593113  0.06751389  0.06645262  0.06909234
   0.06710439  0.06888734  0.06862     0.06654277  0.06596396  0.06868866
   0.04762492  0.04769387  0.0479898   0.04815078  0.05185491]]
2.82114
[[-0.04125525 -0.04063344 -0.06593113  0.93248612 -0.06645262 -0.06909234
  -0.06710439 -0.06888734 -0.06862    -0.06654277 -0.06596396 -0.06868866
  -0.04762492 -0.04769387 -0.0479898  -0.04815078 -0.05185491]
 [-0.04125525 -0.04063344 -0.06593113 -0.06751389 -0.06645262 -0.06909234
  -0.06710439 -0.06888734 -0.06862    -0.06654277 -0.06596396 -0.06868866
  -0.04762492 -0.04769387  0.95201021 -0.04815078 -0.05185491]]
Epoch: 8049	Loss: 3.19333329201	Example Output: 91	Example Reward:  1
[[ 0.04125703  0.04064657  0.06592716  0.06758218  0.06640781  0.06907849
   0.06707773  0.06885923  0.06863981  0.06654955  0.06596182  0.0687011
   0.04761272  0.04768024  0.04800357  0.04817146  0.05184349]]
2.8031

Epoch: 8061	Loss: 3.45318591595	Example Output: 8-	Example Reward:  1
[[ 0.04138807  0.04076176  0.06576449  0.06757788  0.06624145  0.06896513
   0.06699994  0.06868134  0.06859787  0.06664341  0.06585068  0.06870458
   0.04765224  0.04782749  0.04801144  0.04828992  0.0520424 ]]
2.82281
[[-0.04138807 -0.04076176 -0.06576449 -0.06757788 -0.06624145 -0.06896513
  -0.06699994 -0.06868134 -0.06859787 -0.06664341  0.93414932 -0.06870458
  -0.04765224 -0.04782749 -0.04801144 -0.04828992 -0.0520424 ]
 [-0.04138807 -0.04076176 -0.06576449 -0.06757788 -0.06624145 -0.06896513
  -0.06699994 -0.06868134 -0.06859787 -0.06664341 -0.06585068 -0.06870458
  -0.04765224  0.95217252 -0.04801144 -0.04828992 -0.0520424 ]]
Epoch: 8062	Loss: 2.76019089222	Example Output: 40	Example Reward:  1
[[ 0.04139781  0.04077777  0.06575671  0.06761058  0.06621469  0.06893334
   0.06700255  0.06864425  0.06862472  0.06663293  0.06583901  0.06869644
   0.04765154  0.04785255  0.0480078   0.04830714  0.05205026]]
2.806

Epoch: 8075	Loss: 3.06461484432	Example Output: 96	Example Reward:  1
[[ 0.04138101  0.04083088  0.06582106  0.06766036  0.06613752  0.06896741
   0.06693181  0.0685425   0.06860123  0.06665209  0.06582252  0.06868241
   0.04769964  0.04800899  0.04792236  0.04830217  0.05203613]]
2.80275
[[-0.04138101 -0.04083088 -0.06582106 -0.06766036 -0.06613752 -0.06896741
  -0.06693181 -0.0685425  -0.06860123 -0.06665209 -0.06582252  0.93131757
  -0.04769964 -0.04800899 -0.04792236 -0.04830217 -0.05203613]
 [-0.04138101 -0.04083088 -0.06582106 -0.06766036 -0.06613752 -0.06896741
  -0.06693181 -0.0685425   0.93139875 -0.06665209 -0.06582252 -0.06868241
  -0.04769964 -0.04800899 -0.04792236 -0.04830217 -0.05203613]]
Epoch: 8076	Loss: 2.50763530731	Example Output: 75	Example Reward:  1
[[ 0.04136987  0.04080876  0.06583687  0.06766281  0.06614024  0.06893186
   0.06693005  0.06857989  0.06862869  0.066678    0.06580372  0.06870207
   0.04768965  0.04800395  0.04789481  0.04831455  0.0520243 ]]
2.804

Epoch: 8087	Loss: 3.32971293926	Example Output: /4	Example Reward:  -0.3
[[ 0.04144687  0.0409385   0.06579129  0.06782191  0.06611916  0.06866055
   0.06691411  0.06853475  0.06874763  0.06662271  0.06551328  0.06855277
   0.0477637   0.04807612  0.04793357  0.04848389  0.05207926]]
4.1
[[ 0.28756595  0.28771847  0.28026262  0.27965343  0.28016427  0.27940184
   0.27992579  0.2794396   0.27937573  0.2800132   0.28034604  0.27943417
   0.28567091  0.28557718  0.28561994 -0.01454517  0.28437623]
 [ 0.28756595  0.28771847  0.28026262  0.27965343  0.28016427  0.27940184
  -0.02007423  0.2794396   0.27937573  0.2800132   0.28034604  0.27943417
   0.28567091  0.28557718  0.28561994  0.28545484  0.28437623]]
Epoch: 8088	Loss: 3.07233688831	Example Output: /1	Example Reward:  -0.3
[[ 0.04145142  0.04097347  0.06578438  0.06782211  0.0661007   0.06869702
   0.06689466  0.06847758  0.06874724  0.06660461  0.06554243  0.06853045
   0.04775137  0.04809676  0.04795535  0.04848688  0.05208359]]
4.1

Epoch: 8101	Loss: 3.19908020496	Example Output: 3Y	Example Reward:  -0.3
[[ 0.04128144  0.04080968  0.06569228  0.06801631  0.06618696  0.06855604
   0.06727448  0.06853769  0.06880108  0.06652597  0.06579903  0.06852984
   0.04771923  0.04812315  0.04780808  0.04834016  0.05199853]]
4.09768
[[ 0.28761557  0.2877571   0.28029233  0.27959514  0.28014392 -0.02056681
   0.27981767  0.2794387   0.27935967  0.2800422   0.28026032  0.27944106
   0.28568423  0.28556308  0.28565758  0.28549796  0.28440046]
 [ 0.28761557 -0.0122429   0.28029233  0.27959514  0.28014392  0.27943319
   0.27981767  0.2794387   0.27935967  0.2800422   0.28026032  0.27944106
   0.28568423  0.28556308  0.28565758  0.28549796  0.28440046]]
Epoch: 8102	Loss: 3.32665174007	Example Output: 95	Example Reward:  1
[[ 0.04129745  0.04082435  0.06564741  0.06797791  0.06616513  0.06850456
   0.06725853  0.06856608  0.06878825  0.06652538  0.0657635   0.06856006
   0.04776653  0.04814848  0.04781451  0.04836098  0.05203093]]
2.

Epoch: 8115	Loss: 3.06743457317	Example Output: -/	Example Reward:  -0.3
[[ 0.0412385   0.04075924  0.06547943  0.06817958  0.06609872  0.06845856
   0.06730568  0.06863958  0.06880072  0.06662495  0.06593443  0.0686039
   0.04768647  0.04819625  0.04771115  0.0482894   0.05199346]]
4.09488
[[ 0.28762847  0.28777224  0.2803562   0.27954614  0.28017041  0.27946246
   0.27980831  0.27940813  0.27935982  0.28001252  0.28021967  0.27941886
   0.28569406 -0.01445888  0.28568667  0.28551319  0.28440195]
 [ 0.28762847  0.28777224  0.2803562   0.27954614  0.28017041  0.27946246
   0.27980831  0.27940813  0.27935982  0.28001252  0.28021967  0.27941886
   0.28569406  0.28554115  0.28568667 -0.01448682  0.28440195]]
Epoch: 8116	Loss: 3.32668440342	Example Output: -6	Example Reward:  -0.3
[[ 0.04122494  0.04078022  0.06550968  0.06818703  0.06608512  0.06843827
   0.06728439  0.06863932  0.06877352  0.06664851  0.06596918  0.0685887
   0.04770139  0.04820252  0.04769338  0.04829474  0.05197914]]
4

Epoch: 8127	Loss: 3.04166915417	Example Output: +*	Example Reward:  -0.3
4.09463
[[ 0.28762013  0.28774416  0.28039974  0.27953857  0.28019142  0.27951068
   0.27979642  0.27937916  0.27938813  0.2800281   0.28022751  0.27942574
  -0.01433872  0.28553578  0.2856918   0.28547671  0.28438485]
 [ 0.28762013  0.28774416  0.28039974  0.27953857  0.28019142  0.27951068
   0.27979642  0.27937916  0.27938813  0.2800281   0.28022751  0.27942574
   0.28566131  0.28553578 -0.01430823  0.28547671  0.28438485]]
Epoch: 8128	Loss: 2.9136941433	Example Output: 87	Example Reward:  1
[[ 0.04126942  0.04085061  0.06531636  0.06819453  0.06606158  0.06826629
   0.06735725  0.06872106  0.06868912  0.06659127  0.06593698  0.06858068
   0.04778432  0.04821843  0.04769588  0.04841686  0.05204934]]
2.80629
[[-0.04126942 -0.04085061 -0.06531636 -0.06819453 -0.06606158 -0.06826629
  -0.06735725 -0.06872106 -0.06868912 -0.06659127  0.93406302 -0.06858068
  -0.04778432 -0.04821843 -0.04769588 -0.04841686 -0.052049

Epoch: 8141	Loss: 2.93725202084	Example Output: +4	Example Reward:  -0.3
[[ 0.04121891  0.04084225  0.06545411  0.06809677  0.06619847  0.06843784
   0.06741823  0.06885953  0.06844957  0.06653721  0.06601226  0.06847621
   0.04782141  0.04810778  0.04775599  0.04832958  0.05198391]]
4.0998
[[ 0.28763434  0.28774735  0.28036377  0.279571    0.28014046  0.27946866
   0.27977455  0.27934214  0.27946514  0.28003886  0.28019634  0.27945715
  -0.01434642  0.28556767  0.28567323  0.28550112  0.28440484]
 [ 0.28763434  0.28774735  0.28036377  0.279571    0.28014046  0.27946866
  -0.02022547  0.27934214  0.27946514  0.28003886  0.28019634  0.27945715
   0.28565359  0.28556767  0.28567323  0.28550112  0.28440484]]
Epoch: 8142	Loss: 2.65809123516	Example Output: 0-	Example Reward:  1
[[ 0.04119118  0.04080589  0.06547417  0.06810294  0.06619321  0.06843862
   0.06742949  0.06888828  0.06846984  0.06654634  0.06606679  0.06851014
   0.0477994   0.04808276  0.04773242  0.04829789  0.05197062]]
2.8

Epoch: 8155	Loss: 2.91375455856	Example Output: 2-	Example Reward:  1
[[ 0.04122344  0.0408338   0.06562258  0.06799331  0.06611318  0.06851456
   0.06726593  0.06917553  0.06861241  0.06636123  0.06587893  0.0682559
   0.04793014  0.04813188  0.047901    0.04830113  0.05188506]]
2.82236
[[-0.04122344 -0.0408338  -0.06562258 -0.06799331  0.93388683 -0.06851456
  -0.06726593 -0.06917553 -0.06861241 -0.06636123 -0.06587893 -0.0682559
  -0.04793014 -0.04813188 -0.047901   -0.04830113 -0.05188506]
 [-0.04122344 -0.0408338  -0.06562258 -0.06799331 -0.06611318 -0.06851456
  -0.06726593 -0.06917553 -0.06861241 -0.06636123 -0.06587893 -0.0682559
  -0.04793014  0.95186812 -0.047901   -0.04830113 -0.05188506]]
Epoch: 8156	Loss: 3.19449994564	Example Output: 43	Example Reward:  1
[[ 0.04120523  0.04082047  0.06564952  0.0679535   0.0661672   0.06849163
   0.0672717   0.06919065  0.06859589  0.0663679   0.06590881  0.06824054
   0.04792564  0.04815121  0.04788865  0.04829189  0.05187956]]
2.80384


Epoch: 8167	Loss: 2.91741888523	Example Output: /0	Example Reward:  -0.3
[[ 0.04105869  0.04063446  0.06561826  0.06827023  0.06628459  0.06862154
   0.06741328  0.06932035  0.06878513  0.06625783  0.06611028  0.0680944
   0.04777302  0.04808467  0.04773977  0.04820226  0.05173127]]
4.09937
[[ 0.28768241  0.28780967  0.28031453  0.27951896  0.28011462  0.27941355
   0.27977604  0.27920392  0.27936447  0.28012267  0.28016692  0.27957171
   0.2856681   0.28557462  0.28567809 -0.01446068  0.28448063]
 [ 0.28768241  0.28780967 -0.01968548  0.27951896  0.28011462  0.27941355
   0.27977604  0.27920392  0.27936447  0.28012267  0.28016692  0.27957171
   0.2856681   0.28557462  0.28567809  0.28553933  0.28448063]]
Epoch: 8168	Loss: 2.50538043976	Example Output: 1+	Example Reward:  1
2.82077
[[-0.04106661 -0.04063278 -0.06560165  0.93170464 -0.06625566 -0.06865235
  -0.06740793 -0.06930269 -0.06880786 -0.06624878 -0.06614006 -0.06810661
  -0.04775739 -0.04807754 -0.04773422 -0.04819596 -0.051716

Epoch: 8181	Loss: 3.71422560215	Example Output: 1-	Example Reward:  1
[[ 0.04109727  0.04057095  0.06533656  0.06854958  0.06614255  0.06855603
   0.06751937  0.06922926  0.06860486  0.06610693  0.06634942  0.06817406
   0.04783088  0.04823526  0.04771937  0.04821247  0.05176517]]
2.82015
[[-0.04109727 -0.04057095 -0.06533656  0.93145043 -0.06614255 -0.06855603
  -0.06751937 -0.06922926 -0.06860486 -0.06610693 -0.06634942 -0.06817406
  -0.04783088 -0.04823526 -0.04771937 -0.04821247 -0.05176517]
 [-0.04109727 -0.04057095 -0.06533656 -0.06854958 -0.06614255 -0.06855603
  -0.06751937 -0.06922926 -0.06860486 -0.06610693 -0.06634942 -0.06817406
  -0.04783088  0.95176476 -0.04771937 -0.04821247 -0.05176517]]
Epoch: 8182	Loss: 3.1957269907	Example Output: 73	Example Reward:  1
[[ 0.04112823  0.04059752  0.06530101  0.0685828   0.06611703  0.06853084
   0.06750575  0.06919639  0.06856816  0.06607828  0.06635003  0.06815041
   0.04783922  0.04827112  0.04776743  0.04823171  0.05178412]]
2.8044

Epoch: 8195	Loss: 3.32874827385	Example Output: X*	Example Reward:  1
[[ 0.04113739  0.04058085  0.06540002  0.06852311  0.06617229  0.06856039
   0.06726077  0.06908093  0.0685396   0.0662156   0.06635302  0.06847518
   0.04779813  0.04811191  0.04783214  0.0481787   0.05177999]]
2.84611
[[ 0.9588626  -0.04058085 -0.06540002 -0.06852311 -0.06617229 -0.06856039
  -0.06726077 -0.06908093 -0.0685396  -0.0662156  -0.06635302 -0.06847518
  -0.04779813 -0.04811191 -0.04783214 -0.0481787  -0.05177999]
 [-0.04113739 -0.04058085 -0.06540002 -0.06852311 -0.06617229 -0.06856039
  -0.06726077 -0.06908093 -0.0685396  -0.0662156  -0.06635302 -0.06847518
  -0.04779813 -0.04811191  0.95216787 -0.0481787  -0.05177999]]
Epoch: 8196	Loss: 2.93401196003	Example Output: 77	Example Reward:  1
[[ 0.0411509   0.04056209  0.0654637   0.06848868  0.06619417  0.0685482
   0.06724123  0.06912308  0.06851915  0.06619574  0.06637407  0.06849296
   0.04780219  0.04808468  0.04784834  0.04815228  0.05175856]]
2.8060

Epoch: 8207	Loss: 3.06748948097	Example Output: 34	Example Reward:  1
[[ 0.04109608  0.04045557  0.06558395  0.06853909  0.06615451  0.06829625
   0.06733902  0.06918843  0.0684791   0.06627411  0.06649304  0.06888219
   0.04775539  0.04813654  0.04765356  0.04802203  0.0516511 ]]
2.80345
[[-0.04109608 -0.04045557 -0.06558395 -0.06853909 -0.06615451  0.93170375
  -0.06733902 -0.06918843 -0.0684791  -0.06627411 -0.06649304 -0.06888219
  -0.04775539 -0.04813654 -0.04765356 -0.04802203 -0.0516511 ]
 [-0.04109608 -0.04045557 -0.06558395 -0.06853909 -0.06615451 -0.06829625
   0.932661   -0.06918843 -0.0684791  -0.06627411 -0.06649304 -0.06888219
  -0.04775539 -0.04813654 -0.04765356 -0.04802203 -0.0516511 ]]
Epoch: 8208	Loss: 3.32505300045	Example Output: 10	Example Reward:  1
[[ 0.0410908   0.04046074  0.06557169  0.0685542   0.06611791  0.06832718
   0.06734756  0.06915569  0.06848087  0.06629296  0.066506    0.06889447
   0.04774556  0.04814112  0.04764908  0.0480117   0.05165245]]
2.804

Epoch: 8221	Loss: 3.4542586565	Example Output: 74	Example Reward:  1
[[ 0.04115182  0.04049466  0.06565648  0.06839664  0.06624912  0.06822376
   0.06737973  0.06910625  0.06841617  0.06630354  0.0665924   0.06896218
   0.04770515  0.04803183  0.04769557  0.04798679  0.05164788]]
2.80491
[[-0.04115182 -0.04049466 -0.06565648 -0.06839664 -0.06624912 -0.06822376
  -0.06737973 -0.06910625 -0.06841617  0.93369645 -0.0665924  -0.06896218
  -0.04770515 -0.04803183 -0.04769557 -0.04798679 -0.05164788]
 [-0.04115182 -0.04049466 -0.06565648 -0.06839664 -0.06624912 -0.06822376
   0.93262029 -0.06910625 -0.06841617 -0.06630354 -0.0665924  -0.06896218
  -0.04770515 -0.04803183 -0.04769557 -0.04798679 -0.05164788]]
Epoch: 8222	Loss: 3.32258062363	Example Output: 32	Example Reward:  1
[[ 0.04117487  0.04050858  0.06564182  0.0683649   0.0662378   0.06821058
   0.06739706  0.06908103  0.06843544  0.06631787  0.06653787  0.0689523
   0.04771722  0.04805357  0.04770535  0.04799391  0.05166987]]
2.80438

   0.28569216  0.28564435  0.28569323  0.28566796  0.28454533]]
Epoch: 8233	Loss: 3.06371095181	Example Output: 89	Example Reward:  1
[[ 0.04104026  0.04037023  0.06580815  0.06828132  0.06639345  0.06840467
   0.06741721  0.0692213   0.06869484  0.0664848   0.06643569  0.06899033
   0.04767532  0.04783303  0.04766772  0.04776739  0.05151431]]
2.80334
[[-0.04104026 -0.04037023 -0.06580815 -0.06828132 -0.06639345 -0.06840467
  -0.06741721 -0.0692213  -0.06869484 -0.0664848   0.93356431 -0.06899033
  -0.04767532 -0.04783303 -0.04766772 -0.04776739 -0.05151431]
 [-0.04104026 -0.04037023 -0.06580815 -0.06828132 -0.06639345 -0.06840467
  -0.06741721 -0.0692213  -0.06869484 -0.0664848  -0.06643569  0.93100965
  -0.04767532 -0.04783303 -0.04766772 -0.04776739 -0.05151431]]
Epoch: 8234	Loss: 2.77031178474	Example Output: *6	Example Reward:  -0.3
[[ 0.04104216  0.04036078  0.06582138  0.06829623  0.06640159  0.06839053
   0.0674342   0.06919569  0.06870063  0.06647994  0.06647644  0.0689991
   

Epoch: 8245	Loss: 3.06384205818	Example Output: 61	Example Reward:  1
[[ 0.04113096  0.04044021  0.06587754  0.068437    0.0662372   0.06811924
   0.06745071  0.06920256  0.06874412  0.06631931  0.06655373  0.06882826
   0.04762007  0.04799024  0.04760809  0.04793293  0.05150788]]
2.80217
[[-0.04113096 -0.04044021 -0.06587754 -0.068437   -0.0662372  -0.06811924
  -0.06745071 -0.06920256  0.93125588 -0.06631931 -0.06655373 -0.06882826
  -0.04762007 -0.04799024 -0.04760809 -0.04793293 -0.05150788]
 [-0.04113096 -0.04044021 -0.06587754  0.93156302 -0.0662372  -0.06811924
  -0.06745071 -0.06920256 -0.06874412 -0.06631931 -0.06655373 -0.06882826
  -0.04762007 -0.04799024 -0.04760809 -0.04793293 -0.05150788]]
Epoch: 8246	Loss: 3.71281652451	Example Output: --	Example Reward:  -0.3
[[ 0.04114334  0.04047129  0.06587639  0.06846055  0.06622525  0.06807952
   0.06742352  0.06915707  0.06878939  0.0663187   0.06652941  0.06879681
   0.04761922  0.04802668  0.04760469  0.04795834  0.05151986]]
4.

Epoch: 8257	Loss: 3.19373426437	Example Output: 42	Example Reward:  1
[[ 0.04116986  0.04057934  0.06583236  0.06817226  0.06613327  0.0681137
   0.06720764  0.06934404  0.06871589  0.06646822  0.06634671  0.06869119
   0.04771125  0.04812765  0.04767637  0.04807382  0.05163641]]
2.80526
[[-0.04116986 -0.04057934 -0.06583236 -0.06817226 -0.06613327 -0.0681137
   0.93279237 -0.06934404 -0.06871589 -0.06646822 -0.06634671 -0.06869119
  -0.04771125 -0.04812765 -0.04767637 -0.04807382 -0.05163641]
 [-0.04116986 -0.04057934 -0.06583236 -0.06817226  0.93386674 -0.0681137
  -0.06720764 -0.06934404 -0.06871589 -0.06646822 -0.06634671 -0.06869119
  -0.04771125 -0.04812765 -0.04767637 -0.04807382 -0.05163641]]
Epoch: 8258	Loss: 3.17557468414	Example Output: 65	Example Reward:  1
[[ 0.04116933  0.04059698  0.06581803  0.06815725  0.06613855  0.06808679
   0.06722128  0.06935593  0.06874303  0.066462    0.06630553  0.06866495
   0.04772326  0.04813581  0.04770084  0.04808056  0.05163991]]
2.80177


Epoch: 8271	Loss: 3.32657933235	Example Output: 76	Example Reward:  1
[[ 0.04126959  0.04069933  0.06575839  0.06807802  0.06604273  0.06819993
   0.06724814  0.06937095  0.06877829  0.06642995  0.06615468  0.06842222
   0.04775338  0.04814765  0.04785295  0.04817711  0.05161672]]
2.80407
[[-0.04126959 -0.04069933 -0.06575839 -0.06807802 -0.06604273 -0.06819993
  -0.06724814 -0.06937095 -0.06877829  0.93357003 -0.06615468 -0.06842222
  -0.04775338 -0.04814765 -0.04785295 -0.04817711 -0.05161672]
 [-0.04126959 -0.04069933 -0.06575839 -0.06807802 -0.06604273 -0.06819993
  -0.06724814 -0.06937095  0.93122172 -0.06642995 -0.06615468 -0.06842222
  -0.04775338 -0.04814765 -0.04785295 -0.04817711 -0.05161672]]
Epoch: 8272	Loss: 3.07109918594	Example Output: 07	Example Reward:  1
[[ 0.04126184  0.04072296  0.06577388  0.06802914  0.06605323  0.06818207
   0.06721794  0.069339    0.0688338   0.06647577  0.06612009  0.06840239
   0.04776622  0.04813294  0.04786693  0.04819836  0.05162344]]
2.806

Epoch: 8286	Loss: 2.63302726746	Example Output: *	Example Reward:  -0.3
4.09567
[[ 0.28764018  0.28774801  0.2802332   0.2795139   0.28025338  0.27955025
   0.27982992  0.27925748  0.27934995  0.28004089  0.28011882  0.27948666
   0.28568992  0.28553581 -0.01431976  0.28553993  0.28453162]
 [ 0.28764018  0.28774801  0.2802332   0.2795139   0.28025338  0.27955025
   0.27982992  0.27925748  0.27934995  0.28004089  0.28011882  0.27948666
   0.28568992  0.28553581  0.28568026  0.28553993 -0.01546839]]
Epoch: 8287	Loss: 2.79081919193	Example Output: 86	Example Reward:  1
[[ 0.04122005  0.04088871  0.06592226  0.06826995  0.06582157  0.06816524
   0.06719238  0.06911872  0.06879069  0.06652446  0.06626382  0.06835617
   0.04771746  0.04821276  0.0477531   0.04822937  0.05155326]]
2.80424
[[-0.04122005 -0.04088871 -0.06592226 -0.06826995 -0.06582157 -0.06816524
  -0.06719238 -0.06911872 -0.06879069 -0.06652446  0.93373621 -0.06835617
  -0.04771746 -0.04821276 -0.0477531  -0.04822937 -0.051553

Epoch: 8301	Loss: 3.58048033714	Example Output: -2	Example Reward:  -0.3
[[ 0.04114044  0.04089707  0.0662299   0.06834979  0.06582639  0.06808317
   0.06715539  0.06909294  0.06901589  0.06664506  0.06625606  0.0684324
   0.0475652   0.04804888  0.04765097  0.0482454   0.051365  ]]
4.09936
[[ 0.28765789  0.2877309   0.28013104  0.27949509  0.2802521   0.27957505
   0.2798534   0.27927214  0.27929527  0.2800065   0.2801232   0.27947029
   0.28573045 -0.01441466  0.2857047   0.28552639  0.28459051]
 [ 0.28765789  0.2877309   0.28013104  0.27949509 -0.01974792  0.27957505
   0.2798534   0.27927214  0.27929527  0.2800065   0.2801232   0.27947029
   0.28573045  0.28558534  0.2857047   0.28552639  0.28459051]]
Epoch: 8302	Loss: 3.45625400543	Example Output: /1	Example Reward:  -0.3
[[ 0.04116983  0.04095537  0.06622975  0.06836265  0.06577041  0.0681278
   0.06709866  0.06904937  0.06900489  0.06663181  0.06623243  0.06839345
   0.04759302  0.04803867  0.04768994  0.04828493  0.05136697]]
4

Epoch: 8315	Loss: 3.7099542141	Example Output: 8	Example Reward:  1
[[ 0.04124387  0.04101503  0.06612032  0.06863492  0.06559014  0.06799983
   0.06709109  0.0690529   0.06894873  0.06657839  0.06617196  0.06836308
   0.04759449  0.04815694  0.04758021  0.0483554   0.05150276]]
2.81876
[[-0.04124387 -0.04101503 -0.06612032 -0.06863492 -0.06559014 -0.06799983
  -0.06709109 -0.0690529  -0.06894873 -0.06657839  0.93382806 -0.06836308
  -0.04759449 -0.04815694 -0.04758021 -0.0483554  -0.05150276]
 [-0.04124387 -0.04101503 -0.06612032 -0.06863492 -0.06559014 -0.06799983
  -0.06709109 -0.0690529  -0.06894873 -0.06657839 -0.06617196 -0.06836308
  -0.04759449 -0.04815694 -0.04758021 -0.0483554   0.94849724]]
Epoch: 8316	Loss: 2.78616473675	Example Output: 08	Example Reward:  1
[[ 0.04126417  0.04103396  0.06609795  0.06862816  0.06557363  0.06796782
   0.06709889  0.0690486   0.0689205   0.06657545  0.06616322  0.06835554
   0.04760385  0.04818375  0.04757462  0.04836469  0.0515452 ]]
2.80633

Epoch: 8327	Loss: 2.50237658024	Example Output: 84	Example Reward:  1
[[ 0.04119389  0.04091685  0.06608772  0.06884811  0.06562578  0.06774808
   0.06707475  0.06919767  0.06905912  0.06647003  0.06618755  0.06838478
   0.04760504  0.04816199  0.04748998  0.0483751   0.0515736 ]]
2.80546
[[-0.04119389 -0.04091685 -0.06608772 -0.06884811 -0.06562578 -0.06774808
  -0.06707475 -0.06919767 -0.06905912 -0.06647003  0.93381244 -0.06838478
  -0.04760504 -0.04816199 -0.04748998 -0.0483751  -0.0515736 ]
 [-0.04119389 -0.04091685 -0.06608772 -0.06884811 -0.06562578 -0.06774808
   0.93292522 -0.06919767 -0.06905912 -0.06647003 -0.06618755 -0.06838478
  -0.04760504 -0.04816199 -0.04748998 -0.0483751  -0.0515736 ]]
Epoch: 8328	Loss: 3.58381943703	Example Output: X4	Example Reward:  -0.3
[[ 0.04118864  0.04092469  0.06611349  0.06883817  0.0656127   0.06778869
   0.0670838   0.06920347  0.06902218  0.06648613  0.06620041  0.06837044
   0.04760733  0.0481481   0.04749316  0.04835976  0.05155887]]
4.

Epoch: 8341	Loss: 2.91679399014	Example Output: 0+	Example Reward:  1
2.82281
[[-0.0411692  -0.0409463   0.93402523 -0.06857341 -0.06556489 -0.0678832
  -0.06711395 -0.0692737  -0.06907537 -0.06664498 -0.06607275 -0.06830614
  -0.04761428 -0.04811492 -0.04764275 -0.04837302 -0.0516564 ]
 [-0.0411692  -0.0409463  -0.06597479 -0.06857341 -0.06556489 -0.0678832
  -0.06711395 -0.0692737  -0.06907537 -0.06664498 -0.06607275 -0.06830614
   0.95238572 -0.04811492 -0.04764275 -0.04837302 -0.0516564 ]]
Epoch: 8342	Loss: 3.04378898144	Example Output: 6/	Example Reward:  1
[[ 0.0411806   0.04097857  0.06600449  0.06856175  0.0655501   0.06784765
   0.06710169  0.06923237  0.06905814  0.06663588  0.06608257  0.06831942
   0.04763643  0.04811161  0.04765131  0.04839925  0.05164818]]
2.81975
[[-0.0411806  -0.04097857 -0.06600449 -0.06856175 -0.0655501  -0.06784765
  -0.06710169 -0.06923237  0.93094188 -0.06663588 -0.06608257 -0.06831942
  -0.04763643 -0.04811161 -0.04765131 -0.04839925 -0.05164818]


Epoch: 8353	Loss: 2.94441111088	Example Output: 1	Example Reward:  1
[[ 0.04117465  0.04109121  0.06608855  0.0685817   0.06546474  0.06781381
   0.06710801  0.06909347  0.06903783  0.06649689  0.06614161  0.06824512
   0.04783946  0.04810938  0.0477257   0.04840063  0.05158723]]
2.81703
[[-0.04117465 -0.04109121 -0.06608855  0.9314183  -0.06546474 -0.06781381
  -0.06710801 -0.06909347 -0.06903783 -0.06649689 -0.06614161 -0.06824512
  -0.04783946 -0.04810938 -0.0477257  -0.04840063 -0.05158723]
 [-0.04117465 -0.04109121 -0.06608855 -0.0685817  -0.06546474 -0.06781381
  -0.06710801 -0.06909347 -0.06903783 -0.06649689 -0.06614161 -0.06824512
  -0.04783946 -0.04810938 -0.0477257  -0.04840063  0.94841278]]
Epoch: 8354	Loss: 3.32729213238	Example Output: 2*	Example Reward:  1
[[ 0.04118237  0.04110826  0.06613376  0.06855395  0.06547453  0.06781009
   0.06708427  0.06909303  0.06899612  0.0664597   0.06613669  0.0682397
   0.04787334  0.04810226  0.04773536  0.04841283  0.05160373]]
2.82326

Epoch: 8368	Loss: 2.78600320816	Example Output: Y3	Example Reward:  -0.3
[[ 0.04113372  0.04116074  0.06602645  0.06863786  0.06552169  0.06787687
   0.06709673  0.06893399  0.06926364  0.06644658  0.06600302  0.06807741
   0.0478182   0.04794521  0.04785986  0.04853534  0.05166263]]
4.09767
[[ 0.28765991 -0.01234822  0.28019208  0.27940866  0.2803435   0.27963695
   0.27987099  0.27931982  0.27922091  0.28006604  0.28019911  0.27957681
   0.28565454  0.28561646  0.28564206  0.2854394   0.28450122]
 [ 0.28765991  0.28765178  0.28019208  0.27940866  0.2803435  -0.02036306
   0.27987099  0.27931982  0.27922091  0.28006604  0.28019911  0.27957681
   0.28565454  0.28561646  0.28564206  0.2854394   0.28450122]]
Epoch: 8369	Loss: 3.0687609911	Example Output: X*	Example Reward:  1
[[ 0.0411185   0.04115544  0.06604555  0.06863498  0.06553213  0.06791809
   0.06707887  0.06890609  0.06928602  0.06643419  0.06601276  0.06807936
   0.04782474  0.04792608  0.04785794  0.04852151  0.05166774]]
2.8

Epoch: 8380	Loss: 3.06355583668	Example Output: Y0	Example Reward:  -0.3
[[ 0.04115516  0.0411694   0.06602425  0.06841684  0.06556987  0.06814438
   0.06696252  0.06885476  0.06931211  0.06660406  0.06597839  0.06803598
   0.04774795  0.04778821  0.04797979  0.04856016  0.05169618]]
4.09726
[[ 0.28765348 -0.01235082  0.28019273  0.27947497  0.28032905  0.27955669
   0.27991125  0.27934358  0.2792064   0.28001878  0.2802065   0.27958924
   0.28567562  0.28566355  0.28560609  0.28543198  0.28449115]
 [ 0.28765348  0.28764918 -0.01980728  0.27947497  0.28032905  0.27955669
   0.27991125  0.27934358  0.2792064   0.28001878  0.2802065   0.27958924
   0.28567562  0.28566355  0.28560609  0.28543198  0.28449115]]
Saving Weight
Epoch: 8381	Loss: 3.32717883587	Example Output: 77	Example Reward:  1
[[ 0.04115377  0.04113896  0.06603942  0.06841996  0.06561852  0.06813768
   0.06695592  0.06889132  0.06929109  0.06658775  0.06600378  0.06804351
   0.04773657  0.0477752   0.04797388  0.04853656  0

Epoch: 8394	Loss: 3.17296934128	Example Output: X4	Example Reward:  -0.3
[[ 0.04100074  0.04099221  0.06620585  0.06848611  0.06599823  0.06796026
   0.06698394  0.06915921  0.06950197  0.06657525  0.06594853  0.06793033
   0.04766481  0.04764402  0.04789707  0.0484783   0.05157321]]
4.09728
[[-0.01230022  0.28770235  0.28013825  0.27945417  0.28020054  0.27961195
   0.27990484  0.27925226  0.27914941  0.28002745  0.28021544  0.27962092
   0.28570056  0.28570682  0.28563091  0.28545651  0.28452805]
 [ 0.28769979  0.28770235  0.28013825  0.27945417  0.28020054  0.27961195
  -0.02009518  0.27925226  0.27914941  0.28002745  0.28021544  0.27962092
   0.28570056  0.28570682  0.28563091  0.28545651  0.28452805]]
Epoch: 8395	Loss: 3.06519236565	Example Output: 49	Example Reward:  1
[[ 0.04098709  0.04098665  0.06621113  0.06848265  0.06601327  0.06791943
   0.0669811   0.06917189  0.06955284  0.06657013  0.06592585  0.06793434
   0.04766113  0.04765695  0.04788109  0.04848538  0.05157911]]
2.

Epoch: 8408	Loss: 3.32694556713	Example Output: 23	Example Reward:  1
[[ 0.04094049  0.04096339  0.06624418  0.06855872  0.06594562  0.06814619
   0.06685329  0.06936536  0.06962118  0.06655752  0.06594238  0.06800184
   0.04754433  0.04766963  0.04780345  0.04838921  0.05145321]]
2.80465
[[-0.04094049 -0.04096339 -0.06624418 -0.06855872  0.93405437 -0.06814619
  -0.06685329 -0.06936536 -0.06962118 -0.06655752 -0.06594238 -0.06800184
  -0.04754433 -0.04766963 -0.04780345 -0.04838921 -0.05145321]
 [-0.04094049 -0.04096339 -0.06624418 -0.06855872 -0.06594562  0.93185383
  -0.06685329 -0.06936536 -0.06962118 -0.06655752 -0.06594238 -0.06800184
  -0.04754433 -0.04766963 -0.04780345 -0.04838921 -0.05145321]]
Epoch: 8409	Loss: 3.17207872868	Example Output: 16	Example Reward:  1
[[ 0.04096581  0.04098299  0.0662365   0.06851449  0.06595844  0.0681841
   0.06682148  0.06933112  0.06959429  0.06656574  0.06592423  0.06796554
   0.04754763  0.04770096  0.04783214  0.04839703  0.05147753]]
2.8017

Epoch: 8420	Loss: 3.19323298931	Example Output: /+	Example Reward:  -0.3
[[ 0.04086835  0.04087274  0.06624545  0.0684315   0.0664963   0.06800897
   0.06685954  0.06941768  0.06977259  0.06656206  0.06588643  0.0679097
   0.04753168  0.04767199  0.04776033  0.04828436  0.05142033]]
4.09445
[[ 0.28773952  0.28773817  0.28012639  0.27947056  0.28005111  0.27959731
   0.27994215  0.27917472  0.27906823  0.28003138  0.28023407  0.27962708
   0.28574052  0.28569841  0.28567192 -0.01448531  0.28457391]
 [ 0.28773952  0.28773817  0.28012639  0.27947056  0.28005111  0.27959731
   0.27994215  0.27917472  0.27906823  0.28003138  0.28023407  0.27962708
  -0.0142595   0.28569841  0.28567192  0.28551471  0.28457391]]
Saving Weight
Epoch: 8421	Loss: 3.06763527393	Example Output: 39	Example Reward:  1
[[ 0.04085312  0.04085399  0.06625818  0.06847386  0.06650165  0.06801777
   0.06684627  0.06941838  0.06977278  0.0665198   0.06597336  0.06791148
   0.04752266  0.04766726  0.0477672   0.04825884  0.

Epoch: 8434	Loss: 2.5287476778	Example Output: 1+	Example Reward:  1
[[ 0.04089506  0.04090935  0.06625012  0.0684924   0.06646506  0.06808013
   0.06672264  0.06910528  0.06992044  0.06650177  0.0659088   0.06789519
   0.04750673  0.04761132  0.04781093  0.0484654   0.05145936]]
2.82076
[[-0.04089506 -0.04090935 -0.06625012  0.93150759 -0.06646506 -0.06808013
  -0.06672264 -0.06910528 -0.06992044 -0.06650177 -0.0659088  -0.06789519
  -0.04750673 -0.04761132 -0.04781093 -0.0484654  -0.05145936]
 [-0.04089506 -0.04090935 -0.06625012 -0.0684924  -0.06646506 -0.06808013
  -0.06672264 -0.06910528 -0.06992044 -0.06650177 -0.0659088  -0.06789519
   0.95249325 -0.04761132 -0.04781093 -0.0484654  -0.05145936]]
Epoch: 8435	Loss: 3.04715359211	Example Output: 2*	Example Reward:  1
[[ 0.04090035  0.04090819  0.06632338  0.06849843  0.06648246  0.06805582
   0.06671109  0.06908756  0.06994584  0.06649611  0.06589998  0.06786877
   0.04754447  0.04758635  0.04778939  0.04846112  0.05144078]]
2.8219

Epoch: 8448	Loss: 3.19380590916	Example Output: 56	Example Reward:  1
[[ 0.04101327  0.0410697   0.06622642  0.06837867  0.06649666  0.06789631
   0.06669412  0.06886766  0.0696589   0.0664734   0.0659503   0.06789993
   0.047789    0.04759616  0.04787729  0.04859051  0.0515216 ]]
2.80164
[[-0.04101327 -0.0410697  -0.06622642 -0.06837867 -0.06649666 -0.06789631
  -0.06669412  0.93113232 -0.0696589  -0.0664734  -0.0659503  -0.06789993
  -0.047789   -0.04759616 -0.04787729 -0.04859051 -0.0515216 ]
 [-0.04101327 -0.0410697  -0.06622642 -0.06837867 -0.06649666 -0.06789631
  -0.06669412 -0.06886766  0.93034112 -0.0664734  -0.0659503  -0.06789993
  -0.047789   -0.04759616 -0.04787729 -0.04859051 -0.0515216 ]]
Epoch: 8449	Loss: 2.93941903114	Example Output: 4	Example Reward:  1
[[ 0.04099894  0.04105854  0.0662384   0.06836563  0.06652127  0.06784658
   0.06669855  0.06891344  0.06966147  0.06653284  0.0659054   0.06791215
   0.04779578  0.0476066   0.04784751  0.04858114  0.05151583]]
2.8183

Epoch: 8463	Loss: 2.37423417568	Example Output: 45	Example Reward:  1
[[ 0.04094364  0.04104499  0.06632452  0.06841432  0.06649604  0.06788427
   0.06665491  0.06900802  0.06962626  0.06686765  0.06562702  0.06800516
   0.04777262  0.04753452  0.04776556  0.04858587  0.05144474]]
2.80362
[[-0.04094364 -0.04104499 -0.06632452 -0.06841432 -0.06649604 -0.06788427
   0.93334508 -0.06900802 -0.06962626 -0.06686765 -0.06562702 -0.06800516
  -0.04777262 -0.04753452 -0.04776556 -0.04858587 -0.05144474]
 [-0.04094364 -0.04104499 -0.06632452 -0.06841432 -0.06649604 -0.06788427
  -0.06665491  0.93099201 -0.06962626 -0.06686765 -0.06562702 -0.06800516
  -0.04777262 -0.04753452 -0.04776556 -0.04858587 -0.05144474]]
Epoch: 8464	Loss: 3.04544706345	Example Output: 0+	Example Reward:  1
[[ 0.04093036  0.04102328  0.06633139  0.06840906  0.06650219  0.06789697
   0.06669092  0.06906776  0.06960578  0.06685861  0.06562762  0.06800783
   0.0477676   0.04751477  0.04774722  0.04858955  0.05142913]]
2.822

Epoch: 8475	Loss: 3.45638773441	Example Output: +5	Example Reward:  -0.3
[[ 0.04100426  0.04117939  0.06634496  0.06821983  0.0663423   0.06800594
   0.06662323  0.06892931  0.06945421  0.06680035  0.06542455  0.06793036
   0.04792265  0.04749213  0.04795519  0.04877638  0.05159502]]
4.10016
[[ 0.28769875  0.28764617  0.28009653  0.27953407  0.28009734  0.27959824
   0.28001305  0.27932122  0.27916375  0.27995992  0.28037265  0.27962092
  -0.0143768   0.28575236  0.28561345  0.2853671   0.28452149]
 [ 0.28769875  0.28764617  0.28009653  0.27953407  0.28009734  0.27959824
   0.28001305 -0.0206788   0.27916375  0.27995992  0.28037265  0.27962092
   0.28562322  0.28575236  0.28561345  0.2853671   0.28452149]]
Epoch: 8476	Loss: 3.32512514591	Example Output: 01	Example Reward:  1
[[ 0.04103341  0.0412274   0.0663268   0.06818793  0.06629841  0.06803714
   0.06659491  0.0688844   0.06941086  0.06676922  0.06539704  0.06792281
   0.04796428  0.04751197  0.04800526  0.04881173  0.05161643]]
2.

Epoch: 8487	Loss: 2.66130366325	Example Output: 41	Example Reward:  1
2.80484
[[-0.04114741 -0.04132023 -0.06618899 -0.06812309 -0.06607385 -0.06778237
   0.93339241 -0.0687267  -0.06932636 -0.06703839 -0.06527236 -0.06813297
  -0.04804683 -0.04758459 -0.04793912 -0.04897018 -0.05171898]
 [-0.04114741 -0.04132023 -0.06618899  0.9318769  -0.06607385 -0.06778237
  -0.06660762 -0.0687267  -0.06932636 -0.06703839 -0.06527236 -0.06813297
  -0.04804683 -0.04758459 -0.04793912 -0.04897018 -0.05171898]]
Epoch: 8488	Loss: 3.19817588329	Example Output: 8+	Example Reward:  1
[[ 0.04116656  0.04130548  0.06613412  0.06814447  0.06606153  0.06778415
   0.06664521  0.06872839  0.06931592  0.06700884  0.06525671  0.06815676
   0.04803811  0.04758744  0.04796484  0.04895827  0.05174319]]
2.82334
[[-0.04116656 -0.04130548 -0.06613412 -0.06814447 -0.06606153 -0.06778415
  -0.06664521 -0.06872839 -0.06931592 -0.06700884  0.93474329 -0.06815676
  -0.04803811 -0.04758744 -0.04796484 -0.04895827 -0.05174319

Epoch: 8501	Loss: 3.19495909214	Example Output: *X	Example Reward:  -0.3
[[ 0.04099765  0.04110105  0.06627148  0.06809112  0.06611492  0.06761413
   0.06702094  0.06881302  0.06944583  0.06702741  0.06530363  0.06846305
   0.04800123  0.04750834  0.04777316  0.04875017  0.05170291]]
4.09229
[[ 0.28770071  0.28766969  0.28011855  0.2795727   0.28016555  0.27971578
   0.27989373  0.27935609  0.27916625  0.27989179  0.28040892  0.27946112
   0.28559965  0.2857475  -0.01433195  0.28537497  0.28448913]
 [-0.01229929  0.28766969  0.28011855  0.2795727   0.28016555  0.27971578
   0.27989373  0.27935609  0.27916625  0.27989179  0.28040892  0.27946112
   0.28559965  0.2857475   0.28566805  0.28537497  0.28448913]]
Epoch: 8502	Loss: 2.93936743736	Example Output: /+	Example Reward:  -0.3
[[ 0.04097413  0.04108864  0.06628364  0.06808662  0.06609227  0.06757396
   0.06706546  0.06879827  0.06946059  0.06707187  0.06531215  0.06849313
   0.04799315  0.04751112  0.04774874  0.04873822  0.05170805]]

Epoch: 8515	Loss: 3.32796025276	Example Output: 9	Example Reward:  1
[[ 0.04093231  0.04106508  0.06622304  0.06784496  0.06617239  0.06758047
   0.06729302  0.06862424  0.06931966  0.06729618  0.06533904  0.06851056
   0.04803187  0.047543    0.0478395   0.04862537  0.05175929]]
2.81683
[[-0.04093231 -0.04106508 -0.06622304 -0.06784496 -0.06617239 -0.06758047
  -0.06729302 -0.06862424 -0.06931966 -0.06729618 -0.06533904  0.93148947
  -0.04803187 -0.047543   -0.0478395  -0.04862537 -0.05175929]
 [-0.04093231 -0.04106508 -0.06622304 -0.06784496 -0.06617239 -0.06758047
  -0.06729302 -0.06862424 -0.06931966 -0.06729618 -0.06533904 -0.06851056
  -0.04803187 -0.047543   -0.0478395  -0.04862537  0.9482407 ]]
Epoch: 8516	Loss: 2.38031535149	Example Output: 75	Example Reward:  1
2.80366
[[-0.04095126 -0.0410676  -0.06620593 -0.06782541 -0.06616534 -0.06761631
  -0.06727755 -0.06863137 -0.06928342  0.9327206  -0.06532346 -0.06851018
  -0.04804075 -0.04755355 -0.04785489 -0.04862643 -0.05178715]

Epoch: 8529	Loss: 3.32735013962	Example Output: 4*	Example Reward:  1
[[ 0.04091381  0.04095556  0.06620305  0.06777733  0.06618772  0.06787167
   0.06720697  0.06866919  0.06930368  0.067269    0.06543531  0.06848365
   0.04797975  0.0474394   0.04790614  0.04856557  0.0518322 ]]
2.82158
[[-0.04091381 -0.04095556 -0.06620305 -0.06777733 -0.06618772 -0.06787167
   0.93279302 -0.06866919 -0.06930368 -0.067269   -0.06543531 -0.06848365
  -0.04797975 -0.0474394  -0.04790614 -0.04856557 -0.0518322 ]
 [-0.04091381 -0.04095556 -0.06620305 -0.06777733 -0.06618772 -0.06787167
  -0.06720697 -0.06866919 -0.06930368 -0.067269   -0.06543531 -0.06848365
  -0.04797975 -0.0474394   0.95209384 -0.04856557 -0.0518322 ]]
Epoch: 8530	Loss: 3.71479814053	Example Output: 57	Example Reward:  1
[[ 0.04093481  0.04099863  0.06617178  0.06776208  0.06617543  0.06785696
   0.06717873  0.06867575  0.06927171  0.06724544  0.06539483  0.06843632
   0.04800586  0.04745889  0.04797543  0.04860209  0.0518553 ]]
2.803

Epoch: 8541	Loss: 3.32081067562	Example Output: 31	Example Reward:  1
[[ 0.04091374  0.0409686   0.06609116  0.06771682  0.06643023  0.06766737
   0.06722064  0.06871031  0.06943741  0.06757185  0.06505838  0.06837686
   0.04796834  0.04744703  0.04787159  0.04864999  0.05189966]]
2.80395
[[-0.04091374 -0.0409686  -0.06609116 -0.06771682 -0.06643023  0.93233263
  -0.06722064 -0.06871031 -0.06943741 -0.06757185 -0.06505838 -0.06837686
  -0.04796834 -0.04744703 -0.04787159 -0.04864999 -0.05189966]
 [-0.04091374 -0.0409686  -0.06609116  0.93228316 -0.06643023 -0.06766737
  -0.06722064 -0.06871031 -0.06943741 -0.06757185 -0.06505838 -0.06837686
  -0.04796834 -0.04744703 -0.04787159 -0.04864999 -0.05189966]]
Epoch: 8542	Loss: 3.32665119171	Example Output: 1*	Example Reward:  1
[[ 0.04091898  0.04099688  0.06610365  0.06771172  0.06641135  0.06766243
   0.06719483  0.06870464  0.06946053  0.0676122   0.06499739  0.0683528
   0.04798184  0.04744344  0.04787491  0.04867041  0.05190204]]
2.8212

Epoch: 8553	Loss: 3.32696800232	Example Output: -4	Example Reward:  -0.3
[[ 0.04095359  0.04104097  0.06603416  0.06768405  0.06662834  0.06771959
   0.06708898  0.06849089  0.06941438  0.06778101  0.06490236  0.06835441
   0.04792277  0.04740513  0.04789245  0.04866715  0.05201982]]
4.09956
[[ 0.28771394  0.28768772  0.28018978  0.2796948   0.2800115   0.27968413
   0.27987331  0.27945274  0.2791757   0.27966571  0.28052929  0.27949369
   0.28562316 -0.01422154  0.28563228  0.28539988  0.28439406]
 [ 0.28771394  0.28768772  0.28018978  0.2796948   0.2800115   0.27968413
  -0.0201267   0.27945274  0.2791757   0.27966571  0.28052929  0.27949369
   0.28562316  0.28577846  0.28563228  0.28539988  0.28439406]]
Epoch: 8554	Loss: 2.66047518253	Example Output: 5+	Example Reward:  1
[[ 0.04097284  0.04105947  0.0660269   0.06767916  0.06661736  0.06775468
   0.06706527  0.068487    0.0693945   0.0677765   0.06488761  0.06832803
   0.04792117  0.04740261  0.04790563  0.0486919   0.05202938]]
2.

Epoch: 8567	Loss: 3.32550528049	Example Output: 7+	Example Reward:  1
[[ 0.04096556  0.04096913  0.06580136  0.06741691  0.0667323   0.06805495
   0.06698527  0.06855816  0.06938913  0.06789691  0.06462069  0.06830433
   0.04788864  0.04744397  0.04806608  0.04869541  0.05221116]]
2.82123
[[-0.04096556 -0.04096913 -0.06580136 -0.06741691 -0.0667323  -0.06805495
  -0.06698527 -0.06855816 -0.06938913  0.9321031  -0.06462069 -0.06830433
  -0.04788864 -0.04744397 -0.04806608 -0.04869541 -0.05221116]
 [-0.04096556 -0.04096913 -0.06580136 -0.06741691 -0.0667323  -0.06805495
  -0.06698527 -0.06855816 -0.06938913 -0.06789691 -0.06462069 -0.06830433
   0.95211136 -0.04744397 -0.04806608 -0.04869541 -0.05221116]]
Epoch: 8568	Loss: 3.1964682579	Example Output: 4-	Example Reward:  1
[[ 0.04097121  0.04100176  0.06581696  0.06738491  0.06673046  0.06806394
   0.06697078  0.06853531  0.06933752  0.06790658  0.06464038  0.06829527
   0.047922    0.04744738  0.04807132  0.04869894  0.05220523]]
2.8224

Epoch: 8579	Loss: 3.32503180504	Example Output: X7	Example Reward:  -0.3
[[ 0.04089448  0.04097157  0.06583101  0.06743428  0.0667348   0.06814226
   0.06688204  0.06840823  0.06919646  0.06815094  0.06475108  0.06839743
   0.04791464  0.04743184  0.04803783  0.04861833  0.05220279]]
4.09759
[[-0.01226834  0.28770855  0.2802507   0.27976972  0.27997959  0.27955735
   0.27993542  0.27947754  0.27924109  0.27955472  0.28057468  0.27948079
   0.28562564  0.28577048  0.28558865  0.28541452  0.28433919]
 [ 0.28773165  0.28770855  0.2802507   0.27976972  0.27997959  0.27955735
   0.27993542  0.27947754  0.27924109 -0.02044528  0.28057468  0.27948079
   0.28562564  0.28577048  0.28558865  0.28541452  0.28433919]]
Epoch: 8580	Loss: 2.79250771999	Example Output: 4+	Example Reward:  1
[[ 0.04091895  0.04098842  0.06588349  0.06739113  0.06672305  0.06817951
   0.06683629  0.06839208  0.06913286  0.06812374  0.06477264  0.06840992
   0.04792003  0.04741293  0.04806878  0.04862114  0.05222514]]
2.

Epoch: 8592	Loss: 3.06927301884	Example Output: *+	Example Reward:  -0.3
[[ 0.04090474  0.04098442  0.06611011  0.06741109  0.06673244  0.06816968
   0.06684855  0.06841256  0.0689194   0.06804026  0.06494892  0.06846057
   0.04794473  0.04746189  0.04795906  0.04850351  0.05218798]]
4.0947
[[ 0.28772858  0.28770471  0.28016698  0.27977669  0.27998027  0.27954912
   0.27994543  0.27947626  0.27932417  0.27958792  0.28051534  0.27946183
   0.28561661  0.28576145 -0.01438772  0.28544897  0.28434363]
 [ 0.28772858  0.28770471  0.28016698  0.27977669  0.27998027  0.27954912
   0.27994543  0.27947626  0.27932417  0.27958792  0.28051534  0.27946183
  -0.01438342  0.28576145  0.28561231  0.28544897  0.28434363]]
Epoch: 8593	Loss: 2.8111590147	Example Output: 79	Example Reward:  1
[[ 0.04089906  0.04096069  0.06606635  0.06737996  0.06676108  0.06821409
   0.06687068  0.06844199  0.06894486  0.06805137  0.06491229  0.06845338
   0.04792173  0.04746193  0.04797848  0.04847484  0.05220727]]
2.80

Epoch: 8604	Loss: 3.19251925945	Example Output: Y1	Example Reward:  -0.3
[[ 0.04098663  0.04101595  0.06610525  0.06729037  0.06676917  0.06823674
   0.06674313  0.06854727  0.06869981  0.06793533  0.0648693   0.06824624
   0.0480167   0.04763795  0.04805718  0.04848431  0.05235878]]
4.09753
[[ 0.28770402 -0.01230479  0.28016844  0.2798129   0.27996925  0.27952901
   0.27997708  0.27943584  0.27939007  0.2796194   0.28053921  0.27952614
   0.285595    0.28570864  0.28558284  0.28545472  0.28429237]
 [ 0.28770402  0.28769523  0.28016844 -0.02018711  0.27996925  0.27952901
   0.27997708  0.27943584  0.27939007  0.2796194   0.28053921  0.27952614
   0.285595    0.28570864  0.28558284  0.28545472  0.28429237]]
Epoch: 8605	Loss: 2.9442646265	Example Output: 33	Example Reward:  1
[[ 0.04098847  0.0410025   0.06611757  0.06726899  0.06681265  0.06827743
   0.06670971  0.06860361  0.06867037  0.06791622  0.06486291  0.06820254
   0.04802351  0.04761981  0.0480794   0.04847682  0.05236746]]
2.8

Epoch: 8616	Loss: 3.06652989388	Example Output: +8	Example Reward:  -0.3
[[ 0.04105595  0.04100081  0.06599053  0.06747411  0.06666744  0.06835748
   0.06655695  0.06871609  0.06888328  0.06789206  0.06470992  0.06820386
   0.04797554  0.0476137   0.04804738  0.04847446  0.05238044]]
4.09929
[[ 0.28768322  0.28769979  0.28020287  0.27975777  0.27999979  0.27949277
   0.28003293  0.27938518  0.27933502  0.27963239  0.28058705  0.27953884
  -0.01439266  0.28571591  0.28558579  0.28545767  0.28428587]
 [ 0.28768322  0.28769979  0.28020287  0.27975777  0.27999979  0.27949277
   0.28003293  0.27938518  0.27933502  0.27963239 -0.01941298  0.27953884
   0.28560734  0.28571591  0.28558579  0.28545767  0.28428587]]
Epoch: 8617	Loss: 3.32379317284	Example Output: /2	Example Reward:  -0.3
[[ 0.04105001  0.04098257  0.06597681  0.06746459  0.06664371  0.06834602
   0.06660124  0.06873493  0.06889696  0.06790496  0.0646907   0.06825517
   0.04797009  0.04762989  0.04801948  0.04845113  0.05238179]]

Epoch: 8629	Loss: 3.32830715179	Example Output: X-	Example Reward:  1
[[ 0.0410553   0.04100065  0.06596002  0.06740688  0.06659401  0.06839881
   0.06663578  0.06857158  0.06872572  0.06796067  0.06494557  0.06846654
   0.0479211   0.04758084  0.04799609  0.04846934  0.052311  ]]
2.84677
[[ 0.95894468 -0.04100065 -0.06596002 -0.06740688 -0.06659401 -0.06839881
  -0.06663578 -0.06857158 -0.06872572 -0.06796067 -0.06494557 -0.06846654
  -0.0479211  -0.04758084 -0.04799609 -0.04846934 -0.052311  ]
 [-0.0410553  -0.04100065 -0.06596002 -0.06740688 -0.06659401 -0.06839881
  -0.06663578 -0.06857158 -0.06872572 -0.06796067 -0.06494557 -0.06846654
  -0.0479211   0.95241916 -0.04799609 -0.04846934 -0.052311  ]]
Epoch: 8630	Loss: 3.5833170414	Example Output: /0	Example Reward:  -0.3
[[ 0.04109572  0.04104045  0.06592288  0.06739236  0.06655858  0.06838451
   0.06663359  0.06852288  0.06870648  0.06800284  0.06489738  0.06846081
   0.04793344  0.04762099  0.0479825   0.04849833  0.05234626]]
4.0

Epoch: 8641	Loss: 3.17326552868	Example Output: XX	Example Reward:  -0.3
[[ 0.04131491  0.04115735  0.06588975  0.06718098  0.06651216  0.06817539
   0.06652185  0.06858875  0.06853658  0.06782517  0.06476604  0.06832803
   0.04811336  0.04784504  0.04816218  0.04859308  0.05248941]]
4.0905
[[-0.01239447  0.28765279  0.28023309  0.27984571  0.28004637  0.27954739
   0.28004345  0.27942339  0.27943903  0.27965245  0.28057021  0.27950162
   0.285566    0.2856465   0.28555137  0.28542209  0.28425318]
 [-0.01239447  0.28765279  0.28023309  0.27984571  0.28004637  0.27954739
   0.28004345  0.27942339  0.27943903  0.27965245  0.28057021  0.27950162
   0.285566    0.2856465   0.28555137  0.28542209  0.28425318]]
Epoch: 8642	Loss: 3.17114675045	Example Output: 3Y	Example Reward:  -0.3
[[ 0.04132118  0.04119322  0.06590696  0.06714982  0.06649753  0.06814568
   0.06648606  0.06854329  0.06852743  0.06784586  0.06477378  0.0683407
   0.04812158  0.0478611   0.04816828  0.04862985  0.05248774]]
4

Epoch: 8654	Loss: 3.19595167637	Example Output: 46	Example Reward:  1
[[ 0.04136565  0.04122003  0.06591457  0.06711303  0.06657109  0.06803048
   0.06641912  0.06851575  0.06841567  0.06769779  0.0649505   0.0681823
   0.04816503  0.04789512  0.0482733   0.04868519  0.05258534]]
2.80519
[[-0.04136565 -0.04122003 -0.06591457 -0.06711303 -0.06657109 -0.06803048
   0.93358088 -0.06851575 -0.06841567 -0.06769779 -0.0649505  -0.0681823
  -0.04816503 -0.04789512 -0.0482733  -0.04868519 -0.05258534]
 [-0.04136565 -0.04122003 -0.06591457 -0.06711303 -0.06657109 -0.06803048
  -0.06641912 -0.06851575  0.93158436 -0.06769779 -0.0649505  -0.0681823
  -0.04816503 -0.04789512 -0.0482733  -0.04868519 -0.05258534]]
Epoch: 8655	Loss: 2.93747544289	Example Output: 11	Example Reward:  1
[[ 0.0413388   0.04119095  0.06593398  0.06713698  0.06658432  0.06800722
   0.06645795  0.0685195   0.06842465  0.06770564  0.06497395  0.0682023
   0.04814589  0.04788535  0.04824024  0.04866078  0.05259145]]
2.80554
[

Epoch: 8667	Loss: 2.52748527527	Example Output: 47	Example Reward:  1
[[ 0.04135018  0.04130417  0.06591782  0.06695756  0.06648306  0.06806847
   0.06641602  0.06825797  0.06842884  0.06793313  0.06481183  0.06835323
   0.04815185  0.04788725  0.04820172  0.04870806  0.0527689 ]]
2.80558
[[-0.04135018 -0.04130417 -0.06591782 -0.06695756 -0.06648306 -0.06806847
   0.93358397 -0.06825797 -0.06842884 -0.06793313 -0.06481183 -0.06835323
  -0.04815185 -0.04788725 -0.04820172 -0.04870806 -0.0527689 ]
 [-0.04135018 -0.04130417 -0.06591782 -0.06695756 -0.06648306 -0.06806847
  -0.06641602 -0.06825797 -0.06842884  0.93206686 -0.06481183 -0.06835323
  -0.04815185 -0.04788725 -0.04820172 -0.04870806 -0.0527689 ]]
Epoch: 8668	Loss: 3.06954476833	Example Output: 1+	Example Reward:  1
[[ 0.04132538  0.04128595  0.06596153  0.06691061  0.06649054  0.06808797
   0.06643842  0.06822826  0.06844345  0.06803167  0.06479888  0.06840173
   0.04812238  0.04785481  0.04818242  0.04867372  0.05276225]]
2.822

Epoch: 8679	Loss: 3.45390655994	Example Output: 17	Example Reward:  1
[[ 0.04127784  0.04136786  0.06610072  0.06694517  0.06641565  0.06825645
   0.06635682  0.06793778  0.06853066  0.06804434  0.06481045  0.0683058
   0.04808899  0.04782332  0.04827139  0.04867744  0.05278931]]
2.80508
[[-0.04127784 -0.04136786 -0.06610072  0.9330548  -0.06641565 -0.06825645
  -0.06635682 -0.06793778 -0.06853066 -0.06804434 -0.06481045 -0.0683058
  -0.04808899 -0.04782332 -0.04827139 -0.04867744 -0.05278931]
 [-0.04127784 -0.04136786 -0.06610072 -0.06694517 -0.06641565 -0.06825645
  -0.06635682 -0.06793778 -0.06853066  0.93195564 -0.06481045 -0.0683058
  -0.04808899 -0.04782332 -0.04827139 -0.04867744 -0.05278931]]
Epoch: 8680	Loss: 3.32774913311	Example Output: 36	Example Reward:  1
[[ 0.04130149  0.04141051  0.06612373  0.06695105  0.06637324  0.0682696
   0.06632512  0.06788232  0.06848256  0.06804277  0.06480213  0.06828297
   0.04810561  0.04785781  0.04828145  0.04871124  0.05279634]]
2.80384
[

Epoch: 8692	Loss: 2.91620359421	Example Output: 2+	Example Reward:  1
[[ 0.04138653  0.04155487  0.06627275  0.06683969  0.06636234  0.06843492
   0.06614745  0.06757814  0.06839965  0.06815857  0.06481466  0.0681813
   0.04810266  0.04790401  0.04831464  0.04871977  0.052828  ]]
2.82305
[[-0.04138653 -0.04155487 -0.06627275 -0.06683969  0.93363768 -0.06843492
  -0.06614745 -0.06757814 -0.06839965 -0.06815857 -0.06481466 -0.0681813
  -0.04810266 -0.04790401 -0.04831464 -0.04871977 -0.052828  ]
 [-0.04138653 -0.04155487 -0.06627275 -0.06683969 -0.06636234 -0.06843492
  -0.06614745 -0.06757814 -0.06839965 -0.06815857 -0.06481466 -0.0681813
   0.95189732 -0.04790401 -0.04831464 -0.04871977 -0.052828  ]]
Epoch: 8693	Loss: 3.19729390144	Example Output: 5Y	Example Reward:  -0.3
[[ 0.04136099  0.04151571  0.06628185  0.06685113  0.06646936  0.06839314
   0.06617273  0.06762465  0.06841245  0.06815842  0.06479461  0.06815776
   0.04809954  0.04791103  0.04828199  0.04869219  0.05282241]]
4.098

Epoch: 8704	Loss: 2.91787416935	Example Output: 2+	Example Reward:  1
[[ 0.04143032  0.04153631  0.06611244  0.06668708  0.06650749  0.06830697
   0.06618511  0.06768236  0.06840526  0.06833737  0.06452322  0.06804955
   0.04816262  0.04800838  0.04835393  0.04873795  0.05297371]]
2.82298
[[-0.04143032 -0.04153631 -0.06611244 -0.06668708  0.93349254 -0.06830697
  -0.06618511 -0.06768236 -0.06840526 -0.06833737 -0.06452322 -0.06804955
  -0.04816262 -0.04800838 -0.04835393 -0.04873795 -0.05297371]
 [-0.04143032 -0.04153631 -0.06611244 -0.06668708 -0.06650749 -0.06830697
  -0.06618511 -0.06768236 -0.06840526 -0.06833737 -0.06452322 -0.06804955
   0.95183736 -0.04800838 -0.04835393 -0.04873795 -0.05297371]]
Epoch: 8705	Loss: 3.07011010647	Example Output: +0	Example Reward:  -0.3
[[ 0.04142134  0.04151962  0.0660869   0.06665189  0.06652632  0.06830244
   0.06621754  0.06772637  0.06841567  0.06831183  0.06447874  0.0680359
   0.04820017  0.04801508  0.04836799  0.04873207  0.05299005]]
4.1

Epoch: 8718	Loss: 2.93909070492	Example Output: 38	Example Reward:  1
[[ 0.04146395  0.04139015  0.06598336  0.06655814  0.06666452  0.06806676
   0.06635377  0.06803362  0.0684162   0.06804945  0.06464032  0.06795274
   0.04826641  0.04804874  0.04840301  0.04870025  0.05300852]]
2.80712
[[-0.04146395 -0.04139015 -0.06598336 -0.06655814 -0.06666452  0.93193322
  -0.06635377 -0.06803362 -0.0684162  -0.06804945 -0.06464032 -0.06795274
  -0.04826641 -0.04804874 -0.04840301 -0.04870025 -0.05300852]
 [-0.04146395 -0.04139015 -0.06598336 -0.06655814 -0.06666452 -0.06806676
  -0.06635377 -0.06803362 -0.0684162  -0.06804945  0.93535966 -0.06795274
  -0.04826641 -0.04804874 -0.04840301 -0.04870025 -0.05300852]]
Epoch: 8719	Loss: 3.45269649029	Example Output: -2	Example Reward:  -0.3
[[ 0.0414408   0.04135051  0.06597621  0.06657024  0.06668796  0.06806104
   0.06636999  0.0680602   0.0684458   0.06803786  0.06470361  0.06796021
   0.04825084  0.04804398  0.04838212  0.04867478  0.05298379]]
4.

Epoch: 8730	Loss: 3.19449548721	Example Output: 13	Example Reward:  1
[[ 0.04140349  0.04123025  0.0659634   0.06632996  0.06692262  0.06803964
   0.06638438  0.06818043  0.06865784  0.06811506  0.06471957  0.06795894
   0.04820221  0.04805141  0.04832707  0.04856734  0.05294642]]
2.80566
[[-0.04140349 -0.04123025 -0.0659634   0.93367004 -0.06692262 -0.06803964
  -0.06638438 -0.06818043 -0.06865784 -0.06811506 -0.06471957 -0.06795894
  -0.04820221 -0.04805141 -0.04832707 -0.04856734 -0.05294642]
 [-0.04140349 -0.04123025 -0.0659634  -0.06632996 -0.06692262  0.93196034
  -0.06638438 -0.06818043 -0.06865784 -0.06811506 -0.06471957 -0.06795894
  -0.04820221 -0.04805141 -0.04832707 -0.04856734 -0.05294642]]
Saving Weight
Epoch: 8731	Loss: 3.06863920689	Example Output: 84	Example Reward:  1
[[ 0.0413972   0.04121948  0.06595659  0.06633739  0.06691389  0.06810749
   0.06635693  0.06822603  0.06865306  0.06812538  0.06470493  0.0679592
   0.04818758  0.04802383  0.04835061  0.0485554   0.052

Epoch: 8744	Loss: 3.06815335751	Example Output: 98	Example Reward:  1
[[ 0.04135194  0.04110798  0.06598225  0.06647846  0.0668237   0.06835654
   0.06631368  0.06837617  0.06854565  0.06800497  0.06478505  0.06804291
   0.04809635  0.04798261  0.04839288  0.04846022  0.05289867]]
2.80668
[[-0.04135194 -0.04110798 -0.06598225 -0.06647846 -0.0668237  -0.06835654
  -0.06631368 -0.06837617 -0.06854565 -0.06800497 -0.06478505  0.93195707
  -0.04809635 -0.04798261 -0.04839288 -0.04846022 -0.05289867]
 [-0.04135194 -0.04110798 -0.06598225 -0.06647846 -0.0668237  -0.06835654
  -0.06631368 -0.06837617 -0.06854565 -0.06800497  0.93521494 -0.06804291
  -0.04809635 -0.04798261 -0.04839288 -0.04846022 -0.05289867]]
Epoch: 8745	Loss: 3.45462291241	Example Output: 8-	Example Reward:  1
[[ 0.04134678  0.04107308  0.06596312  0.06649075  0.06680577  0.0683401
   0.06634676  0.06841935  0.06850152  0.06797295  0.06488768  0.06810006
   0.04807556  0.04799416  0.04838192  0.0484198   0.05288063]]
2.8240

Epoch: 8756	Loss: 2.3796298027	Example Output: 2-	Example Reward:  1
[[ 0.04133146  0.04109036  0.06597089  0.06634609  0.067015    0.06825803
   0.06632798  0.06835271  0.06831905  0.06783435  0.06517703  0.06812728
   0.04815475  0.04803791  0.04845175  0.04836695  0.05283831]]
2.82241
[[-0.04133146 -0.04109036 -0.06597089 -0.06634609  0.93298501 -0.06825803
  -0.06632798 -0.06835271 -0.06831905 -0.06783435 -0.06517703 -0.06812728
  -0.04815475 -0.04803791 -0.04845175 -0.04836695 -0.05283831]
 [-0.04133146 -0.04109036 -0.06597089 -0.06634609 -0.067015   -0.06825803
  -0.06632798 -0.06835271 -0.06831905 -0.06783435 -0.06517703 -0.06812728
  -0.04815475  0.95196211 -0.04845175 -0.04836695 -0.05283831]]
Epoch: 8757	Loss: 2.63191456795	Example Output: 95	Example Reward:  1
2.8039
[[-0.04131135 -0.04106261 -0.06598567 -0.06631407 -0.06709796 -0.06823749
  -0.06632236 -0.0684045  -0.06831068 -0.06786232 -0.0651762   0.93189639
  -0.04814072 -0.04803809 -0.04844306 -0.04835187 -0.05283734]


Epoch: 8770	Loss: 2.65738296509	Example Output: 43	Example Reward:  1
2.8049
[[-0.04119995 -0.04090438 -0.06591973 -0.06625082 -0.06727443 -0.06827436
   0.9334209  -0.06858755 -0.06829213 -0.06792621 -0.06522354 -0.06811535
  -0.04812047 -0.04805457 -0.0482467  -0.04821043 -0.05282034]
 [-0.04119995 -0.04090438 -0.06591973 -0.06625082 -0.06727443  0.93172562
  -0.06657908 -0.06858755 -0.06829213 -0.06792621 -0.06522354 -0.06811535
  -0.04812047 -0.04805457 -0.0482467  -0.04821043 -0.05282034]]
Saving Weight
Epoch: 8771	Loss: 2.66237404346	Example Output: 0+	Example Reward:  1
[[ 0.04117538  0.0408631   0.06595032  0.06625603  0.06732636  0.06830964
   0.06662806  0.06862754  0.06831577  0.06790729  0.06521437  0.06810133
   0.04810398  0.04802369  0.04822275  0.04817045  0.05280399]]
2.82281
[[-0.04117538 -0.0408631   0.93404967 -0.06625603 -0.06732636 -0.06830964
  -0.06662806 -0.06862754 -0.06831577 -0.06790729 -0.06521437 -0.06810133
  -0.04810398 -0.04802369 -0.04822275 -0.0481704

Epoch: 8784	Loss: 2.91783676147	Example Output: 94	Example Reward:  1
[[ 0.04109524  0.04082466  0.06585546  0.06634159  0.06743719  0.06836817
   0.0667674   0.06852706  0.06828475  0.06798556  0.06517767  0.06819694
   0.04805802  0.04808374  0.04810296  0.04810757  0.05278602]]
2.80464
[[-0.04109524 -0.04082466 -0.06585546 -0.06634159 -0.06743719 -0.06836817
  -0.0667674  -0.06852706 -0.06828475 -0.06798556 -0.06517767  0.93180305
  -0.04805802 -0.04808374 -0.04810296 -0.04810757 -0.05278602]
 [-0.04109524 -0.04082466 -0.06585546 -0.06634159 -0.06743719 -0.06836817
   0.93323261 -0.06852706 -0.06828475 -0.06798556 -0.06517767 -0.06819694
  -0.04805802 -0.04808374 -0.04810296 -0.04810757 -0.05278602]]
Epoch: 8785	Loss: 3.19729571342	Example Output: 5	Example Reward:  1
[[ 0.04108615  0.04081534  0.06582989  0.06633618  0.06743991  0.06836769
   0.06680882  0.06853523  0.06828404  0.06798805  0.06517105  0.06818993
   0.04804604  0.04809366  0.04811499  0.04809644  0.05279658]]
2.8161

Epoch: 8798	Loss: 2.52604608536	Example Output: 89	Example Reward:  1
[[ 0.04120611  0.04100707  0.0660273   0.06614857  0.0673124   0.06838468
   0.06666588  0.06837525  0.06813172  0.0681521   0.06503859  0.06828168
   0.04821187  0.04804483  0.0481368   0.04813341  0.05274182]]
2.80606
[[-0.04120611 -0.04100707 -0.0660273  -0.06614857 -0.0673124  -0.06838468
  -0.06666588 -0.06837525 -0.06813172 -0.0681521   0.93496144 -0.06828168
  -0.04821187 -0.04804483 -0.0481368  -0.04813341 -0.05274182]
 [-0.04120611 -0.04100707 -0.0660273  -0.06614857 -0.0673124  -0.06838468
  -0.06666588 -0.06837525 -0.06813172 -0.0681521  -0.06503859  0.93171835
  -0.04821187 -0.04804483 -0.0481368  -0.04813341 -0.05274182]]
Epoch: 8799	Loss: 3.32794525623	Example Output: Y6	Example Reward:  -0.3
[[ 0.04120273  0.04099923  0.06607378  0.06611997  0.06731755  0.06836351
   0.06665827  0.06837357  0.06811721  0.06822015  0.06504058  0.06832945
   0.04820541  0.04803104  0.04810202  0.04812626  0.05271937]]
4.

Epoch: 8810	Loss: 3.19421396255	Example Output: 85	Example Reward:  1
[[ 0.04120245  0.04091147  0.06598604  0.06599572  0.06731061  0.0683958
   0.06663033  0.06851789  0.06809536  0.06823725  0.06517976  0.06838872
   0.0481689   0.04801849  0.04809253  0.04815825  0.05271045]]
2.80569
[[-0.04120245 -0.04091147 -0.06598604 -0.06599572 -0.06731061 -0.0683958
  -0.06663033 -0.06851789 -0.06809536 -0.06823725  0.93482023 -0.06838872
  -0.0481689  -0.04801849 -0.04809253 -0.04815825 -0.05271045]
 [-0.04120245 -0.04091147 -0.06598604 -0.06599572 -0.06731061 -0.0683958
  -0.06663033  0.93148208 -0.06809536 -0.06823725 -0.06517976 -0.06838872
  -0.0481689  -0.04801849 -0.04809253 -0.04815825 -0.05271045]]
Saving Weight
Epoch: 8811	Loss: 3.06392321587	Example Output: 21	Example Reward:  1
[[ 0.04117483  0.04086286  0.06597132  0.06600232  0.06731432  0.06839526
   0.06670048  0.06856989  0.06815089  0.06823508  0.06519524  0.06838259
   0.04813968  0.04800287  0.04807181  0.04813667  0.05269

Epoch: 8824	Loss: 3.45477428436	Example Output: 00	Example Reward:  1
[[ 0.0410214   0.04070093  0.06578401  0.06642985  0.06735385  0.06843045
   0.06670861  0.06872599  0.06845535  0.06835678  0.06507038  0.06819531
   0.04795641  0.04794273  0.04802179  0.0482016   0.05264462]]
2.80698
[[-0.0410214  -0.04070093  0.93421602 -0.06642985 -0.06735385 -0.06843045
  -0.06670861 -0.06872599 -0.06845535 -0.06835678 -0.06507038 -0.06819531
  -0.04795641 -0.04794273 -0.04802179 -0.0482016  -0.05264462]
 [-0.0410214  -0.04070093  0.93421602 -0.06642985 -0.06735385 -0.06843045
  -0.06670861 -0.06872599 -0.06845535 -0.06835678 -0.06507038 -0.06819531
  -0.04795641 -0.04794273 -0.04802179 -0.0482016  -0.05264462]]
Epoch: 8825	Loss: 3.0439892292	Example Output: 91	Example Reward:  1
[[ 0.04103508  0.04072622  0.06580565  0.06642274  0.06733263  0.0684386
   0.0666874   0.06869945  0.0684074   0.06831963  0.06512197  0.0681734
   0.04796777  0.04795465  0.04806349  0.04820663  0.05263728]]
2.80475


Epoch: 8838	Loss: 2.78632040024	Example Output: *+	Example Reward:  -0.3
[[ 0.04101191  0.04074835  0.06585131  0.06647474  0.06726477  0.06839134
   0.06666884  0.06864183  0.06838431  0.06833543  0.06523634  0.06825184
   0.04790397  0.04788082  0.04812601  0.0483206   0.05250758]]
4.09481
[[ 0.28769642  0.28777552  0.28024462  0.28005758  0.27982056  0.2794826
   0.27999935  0.27940747  0.27948472  0.27949938  0.28042912  0.27952445
   0.28562883  0.28563577 -0.0144378   0.28550383  0.28424773]
 [ 0.28769642  0.28777552  0.28024462  0.28005758  0.27982056  0.2794826
   0.27999935  0.27940747  0.27948472  0.27949938  0.28042912  0.27952445
  -0.01437119  0.28563577  0.28556222  0.28550383  0.28424773]]
Epoch: 8839	Loss: 2.93752076626	Example Output: 03	Example Reward:  1
[[ 0.04098928  0.0407228   0.06583927  0.06644697  0.06725435  0.06843326
   0.06670363  0.06868139  0.06838153  0.06835745  0.06525471  0.06827251
   0.04787866  0.04787692  0.04812356  0.04829042  0.05249332]]
2.80

Epoch: 8850	Loss: 3.32389261723	Example Output: +5	Example Reward:  -0.3
[[ 0.04105171  0.04076221  0.06571145  0.06649359  0.06707709  0.06851136
   0.06681025  0.06864741  0.06837816  0.06825223  0.06531557  0.06819211
   0.04783769  0.04789352  0.04822565  0.04829763  0.05254239]]
4.10013
[[ 0.2876845   0.28777134  0.28028658  0.28005195  0.27987689  0.2794466
   0.27995694  0.2794058   0.27948657  0.27952436  0.28040534  0.27954239
  -0.01435131  0.28563195  0.28553233  0.28551072  0.2842373 ]
 [ 0.2876845   0.28777134  0.28028658  0.28005195  0.27987689  0.2794466
   0.27995694 -0.02059422  0.27948657  0.27952436  0.28040534  0.27954239
   0.2856487   0.28563195  0.28553233  0.28551072  0.2842373 ]]
Saving Weight
Epoch: 8851	Loss: 3.32475893497	Example Output: 84	Example Reward:  1
[[ 0.04104993  0.04078031  0.06573402  0.06645503  0.06711777  0.06848121
   0.06684343  0.06860153  0.06837391  0.06827882  0.06529677  0.06816
   0.04783508  0.04790679  0.04823787  0.0482948   0.0525

Epoch: 8864	Loss: 3.3279355526	Example Output: -4	Example Reward:  -0.3
[[ 0.04101267  0.04075518  0.06563365  0.06635898  0.06729136  0.06861319
   0.06693509  0.06855899  0.06849608  0.06834618  0.06522638  0.06801485
   0.0477298   0.04791349  0.04820843  0.04827211  0.05263358]]
4.09976
[[ 0.28769621  0.28777346  0.28030992  0.28009233  0.2798126   0.27941605
   0.27991951  0.27943233  0.27945119  0.27949616  0.28043211  0.27959555
   0.28568107 -0.01437405  0.28553748  0.28551838  0.28420994]
 [ 0.28769621  0.28777346  0.28030992  0.28009233  0.2798126   0.27941605
  -0.02008053  0.27943233  0.27945119  0.27949616  0.28043211  0.27959555
   0.28568107  0.28562596  0.28553748  0.28551838  0.28420994]]
Epoch: 8865	Loss: 3.58183186054	Example Output: 5*	Example Reward:  1
[[ 0.04102953  0.04079413  0.0656137   0.06632087  0.06727251  0.06865112
   0.06689875  0.0685496   0.06847838  0.0683443   0.0652158   0.06800008
   0.04774495  0.04792357  0.04824089  0.0482798   0.05264205]]
2.8

Epoch: 8878	Loss: 3.19359762669	Example Output: X8	Example Reward:  -0.3
[[ 0.04113785  0.04095424  0.06558462  0.06624641  0.06697945  0.06870803
   0.06669842  0.06864615  0.06845438  0.06830887  0.06513824  0.06797316
   0.04782458  0.0480325   0.04825936  0.04840089  0.05265291]]
4.09718
[[-0.01234135  0.28771374  0.28032464  0.28012609  0.27990618  0.27938759
   0.27999049  0.27940616  0.27946371  0.27950734  0.28045854  0.27960807
   0.28565264  0.28559026  0.28552219  0.28547975  0.28420416]
 [ 0.28765866  0.28771374  0.28032464  0.28012609  0.27990618  0.27938759
   0.27999049  0.27940616  0.27946371  0.27950734 -0.01954147  0.27960807
   0.28565264  0.28559026  0.28552219  0.28547975  0.28420416]]
Epoch: 8879	Loss: 3.7098867178	Example Output: -	Example Reward:  -0.3
[[ 0.04113315  0.04095905  0.06556162  0.06626631  0.06700499  0.06871119
   0.06666799  0.06867629  0.06847288  0.06830921  0.06510878  0.06794368
   0.04782266  0.04803733  0.04826105  0.04840167  0.05266222]]
4

Epoch: 8890	Loss: 3.06630072594	Example Output: 6	Example Reward:  1
[[ 0.04116891  0.04100867  0.06560405  0.06648786  0.06706011  0.06867009
   0.06657378  0.0684754   0.06834047  0.06823193  0.06520396  0.06791832
   0.0478978   0.04809984  0.04818941  0.04839363  0.05267577]]
2.81653
[[-0.04116891 -0.04100867 -0.06560405 -0.06648786 -0.06706011 -0.06867009
  -0.06657378 -0.0684754   0.93165952 -0.06823193 -0.06520396 -0.06791832
  -0.0478978  -0.04809984 -0.04818941 -0.04839363 -0.05267577]
 [-0.04116891 -0.04100867 -0.06560405 -0.06648786 -0.06706011 -0.06867009
  -0.06657378 -0.0684754  -0.06834047 -0.06823193 -0.06520396 -0.06791832
  -0.0478978  -0.04809984 -0.04818941 -0.04839363  0.94732422]]
Saving Weight
Epoch: 8891	Loss: 2.78986742496	Example Output: 66	Example Reward:  1
[[ 0.04115846  0.04099296  0.06560531  0.06651136  0.06707149  0.06865651
   0.06657265  0.06847853  0.06835824  0.06823341  0.06517135  0.06792334
   0.04792138  0.0481044   0.0481635   0.04838708  0.052

Epoch: 8904	Loss: 3.32805147171	Example Output: /8	Example Reward:  -0.3
[[ 0.0411853   0.04104459  0.06579226  0.06656328  0.06699341  0.06845745
   0.06655929  0.06838691  0.06838456  0.06828696  0.0650732   0.06806671
   0.04799397  0.04806084  0.04804785  0.04845705  0.05264638]]
4.09966
[[ 0.28764442  0.28768665  0.28026232  0.28003103  0.27990198  0.27946278
   0.28003222  0.27948394  0.27948466  0.27951393  0.28047806  0.27958
   0.28560182  0.28558177  0.28558567 -0.01453712  0.28420609]
 [ 0.28764442  0.28768665  0.28026232  0.28003103  0.27990198  0.27946278
   0.28003222  0.27948394  0.27948466  0.27951393 -0.01952196  0.27958
   0.28560182  0.28558177  0.28558567  0.28546292  0.28420609]]
Epoch: 8905	Loss: 2.50552387238	Example Output: 6Y	Example Reward:  -0.3
[[ 0.04119619  0.04106706  0.06580701  0.06653941  0.06696901  0.06843818
   0.06655887  0.06839362  0.06838112  0.06830635  0.06504649  0.06806171
   0.04799879  0.04805537  0.048066    0.04846585  0.05264902]]
4.097

Epoch: 8918	Loss: 3.32573559284	Example Output: 57	Example Reward:  1
[[ 0.04119135  0.04100531  0.06595152  0.06659378  0.06696442  0.06835665
   0.06650603  0.06845268  0.06852295  0.06810745  0.0651578   0.06817981
   0.04800391  0.04805483  0.04802603  0.04834298  0.05258253]]
2.80356
[[-0.04119135 -0.04100531 -0.06595152 -0.06659378 -0.06696442 -0.06835665
  -0.06650603  0.93154734 -0.06852295 -0.06810745 -0.0651578  -0.06817981
  -0.04800391 -0.04805483 -0.04802603 -0.04834298 -0.05258253]
 [-0.04119135 -0.04100531 -0.06595152 -0.06659378 -0.06696442 -0.06835665
  -0.06650603 -0.06845268 -0.06852295  0.93189257 -0.0651578  -0.06817981
  -0.04800391 -0.04805483 -0.04802603 -0.04834298 -0.05258253]]
Epoch: 8919	Loss: 3.30003113747	Example Output: 01	Example Reward:  1
2.8066
[[-0.0411946  -0.04102585  0.93405902 -0.0665645  -0.06696683 -0.06835033
  -0.06647845 -0.06845749 -0.0685183  -0.06810811 -0.06513874 -0.0681705
  -0.04802927 -0.04805789 -0.04805633 -0.04835151 -0.05259042]


Epoch: 8932	Loss: 2.65696370602	Example Output: 0	Example Reward:  1
2.81838
[[-0.04123698 -0.04113841  0.93393105 -0.06637304 -0.06689026 -0.06866772
  -0.06632952 -0.06835201 -0.06854947 -0.06812157 -0.06501381 -0.06818402
  -0.04810473 -0.04798887 -0.0481597  -0.04826695 -0.05255406]
 [-0.04123698 -0.04113841 -0.06606893 -0.06637304 -0.06689026 -0.06866772
  -0.06632952 -0.06835201 -0.06854947 -0.06812157 -0.06501381 -0.06818402
  -0.04810473 -0.04798887 -0.0481597  -0.04826695  0.94744593]]
Epoch: 8933	Loss: 2.78230707645	Example Output: 17	Example Reward:  1
2.80513
[[-0.04120791 -0.0411224  -0.06610171  0.93366301 -0.066909   -0.06871189
  -0.0663542  -0.06835613 -0.06855026 -0.06816453 -0.06502467 -0.06817136
  -0.04808397 -0.04797141 -0.04814261 -0.04823978 -0.05255112]
 [-0.04120791 -0.0411224  -0.06610171 -0.06633699 -0.066909   -0.06871189
  -0.0663542  -0.06835613 -0.06855026  0.93183547 -0.06502467 -0.06817136
  -0.04808397 -0.04797141 -0.04814261 -0.04823978 -0.05255112]]

Epoch: 8947	Loss: 2.3804970026	Example Output: 3*	Example Reward:  1
[[ 0.041012    0.04097138  0.06627637  0.06638613  0.06709569  0.06871314
   0.06654296  0.06822152  0.06900286  0.06822398  0.06502008  0.06815514
   0.04792194  0.04786954  0.04804527  0.04804687  0.0524951 ]]
2.82052
[[-0.041012   -0.04097138 -0.06627637 -0.06638613 -0.06709569  0.93128687
  -0.06654296 -0.06822152 -0.06900286 -0.06822398 -0.06502008 -0.06815514
  -0.04792194 -0.04786954 -0.04804527 -0.04804687 -0.0524951 ]
 [-0.041012   -0.04097138 -0.06627637 -0.06638613 -0.06709569 -0.06871314
  -0.06654296 -0.06822152 -0.06900286 -0.06822398 -0.06502008 -0.06815514
  -0.04792194 -0.04786954  0.95195472 -0.04804687 -0.0524951 ]]
Epoch: 8948	Loss: 2.63417584896	Example Output: 57	Example Reward:  1
[[ 0.04103133  0.04097601  0.06629182  0.06635905  0.06710322  0.06870954
   0.06652037  0.06822577  0.0690298   0.0682196   0.06498416  0.0681412
   0.04794146  0.04786318  0.04806291  0.04805446  0.05248617]]
2.80337

Epoch: 8961	Loss: 3.17221133709	Example Output: **	Example Reward:  -0.3
[[ 0.0409864   0.04081612  0.06626867  0.06656239  0.06698981  0.06871329
   0.06668307  0.06811113  0.06917039  0.06813605  0.06519794  0.06852057
   0.04780243  0.04775849  0.04782824  0.0479889   0.05246613]]
4.09456
[[ 0.28770408  0.28775516  0.28011942  0.28003129  0.27990308  0.27938601
   0.27999508  0.27956668  0.27924889  0.2795592   0.28044063  0.27944386
   0.28565928  0.28567249 -0.01434847  0.28560334  0.28426015]
 [ 0.28770408  0.28775516  0.28011942  0.28003129  0.27990308  0.27938601
   0.27999508  0.27956668  0.27924889  0.2795592   0.28044063  0.27944386
   0.28565928  0.28567249 -0.01434847  0.28560334  0.28426015]]
Epoch: 8962	Loss: 2.93605456352	Example Output: 2	Example Reward:  1
[[ 0.04096717  0.04081635  0.06626567  0.06657812  0.0669992   0.06866867
   0.06666351  0.06808443  0.06919735  0.06819917  0.06522169  0.06852268
   0.04778567  0.04776703  0.04780895  0.04799705  0.05245734]]
2.8

Epoch: 8975	Loss: 2.91582918167	Example Output: 9-	Example Reward:  1
[[ 0.04105522  0.04103165  0.06626539  0.0665252   0.06681382  0.06853808
   0.06647221  0.06780866  0.06913314  0.06824227  0.06529844  0.06853468
   0.04788086  0.04796267  0.04783318  0.04809045  0.05251416]]
2.82076
[[-0.04105522 -0.04103165 -0.06626539 -0.0665252  -0.06681382 -0.06853808
  -0.06647221 -0.06780866 -0.06913314 -0.06824227 -0.06529844  0.93146533
  -0.04788086 -0.04796267 -0.04783318 -0.04809045 -0.05251416]
 [-0.04105522 -0.04103165 -0.06626539 -0.0665252  -0.06681382 -0.06853808
  -0.06647221 -0.06780866 -0.06913314 -0.06824227 -0.06529844 -0.06853468
  -0.04788086  0.95203733 -0.04783318 -0.04809045 -0.05251416]]
Epoch: 8976	Loss: 2.91150226593	Example Output: 67	Example Reward:  1
[[ 0.0410601   0.04104862  0.06628555  0.0664866   0.06679937  0.06855908
   0.06645674  0.06778207  0.06910376  0.06825636  0.06530809  0.06854906
   0.04787995  0.04797605  0.04783538  0.04808183  0.05253135]]
2.802

Epoch: 8987	Loss: 2.38020579815	Example Output: 84	Example Reward:  1
[[ 0.04098048  0.04107614  0.06619798  0.06702892  0.06666938  0.06858936
   0.06642792  0.06768404  0.06930329  0.0681344   0.06530317  0.06843004
   0.04787992  0.04794486  0.04786855  0.04809054  0.05239104]]
2.80685
[[-0.04098048 -0.04107614 -0.06619798 -0.06702892 -0.06666938 -0.06858936
  -0.06642792 -0.06768404 -0.06930329 -0.0681344   0.93469685 -0.06843004
  -0.04787992 -0.04794486 -0.04786855 -0.04809054 -0.05239104]
 [-0.04098048 -0.04107614 -0.06619798 -0.06702892 -0.06666938 -0.06858936
   0.93357205 -0.06768404 -0.06930329 -0.0681344  -0.06530317 -0.06843004
  -0.04787992 -0.04794486 -0.04786855 -0.04809054 -0.05239104]]
Epoch: 8988	Loss: 2.63320860863	Example Output: X2	Example Reward:  -0.3
[[ 0.04096876  0.04104779  0.06619082  0.06703392  0.06668704  0.0686176
   0.06644592  0.06770809  0.06934108  0.06812566  0.06530865  0.06839993
   0.04786622  0.04792823  0.04786342  0.04808035  0.05238659]]
4.0

Epoch: 8999	Loss: 3.58531401157	Example Output: 1*	Example Reward:  1
[[ 0.04113791  0.04121206  0.06617685  0.06696269  0.06653738  0.06861352
   0.06637762  0.06762855  0.06894756  0.06810227  0.06548177  0.06838724
   0.04785727  0.04808971  0.04794414  0.04809485  0.05244866]]
2.82212
[[-0.04113791 -0.04121206 -0.06617685  0.93303728 -0.06653738 -0.06861352
  -0.06637762 -0.06762855 -0.06894756 -0.06810227 -0.06548177 -0.06838724
  -0.04785727 -0.04808971 -0.04794414 -0.04809485 -0.05244866]
 [-0.04113791 -0.04121206 -0.06617685 -0.06696269 -0.06653738 -0.06861352
  -0.06637762 -0.06762855 -0.06894756 -0.06810227 -0.06548177 -0.06838724
  -0.04785727 -0.04808971  0.95205587 -0.04809485 -0.05244866]]
Epoch: 9000	Loss: 2.76305627823	Example Output: /	Example Reward:  -0.3
[[ 0.04116528  0.04124593  0.06617788  0.06695193  0.06651042  0.06861055
   0.06635185  0.06762452  0.06889708  0.06806022  0.06549744  0.06836957
   0.04788998  0.04811362  0.0479816   0.04810649  0.05244567]]
4.0

Epoch: 9011	Loss: 3.32942407131	Example Output: 6+	Example Reward:  1
[[ 0.04123688  0.04150812  0.06616195  0.06681763  0.0663121   0.06861471
   0.0662073   0.06741721  0.06889911  0.06806523  0.06542514  0.06832898
   0.04801882  0.04825889  0.04797779  0.04825461  0.0524956 ]]
2.82095
[[-0.04123688 -0.04150812 -0.06616195 -0.06681763 -0.0663121  -0.06861471
  -0.0662073  -0.06741721  0.9311009  -0.06806523 -0.06542514 -0.06832898
  -0.04801882 -0.04825889 -0.04797779 -0.04825461 -0.0524956 ]
 [-0.04123688 -0.04150812 -0.06616195 -0.06681763 -0.0663121  -0.06861471
  -0.0662073  -0.06741721 -0.06889911 -0.06806523 -0.06542514 -0.06832898
   0.95198119 -0.04825889 -0.04797779 -0.04825461 -0.0524956 ]]
Epoch: 9012	Loss: 3.19618554115	Example Output: -8	Example Reward:  -0.3
[[ 0.04124248  0.04153448  0.06618377  0.06678009  0.06630855  0.06860773
   0.06619026  0.06739623  0.06891546  0.06810783  0.06537558  0.06830956
   0.04804122  0.04825518  0.04798511  0.04826139  0.05250505]]
4.

Epoch: 9024	Loss: 2.93840148449	Example Output: 7*	Example Reward:  1
[[ 0.04130195  0.04167797  0.06619686  0.06658887  0.06622797  0.06851247
   0.06624103  0.0672553   0.0686332   0.06808916  0.06547364  0.06812283
   0.04810259  0.0483499   0.04824043  0.04840936  0.05257644]]
2.82162
[[-0.04130195 -0.04167797 -0.06619686 -0.06658887 -0.06622797 -0.06851247
  -0.06624103 -0.0672553  -0.0686332   0.93191081 -0.06547364 -0.06812283
  -0.04810259 -0.0483499  -0.04824043 -0.04840936 -0.05257644]
 [-0.04130195 -0.04167797 -0.06619686 -0.06658887 -0.06622797 -0.06851247
  -0.06624103 -0.0672553  -0.0686332  -0.06808916 -0.06547364 -0.06812283
  -0.04810259 -0.0483499   0.95175958 -0.04840936 -0.05257644]]
Epoch: 9025	Loss: 3.19523024559	Example Output: 35	Example Reward:  1
[[ 0.04128399  0.04165079  0.0662106   0.06658255  0.06623519  0.06853542
   0.06626974  0.06725835  0.06863548  0.06811517  0.06549834  0.06813522
   0.04807176  0.04832181  0.04824863  0.04837826  0.05256871]]
2.804

Epoch: 9036	Loss: 3.19724476337	Example Output: 40	Example Reward:  1
[[ 0.04123211  0.0416701   0.06642358  0.06650203  0.06628549  0.06886885
   0.06631263  0.06710827  0.06858106  0.06828059  0.06549548  0.06804941
   0.04792894  0.04812631  0.04833211  0.04830158  0.05250152]]
2.80677
[[-0.04123211 -0.0416701  -0.06642358 -0.06650203 -0.06628549 -0.06886885
   0.93368739 -0.06710827 -0.06858106 -0.06828059 -0.06549548 -0.06804941
  -0.04792894 -0.04812631 -0.04833211 -0.04830158 -0.05250152]
 [-0.04123211 -0.0416701   0.93357641 -0.06650203 -0.06628549 -0.06886885
  -0.06631263 -0.06710827 -0.06858106 -0.06828059 -0.06549548 -0.06804941
  -0.04792894 -0.04812631 -0.04833211 -0.04830158 -0.05250152]]
Epoch: 9037	Loss: 3.04574882984	Example Output: 75	Example Reward:  1
[[ 0.04122963  0.04167502  0.06642874  0.06648202  0.06629159  0.06885852
   0.06636135  0.06709388  0.06859218  0.06829292  0.06547718  0.06802584
   0.04792121  0.04812481  0.04834141  0.04829913  0.05250453]]
2.804

Epoch: 9048	Loss: 3.19867298603	Example Output: -Y	Example Reward:  -0.3
[[ 0.04107111  0.04148259  0.06642058  0.06677812  0.06634108  0.0685276
   0.06657843  0.06734235  0.06868046  0.06834724  0.06565472  0.06814779
   0.04786355  0.04814917  0.04814967  0.04815539  0.05231012]]
4.09281
[[ 0.28767869  0.28755525  0.28007385  0.27996656  0.28009769  0.27944174
   0.28002647  0.27979732  0.27939588  0.27949584  0.2803036   0.27955568
   0.28564095 -0.01444475  0.28555512  0.2855534   0.28430697]
 [ 0.28767869 -0.01244478  0.28007385  0.27996656  0.28009769  0.27944174
   0.28002647  0.27979732  0.27939588  0.27949584  0.2803036   0.27955568
   0.28564095  0.28555527  0.28555512  0.2855534   0.28430697]]
Epoch: 9049	Loss: 3.32743535042	Example Output: 1*	Example Reward:  1
[[ 0.04108921  0.04149558  0.06638852  0.06673936  0.06631951  0.06849239
   0.06657314  0.067345    0.06867294  0.06833459  0.06563979  0.06815053
   0.04791848  0.04816829  0.04818999  0.04816374  0.05231887]]
2.8

Epoch: 9060	Loss: 2.78560528755	Example Output: 86	Example Reward:  1
[[ 0.04108927  0.04139423  0.06636388  0.06694182  0.06628671  0.06847519
   0.06667838  0.06722984  0.06883565  0.06816984  0.06575815  0.06832977
   0.04780418  0.04813363  0.04819388  0.04804926  0.05226633]]
2.80503
[[-0.04108927 -0.04139423 -0.06636388 -0.06694182 -0.06628671 -0.06847519
  -0.06667838 -0.06722984 -0.06883565 -0.06816984  0.93424183 -0.06832977
  -0.04780418 -0.04813363 -0.04819388 -0.04804926 -0.05226633]
 [-0.04108927 -0.04139423 -0.06636388 -0.06694182 -0.06628671 -0.06847519
  -0.06667838 -0.06722984  0.93116438 -0.06816984 -0.06575815 -0.06832977
  -0.04780418 -0.04813363 -0.04819388 -0.04804926 -0.05226633]]
Saving Weight
Epoch: 9061	Loss: 3.04595522881	Example Output: 92	Example Reward:  1
[[ 0.04108577  0.04138957  0.06636974  0.06693503  0.06627619  0.06845723
   0.06671002  0.06721614  0.06883175  0.06816785  0.06577773  0.06832097
   0.04779094  0.04813939  0.04820216  0.04804325  0.05

Epoch: 9072	Loss: 2.24433791637	Example Output: 88	Example Reward:  1
[[ 0.04110392  0.04135673  0.06635562  0.06677438  0.06639437  0.06841646
   0.06670852  0.06717644  0.06858678  0.06824413  0.06601835  0.06836845
   0.04774903  0.04814234  0.04827878  0.04799188  0.05233382]]
2.80693
[[-0.04110392 -0.04135673 -0.06635562 -0.06677438 -0.06639437 -0.06841646
  -0.06670852 -0.06717644 -0.06858678 -0.06824413  0.93398166 -0.06836845
  -0.04774903 -0.04814234 -0.04827878 -0.04799188 -0.05233382]
 [-0.04110392 -0.04135673 -0.06635562 -0.06677438 -0.06639437 -0.06841646
  -0.06670852 -0.06717644 -0.06858678 -0.06824413  0.93398166 -0.06836845
  -0.04774903 -0.04814234 -0.04827878 -0.04799188 -0.05233382]]
Epoch: 9073	Loss: 3.19745249748	Example Output: *+	Example Reward:  -0.3
[[ 0.04107777  0.04130845  0.06638795  0.06681347  0.06639493  0.06840499
   0.06671502  0.06719793  0.06863175  0.06821476  0.06611007  0.06841385
   0.04771691  0.04811852  0.04825757  0.04794472  0.05229142]]
4.

Epoch: 9087	Loss: 2.65727310181	Example Output: 99	Example Reward:  1
[[ 0.04110814  0.0412018   0.06656801  0.06690093  0.06648149  0.06827907
   0.06675224  0.06725534  0.06860478  0.06794549  0.06635221  0.06830268
   0.04769369  0.04813003  0.04821111  0.04792856  0.05228449]]
2.80341
[[-0.04110814 -0.0412018  -0.06656801 -0.06690093 -0.06648149 -0.06827907
  -0.06675224 -0.06725534 -0.06860478 -0.06794549 -0.06635221  0.93169731
  -0.04769369 -0.04813003 -0.04821111 -0.04792856 -0.05228449]
 [-0.04110814 -0.0412018  -0.06656801 -0.06690093 -0.06648149 -0.06827907
  -0.06675224 -0.06725534 -0.06860478 -0.06794549 -0.06635221  0.93169731
  -0.04769369 -0.04813003 -0.04821111 -0.04792856 -0.05228449]]
Epoch: 9088	Loss: 3.32189595699	Example Output: 08	Example Reward:  1
[[ 0.04108589  0.04116555  0.06654968  0.06693713  0.06653477  0.06823854
   0.06679998  0.06728462  0.06864156  0.06791998  0.06634884  0.06832511
   0.04767264  0.04813455  0.04818099  0.04790351  0.05227665]]
2.806

Epoch: 9101	Loss: 2.78476486206	Example Output: 32	Example Reward:  1
[[ 0.0410847   0.04099063  0.06688379  0.06683939  0.0666829   0.06823596
   0.06673354  0.06754255  0.0687314   0.06768989  0.0665524   0.06831852
   0.04766841  0.04806524  0.04814557  0.04772209  0.05211307]]
2.80441
[[-0.0410847  -0.04099063 -0.06688379 -0.06683939 -0.0666829   0.93176407
  -0.06673354 -0.06754255 -0.0687314  -0.06768989 -0.0665524  -0.06831852
  -0.04766841 -0.04806524 -0.04814557 -0.04772209 -0.05211307]
 [-0.0410847  -0.04099063 -0.06688379 -0.06683939  0.93331707 -0.06823596
  -0.06673354 -0.06754255 -0.0687314  -0.06768989 -0.0665524  -0.06831852
  -0.04766841 -0.04806524 -0.04814557 -0.04772209 -0.05211307]]
Epoch: 9102	Loss: 2.78779397011	Example Output: 9/	Example Reward:  1
[[ 0.04107095  0.04097601  0.06690671  0.06681909  0.06673049  0.068265
   0.06673539  0.06751268  0.06873336  0.06768972  0.06658117  0.06833058
   0.0476454   0.04804378  0.0481444   0.04771088  0.05210443]]
2.82105

Epoch: 9113	Loss: 2.91862220764	Example Output: 46	Example Reward:  1
[[ 0.04104893  0.0409072   0.067054    0.06664836  0.06698974  0.06816709
   0.06674445  0.0677423   0.06872147  0.0677131   0.06650124  0.06824933
   0.04760856  0.04799222  0.04803794  0.04777531  0.05209874]]
2.80389
[[-0.04104893 -0.0409072  -0.067054   -0.06664836 -0.06698974 -0.06816709
   0.93325555 -0.0677423  -0.06872147 -0.0677131  -0.06650124 -0.06824933
  -0.04760856 -0.04799222 -0.04803794 -0.04777531 -0.05209874]
 [-0.04104893 -0.0409072  -0.067054   -0.06664836 -0.06698974 -0.06816709
  -0.06674445 -0.0677423   0.93127853 -0.0677131  -0.06650124 -0.06824933
  -0.04760856 -0.04799222 -0.04803794 -0.04777531 -0.05209874]]
Epoch: 9114	Loss: 3.0693236351	Example Output: Y0	Example Reward:  -0.3
[[ 0.04105453  0.04091848  0.06705914  0.06664082  0.0669766   0.06812945
   0.0667668   0.06772113  0.06874245  0.06770207  0.06647162  0.06822562
   0.04761365  0.04800795  0.04805499  0.04779406  0.05212068]]
4.0

Epoch: 9125	Loss: 2.78812346458	Example Output: X8	Example Reward:  -0.3
[[ 0.04105113  0.04087465  0.06728921  0.06669869  0.06714743  0.06793469
   0.06675374  0.06770559  0.06875627  0.06773056  0.06649455  0.06834692
   0.04758062  0.04786913  0.04804448  0.04772989  0.05199241]]
4.0972
[[-0.01231534  0.28773761  0.27981323  0.2799904   0.27985579  0.2796196
   0.27997389  0.27968833  0.27937314  0.27968085  0.28005165  0.27949592
   0.28572583  0.28563926  0.28558666  0.28568104  0.28440228]
 [ 0.28768468  0.28773761  0.27981323  0.2799904   0.27985579  0.2796196
   0.27997389  0.27968833  0.27937314  0.27968085 -0.01994837  0.27949592
   0.28572583  0.28563926  0.28558666  0.28568104  0.28440228]]
Epoch: 9126	Loss: 3.32378563881	Example Output: 6X	Example Reward:  -0.3
[[ 0.04107068  0.04089388  0.06732994  0.06667298  0.06714552  0.06792925
   0.06672571  0.06769127  0.06872372  0.06773377  0.06646634  0.06837299
   0.04760552  0.04786353  0.04803618  0.04774607  0.05199265]]
4.

Epoch: 9140	Loss: 2.65793411732	Example Output: 1/	Example Reward:  1
2.82205
[[-0.04111033 -0.04082759 -0.06743737  0.93333137 -0.06711949 -0.06757807
  -0.06677369 -0.06773239 -0.06890132 -0.06767093 -0.06643124 -0.0684982
  -0.0477313  -0.04782233 -0.04797997 -0.04777186 -0.05194535]
 [-0.04111033 -0.04082759 -0.06743737 -0.06666863 -0.06711949 -0.06757807
  -0.06677369 -0.06773239 -0.06890132 -0.06767093 -0.06643124 -0.0684982
  -0.0477313  -0.04782233 -0.04797997  0.95222813 -0.05194535]]
Saving Weight
Epoch: 9141	Loss: 3.32420270443	Example Output: 66	Example Reward:  1
[[ 0.04111243  0.04083019  0.06743669  0.06667893  0.06708707  0.06757873
   0.06675657  0.06775223  0.06890599  0.06770296  0.06638677  0.06849398
   0.0477316   0.04784278  0.04796552  0.04779097  0.05194656]]
2.8021
[[-0.04111243 -0.04083019 -0.06743669 -0.06667893 -0.06708707 -0.06757873
  -0.06675657 -0.06775223  0.93109399 -0.06770296 -0.06638677 -0.06849398
  -0.0477316  -0.04784278 -0.04796552 -0.04779097 

Epoch: 9154	Loss: 3.06477620602	Example Output: /-	Example Reward:  -0.3
[[ 0.0410924   0.04088366  0.06737336  0.06672073  0.06729255  0.06734954
   0.0666479   0.06769923  0.06879473  0.06769768  0.06651983  0.06851774
   0.04775469  0.04789005  0.04797936  0.04785765  0.05192888]]
4.09462
[[ 0.28767228  0.28773493  0.27978802  0.27998379  0.27981225  0.27979514
   0.28000563  0.27969024  0.27936161  0.27969071  0.28004405  0.27944469
   0.28567359  0.285633    0.28560621 -0.01435729  0.28442135]
 [ 0.28767228  0.28773493  0.27978802  0.27998379  0.27981225  0.27979514
   0.28000563  0.27969024  0.27936161  0.27969071  0.28004405  0.27944469
   0.28567359 -0.01436702  0.28560621  0.28564271  0.28442135]]
Epoch: 9155	Loss: 3.32367215157	Example Output: 58	Example Reward:  1
[[ 0.0410774   0.04088713  0.06736412  0.06673077  0.06731191  0.06731587
   0.06665764  0.06771083  0.06881556  0.0677007   0.06650698  0.06851456
   0.04776371  0.0478856   0.04796638  0.04786377  0.05192718]]
2.

Epoch: 9168	Loss: 3.1740850687	Example Output: -	Example Reward:  -0.3
[[ 0.04099554  0.04073656  0.06737603  0.06668972  0.06756243  0.06720636
   0.06684627  0.06774341  0.06877689  0.0675096   0.06683536  0.06848907
   0.04772412  0.04784413  0.04794058  0.04774919  0.0519748 ]]
4.09577
[[ 0.28770134  0.28777903  0.27978721  0.27999309  0.27973127  0.27983809
   0.27994615  0.27967697  0.27936694  0.27974713  0.2799494   0.27945328
   0.28568277 -0.01435324  0.28561786  0.28567526  0.28440759]
 [ 0.28770134  0.28777903  0.27978721  0.27999309  0.27973127  0.27983809
   0.27994615  0.27967697  0.27936694  0.27974713  0.2799494   0.27945328
   0.28568277  0.28564677  0.28561786  0.28567526 -0.01559244]]
Epoch: 9169	Loss: 3.04101026058	Example Output: 60	Example Reward:  1
[[ 0.04100987  0.04076205  0.06736679  0.06665505  0.06757108  0.06718899
   0.06684709  0.06773822  0.06879525  0.06750304  0.06680418  0.06846327
   0.0477439   0.04785183  0.047961    0.04775831  0.05198006]]
2.80

Epoch: 9180	Loss: 3.19758908749	Example Output: 97	Example Reward:  1
[[ 0.04093     0.04072532  0.06768846  0.06630946  0.0677612   0.06714165
   0.0669034   0.06774081  0.06878978  0.06764388  0.06701227  0.06841052
   0.04772256  0.04781681  0.04782374  0.04766416  0.051916  ]]
2.80316
[[-0.04093    -0.04072532 -0.06768846 -0.06630946 -0.0677612  -0.06714165
  -0.0669034  -0.06774081 -0.06878978 -0.06764388 -0.06701227  0.93158948
  -0.04772256 -0.04781681 -0.04782374 -0.04766416 -0.051916  ]
 [-0.04093    -0.04072532 -0.06768846 -0.06630946 -0.0677612  -0.06714165
  -0.0669034  -0.06774081 -0.06878978  0.93235612 -0.06701227 -0.06841052
  -0.04772256 -0.04781681 -0.04782374 -0.04766416 -0.051916  ]]
Saving Weight
Epoch: 9181	Loss: 2.50686297417	Example Output: 0/	Example Reward:  1
[[ 0.0409227   0.0407455   0.06770279  0.06632154  0.06774452  0.06714429
   0.06690451  0.06770067  0.06878414  0.06766183  0.06702465  0.06841043
   0.04771519  0.04782473  0.04781137  0.04767356  0.05

Epoch: 9192	Loss: 3.07009081841	Example Output: 7+	Example Reward:  1
[[ 0.04087152  0.04067001  0.06779336  0.06643106  0.06785966  0.06707312
   0.06689387  0.06781735  0.06903812  0.06770863  0.06688465  0.06830503
   0.04767875  0.04771055  0.0477412   0.04768107  0.05184211]]
2.82102
[[-0.04087152 -0.04067001 -0.06779336 -0.06643106 -0.06785966 -0.06707312
  -0.06689387 -0.06781735 -0.06903812  0.93229139 -0.06688465 -0.06830503
  -0.04767875 -0.04771055 -0.0477412  -0.04768107 -0.05184211]
 [-0.04087152 -0.04067001 -0.06779336 -0.06643106 -0.06785966 -0.06707312
  -0.06689387 -0.06781735 -0.06903812 -0.06770863 -0.06688465 -0.06830503
   0.95232123 -0.04771055 -0.0477412  -0.04768107 -0.05184211]]
Epoch: 9193	Loss: 3.32317061424	Example Output: -1	Example Reward:  -0.3
[[ 0.0408502   0.04066532  0.06783286  0.06640958  0.06791463  0.06704253
   0.06692988  0.06782109  0.06903493  0.06771631  0.0668759   0.0682898
   0.047691    0.04771413  0.04772933  0.04765655  0.05182594]]
4.0

Epoch: 9204	Loss: 2.78475656509	Example Output: 34	Example Reward:  1
[[ 0.0410041   0.04071323  0.06764376  0.06649683  0.06771508  0.06690178
   0.06688505  0.06798074  0.06890555  0.06754443  0.06692807  0.0681497
   0.04778999  0.04783298  0.04779979  0.0477699   0.05193905]]
2.80492
[[-0.0410041  -0.04071323 -0.06764376 -0.06649683 -0.06771508  0.9330982
  -0.06688505 -0.06798074 -0.06890555 -0.06754443 -0.06692807 -0.0681497
  -0.04778999 -0.04783298 -0.04779979 -0.0477699  -0.05193905]
 [-0.0410041  -0.04071323 -0.06764376 -0.06649683 -0.06771508 -0.06690178
   0.93311495 -0.06798074 -0.06890555 -0.06754443 -0.06692807 -0.0681497
  -0.04778999 -0.04783298 -0.04779979 -0.0477699  -0.05193905]]
Epoch: 9205	Loss: 3.1975710392	Example Output: -4	Example Reward:  -0.3
[[ 0.04099758  0.04072171  0.06765119  0.06655249  0.06769021  0.06698872
   0.06686056  0.0679531   0.06888191  0.06751683  0.06695747  0.06812197
   0.04777578  0.04783765  0.04779137  0.04778035  0.05192114]]
4.09952

Epoch: 9216	Loss: 3.45280554295	Example Output: 5/	Example Reward:  1
[[ 0.04107599  0.04077519  0.06766652  0.06636076  0.06757403  0.06728429
   0.06686601  0.06783137  0.06868589  0.0674374   0.0671939   0.06816555
   0.0477317   0.04784667  0.04793947  0.04767332  0.05189198]]
2.82122
[[-0.04107599 -0.04077519 -0.06766652 -0.06636076 -0.06757403 -0.06728429
  -0.06686601  0.9321686  -0.06868589 -0.0674374  -0.0671939  -0.06816555
  -0.0477317  -0.04784667 -0.04793947 -0.04767332 -0.05189198]
 [-0.04107599 -0.04077519 -0.06766652 -0.06636076 -0.06757403 -0.06728429
  -0.06686601 -0.06783137 -0.06868589 -0.0674374  -0.0671939  -0.06816555
  -0.0477317  -0.04784667 -0.04793947  0.95232666 -0.05189198]]
Epoch: 9217	Loss: 3.30389714241	Example Output: *0	Example Reward:  -0.3
[[ 0.04110095  0.04078454  0.0676676   0.06633102  0.06755134  0.06725805
   0.06684507  0.06785049  0.06865676  0.06739576  0.06721651  0.06814449
   0.04776231  0.04788206  0.04795873  0.04769666  0.05189767]]
4.

Epoch: 9230	Loss: 3.32594387531	Example Output: 74	Example Reward:  1
[[ 0.04125634  0.04095824  0.06766535  0.06618895  0.06754858  0.0671678
   0.06684268  0.06770027  0.06846741  0.06733397  0.06711025  0.06806245
   0.04785765  0.04798454  0.04811534  0.04778072  0.05195947]]
2.80503
[[-0.04125634 -0.04095824 -0.06766535 -0.06618895 -0.06754858 -0.0671678
  -0.06684268 -0.06770027 -0.06846741  0.932666   -0.06711025 -0.06806245
  -0.04785765 -0.04798454 -0.04811534 -0.04778072 -0.05195947]
 [-0.04125634 -0.04095824 -0.06766535 -0.06618895 -0.06754858 -0.0671678
   0.93315732 -0.06770027 -0.06846741 -0.06733397 -0.06711025 -0.06806245
  -0.04785765 -0.04798454 -0.04811534 -0.04778072 -0.05195947]]
Saving Weight
Epoch: 9231	Loss: 3.06795623302	Example Output: 3	Example Reward:  1
[[ 0.04127207  0.04095626  0.06762662  0.06615481  0.0675512   0.06714012
   0.06690579  0.06767872  0.06846472  0.06736025  0.06707278  0.0681223
   0.04786691  0.04798356  0.04810136  0.04776825  0.0519743

Epoch: 9244	Loss: 3.32371866703	Example Output: 14	Example Reward:  1
[[ 0.04124324  0.04087258  0.06746627  0.06635365  0.06730272  0.06715568
   0.06698476  0.06776949  0.06856608  0.06745184  0.06700005  0.06832475
   0.0478073   0.04805276  0.04797069  0.04766489  0.05201317]]
2.80555
[[-0.04124324 -0.04087258 -0.06746627  0.93364632 -0.06730272 -0.06715568
  -0.06698476 -0.06776949 -0.06856608 -0.06745184 -0.06700005 -0.06832475
  -0.0478073  -0.04805276 -0.04797069 -0.04766489 -0.05201317]
 [-0.04124324 -0.04087258 -0.06746627 -0.06635365 -0.06730272 -0.06715568
   0.93301523 -0.06776949 -0.06856608 -0.06745184 -0.06700005 -0.06832475
  -0.0478073  -0.04805276 -0.04797069 -0.04766489 -0.05201317]]
Epoch: 9245	Loss: 3.19769289494	Example Output: 17	Example Reward:  1
[[ 0.04124478  0.04089414  0.06748948  0.06635299  0.06727719  0.06713133
   0.06699628  0.06773879  0.0685801   0.06748638  0.06695659  0.06833194
   0.04783213  0.04805554  0.04793975  0.04767036  0.05202216]]
2.805

Epoch: 9258	Loss: 2.78841350079	Example Output: -Y	Example Reward:  -0.3
[[ 0.04112787  0.04082925  0.06745356  0.06625473  0.06732385  0.06700841
   0.06711472  0.06776837  0.06859112  0.0676219   0.0669463   0.06828113
   0.04792597  0.04815151  0.04789722  0.04764587  0.05205825]]
4.09235
[[ 0.28766164  0.28775123  0.27976394  0.28012359  0.27980286  0.27989751
   0.27986559  0.27966952  0.27942267  0.27971345  0.27991614  0.27951568
   0.28562224 -0.01444545  0.28563085  0.28570625  0.28438255]
 [ 0.28766164 -0.01224877  0.27976394  0.28012359  0.27980286  0.27989751
   0.27986559  0.27966952  0.27942267  0.27971345  0.27991614  0.27951568
   0.28562224  0.28555456  0.28563085  0.28570625  0.28438255]]
Epoch: 9259	Loss: 3.06807775497	Example Output: 6X	Example Reward:  -0.3
[[ 0.04110857  0.04080723  0.06747768  0.06621724  0.06736046  0.06702761
   0.06711144  0.06779629  0.06856306  0.06762022  0.06698831  0.06824831
   0.04793296  0.04813562  0.04791857  0.04762961  0.05205675]]

Epoch: 9270	Loss: 3.04463214874	Example Output: /*	Example Reward:  -0.3
[[ 0.04113255  0.0407463   0.0674298   0.06633529  0.06742342  0.06692851
   0.0672015   0.06779405  0.0686525   0.06766486  0.06692796  0.06824178
   0.04784523  0.04817254  0.04784237  0.04760651  0.05205485]]
4.09452
[[ 0.28766024  0.28777611  0.27977109  0.28009942  0.279773    0.27992147
   0.27983958  0.27966177  0.27940425  0.27970055  0.27992162  0.27952749
   0.28564644  0.28554824  0.2856473  -0.01428195  0.28438354]
 [ 0.28766024  0.28777611  0.27977109  0.28009942  0.279773    0.27992147
   0.27983958  0.27966177  0.27940425  0.27970055  0.27992162  0.27952749
   0.28564644  0.28554824 -0.01435271  0.28571805  0.28438354]]
Saving Weight
Epoch: 9271	Loss: 3.06419363022	Example Output: /*	Example Reward:  -0.3
[[ 0.04112962  0.04075184  0.06746089  0.06632476  0.06740857  0.06693364
   0.06716651  0.06779976  0.06869093  0.06770792  0.06688821  0.06822979
   0.04785164  0.04815076  0.04784659  0.04761888

Epoch: 9284	Loss: 2.63429074287	Example Output: 93	Example Reward:  1
[[ 0.04101439  0.04057551  0.06737733  0.06638375  0.06753651  0.06698146
   0.06724542  0.06800626  0.06881737  0.06788767  0.06681436  0.06846573
   0.04768761  0.04802138  0.04767734  0.0475391   0.05196883]]
2.80356
[[-0.04101439 -0.04057551 -0.06737733 -0.06638375 -0.06753651 -0.06698146
  -0.06724542 -0.06800626 -0.06881737 -0.06788767 -0.06681436  0.93153429
  -0.04768761 -0.04802138 -0.04767734 -0.0475391  -0.05196883]
 [-0.04101439 -0.04057551 -0.06737733 -0.06638375 -0.06753651  0.93301857
  -0.06724542 -0.06800626 -0.06881737 -0.06788767 -0.06681436 -0.06846573
  -0.04768761 -0.04802138 -0.04767734 -0.0475391  -0.05196883]]
Epoch: 9285	Loss: 2.63201508522	Example Output: 95	Example Reward:  1
[[ 0.04101887  0.04058977  0.06738231  0.06635195  0.06752564  0.06701909
   0.06723434  0.0679861   0.06879343  0.06790722  0.06681041  0.06848838
   0.04768476  0.0480076   0.04769642  0.04753049  0.05197325]]
2.802

Epoch: 9298	Loss: 3.06932008266	Example Output: 3*	Example Reward:  1
[[ 0.04105536  0.04074173  0.06742433  0.06613978  0.067611    0.06700917
   0.06709355  0.06774846  0.06869045  0.06787994  0.06683309  0.06850788
   0.04774268  0.04802568  0.04777598  0.04766045  0.05206046]]
2.82173
[[-0.04105536 -0.04074173 -0.06742433 -0.06613978 -0.067611    0.93299085
  -0.06709355 -0.06774846 -0.06869045 -0.06787994 -0.06683309 -0.06850788
  -0.04774268 -0.04802568 -0.04777598 -0.04766045 -0.05206046]
 [-0.04105536 -0.04074173 -0.06742433 -0.06613978 -0.067611   -0.06700917
  -0.06709355 -0.06774846 -0.06869045 -0.06787994 -0.06683309 -0.06850788
  -0.04774268 -0.04802568  0.95222402 -0.04766045 -0.05206046]]
Epoch: 9299	Loss: 3.19724369049	Example Output: 9/	Example Reward:  1
[[ 0.04105651  0.0407283   0.06739325  0.06609747  0.06762809  0.06704292
   0.06710768  0.06777412  0.06867384  0.06788231  0.06684601  0.06850439
   0.04773318  0.04802135  0.0478011   0.04764241  0.05206709]]
2.820

Epoch: 9310	Loss: 3.06563589573	Example Output: 38	Example Reward:  1
[[ 0.04094539  0.04074073  0.06769245  0.06606886  0.06760607  0.06730962
   0.06713701  0.06783014  0.06866081  0.06779819  0.06695227  0.0685701
   0.04776087  0.04779027  0.04766802  0.04760894  0.05186024]]
2.80442
[[-0.04094539 -0.04074073 -0.06769245 -0.06606886 -0.06760607  0.93269038
  -0.06713701 -0.06783014 -0.06866081 -0.06779819 -0.06695227 -0.0685701
  -0.04776087 -0.04779027 -0.04766802 -0.04760894 -0.05186024]
 [-0.04094539 -0.04074073 -0.06769245 -0.06606886 -0.06760607 -0.06730962
  -0.06713701 -0.06783014 -0.06866081 -0.06779819  0.93304771 -0.0685701
  -0.04776087 -0.04779027 -0.04766802 -0.04760894 -0.05186024]]
Saving Weight
Epoch: 9311	Loss: 2.65479156971	Example Output: 18	Example Reward:  1
[[ 0.04093046  0.0407246   0.06770355  0.06609116  0.06757472  0.0673319
   0.06714804  0.06782627  0.06863771  0.06780682  0.06700702  0.06861448
   0.04774206  0.04777472  0.0476481   0.04758919  0.051849

Epoch: 9324	Loss: 2.65874149799	Example Output: 26	Example Reward:  1
[[ 0.04099605  0.04084242  0.067747    0.06637804  0.06730055  0.06742086
   0.06701922  0.067666    0.06848032  0.06753575  0.06718846  0.06840974
   0.04783815  0.04793012  0.04777445  0.0476305   0.05184235]]
2.80348
[[-0.04099605 -0.04084242 -0.067747   -0.06637804  0.93269944 -0.06742086
  -0.06701922 -0.067666   -0.06848032 -0.06753575 -0.06718846 -0.06840974
  -0.04783815 -0.04793012 -0.04777445 -0.0476305  -0.05184235]
 [-0.04099605 -0.04084242 -0.067747   -0.06637804 -0.06730055 -0.06742086
  -0.06701922 -0.067666    0.93151969 -0.06753575 -0.06718846 -0.06840974
  -0.04783815 -0.04793012 -0.04777445 -0.0476305  -0.05184235]]
Epoch: 9325	Loss: 2.80407681465	Example Output: 55	Example Reward:  1
[[ 0.04096553  0.04081     0.06780332  0.06639082  0.06738131  0.06742827
   0.06701677  0.0676653   0.06851921  0.06758537  0.06719915  0.06838623
   0.04780164  0.04789066  0.04773566  0.04761276  0.05180803]]
2.803

Epoch: 9338	Loss: 2.93796596527	Example Output: 02	Example Reward:  1
[[ 0.04096663  0.04076779  0.06785348  0.0665542   0.06728023  0.06771722
   0.06691887  0.06785996  0.06842167  0.06749564  0.06723714  0.06832546
   0.0478013   0.04787053  0.04764212  0.04751514  0.05177259]]
2.80379
[[-0.04096663 -0.04076779  0.93214655 -0.0665542  -0.06728023 -0.06771722
  -0.06691887 -0.06785996 -0.06842167 -0.06749564 -0.06723714 -0.06832546
  -0.0478013  -0.04787053 -0.04764212 -0.04751514 -0.05177259]
 [-0.04096663 -0.04076779 -0.06785348 -0.0665542   0.93271977 -0.06771722
  -0.06691887 -0.06785996 -0.06842167 -0.06749564 -0.06723714 -0.06832546
  -0.0478013  -0.04787053 -0.04764212 -0.04751514 -0.05177259]]
Epoch: 9339	Loss: 3.06466231346	Example Output: -8	Example Reward:  -0.3
[[ 0.04094197  0.0407383   0.06788122  0.06658763  0.06730682  0.06775857
   0.06693176  0.06788375  0.06847028  0.06748113  0.06723492  0.06828638
   0.04777721  0.04785882  0.04761494  0.04749291  0.05175339]]
4.

Epoch: 9350	Loss: 2.63212509155	Example Output: *+	Example Reward:  -0.3
[[ 0.04082291  0.04059312  0.06786833  0.06665999  0.0673937   0.06789304
   0.06688458  0.068175    0.06869055  0.0675411   0.06724904  0.06814169
   0.04770643  0.0477529   0.04765859  0.04734926  0.05161975]]
4.0942
[[ 0.28775313  0.28782207  0.27963951  0.28000203  0.27978191  0.27963209
   0.27993464  0.27954751  0.27939284  0.27973768  0.2798253   0.2795575
   0.28568807  0.28567412 -0.01429758  0.28579524  0.28451407]
 [ 0.28775313  0.28782207  0.27963951  0.28000203  0.27978191  0.27963209
   0.27993464  0.27954751  0.27939284  0.27973768  0.2798253   0.2795575
  -0.01431193  0.28567412  0.28570244  0.28579524  0.28451407]]
Saving Weight
Epoch: 9351	Loss: 3.19870796204	Example Output: *0	Example Reward:  -0.3
[[ 0.04081177  0.04057971  0.06789764  0.06665557  0.06737559  0.06792291
   0.06688198  0.06818257  0.06864297  0.06750327  0.06734879  0.06817224
   0.04769826  0.04776518  0.04762979  0.04732532  0

Epoch: 9364	Loss: 3.32477228642	Example Output: /5	Example Reward:  -0.3
[[ 0.04083011  0.04063743  0.06793043  0.06660145  0.06724165  0.06806944
   0.06680875  0.06798244  0.06845064  0.06748729  0.06755847  0.06835482
   0.04768544  0.04772256  0.04765841  0.04737003  0.05161057]]
4.09942
[[ 0.28775096  0.28780878  0.27962089  0.28001958  0.27982751  0.27957916
   0.27995738  0.27960527  0.27946481  0.27975383  0.27973247  0.27949357
   0.28569439  0.28568324  0.2857025  -0.01421101  0.28451684]
 [ 0.28775096  0.28780878  0.27962089  0.28001958  0.27982751  0.27957916
   0.27995738 -0.02039473  0.27946481  0.27975383  0.27973247  0.27949357
   0.28569439  0.28568324  0.2857025   0.28578901  0.28451684]]
Epoch: 9365	Loss: 3.45348129272	Example Output: 9*	Example Reward:  1
[[ 0.04085006  0.04066844  0.06789118  0.06661261  0.06721086  0.06809467
   0.06680798  0.06792368  0.06843049  0.06747779  0.06756756  0.0683673
   0.04767807  0.04774595  0.04767491  0.04737547  0.05162296]]
2.8

Epoch: 9378	Loss: 3.32372791767	Example Output: 2/	Example Reward:  1
[[ 0.04092432  0.04077913  0.06793651  0.0663748   0.06695427  0.06820969
   0.06671963  0.06795974  0.06826695  0.06744806  0.06780003  0.06819654
   0.0477225   0.04779784  0.04792156  0.04737232  0.05161609]]
2.82193
[[-0.04092432 -0.04077913 -0.06793651 -0.0663748   0.93304574 -0.06820969
  -0.06671963 -0.06795974 -0.06826695 -0.06744806 -0.06780003 -0.06819654
  -0.0477225  -0.04779784 -0.04792156 -0.04737232 -0.05161609]
 [-0.04092432 -0.04077913 -0.06793651 -0.0663748  -0.06695427 -0.06820969
  -0.06671963 -0.06795974 -0.06826695 -0.06744806 -0.06780003 -0.06819654
  -0.0477225  -0.04779784 -0.04792156  0.95262766 -0.05161609]]
Epoch: 9379	Loss: 2.9347878933	Example Output: 32	Example Reward:  1
[[ 0.04090488  0.04078074  0.06796418  0.06633427  0.06702436  0.06820451
   0.06671464  0.0679367   0.06824936  0.06750344  0.06779553  0.06818617
   0.04772658  0.04776878  0.04792488  0.04737848  0.05160255]]
2.8036

Epoch: 9392	Loss: 3.58486361504	Example Output: /+	Example Reward:  -0.3
[[ 0.04096201  0.04089781  0.0679591   0.06612121  0.06698889  0.0681809
   0.06657485  0.06789023  0.06817684  0.06760941  0.06769088  0.06806009
   0.04792047  0.04776971  0.04810563  0.0474195   0.05167252]]
4.09439
[[ 0.28771141  0.28773066  0.2796123   0.28016365  0.27990335  0.27954572
   0.28002754  0.27963296  0.27954695  0.27971718  0.27969277  0.27958199
   0.28562388  0.28566909  0.28556833 -0.01422585  0.28449824]
 [ 0.28771141  0.28773066  0.2796123   0.28016365  0.27990335  0.27954572
   0.28002754  0.27963296  0.27954695  0.27971718  0.27969277  0.27958199
  -0.01437614  0.28566909  0.28556833  0.28577417  0.28449824]]
Epoch: 9393	Loss: 3.30310130119	Example Output: 06	Example Reward:  1
[[ 0.04101749  0.04093068  0.06792917  0.06610353  0.06694386  0.06814022
   0.06655077  0.06785648  0.06817238  0.06759281  0.06765599  0.06803738
   0.04794504  0.04782217  0.04812904  0.04745201  0.051721  ]]
2.8

Epoch: 9404	Loss: 3.0444578886	Example Output: 07	Example Reward:  1
[[ 0.04108831  0.04107156  0.06782088  0.06608406  0.06697323  0.06815305
   0.06657102  0.06751437  0.06818712  0.06754216  0.06747626  0.06794018
   0.048011    0.04785397  0.04821193  0.04754522  0.05195568]]
2.80409
[[-0.04108831 -0.04107156  0.93217909 -0.06608406 -0.06697323 -0.06815305
  -0.06657102 -0.06751437 -0.06818712 -0.06754216 -0.06747626 -0.06794018
  -0.048011   -0.04785397 -0.04821193 -0.04754522 -0.05195568]
 [-0.04108831 -0.04107156 -0.06782088 -0.06608406 -0.06697323 -0.06815305
  -0.06657102 -0.06751437 -0.06818712  0.93245786 -0.06747626 -0.06794018
  -0.048011   -0.04785397 -0.04821193 -0.04754522 -0.05195568]]
Epoch: 9405	Loss: 3.19582550526	Example Output: 14	Example Reward:  1
[[ 0.04108295  0.04107767  0.06784886  0.06609212  0.06696091  0.06819264
   0.06657154  0.06749076  0.06818966  0.06753595  0.06747905  0.06790613
   0.04799899  0.04784007  0.04822657  0.04754279  0.05196339]]
2.8061

Epoch: 9418	Loss: 3.45296840668	Example Output: X0	Example Reward:  -0.3
[[ 0.0409838   0.04092938  0.06804113  0.066062    0.06714204  0.06815673
   0.06660599  0.06747312  0.06840288  0.06790609  0.06732322  0.06802354
   0.0477865   0.04759182  0.04817129  0.04746392  0.05193654]]
4.09748
[[-0.01229514  0.28772119  0.27958766  0.28018141  0.2798574   0.279553
   0.28001821  0.27975807  0.27947915  0.27962819  0.27980304  0.27959293
   0.28566408  0.28572246  0.28554863  0.28576085  0.28441906]
 [ 0.28770489  0.28772119 -0.02041234  0.28018141  0.2798574   0.279553
   0.28001821  0.27975807  0.27947915  0.27962819  0.27980304  0.27959293
   0.28566408  0.28572246  0.28554863  0.28576085  0.28441906]]
Epoch: 9419	Loss: 2.6575517416	Example Output: *	Example Reward:  -0.3
[[ 0.0409643   0.04092289  0.06803005  0.06609742  0.06710947  0.06817671
   0.0666322   0.06745632  0.06843048  0.06791372  0.06729585  0.06803606
   0.04778378  0.04760119  0.04815693  0.04746147  0.05193108]]
4.095

Epoch: 9430	Loss: 2.63383862972	Example Output: 0	Example Reward:  1
[[ 0.04099657  0.04093593  0.06801108  0.06621208  0.06708726  0.06820837
   0.06658736  0.06737112  0.06836964  0.0678793   0.06730382  0.06802572
   0.04774142  0.04765425  0.04813711  0.04751275  0.05196628]]
2.81678
[[-0.04099657 -0.04093593  0.93198889 -0.06621208 -0.06708726 -0.06820837
  -0.06658736 -0.06737112 -0.06836964 -0.0678793  -0.06730382 -0.06802572
  -0.04774142 -0.04765425 -0.04813711 -0.04751275 -0.05196628]
 [-0.04099657 -0.04093593 -0.06801108 -0.06621208 -0.06708726 -0.06820837
  -0.06658736 -0.06737112 -0.06836964 -0.0678793  -0.06730382 -0.06802572
  -0.04774142 -0.04765425 -0.04813711 -0.04751275  0.94803369]]
Saving Weight
Epoch: 9431	Loss: 2.94090363979	Example Output: 94	Example Reward:  1
[[ 0.04100744  0.04095088  0.06801419  0.06618267  0.06707011  0.06824827
   0.06655363  0.06736315  0.06835758  0.06785114  0.06732809  0.06798442
   0.04773985  0.04766843  0.04816694  0.04751596  0.051

Epoch: 9444	Loss: 2.91907389164	Example Output: 7-	Example Reward:  1
[[ 0.04086113  0.04083526  0.06806099  0.06614633  0.06727774  0.06800625
   0.06680116  0.06739222  0.06837516  0.06790401  0.06749031  0.06836967
   0.04763342  0.04758808  0.04785257  0.04742936  0.05197632]]
2.82098
[[-0.04086113 -0.04083526 -0.06806099 -0.06614633 -0.06727774 -0.06800625
  -0.06680116 -0.06739222 -0.06837516  0.932096   -0.06749031 -0.06836967
  -0.04763342 -0.04758808 -0.04785257 -0.04742936 -0.05197632]
 [-0.04086113 -0.04083526 -0.06806099 -0.06614633 -0.06727774 -0.06800625
  -0.06680116 -0.06739222 -0.06837516 -0.06790401 -0.06749031 -0.06836967
  -0.04763342  0.95241189 -0.04785257 -0.04742936 -0.05197632]]
Epoch: 9445	Loss: 3.04189109802	Example Output: 59	Example Reward:  1
2.80328
[[-0.04087817 -0.04084036 -0.06806056 -0.06611961 -0.06733006 -0.06796411
  -0.06678092  0.93262613 -0.06838001 -0.06793419 -0.06743859 -0.06836658
  -0.04765462 -0.0476028  -0.04783869 -0.0474423  -0.0519946 

Epoch: 9458	Loss: 3.45805721283	Example Output: ++	Example Reward:  -0.3
[[ 0.04090724  0.04080642  0.06794516  0.06632165  0.06741263  0.06786791
   0.06672838  0.06753581  0.06848852  0.06789749  0.06724959  0.0683549
   0.04764528  0.04762329  0.04771035  0.04749315  0.05201225]]
4.09428
[[ 0.28772783  0.28775808  0.27961645  0.2801035   0.27977622  0.27963963
   0.27998149  0.27973926  0.27945346  0.27963075  0.27982512  0.27949354
  -0.01429358  0.28571302  0.28568691  0.28575206  0.28439632]
 [ 0.28772783  0.28775808  0.27961645  0.2801035   0.27977622  0.27963963
   0.27998149  0.27973926  0.27945346  0.27963075  0.27982512  0.27949354
  -0.01429358  0.28571302  0.28568691  0.28575206  0.28439632]]
Epoch: 9459	Loss: 3.19337005615	Example Output: 92	Example Reward:  1
[[ 0.04092888  0.04082276  0.06792307  0.06636447  0.06738466  0.0678656
   0.06670055  0.06752805  0.06848105  0.06788594  0.06723505  0.06832614
   0.04763992  0.04762995  0.04772019  0.04754645  0.05201728]]
2.80

Epoch: 9470	Loss: 3.06955180168	Example Output: 37	Example Reward:  1
[[ 0.04095162  0.04084822  0.06802216  0.06647453  0.06738663  0.06783726
   0.06668815  0.06768769  0.06844167  0.06778379  0.0671051   0.06824624
   0.04761582  0.04761971  0.04769684  0.04762987  0.05196478]]
2.80341
[[-0.04095162 -0.04084822 -0.06802216 -0.06647453 -0.06738663  0.93216276
  -0.06668815 -0.06768769 -0.06844167 -0.06778379 -0.0671051  -0.06824624
  -0.04761582 -0.04761971 -0.04769684 -0.04762987 -0.05196478]
 [-0.04095162 -0.04084822 -0.06802216 -0.06647453 -0.06738663 -0.06783726
  -0.06668815 -0.06768769 -0.06844167  0.93221623 -0.0671051  -0.06824624
  -0.04761582 -0.04761971 -0.04769684 -0.04762987 -0.05196478]]
Saving Weight
Epoch: 9471	Loss: 3.19901514053	Example Output: 6/	Example Reward:  1
[[ 0.04095559  0.04084497  0.0680014   0.06643726  0.06739959  0.06789061
   0.06668315  0.06769935  0.06843093  0.06779628  0.06708426  0.06824458
   0.04760249  0.0476118   0.04770994  0.04763169  0.05

Epoch: 9484	Loss: 3.58138027191	Example Output: +X	Example Reward:  -0.3
[[ 0.04103751  0.04097166  0.06801915  0.0664462   0.06741419  0.06783656
   0.06676812  0.06755061  0.06838912  0.06762619  0.06682723  0.06812777
   0.04768857  0.04764917  0.04786929  0.04772316  0.05205553]]
4.09219
[[ 0.28768876  0.28770852  0.27959427  0.28006616  0.27977577  0.27964905
   0.27996957  0.27973482  0.27948329  0.27971217  0.27995184  0.2795617
  -0.01430657  0.28570527  0.28563923  0.28568307  0.28438336]
 [-0.01231125  0.28770852  0.27959427  0.28006616  0.27977577  0.27964905
   0.27996957  0.27973482  0.27948329  0.27971217  0.27995184  0.2795617
   0.28569344  0.28570527  0.28563923  0.28568307  0.28438336]]
Epoch: 9485	Loss: 3.19748892784	Example Output: 1-	Example Reward:  1
[[ 0.04105926  0.04099555  0.06799538  0.06644867  0.06738121  0.06781515
   0.0667555   0.06757092  0.06841591  0.06759251  0.06678522  0.06810075
   0.04770179  0.04767225  0.04789289  0.0477431   0.05207396]]
2.82

Epoch: 9498	Loss: 3.04441008568	Example Output: 49	Example Reward:  1
[[ 0.04096744  0.04083489  0.06793087  0.06647098  0.06738102  0.06768882
   0.06687757  0.06770403  0.06868543  0.06763444  0.06679963  0.06807777
   0.04763457  0.04767266  0.04778056  0.04775447  0.05210486]]
2.80403
[[-0.04096744 -0.04083489 -0.06793087 -0.06647098 -0.06738102 -0.06768882
   0.9331224  -0.06770403 -0.06868543 -0.06763444 -0.06679963 -0.06807777
  -0.04763457 -0.04767266 -0.04778056 -0.04775447 -0.05210486]
 [-0.04096744 -0.04083489 -0.06793087 -0.06647098 -0.06738102 -0.06768882
  -0.06687757 -0.06770403 -0.06868543 -0.06763444 -0.06679963  0.93192226
  -0.04763457 -0.04767266 -0.04778056 -0.04775447 -0.05210486]]
Epoch: 9499	Loss: 3.58282003403	Example Output: 71	Example Reward:  1
[[ 0.04097999  0.04085589  0.06789958  0.06646439  0.06736014  0.0676704
   0.06690219  0.06765816  0.06870005  0.06766221  0.06675387  0.06806357
   0.04763519  0.04771794  0.04779273  0.04776504  0.05211867]]
2.8046

Epoch: 9513	Loss: 3.06762835979	Example Output: 7	Example Reward:  1
[[ 0.04116881  0.04096745  0.06790335  0.06664018  0.06701087  0.06772606
   0.06680823  0.06773269  0.06866673  0.06742238  0.06665736  0.06812621
   0.04779691  0.04772773  0.04777296  0.04780682  0.05206524]]
2.81725
[[-0.04116881 -0.04096745 -0.06790335 -0.06664018 -0.06701087 -0.06772606
  -0.06680823 -0.06773269 -0.06866673  0.93257761 -0.06665736 -0.06812621
  -0.04779691 -0.04772773 -0.04777296 -0.04780682 -0.05206524]
 [-0.04116881 -0.04096745 -0.06790335 -0.06664018 -0.06701087 -0.06772606
  -0.06680823 -0.06773269 -0.06866673 -0.06742238 -0.06665736 -0.06812621
  -0.04779691 -0.04772773 -0.04777296 -0.04780682  0.94793475]]
Epoch: 9514	Loss: 2.50462260246	Example Output: 07	Example Reward:  1
[[ 0.04115701  0.04095276  0.06786674  0.06665863  0.06698471  0.06773525
   0.06683169  0.06774145  0.0686529   0.06742032  0.0666737   0.06815915
   0.04778085  0.04773724  0.04776629  0.04779227  0.05208905]]
2.8039

Epoch: 9525	Loss: 2.65493929386	Example Output: 13	Example Reward:  1
[[ 0.04104449  0.04090654  0.06790867  0.06671049  0.06708275  0.06760499
   0.06695071  0.06769586  0.06875746  0.06739593  0.06674626  0.06820901
   0.0477738   0.0476747   0.04766041  0.04783402  0.052044  ]]
2.80459
[[-0.04104449 -0.04090654 -0.06790867  0.93328953 -0.06708275 -0.06760499
  -0.06695071 -0.06769586 -0.06875746 -0.06739593 -0.06674626 -0.06820901
  -0.0477738  -0.0476747  -0.04766041 -0.04783402 -0.052044  ]
 [-0.04104449 -0.04090654 -0.06790867 -0.06671049 -0.06708275  0.93239498
  -0.06695071 -0.06769586 -0.06875746 -0.06739593 -0.06674626 -0.06820901
  -0.0477738  -0.0476747  -0.04766041 -0.04783402 -0.052044  ]]
Epoch: 9526	Loss: 3.07039439678	Example Output: 79	Example Reward:  1
[[ 0.04103613  0.04090286  0.06790765  0.06672318  0.06707856  0.0676326
   0.06696071  0.06769399  0.06876953  0.06743528  0.06670365  0.06820997
   0.04776609  0.0476675   0.04765418  0.04782395  0.05203423]]
2.8035

Epoch: 9537	Loss: 3.32389979362	Example Output: +8	Example Reward:  -0.3
[[ 0.0410502   0.0408609   0.06795157  0.06689131  0.06697766  0.06761445
   0.06709176  0.06759579  0.06896532  0.06722982  0.06664915  0.06816098
   0.04773645  0.04772703  0.04761238  0.04781642  0.0520689 ]]
4.09945
[[ 0.28768495  0.28774175  0.27961454  0.27993262  0.27990672  0.27971569
   0.27987248  0.27972129  0.27931041  0.27983108  0.28000528  0.27955171
  -0.01432094  0.2856819   0.2857163   0.28565508  0.28437933]
 [ 0.28768495  0.28774175  0.27961454  0.27993262  0.27990672  0.27971569
   0.27987248  0.27972129  0.27931041  0.27983108 -0.01999475  0.27955171
   0.28567907  0.2856819   0.2857163   0.28565508  0.28437933]]
Epoch: 9538	Loss: 3.17169475555	Example Output: 1Y	Example Reward:  -0.3
[[ 0.04106817  0.04089274  0.06796975  0.06690611  0.06695013  0.06762751
   0.06705168  0.0675526   0.06895217  0.06719538  0.06667079  0.06814796
   0.04774263  0.04772575  0.04763376  0.04785086  0.0520621 ]]

Epoch: 9551	Loss: 3.19473044872	Example Output: 69	Example Reward:  1
[[ 0.04107016  0.04090437  0.06802323  0.0670189   0.06704731  0.06740856
   0.0669542   0.06763986  0.0688871   0.06703657  0.06681287  0.06809776
   0.04785175  0.04780503  0.0475593   0.04793618  0.05194683]]
2.80267
[[-0.04107016 -0.04090437 -0.06802323 -0.0670189  -0.06704731 -0.06740856
  -0.0669542  -0.06763986  0.93111289 -0.06703657 -0.06681287 -0.06809776
  -0.04785175 -0.04780503 -0.0475593  -0.04793618 -0.05194683]
 [-0.04107016 -0.04090437 -0.06802323 -0.0670189  -0.06704731 -0.06740856
  -0.0669542  -0.06763986 -0.0688871  -0.06703657 -0.06681287  0.93190223
  -0.04785175 -0.04780503 -0.0475593  -0.04793618 -0.05194683]]
Epoch: 9552	Loss: 3.19670166969	Example Output: 81	Example Reward:  1
[[ 0.04106957  0.04088441  0.06799086  0.06704061  0.06703426  0.06740198
   0.06695949  0.06768215  0.068928    0.06698864  0.06683107  0.06809342
   0.04784527  0.04783186  0.04756928  0.04791152  0.05193764]]
2.804

Epoch: 9565	Loss: 3.17651383877	Example Output: -5	Example Reward:  -0.3
[[ 0.04102401  0.04078171  0.06797566  0.06731696  0.06713913  0.06725483
   0.06701221  0.0675071   0.06874155  0.06695227  0.06734369  0.06821001
   0.04772061  0.04786343  0.04732474  0.04789338  0.05193873]]
4.09964
[[ 0.28769282  0.2877655   0.27960733  0.27980492  0.27985826  0.27982357
   0.27989635  0.27974787  0.27937755  0.27991432  0.2797969   0.27953702
   0.28568384 -0.01435903  0.2858026   0.28563198  0.2844184 ]
 [ 0.28769282  0.2877655   0.27960733  0.27980492  0.27985826  0.27982357
   0.27989635 -0.02025213  0.27937755  0.27991432  0.2797969   0.27953702
   0.28568384  0.28564098  0.2858026   0.28563198  0.2844184 ]]
Epoch: 9566	Loss: 3.19783735275	Example Output: 2/	Example Reward:  1
[[ 0.04104652  0.04079111  0.0679464   0.06732299  0.06711046  0.06724293
   0.06700767  0.06749538  0.06872803  0.0669551   0.06734273  0.06822767
   0.04772362  0.04787764  0.04731765  0.04791017  0.05195391]]
2.

Epoch: 9577	Loss: 3.45159320831	Example Output: 5X	Example Reward:  -0.3
[[ 0.04097419  0.04078854  0.06809836  0.06716944  0.06727689  0.06731199
   0.06704663  0.0672841   0.0687522   0.06699281  0.06745293  0.0681982
   0.04769628  0.04777804  0.04723137  0.04798909  0.05195898]]
4.09724
[[ 0.28770775  0.28776345  0.27957049  0.27984917  0.27981696  0.27980641
   0.27988601 -0.02018523  0.27937436  0.27990216  0.27976415  0.27954054
   0.28569111  0.28566661  0.28583059  0.28560328  0.28441232]
 [-0.01229226  0.28776345  0.27957049  0.27984917  0.27981696  0.27980641
   0.27988601  0.27981478  0.27937436  0.27990216  0.27976415  0.27954054
   0.28569111  0.28566661  0.28583059  0.28560328  0.28441232]]
Epoch: 9578	Loss: 3.17274162769	Example Output: +3	Example Reward:  -0.3
[[ 0.04097428  0.04080287  0.06811078  0.06714988  0.06727678  0.06733251
   0.06702812  0.06728823  0.06875519  0.06698325  0.06743967  0.06818902
   0.04771637  0.04777302  0.04723002  0.047997    0.05195295]]


Epoch: 9589	Loss: 3.45606946945	Example Output: +0	Example Reward:  -0.3
[[ 0.0411154   0.04092156  0.06805006  0.06706927  0.06724095  0.06716695
   0.06696209  0.06719417  0.06857444  0.0669038   0.06739868  0.06809881
   0.04788272  0.04782334  0.04728895  0.04830327  0.05200554]]
4.09989
[[ 0.2876654   0.28772354  0.279585    0.27987921  0.27982771  0.27984995
   0.27991137  0.27984175  0.27942768  0.27992886  0.27978042  0.27957037
  -0.01436482  0.285653    0.28581333  0.28550905  0.28439835]
 [ 0.2876654   0.28772354 -0.02041502  0.27987921  0.27982771  0.27984995
   0.27991137  0.27984175  0.27942768  0.27992886  0.27978042  0.27957037
   0.2856352   0.285653    0.28581333  0.28550905  0.28439835]]
Epoch: 9590	Loss: 2.93694932461	Example Output: 6*	Example Reward:  1
[[ 0.0411095   0.04091703  0.06805727  0.06704039  0.06724372  0.06721634
   0.06699876  0.06720465  0.06855608  0.06689461  0.06741058  0.06808256
   0.04787621  0.04781409  0.04729343  0.04827864  0.05200619]]
2.

Epoch: 9603	Loss: 2.91318206787	Example Output: +3	Example Reward:  -0.3
4.09947
[[ 0.28771421  0.28779501  0.27955982  0.27989376  0.27978382  0.27981076
   0.27983043  0.27973559  0.27935529  0.27988207  0.2798126   0.27957073
  -0.01430906  0.28573141  0.28581902  0.28557083  0.28444394]
 [ 0.28771421  0.28779501  0.27955982  0.27989376  0.27978382 -0.02018925
   0.27983043  0.27973559  0.27935529  0.27988207  0.2798126   0.27957073
   0.28569096  0.28573141  0.28581902  0.28557083  0.28444394]]
Epoch: 9604	Loss: 2.78508739471	Example Output: 68	Example Reward:  1
[[ 0.04095361  0.04066212  0.06810533  0.06705732  0.06737965  0.06728508
   0.06723252  0.06760318  0.06885307  0.06703882  0.06727315  0.06809356
   0.04768446  0.04756791  0.04726426  0.04809114  0.05185479]]
2.80295
[[-0.04095361 -0.04066212 -0.06810533 -0.06705732 -0.06737965 -0.06728508
  -0.06723252 -0.06760318  0.93114692 -0.06703882 -0.06727315 -0.06809356
  -0.04768446 -0.04756791 -0.04726426 -0.04809114 -0.05185

Epoch: 9617	Loss: 3.32346317768	Example Output: 9Y	Example Reward:  -0.3
[[ 0.0408114   0.04036359  0.0682154   0.06712606  0.06760065  0.06712682
   0.06735336  0.06827875  0.06893639  0.06689121  0.0674388   0.06794576
   0.04759899  0.04749761  0.04735068  0.04778465  0.05167986]]
4.09693
[[ 0.28775659  0.28789094  0.27953541  0.2798622   0.2797198   0.27986196
   0.27979401  0.2795164   0.27931908  0.27993265  0.27976838 -0.02038373
   0.28572032  0.28575072  0.28579479  0.28566462  0.28449607]
 [ 0.28775659 -0.01210908  0.27953541  0.2798622   0.2797198   0.27986196
   0.27979401  0.2795164   0.27931908  0.27993265  0.27976838  0.27961627
   0.28572032  0.28575072  0.28579479  0.28566462  0.28449607]]
Epoch: 9618	Loss: 2.80904288292	Example Output: 11	Example Reward:  1
[[ 0.04081672  0.0403396   0.0681841   0.06714365  0.06758489  0.06711608
   0.06736157  0.06832763  0.06893054  0.06687593  0.06742366  0.06795268
   0.04758862  0.04752666  0.04733981  0.04777303  0.05171492]]
2.

Epoch: 9629	Loss: 3.1930044651	Example Output: 9X	Example Reward:  -0.3
[[ 0.04085511  0.0403525   0.06793146  0.06706269  0.0677818   0.06688485
   0.06750909  0.06833109  0.06892802  0.06678244  0.067382    0.06782497
   0.04764073  0.04768244  0.04747266  0.0477307   0.05184748]]
4.09716
[[ 0.28774348  0.28789425  0.27962056  0.27988121  0.27966547  0.27993456
   0.27974728  0.27950069  0.27932161  0.27996528  0.27978542 -0.02034749
   0.2857078   0.28569528  0.28575823  0.2856808   0.28444576]
 [-0.01225653  0.28789425  0.27962056  0.27988121  0.27966547  0.27993456
   0.27974728  0.27950069  0.27932161  0.27996528  0.27978542  0.27965254
   0.2857078   0.28569528  0.28575823  0.2856808   0.28444576]]
Epoch: 9630	Loss: 3.3302189827	Example Output: X/	Example Reward:  1
[[ 0.04086094  0.04036069  0.06791499  0.06702838  0.06781142  0.06684489
   0.06749201  0.06836856  0.06889786  0.06678288  0.0673621   0.06780913
   0.04768608  0.04771286  0.04747399  0.04772722  0.05186597]]
2.84

Epoch: 9642	Loss: 3.19148406982	Example Output: X0	Example Reward:  -0.3
[[ 0.04085428  0.04035303  0.06796963  0.06684538  0.06793653  0.06694518
   0.06747421  0.06842489  0.06880299  0.06706377  0.06733081  0.06778926
   0.04776332  0.04754741  0.04747219  0.04767498  0.05175215]]
4.09717
[[-0.01225628  0.2878941   0.27960911  0.27994642  0.27961904  0.27991647
   0.27975777  0.27947256  0.2793591   0.27988088  0.27980077  0.27966323
   0.285671    0.28573579  0.28575835  0.28569752  0.28447437]
 [ 0.28774372  0.2878941  -0.02039089  0.27994642  0.27961904  0.27991647
   0.27975777  0.27947256  0.2793591   0.27988088  0.27980077  0.27966323
   0.285671    0.28573579  0.28575835  0.28569752  0.28447437]]
Epoch: 9643	Loss: 2.93442268372	Example Output: 08	Example Reward:  1
[[ 0.04083518  0.04033815  0.06799646  0.06687814  0.06793471  0.06702761
   0.06745254  0.06839816  0.06885035  0.06705827  0.0673423   0.06777468
   0.04773126  0.04753385  0.04746477  0.04765129  0.05173232]]
2.

Epoch: 9654	Loss: 2.91812615395	Example Output: 5-	Example Reward:  1
[[ 0.04088296  0.04056231  0.06791256  0.06667159  0.06808587  0.06708366
   0.06747751  0.06818788  0.06849761  0.06712244  0.06734959  0.06742197
   0.04783969  0.04770173  0.04762502  0.04777764  0.05180003]]
2.82065
[[-0.04088296 -0.04056231 -0.06791256 -0.06667159 -0.06808587 -0.06708366
  -0.06747751  0.93181211 -0.06849761 -0.06712244 -0.06734959 -0.06742197
  -0.04783969 -0.04770173 -0.04762502 -0.04777764 -0.05180003]
 [-0.04088296 -0.04056231 -0.06791256 -0.06667159 -0.06808587 -0.06708366
  -0.06747751 -0.06818788 -0.06849761 -0.06712244 -0.06734959 -0.06742197
  -0.04783969  0.95229828 -0.04762502 -0.04777764 -0.05180003]]
Epoch: 9655	Loss: 2.93943505287	Example Output: 2*	Example Reward:  1
[[ 0.04087509  0.04056126  0.06788469  0.06669869  0.06807524  0.06703686
   0.0674667   0.06823739  0.06848718  0.06710698  0.06736245  0.06740942
   0.04786222  0.0477391   0.04761405  0.04779698  0.05178571]]
2.820

Epoch: 9668	Loss: 2.93586437702	Example Output: 17	Example Reward:  1
[[ 0.0408181   0.04049337  0.06798502  0.06679085  0.06821766  0.06704968
   0.06724467  0.06820163  0.06843489  0.0670446   0.06746685  0.06728678
   0.04791546  0.04774585  0.04760193  0.04785712  0.05184562]]
2.80467
[[-0.0408181  -0.04049337 -0.06798502  0.93320918 -0.06821766 -0.06704968
  -0.06724467 -0.06820163 -0.06843489 -0.0670446  -0.06746685 -0.06728678
  -0.04791546 -0.04774585 -0.04760193 -0.04785712 -0.05184562]
 [-0.0408181  -0.04049337 -0.06798502 -0.06679085 -0.06821766 -0.06704968
  -0.06724467 -0.06820163 -0.06843489  0.93295538 -0.06746685 -0.06728678
  -0.04791546 -0.04774585 -0.04760193 -0.04785712 -0.05184562]]
Epoch: 9669	Loss: 3.19457347393	Example Output: 0*	Example Reward:  1
[[ 0.04078038  0.04047184  0.06802396  0.06683833  0.06825057  0.0670337
   0.06727634  0.06817075  0.06848308  0.06712063  0.06741554  0.06727241
   0.04788163  0.04772348  0.04755984  0.04784786  0.05184964]]
2.8208

Epoch: 9680	Loss: 3.32389059067	Example Output: 58	Example Reward:  1
[[ 0.0406642   0.04035921  0.06801262  0.06697429  0.06831378  0.06715883
   0.0673945   0.06808487  0.06851222  0.06722644  0.0674643   0.06721196
   0.0477379   0.04773673  0.04741284  0.04780864  0.05192672]]
2.80315
[[-0.0406642  -0.04035921 -0.06801262 -0.06697429 -0.06831378 -0.06715883
  -0.0673945   0.9319151  -0.06851222 -0.06722644 -0.0674643  -0.06721196
  -0.0477379  -0.04773673 -0.04741284 -0.04780864 -0.05192672]
 [-0.0406642  -0.04035921 -0.06801262 -0.06697429 -0.06831378 -0.06715883
  -0.0673945  -0.06808487 -0.06851222 -0.06722644  0.93253571 -0.06721196
  -0.0477379  -0.04773673 -0.04741284 -0.04780864 -0.05192672]]
Saving Weight
Epoch: 9681	Loss: 3.03987855911	Example Output: 83	Example Reward:  1
[[ 0.04066354  0.04035725  0.06800971  0.06695191  0.06832164  0.06714547
   0.06739797  0.06811059  0.06853361  0.06721252  0.0674535   0.06718465
   0.04774832  0.04774752  0.04741679  0.04780991  0.05

Epoch: 9694	Loss: 3.19702208042	Example Output: 55	Example Reward:  1
[[ 0.04070301  0.04052294  0.0680382   0.06686778  0.06823207  0.06703009
   0.06739211  0.06792578  0.06853575  0.067242    0.06765849  0.06699918
   0.04779984  0.04782454  0.04742482  0.0478893   0.05191408]]
2.80309
[[-0.04070301 -0.04052294 -0.0680382  -0.06686778 -0.06823207 -0.06703009
  -0.06739211  0.93207419 -0.06853575 -0.067242   -0.06765849 -0.06699918
  -0.04779984 -0.04782454 -0.04742482 -0.0478893  -0.05191408]
 [-0.04070301 -0.04052294 -0.0680382  -0.06686778 -0.06823207 -0.06703009
  -0.06739211  0.93207419 -0.06853575 -0.067242   -0.06765849 -0.06699918
  -0.04779984 -0.04782454 -0.04742482 -0.0478893  -0.05191408]]
Epoch: 9695	Loss: 2.91346435547	Example Output: 07	Example Reward:  1
[[ 0.0407001   0.04051647  0.06807363  0.0668544   0.06821259  0.06706387
   0.06739247  0.06794645  0.06855327  0.06725795  0.06764395  0.06697439
   0.04778362  0.04781896  0.04741282  0.04788153  0.05191357]]
2.803

Epoch: 9708	Loss: 3.04250485897	Example Output: Y9	Example Reward:  -0.3
[[ 0.04058079  0.04052715  0.0681931   0.06681509  0.06851738  0.0671358
   0.06745268  0.06775304  0.06851064  0.06725109  0.06783335  0.06686955
   0.04768519  0.04776164  0.04749993  0.0477334   0.05188023]]
4.09684
[[ 0.28782576 -0.01215814  0.27954209  0.27995548  0.27944478  0.27985927
   0.27976421  0.27967411  0.27944681  0.27982467  0.27965     0.27993914
   0.28569445  0.28567153  0.28575003  0.28568     0.28443593]
 [ 0.28782576  0.28784186  0.27954209  0.27995548  0.27944478  0.27985927
   0.27976421  0.27967411  0.27944681  0.27982467  0.27965    -0.02006087
   0.28569445  0.28567153  0.28575003  0.28568     0.28443593]]
Epoch: 9709	Loss: 2.65238118172	Example Output: 10	Example Reward:  1
[[ 0.04056437  0.04051179  0.06821849  0.06680549  0.06855804  0.06709005
   0.06749313  0.0677866   0.06850247  0.06725475  0.06784429  0.06684551
   0.04768619  0.0477499   0.04748811  0.0477329   0.05186798]]
2.8

Epoch: 9720	Loss: 3.07000863552	Example Output: 2-	Example Reward:  1
[[ 0.04056     0.04044469  0.06844088  0.06674301  0.06857504  0.06697997
   0.06760882  0.06773624  0.06868473  0.06745421  0.06763372  0.06694703
   0.04756483  0.04762986  0.04746906  0.04760588  0.05192209]]
2.82005
[[-0.04056    -0.04044469 -0.06844088 -0.06674301  0.93142498 -0.06697997
  -0.06760882 -0.06773624 -0.06868473 -0.06745421 -0.06763372 -0.06694703
  -0.04756483 -0.04762986 -0.04746906 -0.04760588 -0.05192209]
 [-0.04056    -0.04044469 -0.06844088 -0.06674301 -0.06857504 -0.06697997
  -0.06760882 -0.06773624 -0.06868473 -0.06745421 -0.06763372 -0.06694703
  -0.04756483  0.95237017 -0.04746906 -0.04760588 -0.05192209]]
Saving Weight
Epoch: 9721	Loss: 3.45288383961	Example Output: /-	Example Reward:  -0.3
[[ 0.04055429  0.04043558  0.06842056  0.06673529  0.06859639  0.06691382
   0.06766734  0.06773541  0.06870949  0.06748059  0.06762832  0.06692972
   0.04755989  0.04763811  0.04745869  0.04761146  0

Epoch: 9734	Loss: 2.78216760159	Example Output: 08	Example Reward:  1
[[ 0.04064019  0.04067148  0.06859326  0.06657905  0.06833511  0.06692538
   0.06777073  0.06757271  0.0685589   0.06746947  0.06747169  0.06693
   0.04770487  0.04769187  0.04746067  0.04770186  0.05192279]]
2.80285
[[-0.04064019 -0.04067148  0.93140674 -0.06657905 -0.06833511 -0.06692538
  -0.06777073 -0.06757271 -0.0685589  -0.06746947 -0.06747169 -0.06693
  -0.04770487 -0.04769187 -0.04746067 -0.04770186 -0.05192279]
 [-0.04064019 -0.04067148 -0.06859326 -0.06657905 -0.06833511 -0.06692538
  -0.06777073 -0.06757271 -0.0685589  -0.06746947  0.93252832 -0.06693
  -0.04770487 -0.04769187 -0.04746067 -0.04770186 -0.05192279]]
Epoch: 9735	Loss: 3.45456604958	Example Output: +2	Example Reward:  -0.3
[[ 0.04062762  0.04064337  0.06858515  0.06659111  0.06834348  0.06689802
   0.06779174  0.06759447  0.0685842   0.06747822  0.06748602  0.06695372
   0.04770596  0.04768965  0.04743493  0.04768568  0.05190666]]
4.09962
[[ 

Epoch: 9748	Loss: 2.91282627583	Example Output: 26	Example Reward:  1
2.80234
[[-0.04064059 -0.04066544 -0.06854409 -0.06680375  0.93187094 -0.06672465
  -0.06779532 -0.06762034 -0.06866387 -0.0675822  -0.06727663 -0.06701745
  -0.04779976 -0.04773055 -0.04739032 -0.04776034 -0.05185571]
 [-0.04064059 -0.04066544 -0.06854409 -0.06680375 -0.06812909 -0.06672465
  -0.06779532 -0.06762034  0.93133616 -0.0675822  -0.06727663 -0.06701745
  -0.04779976 -0.04773055 -0.04739032 -0.04776034 -0.05185571]]
Epoch: 9749	Loss: 3.32851130962	Example Output: 16	Example Reward:  1
[[ 0.04063996  0.04067974  0.06853974  0.0667858   0.06811727  0.06675471
   0.06777459  0.06763464  0.06870474  0.06761319  0.06722662  0.06698664
   0.04778292  0.04772647  0.04740433  0.04776611  0.05186258]]
2.80331
[[-0.04063996 -0.04067974 -0.06853974  0.93321419 -0.06811727 -0.06675471
  -0.06777459 -0.06763464 -0.06870474 -0.06761319 -0.06722662 -0.06698664
  -0.04778292 -0.04772647 -0.04740433 -0.04776611 -0.05186258

Epoch: 9760	Loss: 3.57974851131	Example Output: 46	Example Reward:  1
[[ 0.04072964  0.04093761  0.06835603  0.06669885  0.06785441  0.06730888
   0.06753889  0.06742901  0.06869654  0.06772306  0.06684739  0.0668133
   0.04773891  0.04788686  0.04760998  0.0478239   0.05200674]]
2.80307
[[-0.04072964 -0.04093761 -0.06835603 -0.06669885 -0.06785441 -0.06730888
   0.93246108 -0.06742901 -0.06869654 -0.06772306 -0.06684739 -0.0668133
  -0.04773891 -0.04788686 -0.04760998 -0.0478239  -0.05200674]
 [-0.04072964 -0.04093761 -0.06835603 -0.06669885 -0.06785441 -0.06730888
  -0.06753889 -0.06742901  0.93130344 -0.06772306 -0.06684739 -0.0668133
  -0.04773891 -0.04788686 -0.04760998 -0.0478239  -0.05200674]]
Saving Weight
Epoch: 9761	Loss: 3.19526546001	Example Output: 38	Example Reward:  1
[[ 0.04072967  0.04095337  0.06835329  0.06668574  0.06783102  0.06728828
   0.06755847  0.06741343  0.06869431  0.06773092  0.06684388  0.0668135
   0.0477491   0.0479015   0.04759671  0.04784333  0.052013

Epoch: 9774	Loss: 2.2498357296	Example Output: 45	Example Reward:  1
2.80416
[[-0.04065005 -0.04099692 -0.06844361 -0.06669068 -0.06784484 -0.06748539
   0.93262362 -0.06738031 -0.06880251 -0.06776295 -0.06664655 -0.0667935
  -0.04775058 -0.04785198 -0.04756175 -0.04795567 -0.05200633]
 [-0.04065005 -0.04099692 -0.06844361 -0.06669068 -0.06784484 -0.06748539
  -0.06737635  0.93261969 -0.06880251 -0.06776295 -0.06664655 -0.0667935
  -0.04775058 -0.04785198 -0.04756175 -0.04795567 -0.05200633]]
Epoch: 9775	Loss: 3.19900419712	Example Output: -*	Example Reward:  -0.3
[[ 0.04061457  0.04098219  0.06847691  0.06667282  0.06790165  0.06746636
   0.06739459  0.06740844  0.06884615  0.06774434  0.06663179  0.06675214
   0.04776797  0.04784651  0.04758221  0.04793106  0.05198025]]
4.09439
[[ 0.28781566  0.28770536  0.27945694  0.27999818  0.2796295   0.27976009
   0.27978164  0.27977747  0.27934617  0.27967671  0.28001046  0.27997437
   0.28566962 -0.01435396  0.28572536  0.28562069  0.28440595

Epoch: 9786	Loss: 3.4542167902	Example Output: 9+	Example Reward:  1
[[ 0.04061866  0.04111451  0.06849052  0.06678518  0.06765822  0.06723233
   0.06747293  0.06732933  0.06882708  0.06763254  0.06657316  0.06686103
   0.04800053  0.04803331  0.04747563  0.04797226  0.0519228 ]]
2.82163
[[-0.04061866 -0.04111451 -0.06849052 -0.06678518 -0.06765822 -0.06723233
  -0.06747293 -0.06732933 -0.06882708 -0.06763254 -0.06657316  0.93313897
  -0.04800053 -0.04803331 -0.04747563 -0.04797226 -0.0519228 ]
 [-0.04061866 -0.04111451 -0.06849052 -0.06678518 -0.06765822 -0.06723233
  -0.06747293 -0.06732933 -0.06882708 -0.06763254 -0.06657316 -0.06686103
   0.95199949 -0.04803331 -0.04747563 -0.04797226 -0.0519228 ]]
Epoch: 9787	Loss: 3.06478221416	Example Output: 1+	Example Reward:  1
[[ 0.04059974  0.04111491  0.06852265  0.06674486  0.06765896  0.0672013
   0.0674979   0.06732745  0.06883733  0.06763963  0.0666013   0.06687459
   0.04802848  0.04803879  0.04745208  0.04795627  0.05190378]]
2.82167

Epoch: 9800	Loss: 3.04139678478	Example Output: *8	Example Reward:  -0.3
[[ 0.0407066   0.04127021  0.06857547  0.06691667  0.06744936  0.06700224
   0.06753511  0.0672105   0.06882633  0.06743458  0.06655309  0.06668818
   0.04817098  0.04810015  0.04756359  0.0480639   0.0519331 ]]
4.09952
[[ 0.28778803  0.28761896  0.27942735  0.27992502  0.27976522  0.27989933
   0.27973947  0.27983686  0.27935213  0.27976966  0.28003407  0.27999356
   0.28554872  0.28556997 -0.01426908  0.28558084  0.28442007]
 [ 0.28778803  0.28761896  0.27942735  0.27992502  0.27976522  0.27989933
   0.27973947  0.27983686  0.27935213  0.27976966 -0.01996593  0.27999356
   0.28554872  0.28556997  0.28573093  0.28558084  0.28442007]]
Saving Weight
Epoch: 9801	Loss: 3.58195078373	Example Output: +0	Example Reward:  -0.3
[[ 0.04071075  0.04127221  0.06855594  0.06694817  0.0674396   0.06700403
   0.06752525  0.06723443  0.06881796  0.06740028  0.0665805   0.0666545
   0.0481735   0.04810806  0.04758297  0.04806411 

Epoch: 9814	Loss: 2.37440228462	Example Output: 80	Example Reward:  1
[[ 0.04066168  0.04112881  0.06849332  0.0671287   0.06750153  0.06714855
   0.06742903  0.06743135  0.06883942  0.06720728  0.06679901  0.06670891
   0.04811722  0.04799479  0.04758218  0.0479569   0.05187128]]
2.80397
[[-0.04066168 -0.04112881 -0.06849332 -0.0671287  -0.06750153 -0.06714855
  -0.06742903 -0.06743135 -0.06883942 -0.06720728  0.93320101 -0.06670891
  -0.04811722 -0.04799479 -0.04758218 -0.0479569  -0.05187128]
 [-0.04066168 -0.04112881  0.93150669 -0.0671287  -0.06750153 -0.06714855
  -0.06742903 -0.06743135 -0.06883942 -0.06720728 -0.06679901 -0.06670891
  -0.04811722 -0.04799479 -0.04758218 -0.0479569  -0.05187128]]
Epoch: 9815	Loss: 2.91339356899	Example Output: +/	Example Reward:  -0.3
[[ 0.04064956  0.04110096  0.06850688  0.06711879  0.06752682  0.06715412
   0.06741153  0.06746466  0.06885305  0.06722023  0.06682163  0.06673559
   0.04810103  0.04796642  0.04757389  0.04794258  0.05185224]]
4.

Epoch: 9826	Loss: 3.45217268467	Example Output: *X	Example Reward:  -0.3
[[ 0.04058104  0.04095072  0.06854281  0.06700848  0.06746899  0.06723859
   0.06729333  0.06761168  0.06889634  0.06727332  0.06700433  0.0669824
   0.04804605  0.04786411  0.0474317   0.04784311  0.05196306]]
4.09187
[[ 0.2878257   0.28771481  0.27943715  0.27989745  0.27975932  0.27982843
   0.27981201  0.27971649  0.27933112  0.27981803  0.2798987   0.27990529
   0.28558621  0.28564078 -0.01422951  0.28564709  0.2844111 ]
 [-0.01217431  0.28771481  0.27943715  0.27989745  0.27975932  0.27982843
   0.27981201  0.27971649  0.27933112  0.27981803  0.2798987   0.27990529
   0.28558621  0.28564078  0.28577051  0.28564709  0.2844111 ]]
Epoch: 9827	Loss: 3.06453318596	Example Output: 12	Example Reward:  1
[[ 0.0405743   0.04093287  0.06853441  0.06701137  0.06747381  0.06724639
   0.0672875   0.06765518  0.06893452  0.06727274  0.06698617  0.06696699
   0.04804494  0.04786835  0.04742169  0.04782942  0.05195948]]
2.8

Saving Weight
Epoch: 9841	Loss: 3.45483925343	Example Output: 63	Example Reward:  1
[[ 0.04067599  0.04097085  0.06844213  0.06706146  0.06745794  0.06729436
   0.06737638  0.06746286  0.06891401  0.06723497  0.06692476  0.06703258
   0.04807483  0.04784616  0.04747956  0.04776487  0.05198635]]
2.80311
[[-0.04067599 -0.04097085 -0.06844213 -0.06706146 -0.06745794 -0.06729436
  -0.06737638 -0.06746286  0.931086   -0.06723497 -0.06692476 -0.06703258
  -0.04807483 -0.04784616 -0.04747956 -0.04776487 -0.05198635]
 [-0.04067599 -0.04097085 -0.06844213 -0.06706146 -0.06745794  0.93270564
  -0.06737638 -0.06746286 -0.06891401 -0.06723497 -0.06692476 -0.06703258
  -0.04807483 -0.04784616 -0.04747956 -0.04776487 -0.05198635]]
Epoch: 9842	Loss: 3.19217686653	Example Output: 68	Example Reward:  1
[[ 0.04071004  0.04098838  0.06845405  0.06707226  0.06745797  0.06731915
   0.06736273  0.06746039  0.06891592  0.06720752  0.06689567  0.06699736
   0.04808877  0.0478374   0.04747985  0.04776976  0.05

Epoch: 9854	Loss: 2.91391773224	Example Output: 35	Example Reward:  1
[[ 0.04076963  0.0409623   0.06848998  0.06697062  0.06756626  0.06721759
   0.06738187  0.06748141  0.0689964   0.06740683  0.066823    0.06696258
   0.04804641  0.047764    0.0474282   0.04774811  0.05198476]]
2.8042
[[-0.04076963 -0.0409623  -0.06848998 -0.06697062 -0.06756626  0.93278241
  -0.06738187 -0.06748141 -0.0689964  -0.06740683 -0.066823   -0.06696258
  -0.04804641 -0.047764   -0.0474282  -0.04774811 -0.05198476]
 [-0.04076963 -0.0409623  -0.06848998 -0.06697062 -0.06756626 -0.06721759
  -0.06738187  0.9325186  -0.0689964  -0.06740683 -0.066823   -0.06696258
  -0.04804641 -0.047764   -0.0474282  -0.04774811 -0.05198476]]
Epoch: 9855	Loss: 1.94237725735	Example Output: //	Example Reward:  -0.3
[[ 0.04075953  0.04095711  0.06848856  0.06698146  0.06754299  0.06723257
   0.06738175  0.06748115  0.06898285  0.06737962  0.0668979   0.0669695
   0.04804785  0.04776981  0.04742888  0.04773374  0.05196484]]
4.09

Epoch: 9867	Loss: 3.19663028717	Example Output: 7-	Example Reward:  1
[[ 0.04082798  0.04091858  0.06829768  0.06719148  0.0676052   0.06719636
   0.06736962  0.06761439  0.06897801  0.06725297  0.06683244  0.06695706
   0.04804204  0.04780326  0.04741647  0.04774093  0.05195546]]
2.82142
[[-0.04082798 -0.04091858 -0.06829768 -0.06719148 -0.0676052  -0.06719636
  -0.06736962 -0.06761439 -0.06897801  0.93274701 -0.06683244 -0.06695706
  -0.04804204 -0.04780326 -0.04741647 -0.04774093 -0.05195546]
 [-0.04082798 -0.04091858 -0.06829768 -0.06719148 -0.0676052  -0.06719636
  -0.06736962 -0.06761439 -0.06897801 -0.06725297 -0.06683244 -0.06695706
  -0.04804204  0.95219672 -0.04741647 -0.04774093 -0.05195546]]
Epoch: 9868	Loss: 3.19746723175	Example Output: 06	Example Reward:  1
[[ 0.04083674  0.04092164  0.0682976   0.06716107  0.06761027  0.06719432
   0.06734033  0.06762386  0.06896206  0.06729759  0.06678425  0.06695645
   0.04806311  0.04781659  0.04741213  0.0477459   0.05197611]]
2.802

Epoch: 9880	Loss: 2.66015274525	Example Output: 05	Example Reward:  1
[[ 0.04075982  0.04082577  0.0683441   0.06700476  0.06775521  0.06735716
   0.0672675   0.06778363  0.06908569  0.06752654  0.06651658  0.06705322
   0.04810061  0.04772229  0.04729331  0.04760748  0.05199638]]
2.80299
[[-0.04075982 -0.04082577  0.93165588 -0.06700476 -0.06775521 -0.06735716
  -0.0672675  -0.06778363 -0.06908569 -0.06752654 -0.06651658 -0.06705322
  -0.04810061 -0.04772229 -0.04729331 -0.04760748 -0.05199638]
 [-0.04075982 -0.04082577 -0.0683441  -0.06700476 -0.06775521 -0.06735716
  -0.0672675   0.93221635 -0.06908569 -0.06752654 -0.06651658 -0.06705322
  -0.04810061 -0.04772229 -0.04729331 -0.04760748 -0.05199638]]
Saving Weight
Epoch: 9881	Loss: 2.78612127304	Example Output: 4	Example Reward:  1
[[ 0.04074499  0.04082873  0.0683509   0.06699739  0.0677413   0.06737028
   0.06726857  0.06779677  0.06911637  0.06752528  0.066501    0.06705692
   0.04811161  0.04771382  0.04729102  0.04759572  0.051

Epoch: 9894	Loss: 2.93430483341	Example Output: 6	Example Reward:  1
[[ 0.04074224  0.04087637  0.06813145  0.06707893  0.06757268  0.06769804
   0.06729642  0.06764767  0.06878794  0.06742734  0.06663238  0.06734552
   0.04814545  0.04778631  0.04726917  0.04747252  0.05208958]]
2.81587
[[-0.04074224 -0.04087637 -0.06813145 -0.06707893 -0.06757268 -0.06769804
  -0.06729642 -0.06764767  0.93121207 -0.06742734 -0.06663238 -0.06734552
  -0.04814545 -0.04778631 -0.04726917 -0.04747252 -0.05208958]
 [-0.04074224 -0.04087637 -0.06813145 -0.06707893 -0.06757268 -0.06769804
  -0.06729642 -0.06764767 -0.06878794 -0.06742734 -0.06663238 -0.06734552
  -0.04814545 -0.04778631 -0.04726917 -0.04747252  0.94791043]]
Epoch: 9895	Loss: 3.06430258751	Example Output: 11	Example Reward:  1
[[ 0.04072789  0.04085404  0.06811702  0.0670944   0.06756049  0.06771432
   0.06734286  0.06762451  0.06882887  0.06745914  0.06661858  0.06738351
   0.04811212  0.0477701   0.04723698  0.0474547   0.05210051]]
2.8044

Epoch: 9908	Loss: 2.52886292934	Example Output: 3-	Example Reward:  1
[[ 0.04074276  0.0409467   0.06807922  0.06737909  0.06737084  0.06754022
   0.06721823  0.0675898   0.06907185  0.06747295  0.06660207  0.06734566
   0.0481283   0.04771178  0.04714937  0.04762669  0.05202443]]
2.82117
[[-0.04074276 -0.0409467  -0.06807922 -0.06737909 -0.06737084  0.93245977
  -0.06721823 -0.0675898  -0.06907185 -0.06747295 -0.06660207 -0.06734566
  -0.0481283  -0.04771178 -0.04714937 -0.04762669 -0.05202443]
 [-0.04074276 -0.0409467  -0.06807922 -0.06737909 -0.06737084 -0.06754022
  -0.06721823 -0.0675898  -0.06907185 -0.06747295 -0.06660207 -0.06734566
  -0.0481283   0.95228821 -0.04714937 -0.04762669 -0.05202443]]
Epoch: 9909	Loss: 3.19583933353	Example Output: 95	Example Reward:  1
[[ 0.04072258  0.04096358  0.06812367  0.06736451  0.06737263  0.06756634
   0.06720752  0.06759383  0.0690584   0.06750879  0.06660714  0.06732465
   0.04811775  0.04769987  0.04712971  0.04762618  0.05201285]]
2.803

Epoch: 9920	Loss: 3.06644511223	Example Output: 63	Example Reward:  1
[[ 0.0407155   0.04096825  0.0680097   0.06724866  0.06736877  0.06755819
   0.06735636  0.06760931  0.06914851  0.06754828  0.06654233  0.06720705
   0.04803595  0.04778253  0.04718871  0.04757658  0.0521354 ]]
2.80261
[[-0.0407155  -0.04096825 -0.0680097  -0.06724866 -0.06736877 -0.06755819
  -0.06735636 -0.06760931  0.93085146 -0.06754828 -0.06654233 -0.06720705
  -0.04803595 -0.04778253 -0.04718871 -0.04757658 -0.0521354 ]
 [-0.0407155  -0.04096825 -0.0680097  -0.06724866 -0.06736877  0.93244183
  -0.06735636 -0.06760931 -0.06914851 -0.06754828 -0.06654233 -0.06720705
  -0.04803595 -0.04778253 -0.04718871 -0.04757658 -0.0521354 ]]
Saving Weight
Epoch: 9921	Loss: 2.64043366909	Example Output: -7	Example Reward:  -0.3
[[ 0.04072308  0.0409779   0.06800222  0.06726066  0.06736097  0.06757084
   0.06733995  0.06758012  0.06919377  0.06752945  0.06654812  0.06717443
   0.0480226   0.04779839  0.04721757  0.04757176  0

Epoch: 9933	Loss: 2.9370156765	Example Output: *4	Example Reward:  -0.3
[[ 0.04071155  0.04104539  0.06795543  0.06729855  0.06718336  0.06760497
   0.06725264  0.06732403  0.06929785  0.06752307  0.06664955  0.06719655
   0.04806067  0.04787824  0.04730438  0.0475992   0.05211463]]
4.09942
[[ 0.28778654  0.28768641  0.27961338  0.27981046  0.279845    0.27971852
   0.27982423  0.2798028   0.27921066  0.27974311  0.28000516  0.27984104
   0.28558183  0.28563654 -0.01419131  0.28572026  0.28436562]
 [ 0.28778654  0.28768641  0.27961338  0.27981046  0.279845    0.27971852
  -0.02017579  0.2798028   0.27921066  0.27974311  0.28000516  0.27984104
   0.28558183  0.28563654  0.28580868  0.28572026  0.28436562]]
Epoch: 9934	Loss: 3.32880618572	Example Output: *5	Example Reward:  -0.3
[[ 0.04068943  0.04103263  0.06796684  0.06729905  0.06720938  0.06759656
   0.06730681  0.06731407  0.06928372  0.06753182  0.06666294  0.06717854
   0.04806684  0.04787333  0.04731887  0.0475719   0.05209729]]


Epoch: 9947	Loss: 2.94165010452	Example Output: 5*	Example Reward:  1
[[ 0.04056355  0.0408023   0.06804617  0.06737061  0.06738509  0.06743819
   0.06776757  0.06756461  0.06933322  0.06744787  0.06679679  0.06724419
   0.04800842  0.04782036  0.04714973  0.04728417  0.0519772 ]]
2.82147
[[-0.04056355 -0.0408023  -0.06804617 -0.06737061 -0.06738509 -0.06743819
  -0.06776757  0.93243539 -0.06933322 -0.06744787 -0.06679679 -0.06724419
  -0.04800842 -0.04782036 -0.04714973 -0.04728417 -0.0519772 ]
 [-0.04056355 -0.0408023  -0.06804617 -0.06737061 -0.06738509 -0.06743819
  -0.06776757 -0.06756461 -0.06933322 -0.06744787 -0.06679679 -0.06724419
  -0.04800842 -0.04782036  0.95285028 -0.04728417 -0.0519772 ]]
Epoch: 9948	Loss: 2.37521100044	Example Output: +	Example Reward:  -0.3
[[ 0.04053887  0.04078906  0.06806868  0.06735058  0.06740342  0.06743916
   0.06779528  0.06756601  0.06934285  0.06748012  0.06678102  0.06723295
   0.048009    0.04782166  0.04716372  0.04725527  0.05196236]]
4.0

Epoch: 9961	Loss: 3.30143558979	Example Output: 41	Example Reward:  1
[[ 0.04066851  0.04093805  0.0681136   0.06723663  0.06720095  0.06750834
   0.0676214   0.06743278  0.06915627  0.06758485  0.06671724  0.06722367
   0.04809436  0.04790097  0.0472328   0.04736431  0.05200528]]
2.8039
[[-0.04066851 -0.04093805 -0.0681136  -0.06723663 -0.06720095 -0.06750834
   0.93237859 -0.06743278 -0.06915627 -0.06758485 -0.06671724 -0.06722367
  -0.04809436 -0.04790097 -0.0472328  -0.04736431 -0.05200528]
 [-0.04066851 -0.04093805 -0.0681136   0.93276334 -0.06720095 -0.06750834
  -0.0676214  -0.06743278 -0.06915627 -0.06758485 -0.06671724 -0.06722367
  -0.04809436 -0.04790097 -0.0472328  -0.04736431 -0.05200528]]
Epoch: 9962	Loss: 3.19399886131	Example Output: +3	Example Reward:  -0.3
[[ 0.04066402  0.0409361   0.06808361  0.06728948  0.06717914  0.06749881
   0.06764517  0.06743143  0.06913739  0.06753765  0.06679364  0.06720218
   0.04808282  0.04792581  0.04722964  0.04736733  0.05199569]]
4.0

Epoch: 9975	Loss: 3.5821996212	Example Output: +7	Example Reward:  -0.3
[[ 0.04061658  0.04096315  0.06821158  0.06728202  0.06702174  0.0675734
   0.0676887   0.06723528  0.06903908  0.067505    0.06717889  0.06721685
   0.04800988  0.04797493  0.04717556  0.04740994  0.05189741]]
4.0996
[[ 0.28781503  0.28771105  0.27953655  0.27981541  0.27989349  0.279728
   0.27969339  0.27982941  0.27928829  0.2797485   0.27984634  0.27983496
  -0.01440297  0.28560752  0.28584737  0.28577703  0.2844308 ]
 [ 0.28781503  0.28771105  0.27953655  0.27981541  0.27989349  0.279728
   0.27969339  0.27982941  0.27928829 -0.0202515   0.27984634  0.27983496
   0.28559706  0.28560752  0.28584737  0.28577703  0.2844308 ]]
Epoch: 9976	Loss: 3.06697742939	Example Output: 9/	Example Reward:  1
[[ 0.04062258  0.04099344  0.06823657  0.0672558   0.06701557  0.06757651
   0.06768824  0.06718414  0.06901293  0.06752808  0.06716388  0.06721627
   0.04801397  0.04797135  0.04719161  0.04741902  0.05191004]]
2.82165
[

Epoch: 9989	Loss: 3.324883008	Example Output: 14	Example Reward:  1
[[ 0.04049338  0.04083797  0.06826435  0.06746505  0.06699278  0.06746136
   0.06783552  0.06718924  0.0691644   0.06752437  0.06718159  0.06748061
   0.04799426  0.04788219  0.04706035  0.04736587  0.05180665]]
2.80331
[[-0.04049338 -0.04083797 -0.06826435  0.93253493 -0.06699278 -0.06746136
  -0.06783552 -0.06718924 -0.0691644  -0.06752437 -0.06718159 -0.06748061
  -0.04799426 -0.04788219 -0.04706035 -0.04736587 -0.05180665]
 [-0.04049338 -0.04083797 -0.06826435 -0.06746505 -0.06699278 -0.06746136
   0.93216449 -0.06718924 -0.0691644  -0.06752437 -0.06718159 -0.06748061
  -0.04799426 -0.04788219 -0.04706035 -0.04736587 -0.05180665]]
Epoch: 9990	Loss: 3.19268376827	Example Output: Y0	Example Reward:  -0.3
[[ 0.04048153  0.04083428  0.06827696  0.0674904   0.06695679  0.06744135
   0.06783531  0.06719384  0.06914365  0.06753108  0.06721272  0.06749906
   0.04800777  0.04788138  0.04704852  0.04737579  0.05178962]]
4.09