In [1]:
import random
import numpy as np
import tensorflow as tf
from keras.utils.np_utils import to_categorical

Using TensorFlow backend.


In [2]:
class dnn:
    def __init__(self, sizes, epochs=10, rate=0.005):
        self.sizes = sizes
        self.epochs = epochs
        self.rate = rate
        
        self.weights = {
            'w1':np.random.normal(0,0.01,size=(sizes[1],sizes[0])),
            'w2':np.random.normal(0,0.01,size=(sizes[2],sizes[1]))
        }
        
    def sigmoid(self, val, der=False):
        if der:
            return val*(1-val)
        else:
            return 1/(1+np.exp(-val))
        
    def softmax(self, val, der=False): # found online at [1] for stability
        exp = np.exp(val - val.max())
        sig = exp/np.sum(exp,axis=0)
        if der:
            return sig*(1-sig)
        else:
            return sig
    
    def forward(self, x):
        weights = self.weights
        weights['a0'] = x
        
        weights['z1'] = np.dot(weights['w1'],weights['a0'])
        weights['a1'] = self.sigmoid(weights['z1'])
        
        weights['z2'] = np.dot(weights['w2'],weights['a1'])
        weights['a2'] = self.softmax(weights['z2'])
        
        return weights['a2']
    
    def backward(self, y_train, y_pred):
        weights = self.weights
        delta_w = {} # create an empty set to store weight grads
        
        err = (y_pred-y_train)/y_pred.shape[0]*self.softmax(weights['z2'],der=True)
        delta_w['w2'] = np.outer(err,weights['a1'])
        
        err = np.dot(weights['w2'].T,err)*self.sigmoid(weights['z1'],der=True)
        delta_w['w1'] = np.outer(err,weights['a0'])
        
        print(delta_w['w2'])
        return delta_w
    
    def update(self,deltas):
        for key,val in deltas.items():
            self.weights[key] -= self.rate*val
            
    def accuracy(self, x_test, y_test):
        correct = np.zeros(len(y_test))
        for i,(x,y) in enumerate(zip(x_test,y_test)):
            out = self.forward(x)
            pred = np.argmax(out)
            correct[i] = 1*(pred==np.argmax(y))
        return np.mean(correct)
    
    def train(self,x_train,y_train,x_test,y_test):
        for it in range(self.epochs):
            for x,y in zip(x_train,y_train):
                out = self.forward(x)
                deltas = self.backward(y,out)
                self.update(deltas)
            acc = self.accuracy(x_test,y_test)
            print("Epoch: %d, Accuracy: %2.2f" %(it,acc))

1: [Link to code for stable softmax function](https://stackoverflow.com/questions/34968722/how-to-implement-the-softmax-function-in-python)

In [3]:
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()

In [4]:
y_train = to_categorical(y_train)
y_test = to_categorical(y_test)
x_train = x_train.reshape(len(x_train),784)
x_test = x_test.reshape(len(x_test),784)

In [5]:
clf = dnn(sizes=[784,300,10])
clf.train(x_train[0:10],y_train[0:10],x_test,y_test)

[[1.02287783e-07 8.15728857e-04 1.30174665e-03 ... 1.29426084e-03
  3.89093199e-06 6.07680055e-12]
 [7.25324411e-08 5.78434722e-04 9.23070764e-04 ... 9.17762565e-04
  2.75906650e-06 4.30906962e-12]
 [5.05055689e-08 4.02773907e-04 6.42749829e-04 ... 6.39053640e-04
  1.92118480e-06 3.00047826e-12]
 ...
 [6.29324924e-08 5.01876653e-04 8.00898784e-04 ... 7.96293146e-04
  2.39389339e-06 3.73874762e-12]
 [7.42515470e-08 5.92144319e-04 9.44948648e-04 ... 9.39514639e-04
  2.82445969e-06 4.41119974e-12]
 [9.16132190e-08 7.30600901e-04 1.16589877e-03 ... 1.15919417e-03
  3.48488152e-06 5.44263688e-12]]
[[-0.00000000e+000 -4.10491803e-011 -1.46498151e-230 ... -9.32821483e-003
  -0.00000000e+000 -9.32821483e-003]
 [ 0.00000000e+000  4.12353421e-012  1.47162533e-231 ...  9.37051913e-004
   0.00000000e+000  9.37051913e-004]
 [ 0.00000000e+000  2.88767523e-012  1.03056645e-231 ...  6.56209326e-004
   0.00000000e+000  6.56209326e-004]
 ...
 [ 0.00000000e+000  4.18848874e-012  1.49480659e-231 ...  9.51

  return 1/(1+np.exp(-val))
  return val*(1-val)
  return multiply(a.ravel()[:, newaxis], b.ravel()[newaxis, :], out)


Epoch: 0, Accuracy: 0.10
[[nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 ...
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]]
[[nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 ...
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]]
[[nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 ...
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]]
[[nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 ...
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]]
[[nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 ...
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]]
[[nan nan nan .

Epoch: 5, Accuracy: 0.10
[[nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 ...
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]]
[[nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 ...
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]]
[[nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 ...
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]]
[[nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 ...
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]]
[[nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 ...
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]
 [nan nan nan ... nan nan nan]]
[[nan nan nan .