In [None]:
# Python-Notebook für ein künstliches neuronales Netz
# der Code erzeugt ein neuronales Netz ohne versteckte Schicht
# ursprünglicher Code von Tariq Rashid, abgeändert von Leo Thom
# aktualisiert am 22. August 2019

In [None]:
# Bibliothek zur Nutzung von Arrays
import numpy as np
# Bibliothek zur grafischen Darstellung von Arrays
import matplotlib.pyplot as plt
# stelle sicher, dass sich die Grafiken im Notebook befinden, nicht in einem externen Fenster
%matplotlib inline

In [None]:
# Definition der Klasse von neuronalen Netzen
class neuralNetwork:
    
    
    # initialisiere das neuronale Netz
    def __init__(self, inputnodes, outputnodes, learningrate, activationfunction, derivativeactivationfunction):
        # setze die Anzahl Knoten in den einzelnen Schichten
        self.inodes = inputnodes
        self.onodes = outputnodes
        
        # erzeuge Gewichtsmatrizen
        # jede Gewichtsmatrix verbindet zwei aufeinanderfolgende Schichten
        # wähle die Anfangswerte aus einer Normalverteilung um 0
        self.wio = np.random.normal(0.0, pow(self.inodes, -0.5), (self.onodes, self.inodes))
        
        # erzeuge Bias-Vektoren
        # jeder Bias-Vektor verbindet ein imaginäres Bias-Neuron mit dem Wert 1 mit allen Knoten der nächsten Schicht
        # wähle die Anfangswerte aus einer Normalverteilung um 0
        self.biasio = np.random.normal(0.0, pow(self.inodes, -0.5), (self.onodes, 1))
        
        # setze die Lernrate
        self.lr = learningrate
        
        # setze die Aktivierungsfunktion und deren Ableitung
        self.activation = lambda x: activationfunction(x)
        self.derivative_activation = lambda x: derivativeactivationfunction(x)
        
        pass
    
    
    # trainiere das neuronale Netz
    def train(self, inputs_list, targets_list):
        # konvertiere die Eingabeliste in einen 2D-Array
        inputs = np.array(inputs_list, ndmin=2).T
        # konvertiere die Zielliste in einen 2D-Array
        targets = np.array(targets_list, ndmin=2).T
        
        # berechne die Eingaben der Ausgabeschicht
        final_inputs = np.matmul(self.wio, inputs) + self.biasio
        # berechne die Ausgaben der Ausgabeschicht
        final_outputs = self.activation(final_inputs)
        
        # die absoluten Fehler der Ausgabeschicht sind (Näherung - Ideal)
        output_errors = final_outputs - targets
        
        # aktualisiere die Gewichte zwischen der Eingabeschicht und der Ausgabeschicht
        self.wio -= self.lr * np.matmul((output_errors * self.derivative_activation(final_inputs)), np.transpose(inputs))
        
        # aktualisiere die Gewichte des imaginären Bias-Neurons der ersten versteckten Schicht
        self.biasio -= self.lr * (output_errors * self.derivative_activation(final_inputs))
        
        pass
    
    
    # befrage das neuronale Netz
    def query(self, inputs_list):
        # konvertiere die Eingabeliste in einen 2D-Array
        inputs = np.array(inputs_list, ndmin=2).T
        
        # berechne die Eingaben der Ausgabeschicht
        final_inputs = np.matmul(self.wio, inputs) + self.biasio
        # berechne die Ausgaben der Ausgabeschicht
        final_outputs = self.activation(final_inputs)
        
        return final_outputs

In [None]:
#Definitionen der möglichen Aktivierungsfunktionen

# definiere die logistische Funktion
# die Bildmenge ist ]0,1[
logistic = lambda x: 1 / (1 + np.exp(-x))
# definiere die Ableitung der logistischen Funktion
derivative_logistic = lambda x: logistic(x) * (1 - logistic(x))

# definiere den verschobenen und skalierten Tangens hyperbolicus
# die Bildmenge ist ]0,1[
scaled_tanh = lambda x: (np.tanh(x) + 1) / 2
# definiere die Ableitung des verschobenen und skalierten Tangens hyperbolicus
derivative_scaled_tanh = lambda x: (1 - np.tanh(x)**2) / 2

# definiere die verschobene und skalierte Softsign-Funktion
# die Bildmenge ist ]0,1[
scaled_softsign = lambda x: (x / (1 + np.abs(x)) + 1) / 2
# definiere die Ableitung der verschobenen und skalierten Softsign-Funktion
derivative_scaled_softsign = lambda x: 1 / (2 * ((1 + np.abs(x))**2))

In [None]:
# Anzahl Knoten in den einzelnen Schichten
input_nodes = 784
output_nodes = 10

# Lernrate
learning_rate = 0.03

# Aktivierungsfunktion
activation_function = lambda x: scaled_tanh(x)
# Ableitung der Aktivierungsfunktion
derivative_activation_function = lambda x: derivative_scaled_tanh(x)

# erzeuge ein Objekt der Klasse neuralNetwork
n = neuralNetwork(input_nodes, output_nodes, learning_rate, activation_function, derivative_activation_function)