<img src="../.images/logosnb.png" alt="Banner" style="width:800px;"/>

<div style='color: #690027;' markdown="1">
    <h1>RELU</h1> 
</div>

<div class="alert alert-box alert-success">
Om een neuraal netwerk op te bouwen, heeft men een <b>activatiefunctie</b> nodig. ReLu is een veelgebruikte activiatiefunctie. 
</div>

In het volgende voorbeeld beschouwt men blauwe en groene punten in het vlak. Van elk punt is de coördinaat en de kleur gegeven.

### De nodige modules importeren

In [None]:
import pandas as pd

import matplotlib.pyplot as plt
import numpy as np

<div style='color: #690027;' markdown="1">
    <h2>1. Inlezen van de data</h2> 
</div>

Lees met de module `pandas` de dataset in.

In [None]:
punten = pd.read_csv("../.data/IntroductieDeepLearning/data.dat", header=None)  # in te lezen tabel heeft een hoofding

<div style='color: #690027;' markdown="1">
    <h2>2. Tonen van de ingelezen data</h2> 
</div>

Bekijk de data door de instructie `punten` uit te voeren. De dataset bestaat uit de x- en y-coördinaat van de punten en de kleur van elk punt. <br>
De x- en y-coördinaat zijn kenmerken, de kleur is een label. <br> Omdat er twee soorten labels zijn, zegt men dat de punten verdeeld zijn over twee klassen.

In [None]:
punten

Deze tabel is een tabel met 15 rijen en 3 kolommen: er zijn immers 15 punten, 2 kenmerken (x1, x2) en 1 label (y). <br><br>
De kenmerken:
- eerste kolom: x-coördinaat; 
- tweede kolom: y-coördinaat.

Het label:
- derde kolom: kleur.

<div style='color: #690027;' markdown="1">
    <h2>3. Onderzoeken of de punten van elkaar kunnen gescheiden worden</h2> 
</div>

<div style='color: #690027;' markdown="1">
    <h3>3.1 Visualiseren van de data</h3> 
</div>

Om de data te visulaliseren, heb je de x- en y-coördinaat van de punten nodig.

In [None]:
# coördinaten van de punten
X = punten.iloc[:, [0, 1]].values 
X.shape        
print(X)

In [None]:
print(X[:, 0])    # eerste kolom van X: x-coördinaat
print(X[:, 1])    # tweede kolom van X: y-coördinaat

<div style='color: #690027;' markdown="1">
    <h3>3.2 De data weergeven in puntenwolk</h3> 
</div>

In [None]:
x1 = X[:, 0]                # kenmerk: x-coördinaat
x2 = X[:, 1]                # kenmerk: y-coördinaat
# print(type(x1))
# print(x1.min(), x1.max())
# print(x2.min(), x2.max())

In [None]:
plt.figure()     

plt.scatter(x1[:6], x2[:6], color="blue", marker="x")    
plt.scatter(x1[6:], x2[6:], color="green", marker="<") 

plt.show()

Het is duidelijk dat deze punten **niet lineair scheidbaar** zijn. Het is onmogelijk één rechte te vinden, die de groene punten scheidt van de blauwe.<br>
Met een kromme zou het wel gaan. 

<div style='color: #690027;' markdown="1">
    <h2>4. Classificatie</h2> 
</div>

<div style='color: #690027;' markdown="1">
    <h3>4.1 Een scheiding</h3> 
</div>

Zoals uit het volgende script blijkt, kunnen er wel twee rechten gevonden worden, die gebruikt kunnen worden om een scheiding te realiseren.

In [None]:
# scheiding ('decision boundary')
# scheidingslijnen worden bepaald door punten op betreffende rechten
x_1 = np.linspace(-3, 1, 10)   # lijnstuk op domein [-3, 1]
x_2 = np.linspace(1, 3, 10)    # lijnstuk op domein [1, 3]
y_r_1 = 7 * x_2 - 6
y_r_2 = -3 * x_1 + 4

plt.figure()    

# data
plt.scatter(x1[:6], x2[:6], color="blue", marker="x")    
plt.scatter(x1[6:], x2[6:], color="green", marker="<") 
# scheidingslijnen
plt.plot(x_2, y_r_1, color="red")
plt.plot(x_1, y_r_2, color="red")

plt.show()

<div style='color: #690027;' markdown="1">
    <h3>4.2 Twee gebieden</h3> 
</div>

In [None]:
x_1 = np.linspace(-3.5, 1, 10)
x_2 = np.linspace(1, 3, 10)
y_r_1 = 7 * x_2 - 6
y_r_2 = -3 * x_1 + 4
# gekleurde gebieden, resolution = 0.2
xx1 = np.arange(x1.min()-1, x1.max()+1, 0.2)
xx2 = np.arange(x2.min()-1, x2.max()+2, 0.2) 

plt.figure()  

# data 
plt.scatter(x1[:6], x2[:6], color="blue", marker="x")    
plt.scatter(x1[6:], x2[6:], color="green", marker="<") 
# scheidingslijnen
plt.plot(x_2, y_r_1, color="red")
plt.plot(x_1, y_r_2, color="red")
# gekleurde gebieden, resolution = 0.2                  
for a in xx1:
    for b in xx2:
        if (7 * a - b - 6 <= 0) and (-3 * a - b + 4 <= 0):
            kleur = "lightblue"
        else:
            kleur = "lightgreen"
        plt.plot(a, b, marker='.', color=kleur)
        
plt.show()

<div style='color: #690027;' markdown="1">
    <h3>4.3 ReLU</h3> 
</div>

De ReLU-functie is een niet-lineaire functie. Deze functie heeft een meervoudig voorschrift.
$$ReLU(x) = max(0,x)$$
of dus
$$ReLU: \begin{cases} x \longmapsto 0 \;,  \; x < 0 \\ 
        x \longmapsto x \;,  \; x \geq 0 \end{cases}  $$    

<img src="../.images/IntroductieDeepLearning/relu.png" alt="Banner" style="width:300px;"/>

Hieronder wordt de code aangepast naar code die gebruikmaakt van de ReLU-functie. Zo wordt het duidelijk dat met ReLU data die niet lineair scheidbaar zijn toch kunnen worden opgedeeld in verschillende gebieden.<br> 
Het lichtblauwe gebied krijgt label '0' en het lichtgroene gebied krijgt label '1'.<br>
De functie die bepaalt tot welke klasse een punt behoort, heet $\phi$.

In [None]:
def relu(x):
    """ReLU(x) = max(x,0). """
    return np.maximum(x,0)

def som(x, y):
    """Verbinding naar output layer."""
    som = relu(7 * x - y - 6) + relu(-3 * x - y + 4)
    return som

def phi(x, y):
    """Classificatie."""
    if som(x, y) == 0:
        phi = 0
    else:
        phi = 1
    return phi


plt.figure()

plt.scatter(x1[:6], x2[:6], color="blue", marker="x")    
plt.scatter(x1[6:], x2[6:], color="green", marker="<") 

x_1 = np.linspace(-3.5, 1, 10)
x_2 = np.linspace(1, 3, 10)
y_r_1 = 7 * x_2 - 6
y_r_2 = -3 * x_1 + 4
plt.plot(x_2, y_r_1, color="red")
plt.plot(x_1, y_r_2, color="red")


# resolution = 0.2
xx1 = np.arange(x1.min()-1, x1.max()+1, 0.2)
xx2 = np.arange(x2.min()-1, x2.max()+4, 0.2)    

for a in xx1:
    for b in xx2:
        if phi(a, b) == 0:
            kleur = "lightblue"
        else:
            kleur = "lightgreen"
        plt.plot(a, b, marker='.', color=kleur)

plt.show()

De code kan ook aangepast worden naar een deep learning model met drie lagen, dus met een invoer- en uitvoerlaag en één verborgen laag.

In [None]:
def relu(tensor):
    """Relu(x) = max(0,x)."""
    return np.maximum(0,tensor)

def phi(x):
    """Classificatie."""
    if x == 0:
        phi = 0
    else:
        phi = 1
    return phi

class Model:
    """Model met drie lagen, twee neuronen per laag.""" 
    
    def __init__(self, inputnodes, hiddennodes, outputnodes):
        """self heeft drie parameters: leersnelheid, aantal inputneuronen, aantal outputneuronen."""
        #self.inodes = inputnodes
        #self.hnodes = hiddennodes
        #self.onodes = outputnodes
        
        self.wih = np.array([[7, -1], [-3,-1]])    # weights tussen input en hidden layer
        self.biash = np.array([[-6],[4]])            # bias tussen input en hidden layer
        self.who = np.array([1,1])               # weights tussen hidden layer en output
        self.activation_functionh = relu   
        self.activation_functiono = phi
       
    def predict(self, kenmerken):
        """Fit training data."""
        inputs = np.array(kenmerken, ndmin=2).T     # w1 en x2 onder elkaar , inputs heeft dimensie  2x15
        # targets = np.array(labels).T                # targets heeft dimensie 1x15
        hidden_inputs = np.dot(self.wih, inputs) + self.biash    # lineaire combinatie inputs met betreffende weights
        hidden_outputs = self.activation_functionh(hidden_inputs)      # relu is activatiefunctie in hidden layer
        final_inputs = np.dot(self.who, hidden_outputs)  # lineaire combinatie output hidden layer met betreffende weights
        final_outputs = self.activation_functiono(final_inputs)
        return final_outputs

In [None]:
model = Model(2, 2, 2)

In [None]:
# uittesten
print("Geef coördinaat van een punt.")
co_x = float(input("x-coördinaat is: "))
co_y = float(input("y-coördinaat is: "))
X = np.array([co_x, co_y])
model.predict(X)

In [None]:
plt.figure()

# datapunten
plt.scatter(x1[:6], x2[:6], color="blue", marker="x")    
plt.scatter(x1[6:], x2[6:], color="green", marker="<") 

# raster maken met resolutie 0.2
x_1 = np.linspace(-3.5, 1, 10)
x_2 = np.linspace(1, 3, 10)
xx1 = np.arange(x1.min()-1, x1.max()+1, 0.2)
xx2 = np.arange(x2.min()-1, x2.max()+4, 0.2)                     

# aan elk punt in raster juiste kleur toekennen
for a in xx1:
    for b in xx2:
        X = np.array([a, b])
        if model.predict(X) == 0:
            kleur = "lightblue"
        else:
            kleur = "lightgreen"
        plt.plot(a, b, marker='.', color=kleur)

plt.show()