<figure>
  <IMG SRC="https://upload.wikimedia.org/wikipedia/commons/thumb/d/d5/Fachhochschule_Südwestfalen_20xx_logo.svg/320px-Fachhochschule_Südwestfalen_20xx_logo.svg.png" WIDTH=250 ALIGN="right">
</figure>

# Programmierung für KI
### Winterersemester 2025/26
Prof. Dr. Heiner Giefers

In [None]:
import sys
import inspect

def get_size(obj, seen=None):
    """Recursively finds size of objects in bytes"""
    size = sys.getsizeof(obj)
    if seen is None:
        seen = set()
    obj_id = id(obj)
    if obj_id in seen:
        return 0
    # Important mark as seen *before* entering recursion to gracefully handle
    # self-referential objects
    seen.add(obj_id)
    if hasattr(obj, '__dict__'):
        for cls in obj.__class__.__mro__:
            if '__dict__' in cls.__dict__:
                d = cls.__dict__['__dict__']
                if inspect.isgetsetdescriptor(d) or inspect.ismemberdescriptor(d):
                    size += get_size(obj.__dict__, seen)
                break
    if isinstance(obj, dict):
        size += sum((get_size(v, seen) for v in obj.values()))
        size += sum((get_size(k, seen) for k in obj.keys()))
    elif hasattr(obj, '__iter__') and not isinstance(obj, (str, bytes, bytearray)):
        size += sum((get_size(i, seen) for i in obj))
        
    if hasattr(obj, '__slots__'): # can have __slots__ with __dict__
        size += sum(get_size(getattr(obj, s), seen) for s in obj.__slots__ if hasattr(obj, s))
        
    return size

from IPython.core.display import HTML
HTML("""
<style>
ul {
    margin-top: 0.3em !important;
    margin-bottom: 0.3em !important;
    padding-left: 1em !important; /* Einzug anpassen */
}
</style>
""")

#### <figure>
  <IMG SRC="https://upload.wikimedia.org/wikipedia/commons/thumb/d/d5/Fachhochschule_Südwestfalen_20xx_logo.svg/320px-Fachhochschule_Südwestfalen_20xx_logo.svg.png" WIDTH=400 ALIGN="right">
</figure>

# Programmierung für KI
### Wintersemester 2025/26
Prof. Dr. Heiner Giefers

## Veranstaltungsevaluation

- Regelmäßige Befragung der Studierenden zur Lehre
- Umfrage läuft nur bis Montag, 15.12.2025
- Stimmabgabe und Auswertung erfolgen anonym
- Link per Rundmail und über Moodle

http://evaonline.fh-swf.de/evasys/online.php?pswd=ETZDN


## Präsentation der Mini-Projekte

- Terminbuchung über Moodle
- Termine bei Prof. Dorka **oder** Prof. Giefers **je nach Thema!**
- **Giefers:** Analyse und Visualisierung von Wetterdaten, Rezept-Empfehlungssystem, Social-Media-Stimmungsanalyse, Musik-Genre-Klassifikator, Preis-Tracker für Online-Shops
- **Dorka:**  Interaktives Finanz-Dashboard,  Persönlicher Ausgaben-Manager mit intelligenter Kategorisierung, Automatisierter Nachrichten-Aggregator mit Zusammenfassung, Analyse von Open-Data-Stadtinformationen

<figure>
  <IMG SRC="https://numpy.org/doc/stable/_static/numpylogo.svg" WIDTH=500 ALIGN="right">
</figure>

    
   
# Numerische Berechnungen in Python

## Was ist NumPy?

- Klassisches Software Paket für numerische Berechnungen: **Matlab**
   - Sehr verbreitet in Industrie und Hochschulen
   - Numerische Simulation
   - Algorithmenentwurf
   - Datenerfassung, -analyse und -auswertung
   - Finanzmathematik / Ökonomie
   - Diverse Toolboxen

- **NumPy** + **SciPy** + **Matplotlib** (+ **Pandas**) = *Matlab-Funktionalität in Python*
- OpenSource
- Viele weitere Bibliotheken verwenden die o.g. Bibliotheken

### NumPy Features
- Eine effiziente, mehrdimensionale Array-Datenstruktur, die schnelle Lineare-Algebra-Operationen erlaubt (`ndarray`)
- Mathematische Funktionen für NumPy-Arrays, die ohne Programmschleifen auskommen
- Tools zum Lesen und Schreiben von Array-Daten
- Generierung von Zufallszahlen
- Eine C-API zum Anbinden von NumPy an Bibliotheken, die in C, C++ oder Fortran geschrieben sind

## NumPy und *Effizienz*

- Warum sollte man Python für numerische Berechnungen verwenden?
- Python ist eine Skriptsprache und Skriptsprachen sind langsam

- **Falsch!** NumPy vewendet eigene Datenstrukturen und optimierte Bibliotheken für mathematische Berechnungen

- Komplexe Algorithmen können sehr kompakt programmiert werden
- Die Berechnungen verwenden Hardware-nahe (*low-level*) Programme

In [None]:
import numpy as np
np.show_config()

#import mkl
#print(mkl.get_version(),"\n")

In [None]:
def matmul(A,B):
    C = []
    for i in range(len(A)):
        l = []
        for j in range(len(B[0])):
            s = 0
            for k in range(len(B)):
                s += A[i][k] * B[k][j]
            l.append(s)
        C.append(l)
    return C

In [None]:
import numpy as np
N = 200
A = np.random.rand(N, N)
B = np.random.rand(N, N)
A_list = A.tolist()
B_list = B.tolist()

t0 = %timeit -n1 -r1 -o C = matmul(A_list,B_list)

In [None]:
t1 = %timeit -n1 -r1 -o  C = A@B
print(f"NumPy ist {t0.average/t1.average:.2f}-mal schneller")

## NumPy Arrays

 ### N-dimensionales Array: `ndarray`
 $\ $ | $\ $
- | - 
![](https://numpy.org/doc/stable/_images/threefundamental.png) | ![](https://numpy.org/doc/stable/_images/dtype-hierarchy.png)

- Jedes Element im `ndarray` hat die gleiche Größe / den gleichen Typ (`dtype`)
- Jedes Element, das aus einem `ndarray`-Objekt (durch Slicing) extrahiert wird, wird durch ein Python-Objekt dargestellt

### Eigenschaften von NumPy Arrays

In [None]:
A = np.random.rand(8, 8)
print("Array ndim: ", A.ndim)
print("Array shape:", A.shape)
print("Array size: ", A.size)
print("Array dtype:", A.dtype)

### Größe von NumPy Arrays

In [None]:
from sys import getsizeof
A = np.random.rand(N, N)
A_list = A.tolist()
size_list = get_size(A_list)
size_ndarray = get_size(A)
print(f"Größe der Liste:    {size_list:10} Byte")
print(f"Größe des ndarrays: {size_ndarray:10} Byte\n")
print(f"{N}x{N}x8 (float64) =   {N*N*8} Byte ist das Minimum\n")
print(f"Die Liste ist {size_list/size_ndarray:.2}-mal gößer")

## Arrays erzeugen

In [None]:
liste = [[1.2, 2.4, 1.7, 4.2], [3.3, 1.5, 0.2, 1.1], [0.9, 1.2, 4.3, 1.3]]
np.array(liste)

In [None]:
np.zeros((2,5))

In [None]:
np.ones((2,5))

In [None]:
np.eye(3)

In [None]:
np.arange(2,10)

In [None]:
np.concatenate([np.zeros((3,3)) , np.ones((3,3))], axis=1)

## Arrays *umformen*

In [None]:

array = np.arange(20)
print(f"Das ndarray: {array}\n")
array = array.reshape(2,-1)
print(f"Das 2-dimensionale ndarray:\n{array}\n")
array.resize(2,2,5)
print(f"Das 3-dimensionale ndarray:\n{array}\n")
print(f"Das linearisierte 3D ndarray:\n{array.ravel()}\n")

## Array Slicing

In [None]:
X = np.arange(64).reshape(8,8)
X
#X[4:,:]

### Boolean Indexing

In [None]:
X = np.arange(10)
zufall = np.random.rand(X.size)
teil = X[zufall<0.2]
rest = X[zufall>=0.2]
print("Rand: ","  ".join([f"{x:.2f}" for x in zufall]))
print("Wert: ","  ".join([f"{x:4d}" for x in X]))
print("------"*(len(X)+1))

print(teil)
print(rest) 

## Mathematische Operationen

### Transposition

In [None]:
A = np.arange(8).reshape(4,2)
print(f"A:\n{A}\n\nA.T:\n{A.T}")

In [None]:
A = np.arange(120).reshape(5,4,2,3)
A.shape, A.T.shape

### Matrizenmultiplikation

In [None]:
A = np.arange(8).reshape(4,2)
A@A.T

### Element-weise Operationen

In [None]:
B = A@A.T
B + B

### Summe, Wurzel, ...

**Beispiel:** Euklidische Distanz $d(a,b) = \|a-b\|_2 = \sqrt{\sum_{i=0}^N\left(a_i-b_i\right)^2}$

In [None]:
a = np.array([1, 3, 5])
b = np.array([4, 5, 6])
diff = a - b
np.sqrt(np.sum(diff**2))

In [None]:
np.sqrt(np.dot(diff,diff))

In [None]:
np.sqrt(diff@diff.T)

## Broadcasting

![](numpy-broadcasting.png)

In [None]:
a = np.array([[0],[10],[20],[30]])
b = np.array([0, 1, 2])
a, b, a+b

## Zufallszahlen in NumPy

### Funktionen im Modul `numpy.random`
- `rand(dim_0, dim_1,...,dim_n)` Gleichverteilte Werte in der angebenen Dimension
- `randn(dim_0, dim_1,...,dim_n)` Normalverteilte Werte mit $\mu=0$ und $\sigma^2=1$
- `randint(vmin, vmax, size)` Zufällige Ganzzahl(en) $[vmin, vmax)$ (`size` ist optional)
- `choice(a, size, repl, p)` Ein zufälliges Element aus `a`
- `shuffle(a)` Permutation/Durchmischen (in-place)
- `permutation(a)` Permutation (Rückgabe)

In [None]:
import matplotlib.pyplot as plt
y = np.random.randn(100000)
plt.hist(y,bins=100)
pass

In [None]:
farben = ['♦', '♥', '♠', '♣']
werte = ['7', '8', '9', '10', 'B', 'D', 'K', 'A']
karten = []
for f in farben:
    for w in werte:
        karten.append(f+w)

eine_karte = np.random.choice(karten)
print(f"Eine Karte ist {eine_karte}")
np.random.permutation(karten)

## Anwendungen

### Skalarprodukt

![](simplenet.png)

In [None]:
x = np.array([1.3, 4.2, -2.3, 0.3])
w = np.array([0.3, 1.2, -1.1, -0.1])
summe = 0
for i in range(len(x)):
    summe += x[i]*w[i]
summe

In [None]:
np.dot(x,w)

In [None]:
x = x.reshape(-1,1)
w = w.reshape(-1,1)
x.T@w

## Gradientenverfahren mit NumPy

In [None]:
import numpy as np
import matplotlib.pyplot as plt

np.random.seed(123)
N = 100

x = np.random.random(N) * 10
noise = np.random.randn(N)
y = 3.3*x + 6
y += noise*5

In [None]:
plt.scatter(x,y)
pass

![](simplenet1.png)

In [None]:
w0 = 0
w1 = 0
y_ = w0 + w1 * x
plt.scatter(x,y)
plt.scatter(x,y_, c="r")

#### Modellfunktion

$y' = h_W(x) = w_0 + w_1 x$

#### Kostenfunktion

$J(W) = \frac{1}{2m}\sum_{i=1}^m (h_W(x)^{(i)}-y^{(i)})^2 $ 

#### Partielle Ableitungen

$\frac{\partial J}{\partial w_0} = 1\cdot 2\cdot(w_0 + w_1 - y)$ 

$\frac{\partial J}{\partial w_1} = x\cdot 2\cdot(w_0 + w_1 - y)$ 

In [None]:
lernrate = 0.1

y_ = w0 + w1 * x
db = (1*2*(y_ - y)).sum() / N
dw = (x*2*(y_ - y)).sum() / N
w0 -= lernrate*db
w1 -= lernrate*dw

In [None]:
y_ = w0 + w1 * x
plt.scatter(x,y)
plt.plot(x,y_, c="r")
w0, w1

In [None]:
from IPython import display
lernrate = 0.03

for i in range(100):
    plt.clf()
    y_ = w0 + w1 * x
    db = (1*2*(y_ - y)).sum() / N
    dw = (x*2*(y_ - y)).sum() / N
    w0 -= lernrate*db
    w1 -= lernrate*dw
    plt.scatter(x,y, c="tab:blue")
    plt.plot(x,y_, c="r")    
    display.display(plt.gcf())
    display.clear_output(wait=True)
    #time.sleep(1)
pass

In [None]:
plt.scatter(x,y)
plt.scatter(x,y_, c="r")
w0, w1

## Faltungskernel mit NumPy

![](convnet1.png)

In [None]:
import requests
url = "https://upload.wikimedia.org/wikipedia/commons/thumb/d/d4/Karl_Marx_001.jpg/450px-Karl_Marx_001.jpg"
headers={'User-Agent': 'Mozilla/5.0'} 
r = requests.get(url, headers=headers)
if r.status_code == 200:
    try:
        f = open("image.jpg", 'wb')
        f.write(r.content)
    except:
        print("Irgendetwas ist schief gegangen!")
else:
    print("Status code",  r.status_code) 

In [None]:
import matplotlib.image as mpimg
plt.figure(figsize=(9,7.5))
img=mpimg.imread('image.jpg')
plt.imshow(img, cmap="gray")

### Sobel-Operator
- Wird in der Bildverarbeitung zur Kantendetektion eigesetzt
- Einfacher Faltungsoperator
- Erkennt den Gradienten der Helligkeitswerte in einem kleinen Bildausschnitt

${\displaystyle \mathbf {G} _{x}={\begin{bmatrix}1&0&-1\\2&0&-2\\1&0&-1\end{bmatrix}}*A} \; \; \; \; {\displaystyle \mathbf {G} _{y}=\left[{\begin{array}{r}1&2&1\\0&0&0\\-1&-2&-1\end{array}}\right]*A}$



${\mathbf  {G}}={\sqrt  {{\mathbf  {G}}_{x}^{2}+{\mathbf  {G}}_{y}^{2}}}$

![](convnet2.png)

In [None]:
sx = np.array([[-1,0,1],[-2,0,2],[-1,0,1]])
sy = sx.T
Bild = img
Kanten = np.zeros(Bild.shape)
for y in range(1, Bild.shape[0]-1):
    for x in range(1, Bild.shape[1]-1):
        pixx = pixy = 0
        for i in [-1,0,1]:
            for j in [-1,0,1]:
                pixx += Bild[y+i,x+j]*sx[1+i,1+j]
                pixy += Bild[y+i,x+j]*sy[1+i,1+j]
        Kanten[y,x] = np.sqrt(pixx**2+pixy**2)
plt.imshow(Kanten, cmap="gray")

![](convnet3.png)

In [None]:
Bild = img
h,w = Bild.shape

ImgCol = np.zeros((9,(h-2)*(w-2)))
for x in range(h-2):
    for y in range(w-2):
        ImgCol[:,x*(w-2)+y] = (Bild[x:x+3,y:y+3].ravel()).reshape(-1,1).T
img_col = ImgCol

In [None]:
sx = np.array([[-1,0,1],[-2,0,2],[-1,0,1]])
sobel = np.array([sx.ravel(),sx.T.ravel()]).reshape(2,-1)
folded = sobel@img_col
res = np.sqrt(np.square(folded[0]) + np.square(folded[1]))

In [None]:
img_new = res.reshape((h-2,w-2))
plt.figure(figsize=(9,7.5))
plt.imshow(img_new, cmap="gray")

### Pooling

**Idee: Fasse einen zusammenhängenden Bereich zu einem Wert zusammen** 

- **Max Pooling:** Wähle den Maximalen Wert im Bereich
- **Average Pooling:** Wähle den Mittelwert des Bereichs

In [None]:
p = 6
new_shape = (img_new.shape[0]//p,img_new.shape[1]//p)
pool = np.zeros(new_shape)
for i in range(0,new_shape[0]):
    for j in range(0,new_shape[1]):
        pool[i,j] = np.mean(img_new[i*p:(i+1)*p+1,j*p:(j+1)*p+1])

plt.figure(figsize=(9,7.5))
plt.imshow(pool, cmap="gray")
print(f"Das neue Bild ist {img_new.size/pool.size:.1f}-mal kleiner")

## Zum 7. Termin

- **Matplotlib**: Visualisierung mit Python