# Module in Python

Vorlesung Theoretische Chemie (WiSe 2024/2025) 

# Was ist ein Python Modul 

- **Modul**: Erweiterung der Python Sprache, die spezielle Funktionen / Konstanten bereitstellt
- ständige Neuimplementierung von Basisfunktionen ist nicht notwendig

**Bsp. Konstanten und Mathematische Funktionen**:

In [None]:
import numpy as np 
print(np.pi)     # Kreiszahl Pi
print(np.sin(0)) # Sinusfunktion

# Relevante Module für Chemie / Wissenschaften

- **NumPy**: mathematische Funktionen, Lineare Algebra, Daten Einlesen
- **Matplotlib**: Graphen erstellen
- **SciPy**: Regression, Optimierungsprobleme, ...
- **Pandas**: Analyse von großen Datensätzen
- ...

# Installation von Modulen
- nicht alle Module sind in der Installation von Python enthalten
- Installation abhängig von Paketmanager
    - `pip` (standard Python Paketmanager)
        ```bash
        pip install numpy
        ```
    - `conda` Anaconda Paketmanager
        ```bash
        conda install numpy
        ```
- Python Editoren wie PyCharm ermöglichen auch das Installieren mit einer grafischen Benutzeroberfläche

# Einbinden von Python Modulen 

Einfacher Import:
```python
import modul 
```

Import mit alias:
```python
import modul as alias      # bevorzugt 
```

Import von spezifischen Funktionen/Objekten:
```python 
from modul import module_function
```

In [None]:
import numpy
print(numpy.pi)
print(numpy.sin(0))

In [None]:
import numpy as npy
print(npy.pi)
print(npy.sin(0))

In [None]:
from numpy import pi, sin
print(pi)
print(sin(0))

# Wo Modul import statement setzen
- als allererstes im Python Script 
- jedes Modul nur einmal importieren

```python 
# als erstes Module importieren
import module1 as m1
import module2
from module3 import function_5

# danach folgen Funktionsdefinitionen
def my_function1():
    ...
    return ...

# danach die eigentlichen Berechnungen
a = ...
b = ...
print(...)

```

# Numpy

# Numpy: Überblick

- Numpy: "Numerical Python"
- **Inhalt**
    - Konstanten: Eulersche Zahl, Kreiszahl $\pi$, ...
    - Funktionen: trigonometrische Funktionen, exponential und logarithmus Funktionen, numerische Integration, numerische Ableitung, ...
    - **lineare Algebra**: Matrizen (Tensoren), Matrix Operationen (Eigenwert Löser, Matrix Produkt, ...)
    - einlesen von Datensätzen

# Numpy: Arrays (Matrizen, Tensoren)

- Arrays bezeichnet den Datentyp zum Speichern eines Tensors 

| Array-Typ | Bezeichnung         |
|-----------|----------------------|
| 0D-Array  | Skalar              |
| 1D-Array  | Vektor              |
| 2D-Array  | Matrix              |
| 3D-Array  | Rang-3 Tensor       |
| nD-Array  | Rang-n Tensor       |
- Elemente im Tensor haben einen eizigen Datentypen (z.B. Float oder Integer)


<div style="background-color: lightblue; padding: 10px;">
    <h3>Brauch ich Arrays auch wenn man als Experimentalchemiker arbeite?</h3>
    <p><b>Ja</b>: Arbeiten mit Datensätzen, z.B. Spektren mit x und y listen als 1D Arrays, oder 2D mit Zeitauflösung </p>
</div>

# Numpy: Erstellen eines Arrays
## aus Listen 

In [None]:
import numpy as np
my_list = [1, 2, 3, 4]
my_array = np.array(my_list)      # erstellt den 1D-Array
print(type(my_list))

my_array = np.array([1, 2, 3, 4]) # auch so möglich
print(my_array)

In [None]:
import numpy as np
my_array = np.array([[1, 2], [3, 4], [5, 6]]) # erstellt eine Matrix
print(my_array)

# Numpy: Erstellen eines Arrays
## mit generierenden Funktionen 

In [None]:
import numpy as np
my_array = np.linspace(-1.0, 2.0, 10)  # 1D-Array: (start, stop, elements)
print(my_array)
my_array = np.arange(-1.0, 2.0, 0.4)  # 1D-Array: (start, stop, step)
print(my_array)

In [None]:
import numpy as np
my_array = np.zeros((2, 3))  # 2D-Array: (dim1, dim2)
print(my_array)

# Numpy: Python Listen vs Numpy Arrays

In [None]:
import numpy as np
my_array = np.array([1, 2, 3, 4])
result = my_array * 3 + 1   # Operation wird für jedes Element ausgeführt
print(result)

result = np.sin(my_array)
print(result)

In [None]:
my_list = [1, 2, 3, 4]
result = my_list + my_list  # Mit Listen geht das nicht  
print(result)

#my_list = [[1, 2], [3, 4]]
#my_list[0, 1]

# Numpy: Array Indexierung

- Zugreifen auf ein bestimmtes Element in einem Array
- index in **eckigen Klammern**: `numpy_array[index]`

- Simpel für **1D Arrays**: 

In [None]:
import numpy as np
my_array = np.array([1, 2, 3]) 
print(my_array[0]) # erstes Element
print(my_array[1]) # mittleres Element
print(my_array[2]) # letztes Element
print(my_array[-2]) # auch letztes Element

<div style="background-color: lightblue; padding: 10px;">
    <h3>Wichtig</h3>
    <p> Das erste Element in einem Array hat den Index 0.</p>
</div>

# Numpy: Array Indexierung

- Für **2D Arrays**: `my_2d_array[index_axis_0, index_axis_1]`
<div>
<img src="https://philuttley.github.io/prog4aa_lesson2/fig/indexing.png" width="400em"/>
</div>

In [None]:
import numpy as np
my_array = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]) 
print(my_array[0, 0]) # element links oben
#
print(my_array[2, 2]) # element rechts unten
print(my_array[1, 0]) # 2. element in der ersten Spalte

# Numpy: Array Indexierung

- **Ausschnitt eines Arrays** mit mehr als einem Element:
```python
my_1D_array[start_index : end_index]  # Ausschnitt mit ":" operator 
```


In [None]:
import numpy as np
my_array = np.array([1, 2, 3, 4, 5]) 
print(my_array[0:2])
print(my_array[2:]) # weglassen eines index bedeutet alles danach
print(my_array[:2]) # oder davor
print(my_array[:])

# Numpy: Array Indexierung

- **Ausschnitt eines 2D Arrays** mit mehr als einem Element:
```python
my_2D_array[start_index_0 : end_index_0, start_index_1 : end_index_1] 
```


In [None]:
import numpy as np
my_array = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]) 
print(my_array[0:2, 0:2]) # sub-matrix links oben
print(my_array[:, 0])     # erste Spalte
print(my_array[1, :])     # zweite Zeile

# Numpy: Logische Indexierung

- oft gewünscht: Elemente aus einem Array, die eine Bedingung erfüllen
- Bsp. alle Elemente die größer sind als ein Schwellenwert

In [None]:
import numpy as np
my_array = np.array([1, 2, 3, 4])
mask = [False, False, True, True] # nur die letzten beiden elemente
print(my_array[mask])

In [None]:
import numpy as np
my_array = np.array([1, 2, 3, 4])
mask = (my_array > 2.0)  # erstellt liste mit True oder False Werten
print(mask)
print(my_array[mask])

In [None]:
import numpy as np
my_array = np.array([1, 2, 3, 4])
print(my_array[my_array > 2.0])  # alles in einem Ausdruck

# Numpy: Array Dimensionen

- Die Form eines Arrays erhält man mit der `numpy.shape` Funktion
- Es wird eine Tupel mit den Längen der jeweiligen Dimensionen zurückgegeben 

In [None]:
import numpy as np
my_array = np.array([1, 2, 3, 4, 5]) # 1D Array
my_shape = np.shape(my_array)
print(my_shape)
print(f"Der Array hat die Länge {my_shape[0]}.")

In [None]:
import numpy as np
my_array = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]) 
my_shape = np.shape(my_array)
print(my_shape)
print(f"Der Array hat die Form {my_shape[0]} mal {my_shape[1]}.")

# Numpy: Array aus Datei einlesen

- Mit der Funktion `numpy.loadtxt` ist es möglich Textdateien zu laden
```python 
my_array = np.loadtxt("my_txt_file.txt")
```
- optionale Argumente helfen beim einlesen
```python
# einlesen von komma-separierten text file, nur die ersten beiden Spalten
my_array = np.loadtxt("my_txt_file.csv", delimiter=',', usecols=(0, 1))
```

In [None]:
import numpy as np
"""
Inhalt der Textdatei test.txt:

1.0 2.0 3.0
4.0 5.0 6.0
7.0 8.0 9.0
"""

my_array = np.loadtxt("test.txt", usecols=(0))
print(my_array)

# Numpy: Funktionen und Arrays
- numpy stellt sehr viele mathematische Funktionen bereit
- Beispiele einiger Funktionen:

In [None]:
import numpy as np
my_array = np.array([-2, -1, 1, 2])

print(np.sin(my_array))           # trigonometrische Funktionen
print(np.sum(my_array))          # Summe aller Elemente
print(np.abs(my_array))          # absolut Wert aller Elemente
print(np.log(np.abs(my_array)))  # Logarithmus
print(np.amax(my_array))         # Maximum aller Elementen
print(np.amin(my_array))         # Minimum aller Elemente
print(np.mean(my_array))         # Mittelwert 
print(np.trapz(my_array))        # numerische Integration mit trapez-regel
print(np.dot(my_array, my_array)) # Skalarprodukt


# Numpy: Achtung bei Array Kopien!


In [None]:
import numpy as np
import copy
a = np.array([1, 1, 1])
b = a + 1
b[0] = 2
print(a, b)

**Grund:** Python speichert  alles als Objekte. Mit `b = a` enthält die variable `b` die Referenz zu dem Objekt der Variable `a`, aber kein neues Objekt wird erzeugt.

**Workaround:**
```python 
import numpy as np 
import copy
b = copy.deepcopy(a)
```


# Numpy: Übung
<div>
<img src="exercise_numpy.png" width="600em"/>
</div>

[Link zur Übung](https://colab.research.google.com/drive/1-ul8g07r9euDx_uEHXqD-6Wwr4peMsT5?usp=sharing)

# Matplotlib

# Matplotlib: Overview
![](https://miro.medium.com/v2/resize:fit:9450/1*OAFEIg9w1XHyZk0xBud14A.png)

## Matplotlib vs Origin und Excel

- **Nachteile von Matplotlib** gegenüber Origin und Excel:
    - Programmierkenntnisse erforderlich
    - etwas flachere Lernkurve
- **Vorteile von Matplotlib** gegenüber Origin und Excel:
    - Open source (kostenlos nutzbar)
    - mehr Funktionen als in Origin und Excel
    - große Datensätze kein Problem
    - Automatisierung
    - Wiederverwendbarkeit
    - sieht professioneller aus

## Matplotlib: Einfacher Plot
- [Dokumentation von `plt.plot()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html)

In [None]:
import numpy as np
import matplotlib.pyplot as plt # importieren der matplotlib bibliothek

# Sinuskurve
x = np.linspace(0.0, 4.0*np.pi, 100)
y = np.sin(x)

plt.plot(x, y) # zeichnet den graphen
plt.show()     # erzeugt den gesamt-plot

## Matplotlib: Einfaches Säulendiagramm
- [Dokumentation `plt.bar()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.bar.html)

In [None]:
import numpy as np
import matplotlib.pyplot as plt # importieren der matplotlib bibliothek

# Exponentialfunktion
x = np.arange(0, 10, 1)
y = np.exp(x)

plt.bar(x, y) # zeichnet die Säulen
plt.show()     # erzeugt den gesamt-plot

## Matplotlib: mehrere Plots mit Legende

In [None]:
import numpy as np
import matplotlib.pyplot as plt # importieren der matplotlib bibliothek

# Sinuskurve
x = np.linspace(0.0, 2.0*np.pi, 100)
y_sin = np.sin(x)
y_cos = np.cos(x)

plt.plot(x, y_sin, label="sin(x)") # zeichnet den graphen
plt.plot(x, y_cos, label="cos(y)")

plt.legend(fontsize=16) # erstellt die legende

plt.show()     # erzeugt den gesamt-plot

## Matplotlib: Achsenbeschriftung

In [None]:
import numpy as np
import matplotlib.pyplot as plt # importieren der matplotlib bibliothek

# Sinuskurve
x = np.linspace(0.0, 2.0*np.pi, 100)
y_sin = np.sin(x)
plt.plot(x, y_sin) # zeichnet den graphen

""" erstellt die Beschriftung """
plt.xlabel("x", fontsize=18)
plt.ylabel("sin(x)", fontsize=18)
plt.title("Die Sinusfunktion", fontsize=18, fontweight="bold")

plt.show()     # erzeugt den gesamt-plot

## Matplotlib: Achsen Grenzen und Skalierung

In [None]:
import numpy as np
import matplotlib.pyplot as plt # importieren der matplotlib bibliothek

# Exponentialfunktion
x = np.linspace(0.0, 5, 100)
y = np.exp(x)

plt.plot(x, y) # zeichnet den graphen

""" gibt die Grenzen der Achse an """
plt.xlim(left=0.0, right=5) 
plt.ylim(bottom=0.001, top=160)

""" Skalierung der Achse (logarithmisch oder normal)"""
plt.yscale("log")

plt.show()     # erzeugt den gesamt-plot

## Matplotlib: Plot Einstellungen

- für mehr einstellungen: **Matplotlib website besuchen**
- [Farben in Matplotlib](https://matplotlib.org/stable/gallery/color/named_colors.html)
- [Dokumentation von `plt.plot()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html)

In [None]:
import numpy as np
import matplotlib.pyplot as plt # importieren der matplotlib bibliothek

# Exponentialfunktion
x = np.linspace(0.0, 5, 50)
y = np.exp(x)

""" optionale Argumente für die Darstellung des Graphen"""
plt.plot(x, y, linestyle=":", color='red', marker="+")

plt.show()     # erzeugt den gesamt-plot

## Matplotlib: Übung
<div>
<img src="matplotlib_exercise.png" width="600em"/>
</div>

[Link zur Übung](https://colab.research.google.com/drive/1zH8B-62q5zENh-8g0hLDLOw7ui_5J3J7?usp=sharing)

## Matplotlib: Plot speichern

- **interaktiv** 
    - "Speichern" Button drücken
    - rechts unten im Plot-Fenster
- **im Skript**
    - mit `plt.savefig("filename.ending")` speichern
    - `"ending"` kann `"png"`, `"jpg"`, `"svg"`, `"pdf"` und vieles mehr sein
    - bei Pixelgraphiken (z.B. "png"): Auflösung mit Argument `dpi`  

In [None]:
import numpy as np
import matplotlib.pyplot as plt # importieren der matplotlib bibliothek

# Exponentialfunktion
x = np.linspace(0.0, 5, 50)
y = np.exp(x)
plt.plot(x, y)

plt.savefig("exp_funktion.png", dpi=200)
plt.show()

## Matplotlib: Größe der Abbildung
- Alle Einstellungen zur Abbildung mit der Funktion `plt.figure()`
- die Größe wird mit dem Keyword Argument `figsize=(with, height)` übergeben
- Maßeinheit is Zoll

In [None]:
import numpy as np
import matplotlib.pyplot as plt # importieren der matplotlib bibliothek

# Sinus und Cosinus
x = np.linspace(0.0, 2.0*np.pi, 200)
y_sin = np.sin(x)

plt.figure(figsize=(6.4, 4.8)) # ändert die Größe des Plots, default: 6.4x4.8 Zoll

plt.plot(x, y_sin)

plt.show()

## Matplotlib: Subplots

- mehrere Plots in einer Abbildung 
- Gitter von Plots: (Anzahl Plots vertical) x (Anzahl Plots horizontal)
    - [komplexere Anordnung auch möglich](https://matplotlib.org/stable/users/explain/axes/arranging_axes.html)
- erzeugen von einem Subplot: `plt.subplot(id)` 
- `id` ist dreistellige Zahl: 
    - 1. Stelle: Anzahl Plots vertical
    - 2. Stelle: Anzahl Plots horizontal
    - 3. Stelle: Nummer des Plots
    
- Bsp. `plt.subplot(235)`
![](subplots.svg)

In [None]:
import numpy as np
import matplotlib.pyplot as plt # importieren der matplotlib bibliothek

# Sinus und Cosinus
x = np.linspace(0.0, 2.0*np.pi, 200)
y_sin = np.sin(x)
y_cos = np.cos(x)

#plt.figure(figsize=(12.8, 4.8)) # ändert die Größe des Plots, default: 6.4x4.8 zoll

plt.subplot(231)     # plot Gitter 1x2, 1. Plot
plt.subplot(232)    # plot Gitter 1x2, 2. Plot
plt.subplot(233)
plt.subplot(234)
plt.subplot(235, fc='blue')
plt.subplot(236)
plt.tight_layout()  # verhindert Überlagerung, löscht "whitespace" 
plt.savefig("subplots.svg")

## Matplotlib: Subplots

In [None]:
import numpy as np
import matplotlib.pyplot as plt # importieren der matplotlib bibliothek

# Sinus und Cosinus
x = np.linspace(0.0, 2.0*np.pi, 200)
y_sin = np.sin(x)
y_cos = np.cos(x)

plt.figure(figsize=(12.8, 4.8)) # ändert die Größe des Plots, default: 6.4x4.8 zoll

plt.subplot(121)     # plot Gitter 1x2, 1. Plot
plt.plot(x, y_sin)
plt.xlabel("x")

plt.subplot(122)    # plot Gitter 1x2, 2. Plot
plt.plot(x, y_cos)

plt.tight_layout()  # verhindert Überlagerung, löscht "whitespace" 
plt.show()

## Matplotlib: Mehrere Abbildungen in einem Skript
- mehrere Abbildungen in einem Skript: Abbildungen müssen geschlossen werden
- nach jedem `plt.show()`: `plt.close("all")`
- verhindert das Überfüllen des Arbeitsspeichers (RAM) 

In [None]:
import numpy as np
import matplotlib.pyplot as plt # importieren der matplotlib bibliothek

# Sinus und Cosinus
x = np.linspace(0.0, 2.0*np.pi, 200)
y_sin = np.sin(x)
y_cos = np.cos(x)

plt.plot(x, y_sin)
plt.show()
plt.close('all')

plt.plot(x, y_cos)
plt.show()

# Scipy

## Scipy: Überblick

- Wissenschaftliche Bibliothek in Python, die auf NumPy aufbaut und erweiterte Funktionen für technische und wissenschaftliche Berechnungen bietet.
- **Untermodule**:
  - `scipy.constants`: Physikalische und mathematische Konstanten.
  - `scipy.fft`: Fourier-Transformationen.
  - `scipy.integrate`: Integrationstechniken (z.B. quad, odeint).
  - `scipy.interpolate`: Interpolation und Spline-Anpassung.
  - `scipy.linalg`: Lineare Algebra (erweitert NumPy's `linalg`).
  - `scipy.optimize`: Optimierung und Wurzelsuche (z.B. `minimize`, `curve_fit`).
  - `scipy.signal`: Signalverarbeitung (z.B. Filterung, Signaltransformation).
  - `scipy.sparse`: Arbeiten mit spärlichen Matrizen.
  - `scipy.spatial`: Berechnungen in der räumlichen Geometrie (z.B. Distanzen, Delaunay-Triangulation).
  - `scipy.stats`: Statistische Berechnungen (z.B. Wahrscheinlichkeitsverteilungen, Tests).
- **Verwendung**:
  - Hauptsächlich für numerische Berechnungen in Bereichen wie Physik, Chemie, Ingenieurwesen und Statistik.
  - Optimierung von Funktionen und Datenanalyse.

## Scipy Beispiel: Lineare Regression

- mit der Funktion:
```python
slope, intercept, r_value, p_value, std_err = scipy.stats.linregress(x, y)
```
- Rückgabewerte:
    - `slope`: Anstieg
    - `intercept`: Achsenabschnitt
    - `r_value`: Pearson-Korrelationskoeffizient (Bestimmtheitsmaß: `r_vale**2`)

In [None]:
import numpy as np
import scipy as sc

# Beispiel-Daten generieren
x = np.linspace(0, 10, 50)
y = 2 * x + 1 + np.random.normal(0, 1, x.size) # y = 2x +1 mit Rauschen

# Lineare Regression berechnen
slope, intercept, r_value, p_value, std_err = sc.stats.linregress(x, y)

print(f"Steigung: {slope:.2f}\nAchsenabschnitt: {intercept:.2f}\nR^2: {r_value**2:.2f}")

## Scipy: Lineare Regression Plotten

In [None]:
import numpy as np
import scipy as sc
import matplotlib.pyplot as plt

# Beispiel-Daten generieren
x = np.linspace(0, 10, 50)
y = 2 * x + 1 + np.random.normal(0, 1, x.size) # y = 2x +1 mit Rauschen

# Lineare Regression berechnen
slope, intercept, r_value, p_value, std_err = sc.stats.linregress(x, y)
print(f"Steigung: {slope:.2f}\nAchsenabschnitt: {intercept:.2f}\nR^2: {r_value**2:.2f}")

plt.plot(x, y, color='black', linestyle='', marker='o')
plt.plot(x, slope * x + intercept, color='red')
plt.show()

# Zusammenfassung

- **Numpy**: Daten laden, Array-Operationen, mathematische Funktionen
- **Matplotlib**: Abbildungen erstellen
- **Scipy**: komplexere mathematische/physikalische Probleme
- **Übung macht den Meister**
    - manchmal Excel mit Python ersetzen 