<h1><span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#Das-Datenmodell-von-Python" data-toc-modified-id="Das-Datenmodell-von-Python-4"><span class="toc-item-num">4&nbsp;&nbsp;</span>Das Datenmodell von Python</a></span><ul class="toc-item"><li><span><a href="#Struktur-eines-Objekts" data-toc-modified-id="Struktur-eines-Objekts-4.1"><span class="toc-item-num">4.1&nbsp;&nbsp;</span>Struktur eines Objekts</a></span><ul class="toc-item"><li><span><a href="#Datentyp" data-toc-modified-id="Datentyp-4.1.1"><span class="toc-item-num">4.1.1&nbsp;&nbsp;</span>Datentyp</a></span></li><li><span><a href="#Wert" data-toc-modified-id="Wert-4.1.2"><span class="toc-item-num">4.1.2&nbsp;&nbsp;</span>Wert</a></span></li><li><span><a href="#Identität" data-toc-modified-id="Identität-4.1.3"><span class="toc-item-num">4.1.3&nbsp;&nbsp;</span>Identität</a></span></li></ul></li><li><span><a href="#Referenzen-und-Objekte-freigeben" data-toc-modified-id="Referenzen-und-Objekte-freigeben-4.2"><span class="toc-item-num">4.2&nbsp;&nbsp;</span>Referenzen und Objekte freigeben</a></span></li><li><span><a href="#Mutable-vs.-Immutable-Datentypen" data-toc-modified-id="Mutable-vs.-Immutable-Datentypen-4.3"><span class="toc-item-num">4.3&nbsp;&nbsp;</span>Mutable vs. Immutable Datentypen</a></span><ul class="toc-item"><li><span><a href="#Immutable-Datentypen" data-toc-modified-id="Immutable-Datentypen-4.3.1"><span class="toc-item-num">4.3.1&nbsp;&nbsp;</span>Immutable Datentypen</a></span></li><li><span><a href="#Mutable-Datentypen" data-toc-modified-id="Mutable-Datentypen-4.3.2"><span class="toc-item-num">4.3.2&nbsp;&nbsp;</span>Mutable Datentypen</a></span></li><li><span><a href="#Effekte" data-toc-modified-id="Effekte-4.3.3"><span class="toc-item-num">4.3.3&nbsp;&nbsp;</span>Effekte</a></span></li><li><span><a href="#Gegenüberstellung" data-toc-modified-id="Gegenüberstellung-4.3.4"><span class="toc-item-num">4.3.4&nbsp;&nbsp;</span>Gegenüberstellung</a></span></li></ul></li></ul></li></ul></div>

Quellen: 
  - J.Ernesti, P.Kaiser, *Python 3 - Das umfassende Handbuch*: Teil 1 - Kapitel 6
  - https://docs.python.org/3/reference/datamodel.html

# Das Datenmodell von Python



- Wir schauen uns an wie Python Objekte zur Laufzeit verwaltet inkl. sich ergebender Besonderheiten
- Um zu verstehen, was intern passiert, unterscheiden wir: **Referenz** und **(Daten-)Objekt** 
    - **Objekt** = Abstraktion für ein konkretes Datenobjekt im Speicher
        - Ein Objekt kann als Instanziierung eines Datentyps aufgefasst werden.
    
    - **Referenz** = ermöglicht im Quelltext den Zugriff  auf ein Objekt (i.d.R. durch Variablennamen)
        - Wir erzeugen eine Referenz mit dem Zuweisungsoperator `=`, indem wir schreiben: `Referenz = Literal`

**Beispiel**

In [None]:
ref1 = 100.

`ref1` $\rightarrow$ referenziert $\rightarrow$ `100.`

Bereits referenzierte Objekte können wir mit weiteren Referenzen versehen:

In [None]:
ref2 = ref1 
print(ref2)

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;`ref1`  $\rightarrow$ 

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; `100.` 

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;`ref2`  $\rightarrow$

**Wichtige Beobachtung:** Im Speicher gibt es nach wie vor nur einmal das Objekt vom Typ `float` mit dem Wert `100.`
   - Durch `ref2 = ref1` wird das Objekt mit dem Wert `100.` also nicht kopiert, sondern lediglich ein zweites Mal referenziert.

**Referenzen auf dasselbe Objekt sind unabhängig im folgenden Sinne**

Zunächst das Beispiel von oben mit zwei Referenzen auf ein Objekt

In [None]:
ref1 = 100.
ref2 = ref1
print(ref1, ref2) 
# ref1 is ref2 

Nun richten wir `ref1` auf ein anderes Objekt:

In [None]:
ref1 = 200.  # erzeugt ein neues Objekt mit Referenz ref1!
print(ref1, ref2)
# ref1 is ref2

In [None]:
ref1 = 100.
ref2 = ref1
ref1 = 200.
ref2 = ref1
print(ref2, ref1)

Wir bemerken, dass `ref2` weiterhin auf 100. verweist:

`ref1` $\rightarrow$ referenziert $\rightarrow$ `200.`

`ref2` $\rightarrow$ referenziert $\rightarrow$ `100.`

## Struktur eines Objekts

Ein Objekt in Python besitzt *drei* Merkmale:

Merkmal | Beispiel | Abfrage
:-|:-|:-
**Datentyp** | `float` | `type()`
**Wert** | `100.0` | `print()`
**Identität** | `140101856400016` | `id()`

### Datentyp

- Der Datentyp dient als Bauplan bei der Erzeugung eines Objekts
- Er definiert die möglichen Werte und bestimmt die Operationen, die das Objekt unterstützt (z. B. "hat es eine Länge?"; siehe Methoden des Datentyps). 
- Beispiele:
    - `int`/`float` erlauben das Speichern einer ganzen/Gleitkomma- Zahl und unterstützen u.a. die Operationen Addition, Mulitplikation, etc.
    - `str` erlaubt speichern einer Zeichenkette
- Den Datentyp eines Objekts können mit der eingebauten Funktion `type()` erfragen.

In [None]:
ref1 = 100
ref2 = 100.
print(type(ref1), type(ref2))

In [None]:
type(ref1) == type(ref2)

In [None]:
ref = "string"
type(ref)

In [None]:
ref = [1,1]
type(ref)

### Wert

Ein Objekt in Python besitzt *drei* Merkmale:

Merkmal | Beispiel | Abfrage
:-|:-|:-
Datentyp | `float` | `type()`
**Wert** | `100.` | `print()`  $~~~~~\leftarrow$
Identität | `140101856400016` | `id()`

Was den Wert ausmacht hängt vom Datentyp des Objekts ab

In [None]:
# integer
print(5)
# float
print(5.0)
# string
print("5")
# list
print([5])

**Werte können wir mit dem Vergleichsoperator `==` vergleichen:**

Objekt 1 | Beispiel|     |Objekt 2 | Beispiel 
:---------|:---------|:-----|:-----------|:----------
 Datentyp | `int` |   |Datentyp| `float` 
  **Wert** | 5 | $~~~~~$ `==` $~~~~~$ |**Wert**| 5.0 
   Identität | 124213453125 ||Identität| 984248753125

Nur sinnvoll für strukturell ähnliche Datentypen:
- `int == int`, `int == float`
- `str == str`
- `list == list`

In [8]:
ref1 = 10
ref2 = 10.1
ref1 == ref2

False

In [9]:
print(5 == 5, type(5), type(5))
print(5 == 5.0, type(5), type(5.0))
print(5 == "5", type(5), type("5"))
# print("hallo" == "hallo", type("hallo"), type("hallo"))
# print([0, 1] == range(2), type([0,1]), type(range(2))) 

True <class 'int'> <class 'int'>
True <class 'int'> <class 'float'>
False <class 'int'> <class 'str'>


 - Zum Beispiel: `int == string` ist immer False
 - Ist der Operator `==` für zwei bestimmte Typen nicht definiert, wird deren Identität herangezogen 

### Identität

Ein Objekt in Python besitzt *drei* Merkmale:


Merkmal | Beispiel | Abfrage
:-|:-|:-
Datentyp | `float` | `type()`
Wert | `100.` | `print()`  
**Identität** | `140101856400016` | `id()`$~~~~~\leftarrow$

Zwei unterschiedliche Objekte können durchaus denselben Typ und Wert besitzen. Wie können wir diese also unterscheiden?

In [10]:
ref1 = 5.  # erzeugt ein Objekt mit Typ=float, Wert=5.
ref2 = 5.  # erzeugt ein weiteres Objekt mit Typ=float, Wert=5.
type(ref1) == type(ref2), ref1 == ref2

(True, True)

**Identität** eines Objekts = ganze Zahl, die einem Objekt programmweit *eindeutig* zugeordnet ist 

 - ändert sich nie, sobald Objekt angelegt
 - kann als Abstraktion der Speicheradresse aufgefasst werden
 - Abfrage mit der eingebauten Funktion `id()`

In [11]:
ref1 = 5.  # erzeugt ein Objekt mit Typ=float, Wert=5.
ref2 = 5.  # erzeugt ein weiteres Objekt mit Typ=float, Wert=5.
id(ref1), id(ref2), id(ref1) == id(ref2)

(140036387780304, 140036387774704, False)

In [12]:
a = [0,1]
b = a
c = [0,1]
#c = a
print(id(a) == id(b))
print(id(a) == id(c))

True
False


**Ausnahmen:** integers von -5 bis 256 werden python-intern in einem array gespeichert
    
Bei der vermeintlichen Instanziierung `a = 5` wird tatsächlich nur eine neue Referenz erzeugt

In [15]:
a = 190.
b = 190.
id(a) == id(b)

False

**Identitäten-Vergleich besitzt einen eigenen Operator: `is`**

`id(a) == id(b)` $\Leftrightarrow$ `a is b`

Objekt 1 | Beispiel|     |Objekt 2 | Beispiel 
:---------|:---------|:-----|:-----------|:----------
 Datentyp | `int` |   |Datentyp| `float` 
  Wert | 5 |   |Wert| 5. 
   **Identität** | 124213453125 |$~~~~~$**`is`**$~~~~~$|**Identität**| 984248753125

In [16]:
a = 190
b = 190. # 190
a == b, id(a) == id(b), a is b

(True, False, False)

In [None]:
a = [0, 1]
b = [0, 1]
print(a is b)
# erzeugt zwei Objekte und benötigt mehr Speicher als
# die Erzeugung zweier Referenzen:
a = [0, 1]
b = a
print(a is b)

## Referenzen und Objekte freigeben

Objekte werden letztlich im Speicher (Hardware) angelegt. Wenn Objekte nicht mehr gebraucht werden, sollte dieser Speicher freigegeben werden, um nicht unnötig Ressourcen zu verbrauchen.
 - Programmierer kann den Speicher nicht direkt verwalten (das übernimmt Python).
 - Allerdings: Python löscht Objekte automatisch, auf die keine Referenz mehr exisitert (*Garbage Collection*/  *Müllabfuhr*)
     - Objekt ohne Referenz ist für den Programmierer ohnehin nicht mehr zugänglich (daher nicht mehr benötigt)
     - Python benutzt dafür intern einen Referenzzähler (*reference count*)
     - alle Referenzen entfernen $\Rightarrow$ Objekt wird entfernt

**Referenz entfernen/freigeben mit `del`-Anweisung**

[Skizze zu `del`](4_LaufzeitModell_5.png)

In [17]:
a = [1,5]
del a
print(a) 

NameError: name 'a' is not defined

In [18]:
a = [1,5]  # Anzahl Referenzen auf Objekt mit Wert [1,5] = 1
b = a  # Anzahl Referenzen auf Objekt mit Wert [1,5] = 2
del a #,b   # Anzahl Referenzen auf Objekt mit Wert [1,5] = 1
print(b)

[1, 5]


## Mutable vs. Immutable Datentypen

(im)mutable = (un)veränderlich

Häufig unterscheiden Programmiersprachen (so auch Python) zwei grundlegende Eigenschaften von Datentypen: **immutable** vs **mutable**

**Wdh:** Ein Objekt in Python besitzt *drei* Merkmale:

Merkmal | Beispiel | Abfrage
:-|:-|:-
Datentyp | `float` | `type()`
***Wert*** | `100.0` | `print()`
Identität | `140101856400016` | `id()`

Der Unterschied besteht darin, dass der **Wert** eines Objekts vom Typ (im)mutable nach Erzeugung (un)veränderlich ist!

### Immutable Datentypen

- Wert des Objekts ist unveränderlich.
- Manipulation eines immutable Datentyps führt zur Erzeugung eines neuen Objekt.
    - Manipulationen z.B. über *kombinierte Zuweisungsoperatoren*: `+=`,`-=`, `*=`, `/=`, `**=`, `//=`
- Beispiele: `int`, `float`, `str`

In [19]:
a = -6.
b = a
print(a)
print(id(a), id(b), a is b)

-6.0
140036387780944 140036387780944 True


In [20]:
# Nun manipulieren wir den Wert (= 6.) des Objekts
a = a * 2 # oder aequivalent: a = a * 2
print(a, b)
print(id(a), id(b), a is b) 

-12.0 -6.0
140036387780784 140036387780944 False


In [None]:
i = 256.
print(id(i))
while True:
    i = i + 1
    print(i, id(i))
    if i == 268.:
        break

In [21]:
a = "Hallo "
b = a
print(a)
print(id(a), a is b)


Hallo 
140036336396656 True


In [22]:
# Nun manipulieren wir den Wert (= "Hallo ") des Objekts
a += "Welt!" # a = a + "Welt!"
print(a, b)
print(id(a), a is b)

Hallo Welt! Hallo 
140036336393904 False


[Skizze dazu](4_LaufzeitModell_6.png)

### Mutable Datentypen

- Wert eines Objekts vom Typ *mutable* ist veränderlich.
- Manipulation eines mutable Datentyps führt **nicht** zur Erzeugung eines neuen Objekts.
- Beispiel: `list`

In [23]:
a = [1,2]
b = a
print(a)
print(id(a), a is b)


[1, 2]
140036336393408 True


In [25]:
# Nun manipulieren wir den Wert des Objekts
a += [3,[4]] 
# a = a + [3,4]  # Achtung: Syntax a = a + [3,4] bewirkt Objekterzeugung, da Zuweisungsoperator!
print(b)
print(id(a), a is b)

[1, 2, 3, 4, 3, [4]]
140036336393408 True


[Skizze dazu](4_LaufzeitModell_7.png)

### Effekte

Da sich der Wert von immutable Objekten nicht ändern kann, ist es nicht "sinnvoll" zwei unterschiedliche Objekte mit demselben Wert zu erzeugen, da im Optimalfall ein Objekt ausreicht, auf die dann Referenzen verweisen.

In [None]:
a = 1  # Referenzerzeugung 1
b = 1  # vermeintliche Objekterzeugung 2, aber
a is b  # a und b sind nur Referenzen auf das Objekt mit dem Wert 1

Wird im Programm ein immutable angefordert hat Python zwei Möglichkeiten
 - (1) Objekt erzeugen
 - (2) Referenz auf bestehendes Objekt erzeugen

(1) Objekterzeugung = Speicher anfordern +  mit Information befüllen (kostet Rechenzeit und Speicherplatz )
 

(2) ein bestehendes Objekt nochmal referenzieren = Referenzzähler erhöhen + Speicheradresse ermitteln und kopieren (billiger, sofern schnell ermittlet werden kann, wo das Objekt mit dem entsprechenden Wert gespeichert ist)

Daher für immutable Datentypen im Optimalfall nur eine einzige Instanz mit mehreren Referenzen darauf, **aber**...

je mehr Objekte im Speicher existieren, desto aufwändiger ist die Ermittlung der Speicheradresse, daher ab einem gewissen Punkt Instanzerzeugung billiger.

$\rightarrow$ ob er Programmier darauf Einfluss hat hängt von der Umsetzung der Programmiersprache ab. In Python haben wir zunächst keinen direkten Einfluss darauf.

### Gegenüberstellung

In [None]:
a = "Hallo " # Objekterzeugung
b = a      
print(a is b) 
a += "Welt!" # Objekterzeugung (da Wert unveränderlich), a referenziert andere Instanz mit dem neuen Wert
print(a, b)

In [None]:
a = [1,2]
b = a # später Modul copy
c = a
a += [3,4] # *keine* Objekterzeugung (da Wert veränderlich), b und a referenzieren dieselbe Instanz
print(a, b, c)

Also **Vorsicht** bei mehrfach referenzierten Objekten des Datentyps (im)mutable

**Abschließende Bemerkungen aus der offiziellen Python Dokumentation**

 - Der Wert eines unveränderlichen Container-Objekts, das einen Verweis auf ein veränderliches Objekt enthält, kann sich ändern, wenn der Wert des letzteren geändert wird; der Container wird jedoch immer noch als unveränderlich angesehen, da die Sammlung der darin enthaltenen Objekte nicht geändert werden kann. Unveränderlichkeit ist also nicht unbedingt dasselbe wie ein unveränderlicher Wert, sondern etwas subtiler.
 
 - Typen beeinflussen fast alle Aspekte des Objektverhaltens. Selbst die Bedeutung der Objektidentität wird in gewisser Weise beeinflusst: Bei unveränderlichen Typen können Operationen, die neue Werte berechnen, tatsächlich einen Verweis auf ein beliebiges vorhandenes Objekt desselben Typs und desselben Werts zurückgeben, während dies bei veränderlichen Objekten nicht zulässig ist. So können sich z. B. nach a = 1; b = 1 a und b je nach Implementierung auf dasselbe Objekt mit dem Wert 1 beziehen, aber nach c = []; d = [] beziehen sich c und d garantiert auf zwei verschiedene, eindeutige, neu erstellte leere Listen. (Man beachte, dass c = d = [] sowohl c als auch d das gleiche Objekt zuweist).