<img src="img/python-logo-notext.svg"
     style="display:block;margin:auto;width:10%"/>
<h1 style="text-align:center;">Python: Benutzerdefinierte Datentypen<br/><br/>
Mit Exkursen in Ausnahmebehandlung, Dateien und Context Manager</h1>
<h2 style="text-align:center;">Coding Akademie München GmbH</h2>
<br/>
<div style="text-align:center;">Dr. Matthias Hölzl</div>

# Umwandlung in Strings

Python bietet zwei Funktionen an, mit denen beliebige Werte in Strings umgewandelt
werden können:

- `repr` für eine "programmnahe" Darstellung (wie könnte der Wert im Programm erzeugt werden)
- `str` für eine "benutzerfreundliche" Darstellung

In [1]:
print(str("Hallo!"))

Hallo!


In [2]:
print(repr("Hallo!"))

'Hallo!'


Für manche Datentypen liefern `str` und `repr` den gleichen String zurück:

In [3]:
print(str(["a", "b", "c"]))
print(repr(["a", "b", "c"]))

['a', 'b', 'c']
['a', 'b', 'c']


# Benutzerdefinierte Datentypen

In Python können benutzerdefinierte Datentypen (Klassen) definiert werden:

In [4]:
class PointV0:
    pass


Klassennamen werden in Pascal-Case (d.h. groß und mit Großbuchstaben zur
Trennung von Namensbestandteilen) geschrieben, z.B. `MyVerySpecialClass`.


Instanzen von benutzerdefinierten Klassen werden erzeugt, indem man den
Klassennamen als Funktion aufruft.  Manche der Python Operatoren und
Funktionen können verwendet werden:

In [6]:
p1 = PointV0()
p1

<__main__.PointV0 at 0x1ebf92e26d0>

In [7]:
print(p1)

<__main__.PointV0 object at 0x000001EBF92E26D0>


In [10]:
p2 = PointV0()
p1 == p2

False

In [12]:
# p1 < p2


Ähnlich wie Dictionaries neue Einträge zugewiesen werden können, kann man
benutzerdefinierten Datentypen neue *Attribute* zuweisen, allerdings verwendet
man die `.`-Notation statt der Indexing Notation `[]`:

In [13]:
# Möglich, aber nicht gut...
p1.x = 1.0
p1.y = 2.0
print(p1.x)
print(p1.y)

1.0
2.0


In [15]:
# Fehler!
# p2.y


Im Gegensatz zu Dictionaries werden Instanzen von Klassen typischerweise
*nicht* nach der Erzeugung beliebige Attribute zugewiesen!

Statt dessen sollen allen Instanzen die gleiche Form haben. Deswegen werden
die Attribute eines Objekts bei seiner Konstruktion initialisiert. Das geht
über die `__init__()` Methode. Die `__init__()`-Methode hat immer
(mindestens) einen Parameter, der per Konvention `self` heißt:

In [16]:
class PointV1:
    def __init__(self):
        self.x = 0.0
        self.y = 0.0

In [17]:
p1 = PointV1()
p2 = PointV1()
print("p1: x =", p1.x, "y =", p1.y)
print("p2: x =", p2.x, "y =", p2.y)

p1: x = 0.0 y = 0.0
p2: x = 0.0 y = 0.0



Die Werte von Attributen können verändert werden:

In [21]:
p1.x = 1.0
p1.y = 2.0
print("p1: x =", p1.x, "y =", p1.y)
print("p2: x =", p2.x, "y =", p2.y)

p1: x = 1.0 y = 2.0
p2: x = 0.0 y = 0.0



In vielen Fällen wäre es besser, bei der Konstruktion eines Objekts Werte für
die Attribute anzugeben. Das ist möglich, indem man der `__init__()`-Methode
zusätzliche Parameter gibt.

In [36]:
class PointV2:
    def __init__(self, x: float = 0.0, y: float = 0.0):
        self.x = x
        self.y = y

In [39]:
p1 = PointV2(x=2.0, y=3.0)
p2 = PointV2(y=2.1)
print("p1: x =", p1.x, "y =", p1.y)
print("p2: x =", p2.x, "y =", p2.y)
p1

p1: x = 2.0 y = 3.0
p2: x = 0.0 y = 2.1


<__main__.PointV2 at 0x1ebf93e8ca0>

## Mini-Workshop

- Notebook `lecture_045x_Workshop_Benutzerdefinierte_Datentypen`
- Abschnitt "Kraftfahrzeuge (Teil 1)"

## Methoden

Klassen können Methoden enthalten. Im Gegensatz zu vielen anderen Sprachen hat
Python bei der Definition keinen impliziten `this` Parameter; das Objekt auf
dem die Methode aufgerufen wird muss als erster Parameter angegeben werden.

Per Konvention hat dieser Parameter den Namen `self`, wie bei der
`__init__()`-Methode.

In [40]:
class PointV3:
    def __init__(self, x: float = 0.0, y: float = 0.0):
        self.x = x
        self.y = y
    
    def move(self, dx=0.0, dy=0.0):
        self.x += dx
        self.y += dy

In [42]:
p = PointV3(2.0, 3.0)
print(p.x, p.y)

2.0 3.0


In [43]:
p.move(2.0, 5.0)
print(p.x, p.y)

4.0 8.0


## Mini-Workshop

- Notebook `lecture_045x_Workshop_Benutzerdefinierte_Datentypen`
- Abschnitt "Kraftfahrzeuge (Teil 2)"

## Das Python-Objektmodell

Mit Dunder-Methoden können benutzerdefinierten Datentypen benutzerfreundlicher
gestaltet werden:

In [44]:
print(str(p))
print(repr(p))

<__main__.PointV3 object at 0x000001EBF93E8940>
<__main__.PointV3 object at 0x000001EBF93E8940>


Durch Definition der Methode `__repr__(self)` kann der von `repr` zurückgegebene
String für benutzerdefinierte Klassen angepasst werden: Der Funktionsaufruf
`repr(x)` überprüft, ob `x` eine Methode `__repr__` hat und ruft diese auf,
falls sie existiert.

In [69]:
class PointV4:
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def __repr__(self):
        return f"PointV4({self.x}, {self.y})"
    
    def __eq__(self, other):
        if isinstance(other, PointV4):
            return self.x == other.x and self.y == other.y
        return False

    def move(self, dx=0, dy=0):
        self.x += dx
        self.y += dy

In [70]:
p1 = PointV4(2, 5)
print(repr(p1))
print(str(p1))

PointV4(2, 5)
PointV4(2, 5)
PointV4(2, 5)


In [62]:
p2 = PointV4(2, 5)
p3 = PointV4(3, 7)

In [63]:
p1 == p2

True

In [64]:
p1 is p2

False

In [65]:
p1 == p3

False

In [66]:
p1 == 123

False

Standardmäßig delegiert die Funktion `str` an `repr`, falls keine `__str__`-Methode
definiert ist:


In [48]:
print(str(p1))

PointV4(2, 5)


Python bietet viele Dunder-Methoden an: siehe das
[Python Datenmodell](https://docs.python.org/3/reference/datamodel.html)
in der Dokumentation

In [87]:
class Point:
    def __init__(self, x=0, y=0):
        self.x = x
        self.y = y

    def __repr__(self):
        return "Point(" + repr(self.x) + ", " + repr(self.y) + ")"

    def __eq__(self, o: object) -> bool:
        if isinstance(o, Point):
            return self.x == o.x and self.y == o.x
        return False

    def __add__(self, other):
        return Point(self.x + other.x, self.y + other.y)

    def __sub__(self, other):
        return Point(self.x - other.x, self.y - other.y)

    # Double dispatch
    def __mul__(self, other):
        print("Called __mul__()")
        return Point(other * self.x, other * self.y)
    
    def __rmul__(self, other):
        print("Called __rmul__()")
        return Point(other * self.x, other * self.y)

    def move(self, dx=0, dy=0):
        self.x += dx
        self.y += dy

In [88]:
p1 = Point(1, 2)
p2 = Point(2, 4)
p3 = Point(2, 4)
p1, p2, p3

(Point(1, 2), Point(2, 4), Point(2, 4))

In [89]:
p1 == p2

False

In [90]:
p2 == p3

False

In [91]:
p3 = p1 + p2
p3

Point(3, 6)

In [92]:
p3 = p1 - Point(3, 2)
p3

Point(-2, 0)

In [93]:
print(p1)
print(p1 * 3)
print(3 * p1)

Point(1, 2)
Called __mul__()
Point(3, 6)
Called __rmul__()
Point(3, 6)


In [94]:
print(p2)
p2 += p1
p2

Point(2, 4)


Point(3, 6)


Es ist möglich eigene Typen zu definieren, die sich wie Listen verhalten:

In [103]:
class MyBadList:
    def __init__(self, elements = None):
        if elements is None:
            elements = []
        self.elements = elements
    
    def __getitem__(self, n):
        return self.elements[n]
    
    def __len__(self):
        return len(self.elements)
    
    def __repr__(self):
        return f"MyBadList({self.elements!r})"
    
    def append(self, element):
        self.elements.append(element)

In [96]:
my_list_1 = MyBadList()
my_list_2 = MyBadList()
my_list_3 = MyBadList([1, 2, 3])
print(my_list_1)
print(my_list_2)
print(my_list_3)

MyBadList([])
MyBadList([])
MyBadList([1, 2, 3])


In [97]:
my_list_1.append("a")
my_list_1.append("b")
my_list_1.append("c")
print(my_list_1)
print(my_list_2)
print(my_list_3)

MyBadList(['a', 'b', 'c'])
MyBadList([])
MyBadList([1, 2, 3])


In [100]:
print(len(my_list_1))
print(my_list_1[0])
# print(my_list_1[10])

3
a


In [101]:
for elt in my_list_1:
    print(elt)

a
b
c


In [102]:
my_list_1[1:]

['b', 'c']

## Dataclasses

Definition einer Klasse, in der Attribute besser sichtbar sind, Repräsentation
und Gleichheit vordefiniert sind, etc.

Die [Dokumentation](https://docs.python.org/3/library/dataclasses.html)
beinhaltet weitere Möglichkeiten.

In [115]:
from dataclasses import dataclass

@dataclass
class DataPoint:
    x: float = 0.0
    y: float = 0.0

TypeError: non-default argument 'y' follows default argument

In [113]:
dp = DataPoint(2, 3)
dp

DataPoint(x=2, y=3)

In [114]:
dp1 = DataPoint(1, 1)
dp2 = DataPoint(1, 1)
print(dp1 == dp2)
print(dp1 is dp2)

True
False


In [None]:
@dataclass
class Point3D:
    x: float
    y: float
    z: float = 0.0

    # Non-destructive move!
    def move(self, dx=0.0, dy=0.0, dz=0.0):
        return Point3D(self.x + dx, self.y + dy, self.z + dz)

In [None]:
p3d = Point3D(1.0, 2.0)
print(p3d)
print(p3d.move(dy=1.0, dz=5.0))


Dataclasses erzwingen, dass alle Default-Werte unveränderlich sind:

In [None]:
from dataclasses import dataclass, field

@dataclass
class DefaultDemo:
    # item: list = []
    items: list = field(default_factory=list)

In [None]:
d1 = DefaultDemo()
d2 = DefaultDemo()

In [None]:
d1.items.append(1234)
print(d1)
print(d2)

## Workshop

- Notebook `lecture_045x_Workshop_Benutzerdefinierte_Datentypen`
- Abschnitt "Einkaufsliste"