<a href="https://colab.research.google.com/github/michael-wettach/pythonsamples/blob/main/Python_4_Erweiterte_Datentypen.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<h1>Nützliche Python Module</h1>

Ich will noch einige Module vorstellen, die die Basisfunktionalität von Python erweitern. Da gibt es natürlich über 300.000 Projekte in https://pypi.org/ (viele davon sind kleine Privatprojekte und schaffen es nicht in die offizielle Python Dokumentation docs.python.org). Da in der letzten Sitzung noch einmal das Dictionary nachgefragt wurde, beginne ich mit dem Thema Datentypen. 

<h2>Erweiterte Datentypen im Modul collections</h2>

Das Dictionary selbst und die eingebauten iterierbaren Typen wurden bereits in Teil 1 meiner Kurseinheiten vorgestellt. Das Modul collections erweitert diese um einige Typen für spezielle Anwendungsgebiete, die man oft theoretisch auch als Dictionary abbilden könnte, die innerhalb des Moduls collections aber effizienter implementiert sind. Einige Einführungen findet man hier:
* https://docs.python.org/3/library/collections.html 
* https://www.digitalocean.com/community/tutorials/how-to-use-the-collections-module-in-python-3-de 
* https://www.geeksforgeeks.org/python-collections-module/

In [5]:
# Zunächst nochmal die Wiederholung: ein Dictionary speichert Werte für benannte Inhalte.
# Jeder Inhalts-Name kommt nur einmal in dem Dictionary vor, diese heißen daher auch Keys.
my_dict = {'Name': 'Nemo', 'Gattung': 'Clownfisch', 'Standort': 'Aquarium 1'}
print(my_dict)
print(my_dict.keys())      # Liefert eine Liste aller Namen, zu denen etwas im Dictionary steht
print(my_dict.items())     # Liefert alle Namen und deren Wert als eine Liste von Tupeln
print(my_dict['Name'])     # Liefert den Wert zu einem einzelnen eingetragenen Namen

{'Name': 'Nemo', 'Gattung': 'Clownfisch', 'Standort': 'Aquarium 1'}
dict_keys(['Name', 'Gattung', 'Standort'])
dict_items([('Name', 'Nemo'), ('Gattung', 'Clownfisch'), ('Standort', 'Aquarium 1')])
Nemo


Man kann sich den Inhalt des Dictionaries auch vorstellen als einen Datensatz in einer Datenbank.
<table width="50%">
<tr><td>Name</td><td>Gattung</td><td>Standort</td></tr>
<tr><td>Nemo</td><td>Clownfisch</td><td>Aquarium 1</td></tr>
</table>


Um das Ganze zu einer richtigen Tabelle wie in einer Datenbank auszubauen, müsste man eine Liste von solchen Dictionaries anlegen. Blöd ist dann allerdings, dass jedes einzelne Dictionary wieder die Keys Name, Gattung und Standort definieren muss. Für so etwas gibt es im Modul Pandas den Dataframe, im Modul Collections das Named Tuple.

In [6]:
# Jetzt machen wir das mal mit einem Named Tuple
from collections import namedtuple

# Der folgende Aufruf erzeugt eine Klasse mit dem Namen "Fisch" 
Fisch = namedtuple('Fisch', ['Name', 'Gattung', 'Standort'])

# Der folgende Aufruf instantiiert die Klasse mit Werten
Nemo = Fisch('Nemo', 'Clownfisch', 'Aquarium 1')

print(Nemo)

Fisch(Name='Nemo', Gattung='Clownfisch', Standort='Aquarium 1')


In [13]:
# Zugriff auf einzelne Werte
print(Nemo.Name, "/", Nemo.Gattung, "/", Nemo.Standort)

Nemo / Clownfisch / Aquarium 1


In [16]:
# Der Datentyp eignet sich gut zur Verarbeitung von tabellarischen Daten
# Beispiel aus https://realpython.com/python-namedtuple/#reading-tabular-data-from-files-and-databases 
all_the_text = """name,job,email
"Linda","Technical Lead","linda@example.com"
"Joe","Senior Web Developer","joe@example.com"
"Lara","Project Manager","lara@example.com"
"David","Data Analyst","david@example.com"
"Jane","Senior Python Developer","jane@example.com"
"""
with open("Employees.csv", mode='w') as my_csv:
  my_csv.write(all_the_text)

In [18]:
# Jetzt lesen wir die CSV Datei mal ein
import csv
with open("Employees.csv", "r") as csv_file:
    reader = csv.reader(csv_file)
    Employee = namedtuple("Employee", next(reader), rename=True)
    for row in reader:
        employee = Employee(*row)
        print(employee.name, employee.job, employee.email)

Linda Technical Lead linda@example.com
Joe Senior Web Developer joe@example.com
Lara Project Manager lara@example.com
David Data Analyst david@example.com
Jane Senior Python Developer jane@example.com
