<img style="float: right;" src="img/python.png">

### NoSQL am Beispiel von Mongo-DB
Im Gegensatz zu SQL-Datenbanken wie SQLite, MySQL oder MariaDB handelt es sich bei MongoDB **NICHT um eine relationale Datenbank**.
MongoDB ist eine **dokumentorientierte Datenbank mit einer nicht strukturierten Abfragesprache**.

MongoDB ist eine beliebte NoSQL-Datenbank, die für ihre Flexibilität und Skalierbarkeit bekannt ist. In Kombination mit Python, einer der vielseitigsten Programmiersprachen, bietet sie eine leistungsstarke Plattform zur Verwaltung und Verarbeitung von Daten.

Da es MongoDB auf einen Datenbank-Server basiert, muss dieser installiert sein. Der MongoDB-Server kann unter der folgenden Adresse runtergeladen werden:

[Download MongoDB-Community Edition](https://www.mongodb.com/try/download/community)

**Glücklicherweise ist MongoDB bereits auf unserer virtuellen Maschine installiert**.

Nach der Installation kann der MongoDB Compass aufgerufen werden:
<br>
<img style="float: center;" src="img/mongodb0.png">
<br>

**Und wieder geschlossen, da wir ja in mit Python und PyCharm arbeiten**. ;-)



#### Verbindung zu Datenbank mit Hilfe von PyCharm

<br>
<img style="float: center;" src="img/mongodb6.png">
<br>
<img style="float: center;" src="img/mongodb7.png">
<br>



Bei der ersten Verbindung zur Datenbank muss noch der passende Treiber installiert und unter Umständen aktualisiert werden.

Zugangsdaten sind in diesen Fall nicht erforderlich, da der Server auf der virtuellen Maschine nicht geschützt ist.

### Wichtig zu beachten

MongoDB speichert Daten in einem Format namens **BSON**, das eine binäre Version von JSON ist.
MongoDB ist **schemafrei**, was bedeutet, dass Dokumente in derselben Collection unterschiedliche Felder haben können.
Die Interaktion mit MongoDB über Python erfolgt hauptsächlich durch das Arbeiten mit **Dictionaries** und **Cursors**.


#### Verbindung herstellen
In unserem einfachen Beispiel ist der Login zu Datenbank nicht über Zugangsdaten geschützt. Um auf die Datenbank
zuzugreifen nutzen wir **Mongo-Client** aus der Bibliothek "**pymongo**" die installiert werden muss.
Mehr Informationen zu pymongo finden Sie unter der folgenden Adresse:
[Pymongo-Readthedocs](https://pymongo.readthedocs.io/en/stable/tutorial.html)

In [2]:
from pymongo import MongoClient

client = MongoClient('mongodb://localhost:27017')
db = client["neueDatenbank"]


#### Daten zur Datenbank hinzufügen

Mongodb unterstützt dabei folgende Datentypen:
<br>
<img style="float: center;" src="img/mongodb14.png">
Quelle: Entwickler.press

#### String Kodierung
Strings können beim Speichern UTF-8 kodiert sein. Mongodb verarbeitet diese automatisch. Strings müssen also nicht vorher in ASCII-Format konvertiert werden.

#### Datensatz einer Collection hinzufügen

Sobald Sie Daten in eine Collection einfügen, wird die Datenbank (in diesem Fall **neueDatenbank**) erstellt.

In [3]:
collection = db["meineCollection"]
collection.insert_one({"name": "Max Mustermann",
                       "alter": 28,
                       "rolle": "PythonDozentIn"})

InsertOneResult(ObjectId('662f4b6f5e0caf98497c4be4'), acknowledged=True)

**Bingo!**
<br>
<img style="float: center;" src="img/neue_Datenbank.PNG">
<br>
<img style="float: center;" src="img/mongodb8.png">

#### Embedded Documents
Es ist auch möglich Teildokumente in Top-Level-Dokumente einzufügen. Man könnte diese auch unendlich untereinander verschachteln.
In der Regel würde das aber den Aufwand, um an die Daten zu kommen erhöhen.

#### Erfolgskontrolle, alle Datenbanken auflisten:

In [4]:
print(client.list_database_names())

['admin', 'config', 'local', 'neueDatenbank']


Dieser Code zeigt alle Datenbanknamen in Ihrer MongoDB-Instanz an. Sobald die erste Dateneinfügung erfolgt ist, sollte neueDatenbank in dieser Liste erscheinen.

Denken Sie daran, dass in MongoDB eine Datenbank oder eine Collection **nicht physisch erstellt wird, bis Daten darin gespeichert werden**. Dies unterscheidet MongoDB von traditionellen relationalen Datenbanksystemen.

#### Mehrere Elemente der Datenbank hinzufügen

In [5]:
addList = [
    {
        "name": "Tony Tester",
        "alter": 30  
    },
    {
        "name": "Tanja Tester",
        "alter": 25,
        "rolle": "Python-Dozentin"
    }
]

collection.insert_many(addList)

InsertManyResult([ObjectId('662f5e0c5e0caf98497c4be5'), ObjectId('662f5e0c5e0caf98497c4be6')], acknowledged=True)

Wie Ihnen sicher aufgefallen ist, brauchen Tabellen, anders als bei SQL-Datenbanken, nicht erweitert werden, um einen Datensatz hinzuzufügen, der weitere Angaben enthält.
Hier wurde ein neuer Datensatz angelegt, der im Gegensatz zu den anderen Datensätzen noch eine Rolle enthält:

<img style="float: center;" src="img/mongodb9.png">

#### Daten aus der Datenbank lesen

### find_one()

In [6]:
daten = collection.find_one({ "name": "Tony Tester" })
print(daten)

{'_id': ObjectId('662f5e0c5e0caf98497c4be5'), 'name': 'Tony Tester', 'alter': 30}


Wie Sie sicher  bemerkt haben, erfolgt die Ausgabe als **Dictionary**.

In [12]:
daten = collection.find_one({ "name": "Tony Tester" })

for key, value in daten.items():
    print(f"{key}: {value}")
    
print()
print("Möglichkeit2: ")

print(daten["name"])
print(daten["alter"])

daten2 = collection.find_one({ "name": "Tanja Tester" })
print(daten2)

_id: 662f5e0c5e0caf98497c4be5
name: Tony Tester
alter: 30

Möglichkeit2: 
Tony Tester
30
{'_id': ObjectId('662f5e0c5e0caf98497c4be6'), 'name': 'Tanja Tester', 'alter': 25, 'rolle': 'Python-Dozentin'}


#### Die Objectid

<img style="float: center;" src="img/mongodb15.png">
<br>
<br>
Die Objectid wird vom Client Driver oder der Datenbank automatisch generiert.
Falls gewünscht kann der Entwickler eine eigene Objectid generieren. Diese darf allerdings nur einmal vorkommen:


#### Mehrere Suchparameter
Natürlich können auch mehrere Suchparameter kombiniert werden:

In [13]:
daten2 = collection.find_one({ "name": "Tanja Tester", "rolle": "Python-Dozentin" })
print(daten2)

{'_id': ObjectId('662f5e0c5e0caf98497c4be6'), 'name': 'Tanja Tester', 'alter': 25, 'rolle': 'Python-Dozentin'}


### Nach Werten filtern:

In [18]:
daten = collection.find({"alter": {"$gte": 28}})

for i in daten:
    print(i)

{'_id': ObjectId('662f4b6f5e0caf98497c4be4'), 'name': 'Max Mustermann', 'alter': 28, 'rolle': 'PythonDozentIn'}
{'_id': ObjectId('662f5e0c5e0caf98497c4be5'), 'name': 'Tony Tester', 'alter': 30}


In [17]:
daten = collection.find({"alter": {"$gte": 28}})

for i in daten:
    for key, value in i.items():
        print(f"{key}: {value}")
    print("*"*40)


_id: 662f4b6f5e0caf98497c4be4
name: Max Mustermann
alter: 28
rolle: PythonDozentIn
****************************************
_id: 662f5e0c5e0caf98497c4be5
name: Tony Tester
alter: 30
****************************************


### Weitere Filter- und Vergleichsmöglichkeiten:

\begin{tabular}{lll}
\texttt{\$eq} & : & \texttt{Gleich. Vergleicht, ob der angegebene Wert dem im Dokument enthaltenen Wert entspricht.} \\
\texttt{\$ne} & : & \texttt{Nicht gleich. Vergleicht, ob der angegebene Wert nicht dem im Dokument enthaltenen Wert entspricht.} \\
\texttt{\$gt} & : & \texttt{Größer als. Vergleicht, ob der im Dokument enthaltene Wert größer als der angegebene Wert ist.} \\
\texttt{\$gte} & : & \texttt{Größer als oder gleich. Vergleicht, ob der im Dokument enthaltene Wert größer oder gleich dem angegebenen Wert ist.} \\
\texttt{\$lt} & : & \texttt{Kleiner als. Vergleicht, ob der im Dokument enthaltene Wert kleiner als der angegebene Wert ist.} \\
\texttt{\$lte} & : & \texttt{Kleiner oder gleich. Vergleicht, ob der im Dokument enthaltene Wert kleiner oder gleich dem angegebenen Wert ist.} \\
\texttt{\$in} & : & \texttt{In. Überprüft, ob der im Dokument enthaltene Wert in einem angegebenen Array enthalten ist.} \\
\texttt{\$nin} & : & \texttt{Nicht in. Überprüft, ob der im Dokument enthaltene Wert nicht in einem angegebenen Array enthalten ist.}
\end{tabular}

Nach Teil des Names suchen

{'_id': ObjectId('662f5e0c5e0caf98497c4be5'), 'name': 'Tony Tester', 'alter': 30}


Daten suchen mit regex


In [30]:
import pymongo

collection = db["meineCollection"]
# Teil des Namens, nach dem du suchen möchtest
teil_des_namens = "Tester"

# Regulärer Ausdruck für die Suche nach einem Teil des Namens
regex_pattern = {"$regex": ".*" + teil_des_namens + ".*"}

# Die Suche durchführen
ergebnisse = collection.find({"name": regex_pattern})

# Ergebnisse ausgeben
for ergebnis in ergebnisse:
    print(ergebnis)



{'_id': ObjectId('662f5e0c5e0caf98497c4be5'), 'name': 'Tony Tester', 'alter': 30}
{'_id': ObjectId('662f5e0c5e0caf98497c4be6'), 'name': 'Tanja Tester', 'alter': 25, 'rolle': 'Python-Dozentin'}


#### Alle Daten der Datenbank anzeigen mit find():

In [34]:
daten = collection.find()
for i in daten:
    for key, value in i.items():
        print(f"{key}: {value}")
    print("*"*40)


_id: 662f4b6f5e0caf98497c4be4
name: Max Mustermann
alter: 28
rolle: PythonDozentIn
****************************************
_id: 662f5e0c5e0caf98497c4be5
name: Tony Tester
alter: 30
****************************************
_id: 662f5e0c5e0caf98497c4be6
name: Tanja Tester
alter: 25
rolle: Python-Dozentin
****************************************
_id: 662f7035063f0f7011879533
name: Berny New
alter: 15
rolle: TesterPython
****************************************
_id: 662f7204c20b6ad1bdbe74d5
name: Ann
alter: 21
rolle: Beste Freundin
anstellung: festvertrag
****************************************


Der Syntax von find():
find(query, fields, num-docs, skip-docs)

#### Anzahl der Dokumente in einer Datenbank

In [33]:
print(collection.count_documents({}))

3


#### Ein kleines Skript zum Hinzufügen neuer Benutzer (Übung)

In [38]:
from pymongo import MongoClient

client = MongoClient('mongodb://localhost:27017')
db = client["neueDatenbank"]
collection = db["meineCollection"]

name = input("Bitte geben Sie einen Namen ein: ")
alter = int(input("Bitte geben Sie das Alter ein: "))
rolle = input("Bitte geben Sie die Rolle ein: ")

nutzerInfo = {"name": name, "alter": alter, "rolle": rolle}

try:
    collection.insert_one(nutzerInfo)
except Exception as e:
    print("Es ist folgende Fehler aufgetreten", e)
finally:
    client.close()

InsertOneResult(ObjectId('6582fc6278252ccbe9056e0d'), acknowledged=True)

#### Ein kleines Skript zum Suchen eines Eintrages (gemeinsame Übung)

In [35]:
from pymongo import MongoClient

client = MongoClient('mongodb://localhost:27017')
db = client["neueDatenbank"]
collection = db["meineCollection"]

name = input("Bitte geben Sie einen Namen ein: ")

daten = {"name": {"$regex": f".*{name}.*"}}

try:
    ergebnis = collection.find(daten)
    for i in ergebnis:
        print(i)
except Exception as e:
    print("Es ist folgende Fehler aufgetreten", e)
#finally:
#    client.close()

{'_id': ObjectId('662f5e0c5e0caf98497c4be5'), 'name': 'Tony Tester', 'alter': 30}
{'_id': ObjectId('662f5e0c5e0caf98497c4be6'), 'name': 'Tanja Tester', 'alter': 25, 'rolle': 'Python-Dozentin'}


#### Wie viele Python-DozenInnen befinden sich in der Datenbank?

In [37]:
from pymongo import MongoClient

client = MongoClient('mongodb://localhost:27017')
db = client["neueDatenbank"]
collection = db["meineCollection"]
print(collection.count_documents({"rolle": "Python-DozentIn"}))

2


### Daten ändern
Jede Datenbank muss nicht nur aufgerufen, sondern auch gepflegt werden (OK, vielleicht nicht alle, aber die meisten).
Zum Ändern von Daten wird die **update()**-Methode verwendet.
Naturgemäß erwartet die Methode **2**, oder **maximal 4** Parameter.

Syntax:
update(query, new-document/update-document, upsert, multiple)
<br>

<img style="float: center;" src="img/mongodb19.png">




In [4]:
from pymongo import MongoClient

client = MongoClient('mongodb://localhost:27017')
db = client["neueDatenbank"]
collection = db["meineCollection"]

daten = collection.find_one({"name": "Tony Tester" })

print("Vorher: ")
print(daten["name"])
print(daten["rolle"])
print("*"*40)

collection.update_one({"name": "Tony Tester" }, {"$set": {"rolle": "Teilnehmer"}})
daten = collection.find_one({ "name": "Tony Tester" })

print("Hinterher: ")
print(daten["name"])
print(daten["rolle"])


Vorher: 
Tony Tester
Python-DozentIn
****************************************
Hinterher: 
Tony Tester
Teilnehmer


### Daten löschen
#### Einen Eintrag löschen

Wir löschen den Eintrag von Tony Tester:

In [5]:
from pymongo import MongoClient

client = MongoClient('mongodb://localhost:27017')
db = client["neueDatenbank"]
collection = db["meineCollection"]

collection.delete_one({ "name": "Tony Tester" })



DeleteResult({'n': 1, 'ok': 1.0}, acknowledged=True)

#### Mehrere Einräge löschen

Wir löschen alle Python-DozenInnen:

In [6]:
from pymongo import MongoClient

client = MongoClient('mongodb://localhost:27017')
db = client["neueDatenbank"]
collection = db["meineCollection"]

collection.delete_many({ "rolle": "Python-DozentIn" })

DeleteResult({'n': 2, 'ok': 1.0}, acknowledged=True)

Natürlich funktionieren auch Filter:

In [8]:
collection.delete_many({"alter": {"$gte": 20}})

DeleteResult({'n': 1, 'ok': 1.0}, acknowledged=True)

#### Indizierung:
Wie bei relationalen Datenbanken ist die Indizierung in MongoDB entscheidend für die Leistungsfähigkeit bei Abfragen. Sie können Indizes auf Collections erstellen, um die Abfragegeschwindigkeit zu verbessern.

In [12]:
import pymongo
collection.create_index([("name", pymongo.ASCENDING)])

'name_1'

Jede Collection in MongoDB kann mehrere Indizes haben, die die Abfrageleistung verbessern. Sie können die Methode **index_information()** verwenden, um Details zu den Indizes einer bestimmten Collection zu erhalten.

Hier ist ein Beispiel, wie Sie die Informationen zu den Indizes einer Collection in MongoDB mit Python und pymongo abrufen können:

In [13]:
indexes = collection.index_information()

for index in indexes:
    print(indexes[index])

{'v': 2, 'key': [('_id', 1)]}
{'v': 2, 'key': [('name', 1)]}


- **index_information()** gibt ein Dictionary zurück, in dem die Schlüssel die Namen der Indizes sind und die Werte Details zu jedem Index enthalten.
- Die Ausgabe enthält Informationen wie den Namen des Indexes, die Felder, die indiziert sind, und ob der Index in aufsteigender (1) oder absteigender (-1) Reihenfolge ist.
- Standardmäßig hat jede Collection in MongoDB einen Index auf dem _id-Feld.

Diese Methode ist nützlich, um zu verstehen, wie Ihre Daten in MongoDB organisiert und indiziert sind, was wiederum Einfluss auf die Leistung Ihrer Abfragen hat.

### Wichtig!
Das sind die Grundlagen, um mit MongoDB in Python zu arbeiten. Es gibt noch viele weitere Funktionen und Methoden, die MongoDB bietet, insbesondere im Hinblick auf Aggregationen, Indizierung, und Verwaltung großer Datenmengen.

<img style="float: center;" src="img/wbs-logo.jpg">


### Abbildungs- und Quellenverzeichnis
https://de.wikipedia.org/wiki/Python_(Programmiersprache)
Das Python Logo ist ein eingetragenes Warenzeichen der Python Software Foundation
Alle auf dieser Website veröffentlichten Logos sowie Marken-, Produkt- und Warenzeichen sind Eigentum der jeweiligen Unternehmen
© WBS TRAINING AG – Alle Rechte vorbehalten

### Nutzungsrechte:
Die Nutzung dieser Dokumentation ist ausschließlich für Schulungszwecke der WBS TRAINING AG gestattet. Eine Weitergabe an Dritte, auch auszugsweise, sowie Vervielfältigungen und Verbreitungen aller Art (elektronische und andere Verfahren) inklusive Übersetzungen sind nur mit vorheriger schriftlicher Zustimmung des Rechtinhabers gestattet. Zuwiderhandlungen verpflichten zu Schadenersatz.

### Herausgeber:

WBS TRAINING AG
Lorenzweg 5
12099 Berlin
Haftungsausschluss:
Alle Inhalte sind nach bestem Wissen korrekt und vollständig recherchiert und mit größtmöglicher Sorgfalt für die Schulungsunterlage zusammengestellt. Wir sind um die laufende Aktualisierung aller Informationen und Daten bemüht. Dennoch können Fehler (z.B. Abweichungen zur beschriebenen Hard- und Software durch kurzfristige Updates) auftreten, sodass wir für die vollständige Übereinstimmung, Richtigkeit und Aktualität keine Gewähr übernehmen. Hinweise unserer Nutzer werden konsequent weiterverfolgt.
