# Evaluierung von NoSQL-Datenbanksystemen
# CouchDB
## Klemens Bayr BSc., Ivo Hufnagl BSc., Nadine Pribil BSc.

## 1. Kurzbeschreibung CouchDB

### 1.1. Was ist das Spezielle an der Datenbank?

Allgemein:
Bei CouchDB handelt es sich um eine **NoSQL Datenbank** und ist dementsprechend **dokumentenorientiert.** CouchDB ist in erster Linie mit "Erlang" programmiert worden und als Skriptsprache wird "JavaScript" verwendet. Das Konzept hinter dieser DB ist es, die **leichte Struktur** der NoSQL DB, mit der **Skalierbarkeit und Stärke** einer relationalen DB (RDBM) zu vereinen. Der Ansatz basiert auf Schlüssel-/Wert Paaren, Map/Reduce-Algorithmen und Versionierung.

Eigenschaften:
Zu den wichtigsten Eigenschaften der NoSQL Datenbank zählen die Architektur, der Zugriff, sowie die Schnittstellen (direkte und indirekte), MapReduce, Multiversion Concurrency Control (Versionierung) und Merge-Replikation.

- Architektur:
Die Speicherung in der DB erfolgt nicht wie in RDBMs in Tabellen, Zeilen und Spalten - sondern in **Dokumenten.** Diese beinhalten dann **JSON-Objekte** oder noch bei sehr alten Versionen, XML.

- Zugriff und Schnittstellen:
Auf die Daten wird mittels einer **REST-HTTP-Schnittstelle** zugegriffen. 
Indirket: JavaScript, PHP oder Python -> Bibliotheken für eine standardisiertere Arbeitsweise.
Direkt: Direkte Datensendung an Browser, ohne einem Webserver. -> Mit Ajax ist es möglich weitere Daten nachzuschicken und an das DOM anzubinden. 

- MapReduce:
Filter werden gleichzeitig über MapReduce und nicht während der eigentliche Query abgearbeitet. Zudem ist es möglich, dass Abfragen Funktionen beinhalten, die während der Query ausgeführt werden.

CouchDB kann **komplett eigenständig** verwendet werden, da die Datenbank ohne Hilfe seine Webserver Dokumente an den Browser schicken kann. Zusätzliche Software wie zum Beispiel Webserver oder zusätzliche Skriptsprachen (z.B. PHP) sind deswegen nicht notwendig. Ergänzend zu CouchDB kann jedoch aber "Fauxton" oder "Couchapp" verwendet werden - das erste ein Web-Interface zur Erleichterung der Administration, das zweite ein integriertes Webframework für JQuery - Bibliotheken (Evently, Mustache, Patchbinder, Markdown und CouchApp Loader). Zuletzt könnte noch "PouchDB" zusätzlich verwendet werden - dies ist eine mit der CouchDB API-Kompatible DB mit JavaScript.

Irrtümlich wird CouchDB manchmal mit der Datenbank "Bigtable" verglichen. Dies ist jedoch falsch, da es sich bei "Bigtable" um einen spaltenorientierten Speicher handelt und CouchDB diesen nicht hat. CouchDB kann nämlich innerhalb einer DB **verschiedene Dokumente mit unterschiedlichen Strukturen** haben.

### 1.2. Wo findet man Unterlagen?

Mehr zu CouchDB, der Entwicklungsgeschichte und weiteren Details zu Eigenschaften (Multiversion Concurrency Control oder Merge-Replikation) kann unter diesen Links nachgelesen werden:
- https://de.wikipedia.org/wiki/CouchDB
- https://docplayer.org/9018769-Einfuehrung-in-couchdb.html

Mehr zur Installation und Basic CouchDB Operationen kann hier nachgelesen werden:
- https://www.analyticsvidhya.com/blog/2022/07/introduction-to-apache-couchdb-using-python/

Mehr zu Design-Considerations kann bei diesen Link nachgelesen werden:
- https://docs.couchdb.org/en/3.2.2-docs/best-practices/documents.html

Hier können noch zwei sehr gute Dokus zur Verwendung von CouchDB und Python gelesen werden:
- https://couchdb-python.readthedocs.io/en/latest/getting-started.html
- https://couchdb-python.readthedocs.io/en/latest/client.html

### 1.3. Worfür wird sie verwendet?

CouchDB ist am besten geeignet für Anwendungen, die auf die Verwaltung von Dokumenten spezialisiert sind. Einige typische Anwendungsbereiche für CouchDB sind:

1. Content Management Systeme: CouchDB kann verwendet werden, um große Mengen an Inhalten wie Artikel, Bilder und Videos zu speichern und zu verwalten.

2. Mobile Anwendungen: Dank seiner Fähigkeit, Daten offline zu speichern und zu synchronisieren, eignet sich CouchDB gut für mobile Anwendungen, die auch ohne Internetverbindung funktionieren müssen.

3. Social Networking-Anwendungen: CouchDB kann verwendet werden, um Profile, Beiträge und andere Benutzerdaten zu speichern und zu verwalten.

4. E-Commerce-Anwendungen: CouchDB kann verwendet werden, um Produktdaten, Kundenprofile und Bestellungen zu speichern und zu verwalten.

5. Internet of Things (IoT)-Anwendungen: CouchDB eignet sich gut für Anwendungen, die große Mengen an Daten von IoT-Geräten sammeln und verwalten müssen.

6. Analysen und Berichterstellung : CouchDB kann verwendet werden, um große Mengen an Daten von verschiedenen Quellen zu sammeln und zu speichern, um Analysen und Berichterstellungen durchzuführen.

Einsatzbeispiele:
1. CERN: CouchDB wird zum Beispiel beim CERN in Genf verwendet, denn beim "Large Hadron Collider" (ein Teilchenbeschleuniger am Europäischen Kernforschungszetrum CERN) werden jedes Jahr ca. 10 PB Daten generiert. 
2. Internationales Rotes Kreuz: CouchDB wird auch beim Disaster Action Team des Internationalen Roten Kreuz hinter einer mobilen Anwendung (iDAT) verwendet. Dadurch wird ein fehlertoleranter Betrieb bei eingeschränkter Netzverfügbarkeit ermöglicht.
3. Weitere Einsatzbeispiele: United Airlines, IBM, Facebook, BBC, ...

### 1.4. Wo liegen die Stärken/Schwächen?

CouchDB ist eine NoSQL-Datenbank, die sich auf die Verwaltung von Dokumenten spezialisiert hat. Eine der Stärken von CouchDB ist seine Skalierbarkeit, da es in der Lage ist, große Datenmengen problemlos zu verwalten. Es bietet auch eine einfache und flexible API, die es Entwicklern ermöglicht, schnell und einfach Anwendungen zu erstellen. Ein weiteres Plus ist seine Fähigkeit, Daten offline zu speichern und zu synchronisieren, was besonders für mobile Anwendungen nützlich sein kann. Eine Schwäche von CouchDB ist jedoch die fehlende Unterstützung für komplexe Abfragen und Transaktionen im Vergleich zu relationalen Datenbanken. Es ist auch nicht so gut geeignet für Anwendungen, die eine hohe Performance benötigen, da es nicht so schnell wie andere NoSQL-Datenbanken ist.

### 1.5. Wie wird sie installiert?

CouchDB kann auf verschiedenen Betriebssystemen wie Windows, Linux und macOS installiert werden. Hier sind die allgemeinen Schritte zur Installation von CouchDB:

1. Voraussetzungen: Um CouchDB zu installieren, benötigen Sie einen Computer mit einem unterstützten Betriebssystem und einer Internetverbindung. Sie benötigen auch einen Webbrowser, um auf die CouchDB-Administrationskonsole zugreifen zu können.

2. Herunterladen: Laden Sie die aktuelle Version von CouchDB von der offiziellen Website herunter (http://couchdb.apache.org/#download) und speichern Sie sie auf Ihrem Computer.

3. Installation: Entpacken Sie die heruntergeladene Datei und führen Sie das Installationsprogramm aus. Folgen Sie den Anweisungen auf dem Bildschirm, um CouchDB zu installieren.

4. Konfiguration: Nach der Installation können Sie die Konfigurationsdatei von CouchDB bearbeiten, um die Einstellungen an Ihre Anforderungen anzupassen.

5. Starten Sie CouchDB: Starten Sie den CouchDB-Dienst und öffnen Sie die Administrationskonsole im Webbrowser, um sicherzustellen, dass die Installation erfolgreich war.

6. Testen Sie die Installation: Testen Sie die Installation, indem Sie einige Dokumente in die Datenbank hochladen und abfragen.

Installation über Docker:

1. Voraussetzungen: Um CouchDB über Docker zu installieren, benötigen Sie einen Computer mit Docker installiert.

2. Herunterladen: Laden Sie das offizielle CouchDB-Image von Docker Hub herunter (https://hub.docker.com/_/couchdb).

3. Starten Sie den Container: Verwenden Sie den Befehl "docker run" und geben Sie die erforderlichen Parameter an, um den Container zu starten.

4. Konfiguration: Passen Sie die Konfigurationsdatei von CouchDB an, um die Einstellungen an Ihre Anforderungen anzupassen.

5. Testen Sie die Installation: Testen Sie die Installation, indem Sie einige Dokumente in die Datenbank hochladen und abfragen.

### 1.6. Dokumentation

Eine genaue Dokumentation für die Installation gibt es hier: https://docs.couchdb.org/en/3.2.2-docs/install/docker.html

Eine Dokumentation für die Verwendung von CouchDB ist hier nachzulesen:
- https://couchdb-python.readthedocs.io/en/latest/getting-started.html
- https://couchdb-python.readthedocs.io/en/latest/client.html

## 2. Praktisches Beispiel

### 2.1. Wie kann die DB angesprochen werden?

In [None]:
#!pip install couchdb
import couchdb
import uuid

# Connect to CouchDB Server - Enter your Port, User and Passwort here if you installed via Docker:
couch = couchdb.Server('http://admin:YOURPASSWORD@localhost:CHANGEPORT/')

# Selecting or Creating the Database
dbname = "myCouchDB"
if dbname in couch:
    db = couch[dbname]
else:
    db = couch.create(dbname)

### 2.2. Schreiben in die DB

In [None]:
message = {
    'name': 'Vishnu',
    'age': 22,
    'country': 'India',
    'programming_languages': ['python', 'C++', 'C#']
}
    
#Create UUID
myuuid = uuid.uuid4()

#Write API JSON Message with UUID (own ID Creation) into DB Document 
db[str(myuuid)] = message

### 2.3. Lesen aus der DB

In [None]:
#Get all documents from DB and save to DataFrame
rows = db.view('_all_docs', include_docs=True)
data = [row['doc'] for row in rows]
df = pd.DataFrame(data)
df

### 2.4. Codebeispiele

Weitere Links für Codebeispiele in Python:
- https://couchdb-python.readthedocs.io/en/latest/getting-started.html
- https://gist.github.com/marians/8e41fc817f04de7c4a70