![alt text](https://upload.wikimedia.org/wikipedia/commons/thumb/c/c6/Influxdb_logo.svg/2560px-Influxdb_logo.svg.png "Influx")

### Angabe: 
* ~~Grundlagen zur DB, Links auf Homepage und diverse Ressourcen~~
* ~~Es soll ein kurzer Einblick gegeben werden, was das Spezielle an der jeweiligen Datenbank ist~~
* zu welcher Kategorie gehört die DB?
* ~~technische Eckdaten~~
* wann ist ein Einsatz sinnvoll?
* ~~Eckpunkte der Installation(Installationsanleitung, auch Links auf Webressourcen erlaubt)~~

Praktischer Teil:
* Bringen Sie die Datenbank zum Laufen (zum Vorzeigen auch Docker etc. erlaubt)
* Verbinden Sie die Datenbank mit Python, und zeigen Sie in einem vorbereiteten Jupyter-Notebook ein paar Schritte mit der Datenbank vor, sodass man einen Einblick in die Eigenheiten gewinnen kann.
* Gehen Sie ein (sehr einfaches) Beispiel durch

...
zu beachtende Kriterien:
* Alle Unterlagen, Informationen, Codestücke etc. werden in Form eines (einzelnen) Jupyter-Notebooks zusammengefasst.
* Das Jupyter-Notebook soll als "Einstieg" in die Datenbank geeignet sein (Links, Ressourcen, Installationsanleitung, Codestücke, ...)
* Geben Sie dieses Notebook in Moodle ab - es wird für alle anderen zur Verfügung gestellt.
* Referate und Abgabe des Notebooks in 2 Wochen

***

**INFLUX DB = Open-Source Datenbank für Zeitreihen**

Hilfreiche Ressourcen:

[Dokumentation](https://docs.influxdata.com/influxdb/v2.0/)

[Python Client Library](https://docs.influxdata.com/influxdb/v2.0/api-guide/client-libraries/python/)

**Was ist das Spezielle an der Influx DB?**

* Eigene Query Language, ähnlich zu SQL
* Speichert die Einträge mit Zeitsstempeln
* kann große Mengen an Daten verarbeiten
* Besonders geeignet für z.B. Sensordaten
* Das User Interface bietet umfangreiche Möglichkeiten zur Visualisierung der Datenreihen

**Zu welcher Kategorie gehört die Datenbank?**

Zeitreihe
Datenpunkte bestehen aus Key-Value Paaren: field und timestamp
Datenpunkte können mittels Tags zu einer Serie zusammengefasst werden

**Lizenzen**

* Open Source Version als Download
* Kostenpflichtige Version gehostet auf AWS Cloud
* Kostenpflichtige Enterprise Version mit Zusatzleistungen

**Technische Eckdaten**

* Port 8060 für Client/Server Kommunikation
* Port 8088 für RPC Dienst (Datensicherung/Wiederherstellung)
* Einsatz eines Zeitdienstes notwendig (z.B. NTP - Network Time Protocol)
* Programmiert in Go
* Werte: 64-bit Integers, Floats, Strings und Booleans


**INFLUX DB Structure:**

In [1]:
json_body = [
    {
        "measurement": "your-measurement",
        "tags": {
            "tag1": "x",
            "tag2": "y"
        },
        "time": "2009-11-10T23:00:00Z",
        "fields": {
            "value": 0.64
        }
    }
]

**INFLUX DB User Interface**

![alt text](https://www.influxdata.com/wp-content/uploads/Pre-canned-dashboards-influxdb.png "Influx UI")




---

## Installation

[Hier](https://docs.influxdata.com/influxdb/v2.0/install/) gibt es eine genaue Anleitung für die Datenbankinstallation für verschiedene Umgebungen.

***

## Quickstart Guide

Für die Nutzung der Datenbank benötigen wir:

* Token zur Authentifizierung -> [Anleitung zur Tokenerstellung](https://docs.influxdata.com/influxdb/cloud/security/tokens/create-token/)

* Bucket als Speicherort unserer Daten -> [Anleitung zur Bucketerstellung](https://docs.influxdata.com/influxdb/cloud/organizations/buckets/create-bucket/) 

* Die Organisation, der der Bucket zugeordnet wird

*Die Erstellung von Buckets, Tokens und mehr kann über das User Interface, die Influx Command Line oder die InfluxDB API gemacht werden. Zum Einstieg empfehlen wir das UI.*

***

## Nutzung von Influx DB mit Python

#### Dependencies

In [1]:
# Install a pip package in the current Jupyter kernel
import sys
!{sys.executable} -m pip install influxdb-client

Defaulting to user installation because normal site-packages is not writeable
Collecting influxdb-client
  Downloading influxdb_client-1.21.0-py3-none-any.whl (505 kB)
[K     |████████████████████████████████| 505 kB 2.4 MB/s eta 0:00:01
Collecting rx>=3.0.1
  Downloading Rx-3.2.0-py3-none-any.whl (199 kB)
[K     |████████████████████████████████| 199 kB 10.0 MB/s eta 0:00:01
Installing collected packages: rx, influxdb-client
Successfully installed influxdb-client-1.21.0 rx-3.2.0


#### Initialize the Influx client

In [11]:
from datetime import datetime
from influxdb_client import InfluxDBClient, Point, WritePrecision
from influxdb_client.client.write_api import SYNCHRONOUS

# Siehe "Quickstart Guide"
token = "EKOBZJQJ7m-CTLai4-otjUADp-trYaBgEp5gq62KyHW8LXMSnGKZIVFIxLYG6czs_F2FjIMzdBQjDqHy23I-jQ=="
org = "FHTW"
bucket = "Data"

client = InfluxDBClient(url="http://influxdb:8086", token=token)

#### Get some data

As an example, we want to stream some weather data from the API [Openweathermap](https://api.openweathermap.org) into our database, so we make a request to that API to get the current temperature in Vienna.

In [2]:
import requests, json

BASE_URL = "https://api.openweathermap.org/data/2.5/weather?"
CITY = "Vienna"
API_KEY = "366c7011faf41711486e730d3a46e9c7"
URL = BASE_URL + "q=" + CITY + "&appid=" + API_KEY + "&units=metric"

def get_temp():
    # HTTP request
    response = requests.get(URL)
    # checking the status code of the request
    if response.status_code == 200:
        # getting data in the json format
        data = response.json() 
        main = data["main"] 
        # getting temperature
        temperature = main['temp']
    else:
       # showing the error message
       print("Error in the HTTP request")
    return temperature


#### Write the data into the DB

The InfluxDBClient object has a `write_api` method used for configuration:

In [3]:
write_api = client.write_api(write_options=SYNCHRONOUS)

A `point` represents a single data record, similar to a row in a SQL database table. Each point:

* has a measurement, a tag set, a field key, a field value, and a timestamp;
* is uniquely identified by its series and timestamp.
* In a series, each point has a unique timestamp. If you write a point to a series with a timestamp that matches an existing point, the field set becomes a union of the old and new field set, where any ties go to the new field set.

Now we want to write the current temperature into our Influx database and create a time series to monitor the temperature changes:

In [15]:
import time
def stream(interval, number = 10):

    current_number = 0
    while current_number < number:

        #get temperature from the API
        temperature = get_temp()
        print(temperature)
        
        #create new data point
        point = Point("weatherdata").tag("location", "Vienna").field("temperature", temperature).time(datetime.utcnow(), WritePrecision.S)
        print(point)
       
        #write datapoint into database
        write_api.write(bucket=bucket, org=org, record=point)
        
        #wait
        time.sleep(interval)
        current_number += 1

In [16]:
# Let's go! Write the temperature into the database every 3 seconds.

stream(3, 5)


12.91
<influxdb_client.client.write.point.Point object at 0x7f62f56cba00>
12.91
<influxdb_client.client.write.point.Point object at 0x7f62da8f0fd0>
12.91
<influxdb_client.client.write.point.Point object at 0x7f62da8f0be0>
12.91
<influxdb_client.client.write.point.Point object at 0x7f63043ce0a0>
12.91
<influxdb_client.client.write.point.Point object at 0x7f63043ce7f0>
12.91
<influxdb_client.client.write.point.Point object at 0x7f62da8f0f70>


#TODO Real Time visualization

#### Query our data

In [8]:
# 1.Instantiate the query client.
query_api = client.query_api()

# 2.Create a Flux query.
query = 'from(bucket:"Data")\
|> range(start: -10h)\
|> filter(fn:(r) => r._measurement == "weatherdata")\
|> filter(fn: (r) => r.location == "Vienna")\
|> filter(fn:(r) => r._field == "temperature" )'

query = "select * from weatherdata"

In [9]:
result = query_api.query(org=org, query=query)
results = []
for table in result:
    for record in table.records:
        results.append((record.get_time(), record.get_field(), record.get_value()))

print(results)

[(datetime.datetime(2021, 9, 20, 20, 34, 27, tzinfo=tzlocal()), 'temperature', 11.92), (datetime.datetime(2021, 9, 20, 20, 34, 31, tzinfo=tzlocal()), 'temperature', 11.92), (datetime.datetime(2021, 9, 20, 20, 34, 34, tzinfo=tzlocal()), 'temperature', 11.92), (datetime.datetime(2021, 9, 20, 20, 34, 37, tzinfo=tzlocal()), 'temperature', 11.92), (datetime.datetime(2021, 9, 20, 20, 34, 40, tzinfo=tzlocal()), 'temperature', 11.92), (datetime.datetime(2021, 9, 20, 20, 34, 44, tzinfo=tzlocal()), 'temperature', 11.92), (datetime.datetime(2021, 9, 20, 20, 34, 47, tzinfo=tzlocal()), 'temperature', 11.92), (datetime.datetime(2021, 9, 20, 20, 34, 50, tzinfo=tzlocal()), 'temperature', 11.92), (datetime.datetime(2021, 9, 20, 20, 34, 53, tzinfo=tzlocal()), 'temperature', 11.92), (datetime.datetime(2021, 9, 20, 20, 34, 56, tzinfo=tzlocal()), 'temperature', 11.92), (datetime.datetime(2021, 9, 20, 20, 35, tzinfo=tzlocal()), 'temperature', 11.92), (datetime.datetime(2021, 9, 20, 20, 35, 3, tzinfo=tzlocal

***

## Wann ist ein Einsatz sinnvoll?

**Wenn Echtzeitverarbeitung von Daten notwendig ist**

**Bei großen Datenmengen und hoher Geschwindigkeit**

*Beispiele:*

   * Monitoring von IoT / Sensoren
   * DevOps Monitoring (Mikroservices, Container, Ressourcenverwaltung, Netzwerke,...)
   * Echtzeit-Analysen (z.B. Onlinemarketing, Predicitive Maintenance,...)