# Tutoriel pour **InfluxDB**

Bienvenue sur ce tutoriel ! Vous allez d√©couvrir les principales fonctionnalit√©es de InfluxDB, une base de donn√©e non relationnelle orient√©e s√©ries temporelles.
Elle peut √™tre utilis√©e dans de nombreux domaines, en stockant par exemple :
    - les donn√©es des capteurs industriels,
    - les m√©triques de performance des serveurs,
    - les mesures des pr√©cipitations,
    - le cours en bourse.

## üîé Comment se pr√©sente la base de donn√©e ?

L'√©quivalent d'une occurance est un *point* qui est compos√© d'un *timestamp*, *measurement*, *tag keys*, *tag values* et *field key*.
Un groupe de points avec les m√™mes mesurements, tags et fields sont appel√©es des s√©ries temporelles (*time series*)

Les donn√©es sont organis√©es dans des *buckets*. Chaque bucket peut contenir plusieurs mesures (*mesurements*)  diff√©rentes.
Une mesure contiennent un timestamp et plusieurs *tags* et *fields*.
Les tags sont des paires clef-valeur dont les valeurs ne changent pas souvent. Ils sont index√©s donc ils permettents d'organiser rapidement les donn√©es. Par exemple, cela peut √™tre le lieu d'une exp√©rience fixe, ou le nom de l'appareillage.
Les fields sont des paires clef-valeurs qui changent au cours du temps. Ils ne sont pas index√©es. Par exemple, cela peut √™tre la temp√©rature ou la pression mesur√©e.



![Example_InfluxDB_query.png](attachment:Example_InfluxDB_query.png)

*Source: https://docs.influxdata.com*

In [1]:
import influxdb_client
from influxdb_client.client.write_api import SYNCHRONOUS

In [2]:
# Param√®tres de connexion
url = "http://influxdb:8086"
token = "my-secret-token"
org = "my-org"
bucket = "my-bucket"

In [3]:
# Cr√©ation du client
client = influxdb_client.InfluxDBClient(url=url, token=token, org=org)
write_api = client.write_api(write_options=SYNCHRONOUS)
query_api = client.query_api()

print("‚úÖ Connexion r√©ussie √† InfluxDB!")

‚úÖ Connexion r√©ussie √† InfluxDB!


In [4]:
# Population de la base de donn√©es
# Chemin du fichier contenant les donn√©es
FILENAME = "data/migration.txt"
print("Population de la base de donn√©es avec les donn√©es du fichier...", FILENAME)
with open(FILENAME, "r") as file:
    for line in file:
        write_api.write(bucket=bucket, org=org, record=line)
print("Population termin√©e!")


Population de la base de donn√©es avec les donn√©es du fichier... data/migration.txt


FileNotFoundError: [Errno 2] No such file or directory: 'data/migration.txt'

### üìä Insertion de Donn√©es
Nous allons ins√©rer une mesure simple (ex: temp√©rature d'un capteur).


In [5]:
data = "temperature,sensor_id=1 value=22.5"
write_api.write(bucket=bucket, org=org, record=data)
print("‚úÖ Donn√©e ins√©r√©e avec succ√®s!")

‚úÖ Donn√©e ins√©r√©e avec succ√®s!


Commen√ßons par examiner une line protocol element !

![InfluxDB_data_example.png](attachment:InfluxDB_data_example.png)

*Source: https://docs.influxdata.com*

A noter :
- il y a des virgules apr√®s le mesurement, pour s√©parer les tags entre eux, et pour s√©parer les fields entre eux;
- il y a un espace pour s√©parer les tags des fields, ainsi que les fields et le timestamp;
- les lines sont s√©par√©s entre elles par \n;
- si un des attribut √† un espace dans son nom, on peut utiliser \ 
    ex: h`ome,room=Kitchen temp=21.0,hum=35.9,co=0i 1641024000
        home,room=Living\ Room temp=21.4,hum=35.9,co=0i 1641027600
``

Pour ce tutoriel, nous utilisons un dataset √©tudiant la qualit√© de l'air. Voici un line protocol element :

![InfluxDB_data_example_2.png](attachment:InfluxDB_data_example_2.png)

Pour ajouter une ou plusieurs *lines protocol*, on utilise `influx write` :
`

In [14]:
# Cr√©ation d'une nouvelle mesure
data = "airSensors,sensor_id=TLM0100 temperature=71.20345792130973,humidity=35.13532008675829,co=0.5189065248002024 1739235191"
# Ajout de la mesure dans notre bucket
write_api.write(bucket=bucket, org=org, record=data)
print("‚úÖ Donn√©e ins√©r√©e avec succ√®s!")


‚úÖ Donn√©e ins√©r√©e avec succ√®s!


Nous venons donc d'ajouter la donn√©e que pour le timestamp 1739235191 : le capteur TLM0100 a mesur√© une temp√©rature de 71.20345792130973 ¬∞F, une humidit√© de 35.13532008675829 % et un densit√© de CO de 0.5189065248002024.
Nous allons maintenant visualiser pour v√©rifier si notre ajout a bien √©t√© effectu√© et que l'on peut voir les trois valeurs (co, humidity et temperature).

In [17]:
query = f'''
from(bucket: "{bucket}")
  |> range(start: 1739235190 , stop: 1739235192)
  |> filter(fn: (r) => r._measurement == "airSensors")
'''

result = query_api.query(org=org, query=query)

# Affichage des r√©sultats
for table in result:
  for record in table.records:
      print(f"üìå {record.values}")

print("‚úÖ Requ√™te ex√©cut√©e avec succ√®s!")

üìå {'result': '_result', 'table': 0, '_start': datetime.datetime(2025, 2, 11, 0, 53, 10, tzinfo=datetime.timezone.utc), '_stop': datetime.datetime(2025, 2, 11, 0, 53, 12, tzinfo=datetime.timezone.utc), '_time': datetime.datetime(2025, 2, 11, 0, 53, 11, tzinfo=datetime.timezone.utc), '_value': 0.5189065248002024, '_field': 'co', '_measurement': 'airSensors', 'sensor_id': 'TLM0100'}
üìå {'result': '_result', 'table': 1, '_start': datetime.datetime(2025, 2, 11, 0, 53, 10, tzinfo=datetime.timezone.utc), '_stop': datetime.datetime(2025, 2, 11, 0, 53, 12, tzinfo=datetime.timezone.utc), '_time': datetime.datetime(2025, 2, 11, 0, 53, 11, tzinfo=datetime.timezone.utc), '_value': 35.13532008675829, '_field': 'humidity', '_measurement': 'airSensors', 'sensor_id': 'TLM0100'}
üìå {'result': '_result', 'table': 2, '_start': datetime.datetime(2025, 2, 11, 0, 53, 10, tzinfo=datetime.timezone.utc), '_stop': datetime.datetime(2025, 2, 11, 0, 53, 12, tzinfo=datetime.timezone.utc), '_time': datetime.d

Pour plus de pr√©cision :
- -b, --bucket ou --bucket-id permet de pr√©ciser le bucket concern√©;
- -p, --precision permet de donner la precision du timestamp (s pour les secondes, m pour les minutes,...).

#### ‚ùì Rajoutez les mesures suivantes :
 - pour le timestamp 1839241791 : le capteur TLM0103 a mesur√© une temp√©rature de 74.56597046148916 ¬∞F, une humidit√© de 34.48544050518988 % et un densit√© de CO de 0.12410174546713217
 - pour le timestamp 1839241792 : le capteur TLM0202 a mesur√© une temp√©rature de 71.24597046148916 ¬∞F, une humidit√© de 33.71944373469555 % et un densit√© de CO de 0.6329052625629839

Executez le script suivant pour v√©rifier que votre ajout √† fonctionn√©. Vous deviriez avoir :

In [None]:
query=f'''
'''

result = query_api.query(org=org, query=query)

# Affichage des r√©sultats
for table in result:
  for record in table.records:
      print(f"üìå {record.values}")

print("‚úÖ Requ√™te ex√©cut√©e avec succ√®s!")

### üìñ Lecture des Donn√©es
Nous allons r√©cup√©rer les donn√©es ins√©r√©es √† l'aide d'une requ√™te.


In [25]:
query = f"""
from(bucket: "{bucket}")
|> range(start: -1h)
"""

result = query_api.query(org=org, query=query)

# Affichage des r√©sultats
for table in result:
  for record in table.records:
      print(f"üìå {record.values}")

print("‚úÖ Requ√™te ex√©cut√©e avec succ√®s!")


üìå {'result': '_result', 'table': 0, '_start': datetime.datetime(2025, 2, 18, 13, 5, 41, 702135, tzinfo=datetime.timezone.utc), '_stop': datetime.datetime(2025, 2, 18, 14, 5, 41, 702135, tzinfo=datetime.timezone.utc), '_time': datetime.datetime(2025, 2, 18, 13, 23, 42, 465555, tzinfo=datetime.timezone.utc), '_value': 22.5, '_field': 'value', '_measurement': 'temperature', 'sensor_id': '1'}
üìå {'result': '_result', 'table': 0, '_start': datetime.datetime(2025, 2, 18, 13, 5, 41, 702135, tzinfo=datetime.timezone.utc), '_stop': datetime.datetime(2025, 2, 18, 14, 5, 41, 702135, tzinfo=datetime.timezone.utc), '_time': datetime.datetime(2025, 2, 18, 13, 33, 33, 35821, tzinfo=datetime.timezone.utc), '_value': 22.5, '_field': 'value', '_measurement': 'temperature', 'sensor_id': '1'}
üìå {'result': '_result', 'table': 0, '_start': datetime.datetime(2025, 2, 18, 13, 5, 41, 702135, tzinfo=datetime.timezone.utc), '_stop': datetime.datetime(2025, 2, 18, 14, 5, 41, 702135, tzinfo=datetime.timezo

### Process Data

In [None]:
query = """
from(bucket: "{bucket}")
|> range(start: -1h)
|> filter(fn: (r) => r._measurement == "airSensors")
|> filter(fn: (r) => r._field == "temperature")
|> map(fn: (r) => ({ 
    _time: r._time, 
    _measurement: r._measurement, 
    _field: "temp_celsius", 
    _value: (r._value - 32.0) * 5.0 / 9.0 
}))"""

result = query_api.query(org=org, query=query)


In [None]:
query = """
from(bucket: "bucket")
|> range(start: -1h)
|> filter(fn: (r) => r._measurement == "airSensors")
|> filter(fn: (r) => r._field == "co")
|> map(fn: (r) => ({r with state: if r._value < 2 then "ok" else "warning"}))""" 

result = query_api.query(org=org, query=query)

In [None]:
query = """
from(bucket: "bucket")
|> range(start: -1h)
|> filter(fn: (r) => r._measurement == "airSensors")
|> filter(fn: (r) => r._field == "temp")
|> group(columns: ["sensor_id"])""" 

result = query_api.query(org=org, query=query)

In [None]:
query = """from(bucket: "bucket")
|> range(start: -1h)
|> filter(fn: (r) => r._measurement == "airSensors")
|> filter(fn: (r) => r._field == "temp")
|> group(columns: ["sensor_id"])
|> mean()"""

result = query_api.query(org=org, query=query)

In [None]:
query = """from(bucket: "bucket")
|> range(start: 2022-01-01T14:00:00Z, stop: 2022-01-01T20:00:01Z)
|> filter(fn: (r) => r._measurement == "airSensors")
|> filter(fn: (r) => r._field == "co" or r._field == "hum" or r._field == "temp")
|> pivot(rowKey: ["_time"], columnKey: ["_field"], valueColumn: "_value")"""

result = query_api.query(org=org, query=query)

### ‚ùå Fermeture de la connexion
Toujours fermer la connexion apr√®s utilisation pour lib√©rer les ressources.


In [None]:
client.close()
print("‚úÖ Connexion ferm√©e.")

‚úÖ Connexion ferm√©e.
