In [1]:
!pip install minio

Collecting minio
  Downloading minio-7.1.17-py3-none-any.whl (78 kB)
     ---------------------------------------- 0.0/78.3 kB ? eta -:--:--
     ---------------------------------------- 0.0/78.3 kB ? eta -:--:--
     ---------------------------------------- 0.0/78.3 kB ? eta -:--:--
     ----- ---------------------------------- 10.2/78.3 kB ? eta -:--:--
     ----- ---------------------------------- 10.2/78.3 kB ? eta -:--:--
     ----- ---------------------------------- 10.2/78.3 kB ? eta -:--:--
     ----- ---------------------------------- 10.2/78.3 kB ? eta -:--:--
     ----- ---------------------------------- 10.2/78.3 kB ? eta -:--:--
     ----- ---------------------------------- 10.2/78.3 kB ? eta -:--:--
     ----- ---------------------------------- 10.2/78.3 kB ? eta -:--:--
     ----- ---------------------------------- 10.2/78.3 kB ? eta -:--:--
     ----- ---------------------------------- 10.2/78.3 kB ? eta -:--:--
     ----- ---------------------------------- 10.2/78.3 kB


[notice] A new release of pip is available: 23.0.1 -> 23.2.1
[notice] To update, run: python.exe -m pip install --upgrade pip


# Minio

## Use case

Minio est un gestionnaire distribué Open Source de stockage d'objets hautes performances. Minio permet donc de gérer des vidéos, des images, des documents pdfs par exemple. Minio est compatible et interfacable avec le système d'AWS de buckets. 

## Installation

avec docker

```
docker run \
   -p 9000:9000 \
   -p 9001:9001 \
   -e "MINIO_ROOT_USER=root" \
   -e "MINIO_ROOT_PASSWORD=rootpassword" \
   quay.io/minio/minio server /data --console-address ":9001"

```

avec `docker-compose.yml`


```
services:
  minio:
    container_name: minio
    image: quay.io/minio/minio
    ports:
        - 9000:9000
    environment:
      MINIO_ROOT_USER: root
      MINIO_ROOT_PASSWORD: rootpassword
    command: server /data
```

## Utilisation 

Comme expliqué plus haut, Minio permet de stocker et de gérer des médias. On peut 

In [2]:
from minio import Minio

Pour se connecter et créer un client Minio il suffit de le configurer.

In [3]:
client = Minio("localhost:9000", "root", "rootpassword", secure=False)

## Buckets

Les buckets sont la structure de base de stockage. Ils sont la notion la plus grossière, c'est le dossier parent. Les buckets permettent de stocker tout un ensemble de hiérarchie de fichiers.

### Créer et supprimer des buckets

Pour créer un bucket

In [16]:
client.make_bucket("my-bucket")

In [5]:
client.list_buckets()

[Bucket('my-bucket')]

On ne peut pas créer deux buckets avec le même nom.

In [8]:
client.make_bucket("my-bucket")

Pour supprimer un bucket, 

In [9]:
client.remove_bucket("my-bucket")

Pour lister l'ensemble des buckets présents

In [10]:
client.list_buckets()

[]

In [11]:
for i in range(10): 
    client.make_bucket(f"my-bucket{i+1}")

In [12]:
buckets = client.list_buckets()
for bucket in buckets:
    print(bucket.name, bucket.creation_date)
    #client.remove_bucket(bucket.name)

my-bucket1 2023-10-06 11:49:16.608000+00:00
my-bucket10 2023-10-06 11:49:16.718000+00:00
my-bucket2 2023-10-06 11:49:16.627000+00:00
my-bucket3 2023-10-06 11:49:16.640000+00:00
my-bucket4 2023-10-06 11:49:16.651000+00:00
my-bucket5 2023-10-06 11:49:16.662000+00:00
my-bucket6 2023-10-06 11:49:16.674000+00:00
my-bucket7 2023-10-06 11:49:16.686000+00:00
my-bucket8 2023-10-06 11:49:16.696000+00:00
my-bucket9 2023-10-06 11:49:16.706000+00:00


A l'instanciation il est souvent intéressant de vérifier qu'un bucket existe bien.

In [13]:
if client.bucket_exists("my-bucket"):
    print("my-bucket exists")
else:
    print("my-bucket does not exist")

my-bucket does not exist


### Objets

Les objets sont la structure la plus fine de stockage dans Minio. C'est un concept un peu différent des fichiers. Ils regroupent les fichiers ainsi que la structure de dossiers parents. 
Pour donner un exemple l'objet avec le nom `/dossier_parent/dossier_enfant/nom_de_lobjet` integrera aussi la création et le stockage dans les deux dossiers `dossier_parent` et ̀`dossier_enfant`. Pour gérer la structure de rangement des objets il faudra donc aussi jouer sur l'ensemble du chemin vers ce dernier.

On peut stocker n'importe quel fichier ou média dans minio. Une bonne pratique est de préciser le content type qui correspond au type de document stocké. Cela permet au client qui va lire ensuite ce document de savoir comment réagir, est ce que c'est un pdf ? Si oui, je dois l'afficher d'une certaine facon avec potentiellement plusieurs pages, est ce que c'est une video ? Si oui, je dois afficher un lecteur. 

### Ajouter des objets 

In [14]:
import io
import requests
import urllib

#### Bytes

In [17]:
result = client.put_object(
    "my-bucket", "my-bytes-object", io.BytesIO(b"hello"), 5,
)

#### Csv 

In [18]:
url_velib = "https://www.data.gouv.fr/fr/datasets/r/0845c838-6f18-40c3-936f-da204107759a"

# Upload unknown sized data.
data = urllib.request.urlopen(url_velib)
result = client.put_object(
    "my-bucket", "velib-data", data, length=-1, part_size=10*1024*1024, content_type="application/csv",
)

Une image, on peut ajouter des métadatas. 

In [19]:
image_url = "https://media.istockphoto.com/photos/couple-relax-on-the-beach-enjoy-beautiful-sea-on-the-tropical-island-picture-id1160947136?k=20&m=1160947136&s=612x612&w=0&h=TdExAS2--H3tHQv2tc5woAl7e0zioUVB5dbIz6At0I4="
# Upload unknown sized data.
data = urllib.request.urlopen(image_url)
result = client.put_object(
    "my-bucket", "image-plage", data, length=-1, part_size=10*1024*1024, content_type="image/jpeg",
    metadata={"description": "une belle plage"},
)

In [22]:
client.list_objects

<bound method Minio.list_objects of <minio.api.Minio object at 0x000001C432B97B80>>

### Exercices

1. Importer une vidéo 

### Lister des objets

In [23]:
# List objects information.
objects = client.list_objects("my-bucket")
for obj in objects:
    print(obj, obj.object_name)

<minio.datatypes.Object object at 0x000001C432B97B50> image-plage
<minio.datatypes.Object object at 0x000001C4342175B0> my-bytes-object
<minio.datatypes.Object object at 0x000001C434216440> velib-data


In [24]:
for i in range(30):
    for j in range(30):
        result = client.put_object(
            "my-bucket", f"path_{i}/my-bytes-object-{j}", io.BytesIO(f"hello {i} and {j}".encode()), 13,
        )

On peut lister l'ensemble des objets correspondants à un certain prefix

In [25]:
# List objects information.
objects = client.list_objects("my-bucket", recursive=True)
for obj in objects:
    print(obj, obj.object_name)

<minio.datatypes.Object object at 0x000001C434115A80> image-plage
<minio.datatypes.Object object at 0x000001C4341149D0> my-bytes-object
<minio.datatypes.Object object at 0x000001C434114A90> path_0/my-bytes-object-0
<minio.datatypes.Object object at 0x000001C434115000> path_0/my-bytes-object-1
<minio.datatypes.Object object at 0x000001C434114940> path_0/my-bytes-object-10
<minio.datatypes.Object object at 0x000001C434114970> path_0/my-bytes-object-11
<minio.datatypes.Object object at 0x000001C434116740> path_0/my-bytes-object-12
<minio.datatypes.Object object at 0x000001C434115AB0> path_0/my-bytes-object-13
<minio.datatypes.Object object at 0x000001C434114A60> path_0/my-bytes-object-14
<minio.datatypes.Object object at 0x000001C434115510> path_0/my-bytes-object-15
<minio.datatypes.Object object at 0x000001C434116890> path_0/my-bytes-object-16
<minio.datatypes.Object object at 0x000001C434115390> path_0/my-bytes-object-17
<minio.datatypes.Object object at 0x000001C434115630> path_0/my-by

In [26]:
objects = client.list_objects("my-bucket", prefix="path_10/")
for obj in objects:
    print(obj.object_name)

path_10/my-bytes-object-0
path_10/my-bytes-object-1
path_10/my-bytes-object-10
path_10/my-bytes-object-11
path_10/my-bytes-object-12
path_10/my-bytes-object-13
path_10/my-bytes-object-14
path_10/my-bytes-object-15
path_10/my-bytes-object-16
path_10/my-bytes-object-17
path_10/my-bytes-object-18
path_10/my-bytes-object-19
path_10/my-bytes-object-2
path_10/my-bytes-object-20
path_10/my-bytes-object-21
path_10/my-bytes-object-22
path_10/my-bytes-object-23
path_10/my-bytes-object-24
path_10/my-bytes-object-25
path_10/my-bytes-object-26
path_10/my-bytes-object-27
path_10/my-bytes-object-28
path_10/my-bytes-object-29
path_10/my-bytes-object-3
path_10/my-bytes-object-4
path_10/my-bytes-object-5
path_10/my-bytes-object-6
path_10/my-bytes-object-7
path_10/my-bytes-object-8
path_10/my-bytes-object-9


### Créer des URLS présigner 

Les méthodes précédentes sont très intéressantes pour communiquer entre une API et Minio. L'inconvéniant est que le média doit forcément passer par le serveur. Pour des raisons de performances réseaux, il est beaucoup plus intéressant d'utiliser les clients pour envoyer directement les données volumineuses.

Pour cela il faut permettre aux clients de s'authentifier directement sur Minio. Evidemment on ne peut pas donner aux clients (Les utilisateurs mobiles ou navigateurs les informations de connexion qui peuvent être stockés dans l'API), on utilisera alors des URLs présignés. Ces URLs un peu complexes à lire intègrent directement plusieurs informations permettant au client de s'authentifier. Pour des raisons de sécurité il est aussi important de rendre ces URLs inutilisable au bout d'un certain temps. Les clés générées sont à usage unique. 

Il faut alors créer des URLs présigner pour uploader des médias mais aussi pour y accéder. Ces URLs doivent être générés par l'API. Les clients doivent demander à l'API, "puis-je poster un média ?" ou "puis-je voir ce média ?" si la réponse est oui , alors l'API génère un URL qui peut ensuite être utilisé pour réaliser l'action.

In [27]:
from datetime import timedelta

Pour envoyer un média

In [29]:
put_url  = client.get_presigned_url(
    "PUT",
    "my-bucket",
    "my-object",
    expires=timedelta(days=1),
    response_headers={"response-content-type": "application/json"},
)
print(put_url)

http://localhost:9000/my-bucket/my-object?response-content-type=application%2Fjson&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=root%2F20231006%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20231006T123608Z&X-Amz-Expires=86400&X-Amz-SignedHeaders=host&X-Amz-Signature=61352fcb0077e7f39cd2d6eb8c6a7a86726b797c35b03daefa07ed7e329ce074


In [31]:
import requests

In [32]:
response = requests.put(put_url, json={"key":"value"})
response

<Response [200]>

Pour lire un média.

In [33]:
get_url = client.get_presigned_url(
    "GET",
    "my-bucket",
    "my-object",
    expires=timedelta(hours=2),
)
print(get_url)

http://localhost:9000/my-bucket/my-object?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=root%2F20231006%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20231006T123835Z&X-Amz-Expires=7200&X-Amz-SignedHeaders=host&X-Amz-Signature=c71b7b8e56ab5027b64c91228b27076b5bc5aae677fc32a650cffd63236be3de


In [34]:
response = requests.get(get_url)
response.json()

{'key': 'value'}

## Intégration avec L'API 

Pour ajouter un fichier directement depuis l'API, on peut créer une route dans notre application FastAPI. Pour cela on doit utiliser le paramètre suivant `file: UploadFile = File(...)` dans la définition de la route. Si on se réfère à la documentation auto générée par FastAPI on peut directement upload un fichier grâce au bouton créé.

Dans le corps de la fonction définissant la route, on récupère directement le fichier. Il suffit ensuite de l'envoyer directement grâce au client Minio. 

`result = client.put_object('le nom de votre fichier', file.filename, file.file)`


par exemple : 

```
@app.post('/file/upload/')
async def upload_file(file: UploadFile = File(...)):
    result = client.put_object('le nom de votre fichier', file.filename, file.file)
    return {'result': result}
```

## Exercices API

1. Ajouter une route permettant d'uploader directement un fichier sur minio
2. Ajouter une route permettant de créer un URL présigné PUT
3. Ajouter une route permettant de récupérer un URL présigné GET en fonction d'un document
4. Ajouter une route permettant de lister l'ensemble des objets présents dans un bucket.
5. Ajouter un paramètre permettant de rendre ce listing reccursif. 