# Stockage compatible S3 avec MinIO

In [None]:
import os
import io
from IPython.display import Image
from IPython.core.display import HTML

import s3fs
import boto3
import pandas as pd

## Architecture

In [None]:
Image(url="https://min.io/resources/img/products/encryption-worm.svg")

## Avantages

- **Portabilité**
- **Autonomie**
- **Découplage stockage / moteur de calcul**

## Démonstration

In [None]:
!mc ls s3

In [None]:
!mc ls s3/projet-onyxia/demo/rp

### Déclaration du endpoint

Les paramètres d'authentification auprès de MinIO sont injectés comme variables d'environnement dans les différents services du Datalab.

In [None]:
endpoint_url='https://' + os.environ['AWS_S3_ENDPOINT']
print(endpoint_url)

In [None]:
print(os.environ['MC_HOST_s3'])

### Importer les données en Python

#### Mode authentifié

In [None]:
fs = s3fs.S3FileSystem(client_kwargs={'endpoint_url': endpoint_url})

with fs.open('projet-onyxia/demo/rp/sample.csv','r') as file:
    data = pd.read_csv(file, sep=";")

data.head(5)

#### Mode public

In [None]:
URL = "https://minio.lab.sspcloud.fr/projet-onyxia/demo/rp/sample.csv"
data2 = pd.read_csv(URL, sep=";")
data2.head(5)

### Exporter les données transformées vers MinIO

In [None]:
rf_sub = data[data["departement_residence"] == "33"]
rf_sub.head()

In [None]:
BUCKET_OUT = "avouacr"
FILE_KEY_OUT_S3 = "demo/rp_sub.csv"
FILE_PATH_OUT_S3 = BUCKET_OUT + "/" + FILE_KEY_OUT_S3

with fs.open(FILE_PATH_OUT_S3, 'w') as file_out:
    rf_sub.to_csv(file_out)

In [None]:
!mc ls s3/avouacr/demo/