Yann Maisonneuve

Projet data MLOPS

septembre 2022

Ce document présente le projet fil rouge de la formation MLOPS datascientest.

Objectif

L’objectif de ce projet est de déployer et maintenir un modèle de machine learning de manière fiable et efficace dans un environnement de production.

Architecture générale

stack technique

La partie MLOPS ne comprend pas le front-end ni la mise en place de la base de données.

la stack technique utilisée sur ce projet est :

SCIKIT LEARN pour le machine learning
FASTAPI/UVICORN pour le back end
DOCKER pour la conteneurisation
AIRFLOW
GITHUB

structure des dossiers

├── data
│ ├── predict
│ ├── raw
│ └── refined
├── logs
├── pyventive_maintenance
│ ├── model
│ ├── setting
│ ├── src
│ │ ├── classes
│ └── test
│ ├── auto_ml_model_test
│ ├── raw_train_test
│ └── train_df_test
└── temp

Les dossiers data, logs et temp seront partagés entre les containeurs.

le modèle

La provenance des données

Le jeu de donnée utilisé pour ce projet provient du site Kaggle, “https://www.kaggle.com/datasets/vinayak123tyagi/bearing-dataset”, les données ont été générées par le IMS– www.imscenter.net.

Le sujet

Quatre roulements ont été installés sur un arbre, des accéléromètres mesurent toutes les 10 minutes les vibrations du système jusqu'à rupture des roulements. L’objectif étant d’utiliser ces données pour prédire l'état d’usure des roulements afin de faire de la maintenance préventive.

Le pipeline d'entraînement

Les données de chaque enregistrement sont disponibles dans un fichier texte sous la forme d’une liste d'accélérations :

La première étape consiste à transformer les accélérations en données fréquentielles avec une transformée de fourier
Ensuite toutes les données sont agrégées dans un dataframe d'entraînement
Enfin une normalisation est effectuée et un modèle auto-ml est entraîné.

corrélations

On peut voir sur l'image suivante qu'il y a des corrélations assez bonnes entre une hypothèse de dégradation linéaire et l'analyse vibratoire pour le roulement 2, notamment dans les fréquences autour de 1000 hz.

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
.github/workflows		.github/workflows
model		model
src		src
test		test
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
Readme Document for IMS Bearing Data.pdf		Readme Document for IMS Bearing Data.pdf
__init__.py		__init__.py
aws_setup.sh		aws_setup.sh
build_and_push_docker_api.sh		build_and_push_docker_api.sh
docker-compose.yml		docker-compose.yml
kubes_airflow_deployment.yml		kubes_airflow_deployment.yml
kubes_api_deployment.yml		kubes_api_deployment.yml
pytest.ini		pytest.ini
requirements.txt		requirements.txt
setup_kubes.sh		setup_kubes.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Yann Maisonneuve

Projet data MLOPS

septembre 2022

Ce document présente le projet fil rouge de la formation MLOPS datascientest.

Objectif

Architecture générale

stack technique

structure des dossiers

le modèle

La provenance des données

Le sujet

Le pipeline d'entraînement

corrélations

API BACKEND

About

Releases

Packages

Languages

License

yann112/mlops_project_2022_preventive_maintenance

Folders and files

Latest commit

History

Repository files navigation

Yann Maisonneuve

Projet data MLOPS

septembre 2022

Ce document présente le projet fil rouge de la formation MLOPS datascientest.

Objectif

Architecture générale

stack technique

structure des dossiers

le modèle

La provenance des données

Le sujet

Le pipeline d'entraînement

corrélations

API BACKEND

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages