🧩 Projet : Détection et classification de mesures environnementales (analyse de dépassements de seuils réglementaires)
⚠️ Remarque importante :
Ce projet a été réalisé dans un contexte professionnel.
En raison de contraintes de confidentialité et du RGPD, aucun code source, aucune donnée et aucun détail d’architecture interne ne peuvent être publiés.
Cette fiche présente uniquement la méthodologie, les objectifs et les compétences mises en œuvre.
Dans le cadre du suivi réglementaire de paramètres environnementaux (notamment la Demande Chimique en Oxygène – DCO), l’entreprise devait surveiller en continu des valeurs mesurées par différents capteurs.
Chaque dépassement des seuils imposés pouvait entraîner des pénalités financières importantes.
Cependant, certains pics observés ne correspondaient pas à de vrais dépassements, mais à des mesures aberrantes (problèmes de capteur, erreurs ponctuelles, bruit).
L’objectif était donc d'améliorer la qualité du diagnostic en distinguant :
- les dépassements réels,
- les mesures aberrantes,
- les mesures normales.
L’étude s’appuyait sur environ 5 ans d’historique de données environnementales.
- Classifier les mesures environnementales en trois catégories :
- Mesure normale : valeurs cohérentes avec le fonctionnement attendu.
- Dépassement réel : valeur réellement supérieure au seuil réglementaire.
- Mesure aberrante : valeur incohérente, liée à un problème de mesure.
- Détecter automatiquement les points atypiques et anomalies dans les séries temporelles.
- Réduire le nombre de faux dépassements, donc les pénalités associées.
- Améliorer la fiabilité globale du système de mesure.
- Analyse exploratoire d’environ 5 ans d’historique de mesures.
- Nettoyage, structuration et consolidation des données environnementales.
- Mise en place d’indicateurs et outils de détection :
- moyennes glissantes pour lisser les tendances,
- intervalles de confiance pour définir des seuils dynamiques,
- détection de valeurs aberrantes (z-score, écarts inhabituels),
- analyse locale vs. globale des variations.
- Construction d’un modèle simple de classification des points entre :
- normal,
- dépassement réel,
- aberrant.
- Identification des causes probables des anomalies (capteur défaillant, bruit, pique isolé).
- Recommandations sur la fiabilité et la maintenance des capteurs.
- Réduction notable des faux dépassements signalés.
- Diminution des coûts liés aux pénalités environnementales.
- Meilleure compréhension des comportements anormaux dans les mesures.
- Mise en place de bases méthodologiques réutilisables pour d'autres analyses environnementales.
- Python, Pandas, NumPy
- Analyse statistique (moyennes glissantes, intervalles de confiance, détection d'anomalies)
- Traitement de séries temporelles
- Visualisation (matplotlib, seaborn)
- Analyse exploratoire (EDA)
⚠️ Important Note:
This project was carried out in a professional context.
Due to confidentiality and GDPR constraints, no source code, datasets, or internal architecture details can be shared.
This case study focuses solely on methodology, objectives, and the skills applied.
As part of environmental regulatory monitoring—specifically parameters such as Chemical Oxygen Demand (COD)—the company needed to continuously track measurements recorded by sensors.
Any exceedance of regulatory thresholds could result in significant financial penalties.
However, some extreme values were not actual exceedances but aberrant measurements caused by sensor issues, noise, or isolated errors.
The goal was to improve diagnostic accuracy by distinguishing between:
- Normal measurements,
- True exceedances,
- Aberrant measurements (sensor faults, data errors, noise).
The study was conducted using approximately five years of historical environmental data.
- Classify environmental measurements into three categories:
- Normal measurement – consistent with expected system behavior
- True exceedance – value genuinely above the regulatory threshold
- Aberrant measurement – inconsistent value caused by measurement issues
- Automatically detect anomalies and unusual points in time-series data.
- Reduce false exceedance alerts and resulting regulatory penalties.
- Improve the overall reliability of the environmental monitoring system.
- Conducted exploratory analysis on ~5 years of historical measurements.
- Cleaned, structured, and consolidated environmental data from multiple sources.
- Implemented quantitative tools to evaluate measurement quality:
- Rolling averages to smooth trends
- Confidence intervals to build dynamic thresholds
- Outlier detection (e.g., z-score, deviation analysis)
- Local vs. global variation comparison
- Developed a simple classification approach to categorize:
- normal points,
- real exceedances,
- aberrant values.
- Identified root causes of anomalies (sensor malfunction, noise, isolated spikes).
- Provided recommendations to improve sensor reliability and data quality.
- Significant reduction in false exceedance alerts.
- Decrease in regulatory penalties thanks to more accurate classification.
- Improved understanding of abnormal measurement behavior.
- Establishment of reusable statistical methods for future environmental analyses.
- Python, Pandas, NumPy
- Statistical analysis (rolling averages, confidence intervals, anomaly detection)
- Time-series processing
- Visualization tools: matplotlib, seaborn
- Exploratory Data Analysis (EDA)