Je m’intéresse à l’intelligence artificielle, à la science des données, à la visualisation de données et à la conception de systèmes informatiques.
Mon profil GitHub regroupe des projets appliqués liés à l’analyse de données, à l’intelligence artificielle, à l’apprentissage automatique, aux données ouvertes et aux solutions guidées par les données.
- Intelligence artificielle
- Science des données
- Apprentissage automatique
- Analyse exploratoire de données
- Visualisation de données
- Données ouvertes
- Analyse géospatiale
- Tableaux de bord interactifs
- Architecture des systèmes informatiques
- Solutions guidées par les données
- Régression logistique équilibrée
- Forêt aléatoire
- Extra Trees
- Classification supervisée
- Prévision de tendances
- Analyse géospatiale
- Visualisation cartographique
- Génération de données JSON pour dashboards statiques
Dashboard géospatial de science des données utilisant l’algorithme K-Nearest Neighbors pour explorer les arbres répertoriés de la Ville de Québec, identifier les arbres similaires et illustrer le principe de proximité en apprentissage automatique.
Ce projet utilise les données ouvertes de la Ville de Québec, accessibles via l’API CKAN du portail Données Québec. Il combine extraction de données par API, préparation des variables avec Python, modélisation K-NN, génération d’un fichier dashboard_data.json et visualisation cartographique interactive avec Leaflet.js.
Le dashboard permet à l’utilisateur de filtrer les arbres selon plusieurs critères, de naviguer sur la carte, de sélectionner un arbre de référence et de visualiser les arbres les plus similaires selon leurs caractéristiques spatiales, botaniques et descriptives.
Le projet couvre notamment :
- la consommation de données ouvertes via l’API CKAN de Données Québec ;
- la préparation et le nettoyage des données avec Python ;
- la sélection de variables numériques et catégorielles pertinentes ;
- l’utilisation de K-NN pour rechercher des arbres similaires ;
- la classification du type d’arbre, feuillu ou conifère ;
- la génération d’un fichier
dashboard_data.json; - la visualisation géospatiale avec Leaflet.js ;
- l’ajout de filtres interactifs et d’une interface explicative ;
- la publication du dashboard avec GitHub Pages.
Modèle utilisé :
- K-Nearest Neighbors pour la recherche de similarité entre arbres et la classification du type d’arbre.
Dashboard géospatial d’IA prédictive pour analyser les permis délivrés à la Ville de Québec, visualiser les zones de concentration et estimer les tendances mensuelles futures.
Ce projet utilise des données ouvertes de la Ville de Québec afin d’analyser les permis délivrés sur le territoire municipal. Il combine science des données, apprentissage automatique, agrégation géographique et visualisation cartographique interactive.
Le dashboard met en évidence les concentrations territoriales des permis délivrés, avec un panneau latéral permettant de filtrer les résultats par année, mois, arrondissement, domaine et type de permis.
Le projet couvre notamment :
- la préparation et le nettoyage des données ouvertes ;
- l’agrégation des permis par période, arrondissement, domaine et type ;
- la réduction de la précision spatiale afin de limiter l’exposition de données sensibles ;
- la génération d’un fichier
dashboard_data.jsonavec Python ; - la visualisation cartographique avec Leaflet.js ;
- la classification du type de permis ;
- la prévision du volume mensuel de permis ;
- la publication du dashboard avec GitHub Pages.
Modèles utilisés :
- Extra Trees pour la classification du type de permis ;
- Forêt aléatoire pour la prévision du volume mensuel.
Dashboard d’IA prédictive pour estimer le risque de collision routière à Seattle à partir de modèles de classification.
Ce projet présente une démarche complète de science des données appliquée aux collisions routières. Il combine la préparation des données, l’entraînement de modèles d’apprentissage automatique, la comparaison des performances et la visualisation des résultats dans une interface web interactive publiée avec GitHub Pages.
Le projet couvre notamment :
- la préparation et la transformation de données historiques de collisions ;
- la construction d’un jeu analytique pour la classification supervisée ;
- la comparaison de plusieurs modèles d’apprentissage automatique ;
- la sélection automatique du meilleur modèle ;
- la génération d’un fichier
dashboard_data.json; - la visualisation interactive des scénarios de risque.
Modèles comparés :
- Régression logistique équilibrée ;
- Forêt aléatoire ;
- Extra Trees.
Le modèle retenu dans l’exécution actuelle est une forêt aléatoire, sélectionnée à partir des métriques de performance calculées par le script Python.
Ce profil me sert d’espace pour présenter des projets concrets en science des données, en intelligence artificielle, en analyse géospatiale et en visualisation interactive.
L’objectif est de documenter progressivement des travaux appliqués, avec une attention particulière portée à la clarté, à la structure, à la reproductibilité et à la compréhension des résultats.
Les projets présentés cherchent à montrer comment des données ouvertes peuvent être transformées en analyses exploitables, en modèles prédictifs et en tableaux de bord accessibles.