Le projet de ce notebook a été réalisé dans le cadre du cours STA211: Entreprosage et fouille de données dispensé par Ndeye Niang Keita et Vincent Audigier au CNAM de Paris.
Ce dernier est le fruit d'une collaboration avec Marinette Simon et Thomas Lebrat.
Il portait sur l'entraînement d'un modèle supervisé permettant de catégoriser des banières présentes sur un site internet comme étant un contenu publicitaire ou non.
Les travaux ont été effectués sur la base du papier de recherche de Nicholas Kushmerick publié en 1999.
- Un notebook de réalisaton des travaux: LEBRAT_Thomas_SIMON_Marinette_SOARES_Cedric_notebook_projet_final.ipynb
- Le papier de recherche de Nicholas Kushmerick: kushmerick99learning.pdf
- La nomenclature des données liées au papier de recherche: ad.DOCUMENTATION