Ce projet comportera trois parties principales :
1/ Data : Le point de départ est une base que nous consolidons à l’aide du web Scrapping du site NEXITY.
2/ Feature engineering: La base de données est construite en créant de nouvelles variables à partir des variables existantes sous Pyspark.
3/ Analytique: faire une analyse simple avec des statistiques descriptives pour explorer les données.
4/ Machine Learning : utiliser un modèle de ML pour estimer le loyer avec les données consolidées.
PS : A partir de cette base de données consolidée, nous avons créée une application que vous pourrez consulter ici