Skip to content

Academic project based on the https://www.kaggle.com/austinreese/craigslist-carstrucks-data dataset, as part of the R Datamining class of master MOSEF. Realized with Paul Leydier and Donovan Thaing.

Notifications You must be signed in to change notification settings

Orlogskapten/craigslistVehicles

 
 

Repository files navigation

Projet craigslistVehicles

Ceci est un projet universitaire

En collaboration avec:


Présentation

Le but de ce projet est d'appliquer nos connaissances en dataming (avec R) et en Dataviz' pour analyser et construire une problématique autour d'un dataset de Kaggle.

Ce dataset est un sample des voitures de secondes mains que l'on retrouve sur craiglist.

Le projet

Nous avons décidé de construire notre problèmatique d'un point de vue BI, tant sur la construction de nos modèles que sur la partie DataViz'.

On a donc construit notre travail à travers le spectre de l'entreprise Autotrader, site de vente de voiture d'occasion, qui souhaite à la fois, conseiller ses clients sur le prix d'un véhicule lors de sa mise en vente mais aussi pouvoir déterminer quel véhicule devrait être mis en avant sur le site.

Enfin, on a aussi cherché à classifer nos données selon des typologies géographiques, mais pas uniquement (BU marketing).

Les fichiers

Vous pourrez ainsi retrouver dans le repository notre projet scindé en 3 parties:

  • 1_exploration.Rmd et son homologue en HTML. Il contient l'exploration des données, le traitement des valeurs manquantes et celui des valeurs aberrantes.
  • 2_unsupervised_learning. La première étape a été de comprendre notre marché, c'est à dire sa segmentation géographique dans un premier temps, puis de comprendre les caractéristiques principales des véhicules qui contituent notre dataset.
  • 3_supervised_learning.
  • dashboard_craiglist.twbx. Dans une optique métier, il nous a fallu créer un dahsboard sur l'état du marché des voitures d'occasions pour permettre aux équipes métiers de piloter / comprendre leurs actions. Le dashboard MACRO contient les outils de pilotage nécessairent pour comprendre le marché Américains dans son ensemble, par état et par marque.

About

Academic project based on the https://www.kaggle.com/austinreese/craigslist-carstrucks-data dataset, as part of the R Datamining class of master MOSEF. Realized with Paul Leydier and Donovan Thaing.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • HTML 99.4%
  • Jupyter Notebook 0.6%