Le marché du vin aux USA
Etude de cas effectué lors du passage de la certification Data Analyste du 14 au 16 Octobre 2024.
- Jeu de données apres prétraitement (df_wine)
- Jupyter notebook pour le prétraitement et l'analyse exploratoire du jeu de données
- Ficher power BI contenant le Dashboard final, après analyse et sélection des indicateurs pertinents
Note: Pour utiliser le fichier PowerBI, après ouverture dans l'application Power BI, menu Accueil, choisir l'option "Transformer les données" puis "paramètres de la source des données" puis "changer la source", et selectionner le fichier df_wine prélablement copié en local dans votre ordinateur.
- Suppression des doublons
- Suppression des vins dont le pays et/ou le prix n’étaient pas renseignés (~6%)
- Ajout de la colonne millésime
Analyse descendante du marché aux Etats-Unis:
- Tous les vins
- Les vins français
- Les vins de Bourgogne
- Comparaisons du vin Domaine des Croix (Pinot Noir, millésime 2016, 94/100)
- Les prix des vins français aux USA restent plus élevés que les vins locaux
- Les vins français sont bien représentés (2è position après les USA)
- Les vins français sont dans le TOP 5 des pays avec des vins notés 100/100
- Avec une note moyenne de 88/100, les vins français sont en 8ème position sur un total de 43 pays producteurs
- Les prix des vins français aux USA restent plus élevés que les vins locaux américains
- Les vins français sont bien représentés (2è position après les USA en nombre total de vins présents sur le marché)
- Les vins français sont dans le TOP 5 des pays avec des vins notés 100/100
- Avec une note moyenne de 88/100, les vins français sont en 8ème position sur un total de 43 pays producteurs.
- Notez que toutes les régions ne sont pas affichées. Il manque le Beajoulais, Bordeaux et le Sud-ouest (voir section Difficultés rencontrées).
- Extraction du millésime à partir de la dénomination du vin. Il a fallu plusieurs aller-retours entre le notebook et le Power BI, pour trouver une expression regex qui semble marcher !
- Problème avec l'utilisation des emplacements géographiques dans Power BI. En effet, la région "Southwest France" était placée au Cameroun et non pas en France ! Aussi les vins de Bordeaux et du Beajoulais ne sont pas nonplus affichés sur la carte de France (Les noms ne sont pas considérés comme de "provinces" par Power BI peut etre ?). Pour résoudre ce problème il faudrait peut-etre se baser sur des cordonnées (latitude, longitude), en ajoutant une colonne supplémentaire ?
source de l'image: https://www.carnetdevins.fr/guide-des-regions/








