# Map Plot

Ce script python à pour objectif de vous faire prendre en mains les principales libraires dans le fichier `Librairies.ipynb` à la racine du repo git ainsi que vous familiariser avec la visualisation de données. 

In [1]:
#import des librairies 
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
#Pour plus de détails sur la librairie Bokeh voir le fichier Librairies.ipynb
from bokeh.io import output_file, show
from bokeh.models import ColumnDataSource, GMapOptions, BoxSelectTool
from bokeh.plotting import gmap
from bokeh.models.mappers import LinearColorMapper
from bokeh.palettes import Viridis5

## Setup

In [2]:
#charger le dataset
dataset = pd.read_csv("../data/listings.csv", sep=";")

In [3]:
#paramètrage de la map google 
map_options = GMapOptions(lat=48.864715, lng=2.346408, map_type="roadmap", zoom=13)


## La documentation google map 
https://developers.google.com/maps/documentation/javascript/get-api-key

** Remplacer par la clefs API ** 

In [4]:
p = gmap("AIzaSyAYXIJSSMvMAcBIngsIiKaTRQde2O_zkas", map_options, title="Paris", sizing_mode='stretch_both')

#chargement du dataset dans la map 
source = ColumnDataSource(
    data=dict(lat=dataset["latitude"].values,
              lon=dataset["longitude"].values)
)


## Affichage

In [5]:
#coloration 
color_mapper = LinearColorMapper(palette=Viridis5)
#paramètre d'affichage 
p.circle(x="lon", y="lat", size=7, fill_color="blue", fill_alpha=0.4, source=source)
#configuration du plot  
p.add_tools(BoxSelectTool())
#ouverture du graphique 
show(p)

## petit bonnus : affichage des mots les plus courants  


In [6]:
from collections import Counter
#utilisation des collections cf : https://docs.python.org/2/library/collections.html
def most_common_word(labels):
    words = []
    for lab in labels : 
        words += lab.split(" ")
    counter = Counter(words)
    for word in counter.most_common(100):
        print(word)


In [7]:
#renvoyer la liste des mots les plus courant ainsi que leurs occurrences 
most_common_word(dataset['name'].values)

('Paris', 162)
('-', 150)
('de', 113)
('in', 92)
('Appartement', 83)
('Studio', 78)
('2', 75)
('Marais', 73)
('studio', 56)
('Eiffel', 55)
('&', 49)
('à', 44)
('du', 44)
('', 43)
('Chambre', 42)
('apartment', 42)
('of', 40)
('the', 39)
('appartement', 38)
('Cosy', 37)
('3', 37)
('au', 36)
('flat', 36)
('dans', 35)
('Saint', 34)
('avec', 32)
('pièces', 32)
('and', 31)
('et', 31)
('des', 30)
('personnes', 30)
('coeur', 29)
('Charming', 29)
('Le', 29)
('Tour', 29)
('Germain', 28)
('cosy', 28)
('room', 25)
('4', 25)
('le', 24)
('Tower', 24)
('near', 24)
('!', 24)
('PARIS', 23)
('Charmant', 23)
('Parisian', 22)
('St', 22)
('Loft', 22)
('heart', 22)
('Martin', 21)
('Apartment', 21)
('to', 21)
('1', 21)
('MARAIS', 20)
('Champs', 20)
('près', 20)
('Luxury', 20)
('/', 19)
('Canal', 19)
('with', 19)
('lumineux', 19)
('quartier', 18)
('Beautiful', 18)
('Louvre', 17)
('Flat', 17)
('sur', 17)
('calme', 16)
('proche', 16)
('Bastille', 16)
('Grand', 16)
('m2', 15)
('Duplex', 15)
('plein', 15)
('APPAR