# Giriş

28/02/2021 - [@mebaysan](https://github.com/mebaysan)

Bu notebook'da [Plotly](https://plotly.com/python/) kullanarak [ScatterMap](https://plotly.com/python/scattermapbox/) harita yapımını öğrenmeye çalışacağız.

**Notebook üzerine çekilen Youtube videosuna [buradan](https://youtu.be/lMOUS8Q-1c0) erişebilirsiniz.**

- [GitHub gist'lerim](https://gist.github.com/mebaysan/f296ff7d603f973f7a6b1dff39c69596) üzerinden harita oluşturmak için kullanabileceğiniz hazır scriptlere ulaşabilirsiniz.
- Türkiye illeri için **GeoJSON** dosyasına erişmek için [burayı](https://gist.github.com/mebaysan/9be56dd1ca5659c0ff7ea5e2b5cf6479) kullanabilirsiniz.
- Türkiye'ye ait **tüm ilçelere** ve coğrafi bilgilerine CSV olarak erişmek için [burayı](https://gist.github.com/mebaysan/3246378ebce34a67106dcf5271771f4a), JSON olarak erişmek için [burayı](https://gist.github.com/mebaysan/b9f3cc1ad9c1f4294a0a7c7a7be9ec62) kullanabilirsiniz.
- Türkiye **tüm illere** ve coğrafi bilgilerine CSV olarak erişmek için [burayı](https://gist.github.com/mebaysan/7a4ba8531187fa8703ff1f22692d5fa6), JSON olarak erişmek için [burayı](https://gist.github.com/mebaysan/4153d60270167f5245f89c9b8efaec9d) kullanabilirsiniz.

## Plotly ScatterMap Hk.

Plotly ScatterMap oluşturmak istiyorsak çalışacağımız veriler ile ilgili **latitude & longitude (enlem & boylam)** bilgilerine sahip olmamız gerekmektedir.

ScatterMap haritalar hakkında daha detaylı bilgiyi almak için [buraya](https://datavizcatalogue.com/TR/yontemleri/nokta_haritasi.html) bakabilirsiniz.

## Notebook Hk.

Haritamızı oluştururken [veri setini kullanacağız](https://www.kaggle.com/ocakhsn/istanbul-airbnb-dataset).

Bu veri seti İstanbul'da AirBnb'e kayıtlı odaları listelemektedir.

Oluşturduğumuz harita ilçelerdeki oda fiyatlarını ve yerlerini gösterecek.

# Ön Hazırlıklar

## Kullanacağımız Paketleri Import Ediyoruz

In [11]:
import pandas as pd  # pip install pandas
import numpy as np  # pip install numpy
import plotly.express as px  # pip install plotly
import plotly.graph_objects as go  # pip install plotly

## Veri Setlerimizi Yüklüyoruz

### AirBnb İstanbul Veri Seti

- Bu notebook'un dizininde bulunan **'listings.csv'** dosyası

In [12]:
df = pd.read_csv('listings.csv')

# Veri Setini İnceleyelim - Düzenleyelim

## AirBnb İstanbul

In [13]:
df.describe().T  # veri seti hakkında betimsel istatistikler

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
id,23728.0,29137110.0,13059640.0,4826.0,21018600.0,33986370.0,39659020.0,43970930.0
host_id,23728.0,149397300.0,115545200.0,6603.0,32854400.0,147772700.0,258814500.0,352204100.0
neighbourhood_group,0.0,,,,,,,
latitude,23728.0,41.02842,0.04571288,40.81396,41.00512,41.03185,41.04853,41.47903
longitude,23728.0,28.98211,0.1275031,28.01901,28.97321,28.98349,29.02005,29.90778
price,23728.0,484.6432,1973.884,0.0,137.0,247.0,446.0,76922.0
minimum_nights,23728.0,4.525202,27.61419,1.0,1.0,1.0,3.0,1125.0
number_of_reviews,23728.0,7.870828,23.22913,0.0,0.0,0.0,4.0,345.0
reviews_per_month,11353.0,0.710177,0.9029131,0.01,0.13,0.33,0.95,9.2
calculated_host_listings_count,23728.0,5.861767,16.53537,1.0,1.0,2.0,5.0,176.0


In [14]:
df.info()  # değişkenler hakkında bilgiler

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 23728 entries, 0 to 23727
Data columns (total 16 columns):
 #   Column                          Non-Null Count  Dtype  
---  ------                          --------------  -----  
 0   id                              23728 non-null  int64  
 1   name                            23674 non-null  object 
 2   host_id                         23728 non-null  int64  
 3   host_name                       23727 non-null  object 
 4   neighbourhood_group             0 non-null      float64
 5   neighbourhood                   23728 non-null  object 
 6   latitude                        23728 non-null  float64
 7   longitude                       23728 non-null  float64
 8   room_type                       23728 non-null  object 
 9   price                           23728 non-null  int64  
 10  minimum_nights                  23728 non-null  int64  
 11  number_of_reviews               23728 non-null  int64  
 12  last_review                     

In [15]:
df.dtypes  # değişkenlere ait veri tipleri

id                                  int64
name                               object
host_id                             int64
host_name                          object
neighbourhood_group               float64
neighbourhood                      object
latitude                          float64
longitude                         float64
room_type                          object
price                               int64
minimum_nights                      int64
number_of_reviews                   int64
last_review                        object
reviews_per_month                 float64
calculated_host_listings_count      int64
availability_365                    int64
dtype: object

In [17]:
df.head(2)

Unnamed: 0,id,name,host_id,host_name,neighbourhood_group,neighbourhood,latitude,longitude,room_type,price,minimum_nights,number_of_reviews,last_review,reviews_per_month,calculated_host_listings_count,availability_365
0,4826,The Place,6603,Kaan,,Uskudar,41.0565,29.05367,Entire home/apt,720,1,1,2009-06-01,0.01,1,365
1,20815,The Bosphorus from The Comfy Hill,78838,Gülder,,Besiktas,41.06984,29.04545,Entire home/apt,816,365,41,2018-11-07,0.33,2,279


# ScatterMap Yapımı

## Plotly Express ile ScatterMap

### ScatterMap MapBox

- ScatterMap MapBox; Plotly'nin [MapBox](https://www.mapbox.com/) haritaları ile kullanmak için oluşturduğu objelerdir. Platform üzerinden oluşturduğunuz token'lar ile kendi özel haritalarınızı kullanabilirsiniz.

In [25]:
fig = px.scatter_mapbox(df,  # hangi veri seti
                        lat="latitude",  # latitude bilgilerinin tutulduğu değişken adı
                        lon="longitude",  # longitude bilgilerinin tutulduğu değişken adı
                        # hangi değişkene göre renklenecek (sürekli değişken)
                        color="price",
                        size="price",  # noktalar hangi değişkene göre size olacak
                        color_continuous_scale='viridis',  # sürekli değişken renk paleti
                        range_color=(df['price'].min(), df['price'].max()),
                        zoom=10,  # harita başlangıç zoom'u
                        # mapbox stil / carto-positron da ücretsiz olarak kullanılabilen bir mapbox stilidir / open-street-map -> open street map ücretsiz olarak kullanılabilir
                        mapbox_style="carto-positron",
                        custom_data=[df['name'], df['host_name'], df['neighbourhood'],
                                     df['price'], df['room_type'], df['availability_365']],  # grafiğe custom veriler gönderiyoruz, liste olarak göndermemiz gerekmekte
                        # grafik oluşturulurken 'price' gördüğü her yere 'Fiyat' yazacak
                        labels={'price': 'Fiyat'}
                        )
fig.update_layout(title='İstanbul AirBnb Oda Bilgileri',  # figure başlığı
                  title_x=0.5,  # Title'ın x eksenindeki pozisyonu
                  )
#  gönderdiğimiz customdata'nın ilk elemanı
hovertemp = '<i style="color:red;">Oda Adı:</i> %{customdata[0]}<br>'
hovertemp += '<i style="color:red;">Oda Sahibinin Adı:</i> %{customdata[1]}<br>'
hovertemp += '<i style="color:red;">Oda İlçesi:</i> %{customdata[2]}<br>'
hovertemp += '<i style="color:red;">Oda Fiyatı:</i> %{customdata[3]:,} ₺<br>'
hovertemp += '<i style="color:red;">Oda Tipi:</i> %{customdata[4]}<br>'
hovertemp += '<i style="color:red;">Yılda Kaç Gün Müsait:</i> %{customdata[5]}<br>'
# figure üzerine gelince oluşturduğum stringi göster
fig.update_traces(hovertemplate=hovertemp)
fig.show()