In [None]:
# This Python 3 environment comes with many helpful analytics libraries installed
# It is defined by the kaggle/python docker image: https://github.com/kaggle/docker-python
# For example, here's several helpful packages to load in 

import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

# plotly
import plotly
import plotly.plotly as py
from plotly.offline import init_notebook_mode, iplot
init_notebook_mode(connected=True)
import plotly.graph_objs as go

# word cloud library
from wordcloud import WordCloud

# seaborn
import seaborn as sns

# matplotlib
import matplotlib
import matplotlib.pyplot as plt

%matplotlib inline

sns.set()

# Input data files are available in the "../input/" directory.
# For example, running this (by clicking run or pressing Shift+Enter) will list the files in the input directory

import os
print(os.listdir("../input/"))

# Any results you write to the current directory are saved as output.

In [None]:
pd.__version__

In [None]:
np.__version__

In [None]:
sns.__version__

In [None]:
plotly.__version__

In [None]:
matplotlib.__version__

In [None]:
df = pd.read_csv('../input/store-locations/directory.csv')
df.head()

In [None]:
def update_column(column):
    return column.replace(' ', '_').lower()

In [None]:
starbucks = df.copy()

In [None]:
starbucks.columns = starbucks.columns.map(update_column)

In [None]:
starbucks.head()

In [None]:
starbucks.info()

`longitude` ve `latitude` değerleri olmayan Starbucks'ları dikkate almayalım. Bu veri kümemizde sadece bir yerin 2 değerinin olmadığını yukarıda görüyoruz.

In [None]:
starbucks.dropna(axis=0, subset=['longitude', 'latitude'], inplace=True)

In [None]:
starbucks.dropna(axis=1, inplace=True)

In [None]:
starbucks.info()

In [None]:
starbucks.ownership_type.unique()

In [None]:
starbucks.country.unique()

In [None]:
country_indices, country_labels = starbucks.country.factorize()
country_labels

In [None]:
country_indices

In [None]:
starbucks["country_indice"] = country_indices

Öncelikle daha anlaşılır olması açıcısından ülke kısaltmalarının tam isimlerini de veri kümemize ekleyelim.

In [None]:
countries = pd.read_csv('../input/all-countries-with-their-2-digit-codes/countries.csv', names=['country_name', 'code'])
countries.head()

In [None]:
starbucks = starbucks.merge(countries, left_on='country', right_on='code')
starbucks.drop('code', axis=1, inplace=True)
starbucks.head()

İncelememize ülkelerdeki Starbucks dağılımlarını görselleştirmekle başlayalım. Öncelikle `matplotlib` kullanarak bunu gerçekleştirelim.

In [None]:
starbucks.plot(kind="scatter", x="longitude", y="latitude", 
               alpha=0.4, 
               figsize=(20,10), 
               c=starbucks.country_indice,
               s=starbucks["country_indice"] * 10 / len(country_labels), label="country",
               cmap=plt.get_cmap("jet"), 
               colorbar=False
)
plt.legend();

Bir de aynı haritayı _seaborn_ ile oluşturmayı deneyelim.

In [None]:
plt.figure(figsize=(20,10))

sns.scatterplot(x="longitude", y="latitude", data=starbucks, 
                hue="country", 
                legend=False, 
                palette=sns.color_palette('coolwarm', n_colors=len(country_labels)));

Sırada _ployly_ üzerinden aynı aracı interaktif olarak görselleştirmeye çalışalım:

In [None]:
co_lat_long = pd.Series(starbucks.country_name + " <br> "+starbucks.latitude.astype(str) + ' : ' + starbucks.longitude.astype(str))

In [None]:
trace = go.Scattergeo(
    lat=starbucks.latitude, 
    lon=starbucks.longitude, 
    mode='markers',
    hoverinfo = 'text', 
    text=co_lat_long,
    marker = dict( 
        size=2, 
        color= starbucks.country_indice,
        colorscale='jet',
        autocolorscale = False,
    )
)

data = [trace]

layout = dict(
    title = 'Starbucks Locations Worldwide<br>(Hover for locations)',
    showlegend = False, 
    geo = dict(
        showframe=False,
        showland = True,
        showlakes = False,
        showcountries = True,
        showcoastlines=False, 
        showocean = False,
        landcolor = 'rgb(243, 243, 243)',
        countrycolor = 'rgb(204, 204, 204)',
        projection = dict(
            type = 'natural earth'
        )
    )
)

fig = dict(data = data, layout = layout)
iplot(fig)

Görseller üzerinden konuşmak gerekirse, Amerika Birleşik Devletleri'nde Starbucks popülasyonunun fazla olduğu görmekteyiz. Bu düşünceyi somutlaştırmak adına gerekli adımlar atalım. 

In [None]:
first_ten_countries = starbucks.country_name.value_counts()[:10]
first_ten_countries

Türkiye 9. sırada ve Amerika Birleşik Devletleri ilk sırada beliriyor.

In [None]:
country_names =  first_ten_countries.index
country_values = first_ten_countries.values

In [None]:
plt.figure(figsize=(15,10))

sns.barplot(x=country_names, y=country_values, palette=sns.color_palette('BuGn', n_colors=10))
plt.xticks(rotation= 45)
plt.xlabel('Countries')
plt.ylabel('Size');

Bariz bir şekilde Amerika Birleşik Devletleri ilk sırada ve onu takip edenler ile arasında büyük bir oran farkı bulunmaktadır.

Ayrıca hangi devletlerin bulunduğunu _WordCloud_ oluşturarak da görselleştirebiliriz.

In [None]:
plt.figure(figsize=(20,10))

wordcloud = WordCloud(background_color='white',
                    width=712,
                    height=384)\
            .generate(" ".join(starbucks.country_name.value_counts().index))

plt.imshow(wordcloud)
plt.axis('off');

In [None]:
starbucks.head()

![](http://)Sahiplik tipi (`ownership_type`) üzerinden Starbucks dağılımlarını inceleyelim.

İlk olarak sahiplik tiplerine göre en çok hangi tip(ler) ağırlık göstermekte bakalım:[](http://)

In [None]:
sns.countplot(starbucks.ownership_type, palette=sns.color_palette('Purples'))
plt.ylabel('Number of Ownership')
plt.xlabel('Owenership Type')
plt.title('Ownership Types over Startbucks', color = 'blue', fontsize=15);

İlk 10 ülkeye ait sahiplik tip verilerine bakalım:

In [None]:
list_ten_countries = country_names.tolist()

In [None]:
ten_countries = starbucks.query('country_name in @list_ten_countries')

In [None]:
group_country_ownership = ten_countries.groupby(['country_name', 'ownership_type'])['brand'].count().reset_index()
pivot_country_ownership = pd.pivot_table(group_country_ownership, values='brand', index='country_name', columns='ownership_type', fill_value=0)
pivot_country_ownership

Bar grafiği üzerinden sahiplik kategorilerinin başlıca 10 ülke üzerindeki dökümüne bakalım:

In [None]:
sns.set_palette(sns.color_palette('coolwarm'))
pivot_country_ownership.plot(kind='bar',figsize=(20,10))
plt.xlabel('Countries')
plt.ylabel('Ownership Size')
plt.title('Starbucks Ownership Size Over Ten Countries', fontsize=15);

Sahiplik kategorisinde ortalamaya göre ilk 10 ülkenin değerleri:

In [None]:
max_ownership_type = pivot_country_ownership.sum(axis=0)
pivot_country_ownership["Company Owned Ratio"] = pivot_country_ownership["Company Owned"] / max_ownership_type["Company Owned"]
pivot_country_ownership["Franchise Ratio"] = pivot_country_ownership["Franchise"] / max_ownership_type["Franchise"]
pivot_country_ownership["Joint Venture Ratio"] = pivot_country_ownership["Joint Venture"] / max_ownership_type["Joint Venture"]
pivot_country_ownership["Licensed Ratio"] = pivot_country_ownership["Licensed"] / max_ownership_type["Licensed"]

In [None]:
fig, ax = plt.subplots(figsize=(20,10))

sns.barplot(x=pivot_country_ownership["Company Owned Ratio"], y=pivot_country_ownership.index, color='green',alpha = 0.8,label='Company Owned')
sns.barplot(x=pivot_country_ownership["Franchise Ratio"], y=pivot_country_ownership.index, color='blue',alpha = 0.5,label='Franchise')
sns.barplot(x=pivot_country_ownership["Joint Venture Ratio"], y=pivot_country_ownership.index, color='red',alpha = 0.5,label='Jount Venture')
sns.barplot(x=pivot_country_ownership["Licensed Ratio"], y=pivot_country_ownership.index, color='yellow',alpha = 0.5,label='Licensed')

ax.legend(loc='center right',frameon = True)
ax.set(xlabel='Ownership Size Ratio', ylabel='Countries',title = "Ratio For Each Starbucks Ownership Over Type Ten Countries");

_Franchise_ kategorisinde Starbucks, sadece İngiltere'de düşünülmüş durumda.

Son olarak, veri kümemiz içerisindeki _Brand_ kolonunu inceleyelim:[](http://)

In [None]:
starbucks.brand.unique()

Starbucks dışında toplam 3 farklı marka gözümüze çarpıyor. Bu markaları biraz internette incelediğimizde, hepsi Starbucks şirketi tarafından alındığını öğreniyoruz. Bu şirketler sonrasında Starbucks'ın bünyesine dahil olmuşlar.

Son 3 markanın listesini çıkartalım ve sahiplik tiplerine bakalım:

In [None]:
brands = ['Teavana', 'Evolution Fresh', 'Coffee House Holdings']

In [None]:
result = starbucks.query('brand in @brands')
result.shape

In [None]:
result.ownership_type.unique()

In [None]:
result.country_name.unique()

3 şirketin sonrasında Starbucks tarafından alındığını kesinlikle görmüş oluyoruz. Toplamda 3 ülkede 351 tane şubesi mevcutmuş bu markaların.