In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt 
import seaborn as sns

data = pd.read_csv("C:/Users/ozann/OneDrive/Masaüstü/databank/starbucks/asıl data.csv")
data.head()

İlk 5 datayı görmek için data.head() komutunu kullandım.Sonrasında null değerleri bulup temizlemek ve datayı temiz hale getirmek için null değerleri görüntüledim

In [None]:
data.isnull().sum()

Sonrasında datadaki null değerleri çıkarmak için data = data.dropna() metodunu kullandım ve null değerleri çıkardım. Null değerlerin veri analizinde yapmış olduğu hatalar sebebiyle null değerleri silmek, iyi bir algortima yaratmaya yardım eder.

In [None]:
data = data.dropna()
data = data[data['size'] == 'Grande']

data['type'] = data['type'].replace({'Frappuccino® Blended Beverages':'Frappuccinos'})
data['drink_name'] = data['drink_name'].str.replace('Frappuccino® Blended Beverage', 'Frappuccino')
data['drink_name'] = data['drink_name'].str.replace('Frappuccino®', 'Frappuccino')
data.head()


In [None]:
data.shape

data.shape komutu ile datalarımdan ne kadar satır ve sütun sildiğime baktım ve temiz veriyi gördüm.

In [None]:
data.describe()

Sonrasında Starbuckstaki en sağlıksız,kafein,şeker ve kalori oranı en yüksek kahvesini bulmak için maksimum değerlere baktım.

In [None]:
data.groupby('type').mean()

Starbuckstaki içeceklerin ne kadarlık bi kısmı kafein içeriyor? 

In [None]:
caf_perc = round(len(data[data.caffeine > 0]) / len(data) * 100, 2)
print('Percentage of menu drinks that contain caffeine: ', caf_perc, '%', sep='')

Starbucks menüsündeki içeceklerin %85.6 sı kafeinli içecek.

Bu içecek menüsündeki sıcak,soğuk içecekler, çaylar,frappucinoların verilerini grafik ile inceleyelim;

In [None]:
data['type'].value_counts().plot(kind='bar', figsize=(10, 6), rot=0, color='orange')
plt.title('Variety in Starbucks Drink Categories', fontsize=16)
plt.xlabel("Drink Category")
plt.ylabel("Number of Drinks")
plt.show()

In [None]:
plt.figure(figsize=(10,8), dpi= 80)
sns.heatmap(data.corr(), xticklabels=data.corr().columns, yticklabels=data.corr().columns, cmap='Greens', center=0, annot=True)

# Decorations
plt.title('Correlogram of Starbucks Nutrition Types', fontsize=16)
plt.xticks(fontsize=12)
plt.yticks(fontsize=12)
plt.show()

### Bu korelogram, Starbucks içeceklerindeki her bir beslenme türü arasındaki korelasyonları gösterir. Daha koyu yeşil renkler, daha yüksek (daha pozitif) bir beslenme türü korelasyonunu kodlar. Kafein dışında her beslenme türü birbiriyle pozitif bir korelasyon gösterir - kafeinin diğer beslenme türleri ile hafif bir negatif korelasyonu veya sıfıra yakın bir korelasyonu vardır. Bu, hem şekerli hem de şekersiz içeceklerde farklı seviyelerde kafein bulunabileceğini düşündürebilir. En güçlü pozitif korelasyon, yağ ve kolesterol arasındadır; bu mantıklıdır, çünkü kolesterol birçok lipit türünden biridir. Benzer şekilde, şeker bir karbonhidrat olduğundan, karbonhidratlar ve şeker ikinci en güçlü korelasyona sahiptir.

### Diğer çok güçlü pozitif ilişkiler şunlardır: kalori~karbonhidratlar, kalori~yağ, kalori~kolesterol ve kalori~şeker. Bu korelasyonlar, Starbucks beslenmesinde herhangi bir benzersiz gözleme işaret etmese de, korelasyonların genel olarak anlamlı olduğunu doğrulamak iyidir.

# Hangi ürünlerin kalorisi en yüksek?

In [None]:
data.nlargest(5, 'calories')[['drink_name', 'calories']]

|drink_name                                 |  calories  |
|-------------------------------------------|------------|
|Salted Caramel Mocha                       |    470     |
|Mocha Cookie Crumble Frappucc              |    470     |
|Caramel Ribbon Crunch Frappuccino          |    470     |
|Salted Caramel Hot Chocolate               |    460     |
|Chocolate Cookie Crumble Crème Frappuccino |    450     |
		
	

In [None]:
fig = plt.figure(figsize = (6, 4))
plt.hist(data.calories, bins = 8, rwidth= 0.85, color='green')
plt.title('Distribution of Starbucks Calories')
plt.xlabel("Calories")
plt.ylabel("Number of Drinks")
plt.show()

# Hangi ürünlerin kafeini daha yüksek?

In [None]:
data.nlargest(5, 'caffeine')[['drink_name', 'caffeine']]

|drink_name                                 |  caffeine  |
|-------------------------------------------|------------|
|Blonde Roast                               |    360     |
|Pike Place                                 |    310     |
|Nitro Cold Brew with Dark Cocoa            |    280     |
|Starbucks Reserve Nitro Cold Brew          |    280     |
|Nitro Cold Brew                            |    280     |
		

In [None]:
fig = plt.figure(figsize = (6, 4))
plt.hist(data.caffeine, bins = 8, rwidth= 0.85, color='green')
plt.title('Distribution of Starbucks Caffeine')
plt.xlabel("Caffeine (g)")
plt.ylabel("Number of Drinks")
plt.show()

In [None]:
data.nlargest(5, 'calories')[['drink_name', 'calories']]

In [None]:
fig = plt.figure(figsize = (6, 4))
plt.hist(data.caffeine, bins = 8, rwidth= 0.85, color='green')
plt.title('Distribution of Starbucks Caffeine')
plt.xlabel("Caffeine (g)")
plt.ylabel("Number of Drinks")
plt.show()


In [None]:
data.nsmallest(10, 'calories')[['drink_name', 'calories']]

In [None]:
fig = plt.figure(figsize = (8, 6))
plt.scatter(data.calories, data.sugar, c=data.caffeine, cmap='Greens')
cbar = plt.colorbar()
cbar.set_label('Caffeine (g)', rotation=270)

# draw line
plt.plot(np.unique(data.calories), np.poly1d(np.polyfit(data.calories, data.sugar, 2))
         (np.unique(data.calories)), color = 'black')

plt.title('Calories vs Sugar in Starbucks Drinks', fontsize=16)
plt.xlabel("Calories")
plt.ylabel("Sugar (g)")
plt.show()

In [None]:
sns.set(palette="muted")
sns.catplot(x="type", y="caffeine", hue="type",
            kind="swarm", data=data, aspect=1.5);
plt.title("Caffeine by Drink Type", fontsize=16)
plt.show()

In [None]:
sns.catplot(x="type", y="calories",
            kind="swarm", data=data, aspect=1.5);
plt.title("Calories by Drink Type", fontsize=16)
plt.show()

In [None]:
sns.catplot(x="type", y="sugar",
            kind="swarm", data=data, aspect=1.5);
plt.title("Sugar by Drink Type", fontsize=16)
plt.show()


## Frappuccino kategorisi, kolayca en fazla kalori ve şeker içeren kategori olarak tanımlanır. Bu kategorideki puanların çoğu 350 kalorinin ve 40 gram şekerin üzerindedir.

In [None]:
sns.lmplot(x="calories", y="sugar", hue="type",
           data=data, aspect=1.5);
plt.title("Calories & Sugar in Starbucks Drink Types", fontsize=16)
plt.show()

# Tüm beslenme türleri için g/mg değerlerine bakmak bize pek bir şey söylemez çünkü her beslenme türünün miktarlarını farklı ölçeklerle karşılaştıramayız. Bunu standardize etmek için, her tür için beslenme değerlerinin günlük önerilen alım miktarına kıyasla nasıl olduğunu bilmek istiyorum.

## FDA nın verilerine göre;
- Calories: 2000
- Fat: 78g
- Cholesterol: 300mg
- Sodium: 2300mg
- Carbohydrates: 275g

- Protein: 50g

# Yetişkin bireylerin günlük kafein alım oranı,maksimum değer 400 mg ın üzerine çıkmamaktır.Bu noktada, starbucks ürünlerinin besin değerlerinin günlük ihtiyacımızın üzerine çıkıp çıkmadığına bakıyorum;


In [None]:
dv = data.copy(deep=True)
dv.calories = dv.calories / 2000 * 100
dv.fat = dv.fat / 78 * 100
dv.cholesterol = dv.cholesterol / 300 * 100
dv.sodium = dv.sodium / 2300 * 100
dv.carb = dv.carb / 275 * 100
dv = dv.drop(columns=['sugar']) # no daily level for total sugars
dv.protein = dv.protein / 50 * 100
dv.caffeine = dv.caffeine / 400 * 100

In [None]:
dv.head()

In [None]:
dv.mean()

In [None]:
dv.max()[3:]

|calories   |    23.5    |
|-----------|------------|
|fat        |    30.7692 |
|cholesterol|    21.6667 |
|sodium     |    16.5217 |
|carb       |    28      |
|protein    |    30      |
|caffeine   |    90      |

# hiçbir içecek günlük ihtiacın 1/3 ünün üzerine çıkmıyor.

In [None]:
dv.nlargest(10, 'caffeine')[['drink_name', 'caffeine']]

# En yüksek kafein değeri olan içeceğe bakıyorum ve Blonde Roast adlı ürünün en yüksek kafein değerine sahip olduğunu gördüm.

| drink_name                   | caffeine   |
| Blonde Roast                 |    90      |
|Pike place                    |    70      |
|Nitro Cold Brew dark chocolate|    70      |
|Starbucks Reserve             |    70      |
|Nitro Cold Brew               |    70      |
|Nitro Cold Brew with Cinnamon |    68      |

# Blonde Roast günlük kafein ihtiyacımızın %90 ını karşılıyor.

In [None]:
dv.nlargest(10, 'calories')[['drink_name', 'calories']]

# 23.5 kalorilik değeriyle Salted Caramel Mocha'nın en kalorili içecek olduğunu gördüm. 

In [None]:
heatmap = dv.groupby('type').mean()

plt.figure(figsize=(8,6))
plt.title('Average Nutrition Daily Intake % of Starbucks Items by Category', fontsize=16)
sns.heatmap(heatmap, cmap="Greens", annot=True)

In [None]:
dv[(dv['caffeine'] > 60 )].sort_values(by=['caffeine'], ascending=False)

In [None]:
dv[(dv['calories'] >= 20) & (dv['carb'] > 20)].sort_values(by=['calories', 'carb'], ascending=False)

# Ve en sağlıksız içecekler...
## %60 DV'den daha fazla kafein ve %20 DV'den daha fazla kalori ve karbonhidrat ile işte en kötü içecekleriniz!

# Kafein içeriği en yüksek olan içecek
- Blonde Roast 90.00mg

# En kalorili ve en sağlıksız içecek!
- Salted Caramel Mocha!

