 Bu not defterinde:
 - "Tips" veri kümesine benzer bir CSV dosyasını yükleyeceğiz.
 - **pandas** kullanarak veriyi keşfedecek ve temizleyeceğiz.
 - **seaborn** ve **matplotlib** kullanarak gelişmiş grafiklerle veriyi görselleştireceğiz.

In [None]:
# Kütüphaneler 
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
# Seaborn için güzel bir tema ayarlayalım
sns.set_theme(style="whitegrid")

## Veri Hazırlama

 Bu örnek için, restoran bahşişlerini içeren örnek bir CSV dosyası oluşturuyoruz.
 Kendi CSV dosyanızı kullanmak isterseniz, oluşturma adımını atlayıp dosyanızı yükleyebilirsiniz.
 Burada csv dosyalarını elimizdeki datadan oluşturmayı görüyoruz.


In [None]:
# Örnek DataFrame oluşturma
data = {
    'total_bill': [16.99, 10.34, 21.01, 23.68, 24.59, 25.29, 8.77, 26.88, 15.04, 14.78,
                   34.00, 17.50, 22.30, 12.45, 18.65, 28.75, 19.80, 11.00, 27.30, 13.90],
    'tip': [1.01, 1.66, 3.50, 3.31, 3.61, 4.71, 2.00, 3.12, 1.96, 3.23,
            5.00, 2.50, 4.00, 2.10, 3.40, 4.80, 3.00, 1.50, 4.20, 2.80],
    'sex': ['Female', 'Male', 'Male', 'Male', 'Female', 'Male', 'Male', 'Female', 'Female', 'Male',
            'Female', 'Male', 'Male', 'Female', 'Female', 'Male', 'Male', 'Female', 'Male', 'Female'],
    'smoker': ['No'] * 20,
    'day': ['Sun'] * 10 + ['Sat'] * 10,
    # İlk 10 kayıt için öğle, sonraki 10 kayıt için akşam yemeği
    'time': ['Öğle Yemeği'] * 10 + ['Akşam Yemeği'] * 10,
    'size': [2, 3, 3, 2, 4, 4, 2, 4, 2, 2,
             4, 2, 3, 2, 4, 5, 2, 3, 4, 2]
}


# datadan bir csv dosyası oluşturuyrouz
df = pd.DataFrame(data)

# DataFrame'i CSV dosyası olarak kaydetme
csv_filename = 'sample.csv'
df.to_csv(csv_filename, index=False)
print(f"CSV dosyası '{csv_filename}' başarıyla oluşturuldu!")


Artık bu dataları bir csv yaptığımız için, csvden okuma yapabilriz. Elinde bir csv dosyası var ise aynı şekilde okuman mümkün.

In [None]:
# CSV dosyasını yükleme
df = pd.read_csv(csv_filename)


Pandas kullanarak veriyi biraz inceleyelim

In [None]:
# Veri kümesinin ilk birkaç satırını görüntüleme
df.head()

In [None]:
# Veri kümesine ait temel bilgilerin görüntülenmesi
df.info()

In [None]:
# Veri kümesinin istatistiksel özetinin görüntülenmesi
df.describe()

## Seaborn ve Matplotlib ile Veri Görselleştirme
Şimdi verideki çeşitli özellikleri göstermek için bir dizi grafik oluşturalım.







# %%
# Toplam hesap dağılımı
plt.figure(figsize=(8, 4))
sns.histplot(df['total_bill'], kde=True, color="skyblue")
plt.title("Toplam Hesap Dağılımı")
plt.xlabel("Toplam Hesap")
plt.ylabel("Frekans")
plt.show()

# %%
# Toplam hesap ve bahşiş arasındaki ilişkiyi gösteren saçılma grafiği
plt.figure(figsize=(8, 4))
sns.scatterplot(data=df, x='total_bill', y='tip', hue='sex', style='sex', s=100)
plt.title("Toplam Hesap ve Bahşiş Arasındaki İlişki (Cinsiyete Göre)")
plt.xlabel("Toplam Hesap")
plt.ylabel("Bahşiş")
plt.show()

# %%
# Cinsiyete göre toplam hesap dağılımını gösteren kutu grafiği
plt.figure(figsize=(8, 4))
sns.boxplot(data=df, x='sex', y='total_bill', palette="Pastel1")
plt.title("Cinsiyete Göre Toplam Hesap Kutu Grafiği")
plt.xlabel("Cinsiyet")
plt.ylabel("Toplam Hesap")
plt.show()

# %%
# Tüm sayısal değişkenler arasındaki ilişkileri keşfetmek için çift grafiği
sns.pairplot(df, hue='sex', palette="coolwarm", markers=["o", "s"])
plt.suptitle("Tips Veri Kümesinin Çift Grafiği", y=1.02)
plt.show()

# %% [markdown]
# ### Ekstra Harika Grafikler
#
# Aşağıda daha gelişmiş ve açıklayıcı bazı görselleştirmeler yer almaktadır.

# %%
# Keman grafiği: Kutu grafiği ve yoğunluk grafiğinin birleşimi
plt.figure(figsize=(8, 4))
sns.violinplot(data=df, x='sex', y='total_bill', palette="Set2", inner="quartile")
plt.title("Cinsiyete Göre Toplam Hesap Keman Grafiği")
plt.xlabel("Cinsiyet")
plt.ylabel("Toplam Hesap")
plt.show()

# %%
# Sürü grafiği: Kutu grafiği üzerine bireysel gözlemleri gösterir
plt.figure(figsize=(8, 4))
sns.boxplot(data=df, x='day', y='total_bill', palette="Pastel2", showfliers=False)
sns.swarmplot(data=df, x='day', y='total_bill', color=".25")
plt.title("Günlere Göre Toplam Hesap: Kutu + Sürü Grafiği")
plt.xlabel("Gün")
plt.ylabel("Toplam Hesap")
plt.show()

# %%
# Birleşik grafik: Toplam hesap ve bahşiş arasındaki ilişkiyi kenar dağılımları ile gösterir
sns.jointplot(data=df, x='total_bill', y='tip', kind="scatter", hue='sex', palette="deep")
plt.suptitle("Toplam Hesap ve Bahşişin Birleşik Grafiği", y=1.05)
plt.show()

# %%
# Isı haritası: Sayısal değişkenlerin korelasyon matrisini görselleştirir
plt.figure(figsize=(8, 6))
corr = df[['total_bill', 'tip', 'size']].corr()
sns.heatmap(corr, annot=True, cmap="coolwarm", linewidths=0.5)
plt.title("Sayısal Özellikler Arası Korelasyon Isı Haritası")
plt.show()

# %%
# Regresyon grafiği: Toplam hesap ve bahşiş arasındaki doğrusal ilişkiyi gösterir
plt.figure(figsize=(8, 4))
sns.regplot(data=df, x='total_bill', y='tip', scatter_kws={'s': 80}, line_kws={'color': 'red'})
plt.title("Toplam Hesap ve Bahşiş Arasındaki Regresyon Grafiği")
plt.xlabel("Toplam Hesap")
plt.ylabel("Bahşiş")
plt.show()

# %%
# Kayıt sayısı grafiği: Her güne ait kayıt sayısını gösterir
plt.figure(figsize=(8, 4))
sns.countplot(data=df, x='day', palette="Blues_d")
plt.title("Günlere Göre Kayıt Sayısı")
plt.xlabel("Gün")
plt.ylabel("Kayıt Sayısı")
plt.show()

# %% [markdown]
# ## Sonuç
#
# Bu not defterinde:
# - Örnek bir CSV dosyası oluşturduk.
# - **pandas** kullanarak veriyi yükleyip keşfettik.
# - **seaborn** ve **matplotlib** ile aşağıdaki grafiklerle veriyi görselleştirdik:
#   - Histogram, saçılma grafiği, kutu grafiği, çift grafik.
#   - Keman grafiği, sürü grafiği, birleşik grafik, ısı haritası, regresyon grafiği ve kayıt sayısı grafiği.
#
# Bu teknikler, **pandas** ve **seaborn**'un veri analizi ve görselleştirme konusundaki tüm gücünü ortaya koymaktadır. Kendi veri kümeleriniz ve fikirlerinizle bu örnekleri geliştirebilirsiniz!