# Sales Analysis - Step by Step (Beginner Friendly)

**Amaç:** Bu notebook, satış verileri üzerinde sıfırdan başlayarak adım adım Keşifsel Veri Analizi (EDA) yapmayı öğretir.

**İçerik:**
1. Ortam kurulumu ve kütüphanelerin yüklenmesi
2. Veriyi okuma ve ilk inceleme
3. Veri temizleme (tarih, eksikler, yinelenen satırlar)
4. Özellik çıkarımı (Ay, Yıl vb.)
5. Sık sorulan iş soruları (business questions) ve cevapları
6. Görselleştirmeler (tek grafik / chart başına tek plot)
7. Sonuçların `results/` klasörüne kaydedilmesi

## 0) Kurulum Kontrolü

Aşağıdaki komutu çalıştırarak kütüphanelerin doğru yüklendiğini test edin.

In [None]:
import sys, os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

print("Python:", sys.version)
print("NumPy:", np.__version__)
print("Pandas:", pd.__version__)
print("Matplotlib:", plt.matplotlib.__version__)

# Çıktı görmüyorsanız, `pip install -r requirements.txt` komutu ile kurulum yapın.

## 1) Veriyi Yükleme

- `data/sales_sample.csv` dosyasını Pandas ile okuyacağız.
- Tarih alanını (OrderDate) `datetime` tipine çevireceğiz.

In [None]:
import pandas as pd
from pathlib import Path

DATA_PATH = Path("..") / "data" / "sales_sample.csv"
df = pd.read_csv(DATA_PATH)

# Tarih alanını datetime formatına çevir
df["OrderDate"] = pd.to_datetime(df["OrderDate"], errors="coerce")

df.head()

## 2) Hızlı Genel Bakış

- Şema ve veri tipleri
- Sayısal sütunların özet istatistikleri
- Eksik değer kontrolü

In [None]:
display(df.info())
display(df.describe(numeric_only=True).T)
df.isna().sum()

## 3) Veri Temizleme

- Geçersiz tarihleri düşür
- Yinelenen (duplicate) satır var mı?

In [None]:
# Geçersiz tarihleri çıkar
before = len(df)
df = df.dropna(subset=["OrderDate"])
after = len(df)
print(f"Geçersiz tarihli satırlar çıkarıldı: {before - after} satır.")

# Yinelenen satırlar
dups = df.duplicated().sum()
print("Yinelenen satır sayısı:", dups)
if dups > 0:
    df = df.drop_duplicates()
    print("Yinelenenler düşüldü. Yeni satır sayısı:", len(df))

## 4) Özellik Çıkarımı (Feature Engineering)

- Yıl ve Ay sütunlarını oluştur
- Aylık gruplama için `YearMonth` (YYYY-MM) alanı

In [None]:
df["Year"] = df["OrderDate"].dt.year
df["Month"] = df["OrderDate"].dt.month
df["YearMonth"] = df["OrderDate"].dt.to_period("M").astype(str)

df.head()

## 5) İş Soruları ve Cevaplar (EDA)

### Soru 1: En çok ciro (Sales) getiren kategoriler hangileri?

In [None]:
category_sales = df.groupby("Category")["Sales"].sum().sort_values(ascending=False)
print(category_sales)

# Çubuk grafik
plt.figure()
category_sales.plot(kind="bar")
plt.title("Toplam Satış (Sales) - Kategori Bazında")
plt.xlabel("Kategori")
plt.ylabel("Toplam Satış")
plt.tight_layout()
plt.show()

### Soru 2: Şehirlere göre ciro dağılımı nasıldır? İlk 10 şehir.

In [None]:
city_sales = df.groupby("City")["Sales"].sum().sort_values(ascending=False).head(10)
print(city_sales)

plt.figure()
city_sales.plot(kind="bar")
plt.title("Toplam Satış - İlk 10 Şehir")
plt.xlabel("Şehir")
plt.ylabel("Toplam Satış")
plt.tight_layout()
plt.show()

### Soru 3: Aylık satış trendi (tüm şehirler için toplam)

In [None]:
monthly = df.groupby("YearMonth")["Sales"].sum().reset_index()
plt.figure()
plt.plot(monthly["YearMonth"], monthly["Sales"])
plt.title("Aylık Toplam Satış Trendi")
plt.xlabel("Yıl-Ay")
plt.ylabel("Toplam Satış")
plt.xticks(rotation=45, ha="right")
plt.tight_layout()
plt.show()

### Soru 4: Kâr (Profit) dağılımı kategori bazında

In [None]:
category_profit = df.groupby("Category")["Profit"].sum().sort_values(ascending=False)
print(category_profit)

plt.figure()
category_profit.plot(kind="bar")
plt.title("Toplam Kâr - Kategori Bazında")
plt.xlabel("Kategori")
plt.ylabel("Toplam Kâr")
plt.tight_layout()
plt.show()

### Soru 5: Zarar ettiren ürünler (Profit < 0) ve en fazla zarar eden ilk 10 ürün

In [None]:
loss_products = df[df["Profit"] < 0].groupby("ProductName")["Profit"].sum().sort_values().head(10)
loss_products

## 6) Sonuçların Kaydedilmesi

- Grafiklerin `results/charts/` klasörüne kaydedilmesi
- Kısa özet/çıkarımların `results/insights.md` dosyasına yazılması

In [None]:
from pathlib import Path

charts_dir = Path("..") / "results" / "charts"
charts_dir.mkdir(parents=True, exist_ok=True)

# 6.a) Grafikleri dosyaya kaydet
# (Grafikleri tekrar çizip kaydediyoruz)
plt.figure()
category_sales.plot(kind="bar")
plt.title("Toplam Satış (Sales) - Kategori Bazında")
plt.xlabel("Kategori")
plt.ylabel("Toplam Satış")
plt.tight_layout()
plt.savefig(charts_dir / "category_sales.png")
plt.close()

plt.figure()
city_sales.plot(kind="bar")
plt.title("Toplam Satış - İlk 10 Şehir")
plt.xlabel("Şehir")
plt.ylabel("Toplam Satış")
plt.tight_layout()
plt.savefig(charts_dir / "city_sales_top10.png")
plt.close()

plt.figure()
plt.plot(monthly["YearMonth"], monthly["Sales"])
plt.title("Aylık Toplam Satış Trendi")
plt.xlabel("Yıl-Ay")
plt.ylabel("Toplam Satış")
plt.xticks(rotation=45, ha="right")
plt.tight_layout()
plt.savefig(charts_dir / "monthly_sales_trend.png")
plt.close()

plt.figure()
category_profit.plot(kind="bar")
plt.title("Toplam Kâr - Kategori Bazında")
plt.xlabel("Kategori")
plt.ylabel("Toplam Kâr")
plt.tight_layout()
plt.savefig(charts_dir / "category_profit.png")
plt.close()

# 6.b) Kısa içgörüleri kaydet
insights_path = Path("..") / "results" / "insights.md"
top_cat = category_sales.idxmax()
top_city = city_sales.idxmax()
best_month = monthly.iloc[monthly["Sales"].idxmax()]["YearMonth"]

with open(insights_path, "w", encoding="utf-8") as f:
    f.write("# Özet İçgörüler\n\n")
    f.write(f"- En yüksek satış kategorisi: **{top_cat}**\n")
    f.write(f"- En yüksek satış yapılan şehir (ilk 10 listesinden): **{top_city}**\n")
    f.write(f"- En yüksek aylık satışın olduğu dönem: **{best_month}**\n")
    f.write("\n> Not: Bu veriler sentetiktir (örnek). Gerçek iş verilerinde sonuçlar farklı olabilir.\n")

## Tebrikler 🎉

Bu notebook ile:
- Veriyi yükledin ve inceledin,
- Temizleme ve özellik çıkarımı yaptın,
- Sık sorulan iş sorularını yanıtladın,
- Grafikler oluşturdun ve sonuçları kaydettin.

**Sıradaki adım:** `README.md` dosyasındaki talimatları izleyerek projeyi GitHub'a yükle.