
# 💻 Çalışma Ortamı Kullanımı (Colab & GitHub)

Bu not defteri, **Professional Data Science Bootcamp** eğitiminde kullanılan uygulama dosyalarının bir parçasıdır.  
Her katılımcı, kendi çalışma kopyasında özgürce kod yazabilir ve değişiklik yapabilir.  

---

## 🪄 1️⃣ Dosyayı nasıl açacağız?

Bu dosyayı GitHub üzerinden açarken sayfanın üstünde şöyle bir buton göreceksiniz:

> **“Open in Colab”**

Bu butona tıkladığınızda, not defteri Google Colab ortamında açılır.  
Yani bilgisayarınıza hiçbir kurulum yapmadan, tarayıcı üzerinden Python kodlarını çalıştırabilirsiniz. 🎉  

---

## 💾 2️⃣ Değişiklikler nasıl kaydedilir?

Colab’daki tüm değişiklikler **sadece sizin oturumunuzda geçerlidir**.  
Orijinal eğitmen dosyası değişmez.  
Eğer kendi çalışmalarınızı saklamak istiyorsanız, aşağıdaki adımlardan birini mutlaka uygulayın:

- 📁 `File → Save a copy in Drive` → Dosya, kendi Google Drive’ınızda kaydedilir.  
- 🧭 (isteğe bağlı) `File → Save a copy in GitHub` → Dosya kendi GitHub hesabınıza fork edilir.  

> 🔸 Bu sayede kendi versiyonunuzda çalışabilir, notlar ekleyebilir, kodları değiştirebilirsiniz.

---

## 👩‍💻 3️⃣ Orijinal dosyayı değiştirmeyin

Bu not defteri eğitim sırasında herkes tarafından kullanılmaktadır.  
Bu nedenle orijinal sürümde **kod veya hücre silmeyin / değiştirmeyin.**  
Kendi çalışma kopyanızı oluşturduktan sonra değişiklikleri rahatça yapabilirsiniz.

---

## ☁️ 4️⃣ Verilere erişim

Bu not defteri otomatik olarak gerekli CSV dosyalarını (`netflix_titles.csv`, `retail_sales.csv`) indirir.  
Veri yoksa GitHub RAW veya yedek kaynaklardan (Hugging Face, Zenodo) indirilecektir.  
Hiçbir şey indirmenize gerek yok — “Run all” dediğinizde her şey hazır olur.

---

## 🎓 5️⃣ Özet

| Ne yapıyorum? | Nereye kaydolur? | Orijinal dosya etkilenir mi? |
|----------------|------------------|------------------------------|
| Sadece Colab’da çalıştırıyorum | Geçici oturum | ❌ Hayır |
| Save a copy in Drive | Kendi Google Drive’ım | ❌ Hayır |
| Save a copy in GitHub | Kendi GitHub hesabım | ❌ Hayır |
| GitHub’da “Edit” deyip kaydediyorum | Eğitmenin repo’su | ✅ Evet (yapmayın) |

---

## 🌱 Hazırsanız başlayalım!

Şimdi aşağıdaki hücreleri sırayla çalıştırın ve ortamınızı hazırlayın 👇  


# 00 · Veri Kurulumu (Quick Start)
Bu not defteri, ders CSV'lerini otomatik indirir ve `/content/data/` klasörüne yerleştirir.
Okuma sırası: **GitHub RAW (kendi reponuz) → Mirror → Fallback**.

> ⚠️ **Önemli:** Bu not defteri *eğitmen reposundaki orijinal şablondur*.
Lütfen kendi hesabınıza **kopyalayın** ve **kopya üzerinde** çalışın.

**Colab**: `File → Save a copy in Drive` veya `File → Save a copy in GitHub`

## 1) Klasör oluştur

In [None]:
import pathlib
DATA_DIR = "/content/data"
pathlib.Path(DATA_DIR).mkdir(parents=True, exist_ok=True)
print("DATA_DIR:", DATA_DIR)

## 2) Yardımcı fonksiyonlar

In [None]:
import pandas as pd
def try_read_csv(urls, **kwargs):
    last_err = None
    for url in urls:
        try:
            print("→ trying:", url)
            return pd.read_csv(url, **kwargs)
        except Exception as e:
            print("  failed:", e)
            last_err = e
    raise last_err

def save_df(df, path):
    df.to_csv(path, index=False)
    print("✔ saved:", path)

## 3) Netflix verisini indir

In [None]:
NETFLIX_URLS = [
    "https://raw.githubusercontent.com/<YOUR_USERNAME>/professional-datascience-bootcamp/main/module_1_basics/data/netflix_titles.csv",
    "https://huggingface.co/datasets/hugginglearners/netflix-shows/resolve/main/netflix_titles.csv",
    "https://zenodo.org/records/13925131/files/netflix_titles.csv?download=1",
]
try:
    df_netflix = try_read_csv(NETFLIX_URLS)
except Exception as e:
    print("Uyarı: URL'lerden okunamadı, küçük örnek oluşturuluyor.", e)
    df_netflix = pd.DataFrame({
        'title':['Money Heist','Stranger Things','Roma','Dark','The Crown'],
        'type':['TV Show','TV Show','Movie','TV Show','TV Show'],
        'country':['Spain','USA','Mexico','Germany','UK'],
        'release_year':[2017,2016,2018,2017,2016],
        'listed_in':['Crime, Drama','Sci-Fi, Horror','Drama','Sci-Fi, Mystery','Historical, Drama'],
        'duration':['5 Seasons','4 Seasons','135 min','4 Seasons','5 Seasons']
    })
save_df(df_netflix, f"{DATA_DIR}/netflix_titles.csv")
df_netflix.head()

## 4) Retail verisini indir

In [None]:
RETAIL_URLS = [
    "https://raw.githubusercontent.com/<YOUR_USERNAME>/professional-datascience-bootcamp/main/module_1_basics/data/retail_sales.csv",
    "https://raw.githubusercontent.com/plotly/datasets/master/2014_apple_stock.csv",  # demo örnek
]
try:
    df_retail = try_read_csv(RETAIL_URLS)
except Exception as e:
    print("Uyarı: URL'lerden okunamadı, seaborn 'tips' fallback'i kullanılacak.", e)
    import seaborn as sns
    df_retail = sns.load_dataset('tips')
    if 'total_bill' in df_retail.columns:
        df_retail = df_retail.rename(columns={'total_bill':'price','size':'quantity'})
        df_retail['quantity'] = df_retail['quantity'].fillna(1)
        df_retail['country'] = 'USA'
        df_retail['month'] = 1
save_df(df_retail, f"{DATA_DIR}/retail_sales.csv")
df_retail.head()

> ✅ `/content/data/netflix_titles.csv` ve `/content/data/retail_sales.csv` hazır.