# 1. Veri Keşfi ve Ön Analiz (EDA)

Bu notebook'ta Türkiye ikinci el araç veri setini keşfedeceğiz ve ön analizler yapacağız.

## İçerik:
1. Veri setini yükleme
2. Temel bilgiler
3. Eksik değer analizi
4. Aykırı değer tespiti
5. Kategorik değişkenlerin analizi
6. Sayısal değişkenlerin analizi
7. Değişkenler arası korelasyonlar


In [None]:
# Gerekli kütüphaneleri import edelim
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import warnings
warnings.filterwarnings('ignore')

# Türkçe karakter desteği için
plt.rcParams['font.family'] = 'DejaVu Sans'

# Görselleştirme ayarları
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")

print("Kütüphaneler başarıyla yüklendi!")


In [None]:
# Veri setini yükleyelim
# Not: Veri setini data/ klasörüne yerleştirmeniz gerekecek
try:
    df = pd.read_csv('../data/ikinci_el_arac_verisi.csv')
    print(f"Veri seti başarıyla yüklendi! Boyut: {df.shape}")
except FileNotFoundError:
    print("Veri dosyası bulunamadı! Lütfen data/ klasörüne veri dosyasını yerleştirin.")
    print("Örnek veri seti oluşturuluyor...")
    # Örnek veri seti oluşturalım
    np.random.seed(42)
    n_samples = 1000
    
    markalar = ['Toyota', 'Volkswagen', 'Ford', 'Renault', 'Opel', 'BMW', 'Mercedes', 'Audi', 'Hyundai', 'Fiat']
    modeller = ['Corolla', 'Golf', 'Focus', 'Megane', 'Astra', '3 Series', 'C-Class', 'A4', 'i20', 'Punto']
    yakit_turleri = ['Benzin', 'Dizel', 'LPG', 'Hibrit']
    vites_turleri = ['Manuel', 'Otomatik', 'Yarı Otomatik']
    govde_tipleri = ['Sedan', 'Hatchback', 'SUV', 'Station Wagon', 'Coupe']
    
    df = pd.DataFrame({
        'marka': np.random.choice(markalar, n_samples),
        'model': np.random.choice(modeller, n_samples),
        'model_yili': np.random.randint(2010, 2024, n_samples),
        'kilometre': np.random.randint(5000, 300000, n_samples),
        'motor_hacmi': np.random.choice([1.0, 1.2, 1.4, 1.6, 1.8, 2.0, 2.2, 2.5, 3.0], n_samples),
        'yakit_turu': np.random.choice(yakit_turleri, n_samples),
        'vites_turu': np.random.choice(vites_turleri, n_samples),
        'govde_tipi': np.random.choice(govde_tipleri, n_samples),
        'fiyat': np.random.randint(50000, 800000, n_samples)
    })
    
    # Örnek veriyi kaydedelim
    df.to_csv('../data/ornek_veri.csv', index=False)
    print(f"Örnek veri seti oluşturuldu! Boyut: {df.shape}")
