# 1. Veri Setini Yükleme ve Hazırlama
Örnek olarak, scikit-learn'ün sağladığı bir veri setini kullanarak başlayabiliriz. Örneğin, iris veri setini kullanalım

In [1]:
from sklearn.datasets import load_iris

# Iris veri setini yükleyin
iris = load_iris()
X = iris.data  # Özellikler
y = iris.target  # Etiketler


# 2. Veri Setini Eğitim ve Test Setlerine Bölme
Modelinizi değerlendirmek için verilerinizi eğitim ve test setlerine ayırmanız önemlidir:

In [2]:
from sklearn.model_selection import train_test_split

# Verileri eğitim ve test setlerine ayırın
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)


# 3. Model Seçimi ve Oluşturma
scikit-learn çok sayıda model sunar. Örneğin, basit bir sınıflandırma modeli olan K-Nearest Neighbors (KNN) kullanabiliriz:

In [None]:
from sklearn.neighbors import KNeighborsClassifier

# KNN sınıflandırıcıyı oluşturun
model = KNeighborsClassifier(n_neighbors=3)


# 4. Modeli Eğitim (Fit Etme)
Modeli eğitim verileri üzerinde fit edin:

In [None]:
# Modeli eğitim verileriyle eğitin
model.fit(X_train, y_train)


# 5. Tahminler Yapma
Test verileri üzerinde tahminler yapın:

In [None]:
# Test verileri üzerinde tahminler yapın
y_pred = model.predict(X_test)


# 6. Model Performansını Değerlendirme
Modelin başarımını değerlendirmek için çeşitli metrikler kullanabilirsiniz:

In [None]:
from sklearn.metrics import accuracy_score, classification_report

# Modelin doğruluğunu hesaplayın
accuracy = accuracy_score(y_test, y_pred)
print(f"Doğruluk: {accuracy:.2f}")

# Detaylı sınıflandırma raporu
report = classification_report(y_test, y_pred)
print(report)


# 7. Özelliklerin Ölçeklenmesi
Çoğu makine öğrenme modeli, özelliklerin ölçeklenmesini gerektirir. scikit-learn bu işlemi kolaylaştırır:

In [None]:
from sklearn.preprocessing import StandardScaler

# Özellikleri ölçeklendirin
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)


# 8. Model Seçimi ve Hiperparametre Tuning
Modelinizi seçerken ve hiperparametreleri ayarlarken GridSearchCV veya RandomizedSearchCV kullanabilirsiniz:

In [None]:
from sklearn.model_selection import GridSearchCV

# Hiperparametreler için bir ızgara oluşturun
param_grid = {'n_neighbors': [1, 3, 5, 7, 9]}

# GridSearchCV nesnesini oluşturun
grid_search = GridSearchCV(KNeighborsClassifier(), param_grid, cv=5)
grid_search.fit(X_train, y_train)

# En iyi hiperparametreleri ve skoru yazdırın
print(f"En iyi parametreler: {grid_search.best_params_}")
print(f"En iyi skor: {grid_search.best_score_:.2f}")
