# Regression Modelleri ile Makine Öğrenmesi Uygulaması
Bu çalışmada, farklı regresyon algoritmaları kullanılarak bir makine öğrenmesi uygulaması geliştirilmiştir. Kullanılan algoritmalar:
- Linear Regression
- Decision Tree Regression
- Random Forest Regression


In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error


In [2]:
# Veri setini yükle.
url = "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/mpg.csv"
data = pd.read_csv(url)

# İlk birkaç satırını görüntüle.
data.head()
#Kullanacağım veri seti araçların yakıt tüketimi verisidir. Veri setinin ilk beş satırını inceleyerek genel bir fikir edindim.

Unnamed: 0,mpg,cylinders,displacement,horsepower,weight,acceleration,model_year,origin,name
0,18.0,8,307.0,130.0,3504,12.0,70,usa,chevrolet chevelle malibu
1,15.0,8,350.0,165.0,3693,11.5,70,usa,buick skylark 320
2,18.0,8,318.0,150.0,3436,11.0,70,usa,plymouth satellite
3,16.0,8,304.0,150.0,3433,12.0,70,usa,amc rebel sst
4,17.0,8,302.0,140.0,3449,10.5,70,usa,ford torino


In [4]:
# Eksik verileri temizle.
data = data.dropna()

# Temizlenmiş veri setinin şeklini kontrol et.
data.shape
#Veri setinde eksik bulunan değerleri analizlerin sağlıklı olması için çıkardım.

(392, 9)

In [5]:
# Özellikler (bağımsız değişkenler) ve hedef (bağımlı değişken) belirle.
X = data[['horsepower', 'weight', 'acceleration']]
y = data['mpg']
#Modelin girdi (X) ve çıktı (y) değişkenlerini seçtim.

In [6]:
# Veriyi eğitim ve test setlerine böl.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
#Modelin performansını daha doğru ölçebilmek için veriyi eğitim ve test olarak ikiye böldüm.

In [10]:
# Kullanacağım modelleri tanımla.
models = {
    'Linear Regression': LinearRegression(),
    'Decision Tree Regression': DecisionTreeRegressor(),
    'Random Forest Regression': RandomForestRegressor()
}

# Modelleri eğit ve test seti üzerinde tahmin yap.
results = {}

for name, model in models.items():
    model.fit(X_train, y_train)
    predictions = model.predict(X_test)
    mse = mean_squared_error(y_test, predictions)
    results[name] = mse
#Her modeli ayrı ayrı eğittim ve test verisi üzerinde tahmin yaptım. Başarıyı Mean Squared Error (MSE) değeri ile ölçtüm.

In [12]:
# Modellerin sonuçlarını karşılaştır.
for name, mse in results.items():
    print(f"{name} için MSE: {mse:.2f}")
#Sonuçları karşılaştırarak hangi modelin daha iyi performans gösterdiğini gözlemledim.

Linear Regression için MSE: 17.81
Decision Tree Regression için MSE: 34.16
Random Forest Regression için MSE: 15.32


## Genel Değerlendirme
Bu çalışmada üç farklı regresyon algoritması kullanılarak modelleme yapılmıştır. Sonuçlara göre en düşük MSE değerine sahip model daha başarılı olmuştur. İlerleyen çalışmalarda model parametreleri optimize edilerek sonuçlar daha da geliştirilebilir.
