In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

Bu bölümde analiz için gerekli Python kütüphanelerini içe aktarıyoruz. Ardından Tesla üretim ve teslimat verilerini CSV dosyasından okuyarak bir DataFrame'e yüklüyoruz. Bu veri seti tüm analiz adımlarının temelini oluşturuyor.


In [None]:
# veri okuma
df = pd.read_csv("tesla_deliveries_dataset_2015_2025.csv")

In [None]:
print(df.head())
print(df.info())
print(df.describe())
print(df.isnull().sum())


## İlk Veri İncelemesi (EDA)

Bu adımda veri setine hızlı bir göz atarak satır–sütun yapısını, veri tiplerini ve sayısal sütunların istatistiksel özetini inceliyoruz. 
Ayrıca eksik veri kontrolü yaparak model kurmadan önce veri kalitesinin uygun olup olmadığını doğruluyoruz.

In [None]:
# bagımsız ve bagımlı degisken secimi
X = df[["Production_Units"]]
y = df["Estimated_Deliveries"]

Burada bağımsız değişken olarak üretim miktarını (X) ve bağımlı değişken olarak teslimat tahminlerini (y) seçiyoruz. Lineer regresyon modeli X değişkenine bakarak y’yi tahmin etmeye çalışacaktır.


In [None]:
plt.scatter(X, y, s=5)
plt.title("Production vs Deliveries")
plt.xlabel("Production Units")
plt.ylabel("Estimated Deliveries")
plt.show()

Bu scatter plot iki değişken arasındaki ilişkinin görsel bir özetini sunar. Noktaların neredeyse doğrusal bir çizgi oluşturması, üretim ile teslimat arasında güçlü bir doğrusal korelasyon olduğunu gösterir.


In [None]:
# eğitim-test ayrimi
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

Modelin gerçek performansını değerlendirebilmek için veri setini eğitim (%80) ve test (%20) olarak ikiye ayırıyoruz. Eğitim verisi modelin öğrenmesini, test verisi ise modelin genelleme başarısını ölçmek için kullanılır.


In [None]:
# model olusturma
model = LinearRegression()
model.fit(X_train, y_train)

Bu adımda lineer regresyon modelini oluşturup eğitim verisi üzerinde eğitiyoruz. Model, üretim değerleri ile teslimat değerleri arasındaki en uygun doğrusal ilişkiyi öğrenir.


In [None]:
# model sonuclari
print("Model eğimi:", model.coef_[0])
print("Model sabiti:", model.intercept_)
print("R^2 skoru:", model.score(X_test, y_test))

Modelin eğimi üretimdeki her bir birimlik artışın teslimata etkisini temsil eder. Sabit terim ise üretim 0 iken modelin öngördüğü teslimat değeridir. R² skoru modelin veri varyansını ne kadar iyi açıkladığını gösterir.


In [None]:
# test hatasi
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
rmse = mse ** 0.5
print("RMSE:", rmse)

Bu bölümde modelin tahmin performansını RMSE metriği ile değerlendiriyoruz. RMSE değeri, tahmin edilen değerlerin gerçek değerlere ne kadar yakın olduğunu ölçer; düşük bir RMSE modelin iyi performans gösterdiğini gösterir.
