### En Küçük Kareler Yöntemi (Least Square Method) ile Lineer Regresyon Katsayılarının Hesaplanması

**Tek Değişkenli (Simple) Lineer Regresyon Katsayılarının Hesaplanması**

Tek değişkenli (simple) lineer regresyon, veri setindeki $n$ adet gözlem için, $x$(bağımsız değişken) ve $y$(bağımlı değişken) değerleri arasındaki doğrusal ilişkiyi ifade eden modeldir:

$$
y_i = mx_i + c + \varepsilon_i
$$

Burada:
- $x_i$ ve $y_i$, sırasıyla bağımsız ve bağımlı değişkenin $i$.nci gözlem değerleridir.

- $m$, eğimi temsil eder (regresyon katsayısı).

- $c$, kesme terimini (y-intercept) temsil eder.

- $\varepsilon_i$, hata terimidir.

En küçük kareler yöntemi, bu hataları minimize ederek, veri setindeki gözlemler ile model arasındaki farkları en aza indirmeyi amaçlar. Bu yöntemle $m$ ve $c$ katsayıları şu şekilde hesaplanır:

$$
m = \frac{{n \sum{(x_iy_i)} - \sum{x_i} \cdot \sum{y_i}}}{{n \sum{(x_i^2)} - (\sum{x_i})^2}}
$$

$$
c = \frac{{\sum{y_i} - m \cdot \sum{x_i}}}{{n}}
$$

**Çok Değişkenli (Multiple) Lineer Regresyon Katsayılarının Hesaplanması**

Çok değişkenli (multiple) lineer regresyon, veri setindeki $n$ adet gözlem için, $X_1, X_2, \cdots, X_p$ (bağımsız değişkenler) ve $Y$ (bağımlı değişken) değerleri arasındaki doğrusal ilişkiyi ifade eden modeldir:

$$
Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + \dots + \beta_pX_p + \varepsilon
$$

Burada:
- $Y$, bağımlı değişkeni temsil eder.

- $X_1, X_2, \cdots, X_p$,  $p$ adet bağımsız değişkenleri ifade eder.

- $\beta_0$, kesme (intercept) terimini temsil eder.

- $\beta_1, \beta_2, \dots, \beta_p$, her bir bağımsız değişkenin regresyon katsayılarını temsil eder.

- $\varepsilon$, hata terimidir.

Regresyon katsayıları \( \beta_0, \beta_1, \dots, \beta_p \) değerleri, en küçük kareler yöntemi kullanılarak şu şekilde hesaplanır:

$$
\mathbf{\beta} = (X^T X)^{-1} X^T Y
$$

Burada:
- $\mathbf{\beta}$, regresyon katsayılarını içeren vektördür.
- $X$, bağımsız değişkenlerin değerlerini içeren matristir 
- $Y$, bağımlı değişkenin değerlerini içeren vektördür.

In [1]:
import numpy as np

In [2]:
np.random.seed(42)

# Veri Seti Oluşturma
data = {'X1': np.random.rand(100),
       'X2': np.random.rand(100),
       'X3': np.random.rand(100),
       'Y': np.random.rand(100)}

In [3]:
# X = Bağımsız Değişkenler Matrisi
X = np.column_stack((data['X1'], data['X2'], data['X3']))

# Y = Bağımlı Değişken Vektörü
Y = data['Y']

$\mathbf{\beta} = (X^T X)^{-1} X^T Y$, $\quad = \beta = [\beta_0, \beta_1, \beta_2, \beta_3]$

In [4]:
# ÖNEMLİ: beta_0 (Sabit Terim) hesaplamak için X maatrisine bir sütun eklemek gerekmektedir.
X = np.column_stack((np.ones(len(X)), X))

In [5]:
# beta = (X^T . X)^(-1) . X^T . Y

beta = np.linalg.inv(X.T @ X) @ X.T @ Y

In [None]:
print("Çok Değişkenli (Multiple) Lineer Regresyon Katsayıları")
print("beta_0 (sabit terim)=", beta[0]),
print("beta_1 =", beta[1]),
print("beta_2 =", beta[2]),
print("beta_3 =", beta[3])

**Çok Değişkenli (Multiple) Lineer Regresyon Katsayılarını En Küçük Kareler Yöntemi ile Bulan Bir Fonskiyon Oluşturma**

In [6]:
def en_kucuk_kareler_yontemi(X, Y):
    X = np.column_stack((np.ones(len(X)), X))
    beta = np.linalg.inv(X.T @ X) @ X.T @ Y
    return beta

In [7]:
np.random.seed(42)

# Veri Seti Oluşturma
data = {'X1': np.random.rand(100),
       'X2': np.random.rand(100),
       'X3': np.random.rand(100),
       'Y': np.random.rand(100)}

# X = Bağımsız Değişkenler Matrisi
X = np.column_stack((data['X1'], data['X2'], data['X3']))

# Y = Bağımlı Değişken Vektörü
Y = data['Y']

In [8]:
beta = en_kucuk_kareler_yontemi(X, Y)

In [None]:
print("Çok Değişkenli (Multiple) Lineer Regresyon Katsayıları")
print("beta_0 (sabit terim)=", beta[0]),
print("beta_1 =", beta[1]),
print("beta_2 =", beta[2]),
print("beta_3 =", beta[3])

**Scikit-learn Kütüphanesi ile Lineer Regresyon Katsayılarını Hesaplama**

In [9]:
import pandas as pd
from sklearn.linear_model import LinearRegression

In [10]:
np.random.seed(42)

# Veri Seti Oluşturma
data = {'X1': np.random.rand(100),
       'X2': np.random.rand(100),
       'X3': np.random.rand(100),
       'Y': np.random.rand(100)}

# Panda DataFrame Tipine Dönüştürme
df = pd.DataFrame(data)

# X = Bağımsız Değişkenler Matrisi
X = df[['X1', 'X2', 'X3']]

# Y = Bağımlı Değişken Vektörü
Y = df['Y']

In [11]:
# Lineer Regresyon Modeli Oluşturma
model = LinearRegression()

In [12]:
# Modeli fit Etme
model.fit(X, Y)

In [None]:
# beta_0 = intecept 
print('beta_0 =', model.intercept_)

# beta_1,2,3 = coefficients
print('beta_1 =', model.coef_[0])
print('beta_2 =', model.coef_[1])
print('beta_3 =', model.coef_[2])