# Multiple Linear
### **ğŸ“¢ Real-World Applications of Assumptions**
| **Assumption**            | **Real-World Application**                        |
|--------------------------|------------------------------------------------|
| **Linearity**            | Salary prediction, price estimation           |
| **Homoscedasticity**     | Market analysis, advertising expenditures      |
| **Normality**           | Survey analysis, statistical tests             |
| **Independence**        | Stock prices, time series                      |
| **Lack of Multicollinearity** | Economic forecasting, customer behavior analysis |
| **Outliers**            | Sales forecasting, healthcare data analysis    |


## Importing the libraries
# KÃ¼tÃ¼phanelerin Ä°Ã§e AktarÄ±lmasÄ±

Bu bÃ¶lÃ¼mde, Ã§oklu doÄŸrusal regresyon analizi iÃ§in gerekli olan temel Python kÃ¼tÃ¼phanelerini iÃ§e aktarÄ±yoruz:

- **numpy**: SayÄ±sal iÅŸlemler ve Ã§ok boyutlu diziler iÃ§in kullanÄ±lÄ±r. Ã–zellikle matris iÅŸlemleri iÃ§in Ã¶nemlidir.
- **matplotlib.pyplot**: Veri gÃ¶rselleÅŸtirme iÃ§in kullanÄ±lÄ±r. Regresyon sonuÃ§larÄ±nÄ± grafiksel olarak gÃ¶stermek iÃ§in faydalÄ±dÄ±r.
- **pandas**: Veri manipÃ¼lasyonu ve analizi iÃ§in kullanÄ±lÄ±r. CSV dosyasÄ±nÄ± okumak ve veri Ã§erÃ§eveleri ile Ã§alÄ±ÅŸmak iÃ§in gereklidir.

Bu kÃ¼tÃ¼phaneler, veri bilimi ve makine Ã¶ÄŸrenimi projelerinde sÄ±kÃ§a kullanÄ±lan temel araÃ§lardÄ±r. Ã‡oklu doÄŸrusal regresyon gibi istatistiksel analizler iÃ§in veri hazÄ±rlama, iÅŸleme ve sonuÃ§larÄ± gÃ¶rselleÅŸtirme aÅŸamalarÄ±nda Ã¶nemli rol oynarlar.


In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

## Importing the dataset
# Veri Setinin Ä°Ã§e AktarÄ±lmasÄ±

Bu bÃ¶lÃ¼mde, Ã§oklu doÄŸrusal regresyon analizi iÃ§in kullanacaÄŸÄ±mÄ±z veri setini yÃ¼klÃ¼yoruz ve gerekli deÄŸiÅŸkenleri oluÅŸturuyoruz:

1. **Veri Setinin OkunmasÄ±**:
   - `pd.read_csv('50_Startups.csv')` komutu ile '50_Startups.csv' dosyasÄ±nÄ± okuyoruz.
   - Bu, 50 farklÄ± startup ÅŸirketine ait verileri iÃ§eren bir CSV dosyasÄ±dÄ±r.

2. **BaÄŸÄ±msÄ±z DeÄŸiÅŸkenlerin (X) OluÅŸturulmasÄ±**:
   - `dataset.iloc[:, :-1].values` komutu ile veri setindeki tÃ¼m sÃ¼tunlarÄ± (son sÃ¼tun hariÃ§) seÃ§iyoruz.
   - Bu, startup'larÄ±n Ã¶zelliklerini (Ã¶rneÄŸin, Ar-Ge harcamalarÄ±, YÃ¶netim harcamalarÄ±, Pazarlama harcamalarÄ±, vb.) iÃ§erir

3. **BaÄŸÄ±mlÄ± DeÄŸiÅŸkenin (y) OluÅŸturulmasÄ±**:
   - `dataset.iloc[:, -1].values` komutu ile veri setinin son sÃ¼tununu seÃ§iyoruz.
   - Bu genellikle tahmin etmek istediÄŸimiz deÄŸerdir (Ã¶rneÄŸin, startup'Ä±n kÃ¢rÄ±).

Bu adÄ±mlar, veri setimizi Ã§oklu doÄŸrusal regresyon modeli iÃ§in uygun formata getirmemizi saÄŸlar. X matrisi baÄŸÄ±msÄ±z deÄŸiÅŸkenleri, y vektÃ¶rÃ¼ ise baÄŸÄ±mlÄ± deÄŸiÅŸkeni temsil eder.

In [3]:
dataset = pd.read_csv('50_Startups.csv')  # CSV dosyasÄ±nÄ± okuyup dataset deÄŸiÅŸkenine atÄ±yoruz
X = dataset.iloc[:, :-1].values  # BaÄŸÄ±msÄ±z deÄŸiÅŸkenleri X'e atÄ±yoruz (son sÃ¼tun hariÃ§ tÃ¼m sÃ¼tunlar)
y = dataset.iloc[:, -1].values   # BaÄŸÄ±mlÄ± deÄŸiÅŸkeni y'ye atÄ±yoruz (son sÃ¼tun)

In [4]:
print(X)

[[165349.2 136897.8 471784.1 'New York']
 [162597.7 151377.59 443898.53 'California']
 [153441.51 101145.55 407934.54 'Florida']
 [144372.41 118671.85 383199.62 'New York']
 [142107.34 91391.77 366168.42 'Florida']
 [131876.9 99814.71 362861.36 'New York']
 [134615.46 147198.87 127716.82 'California']
 [130298.13 145530.06 323876.68 'Florida']
 [120542.52 148718.95 311613.29 'New York']
 [123334.88 108679.17 304981.62 'California']
 [101913.08 110594.11 229160.95 'Florida']
 [100671.96 91790.61 249744.55 'California']
 [93863.75 127320.38 249839.44 'Florida']
 [91992.39 135495.07 252664.93 'California']
 [119943.24 156547.42 256512.92 'Florida']
 [114523.61 122616.84 261776.23 'New York']
 [78013.11 121597.55 264346.06 'California']
 [94657.16 145077.58 282574.31 'New York']
 [91749.16 114175.79 294919.57 'Florida']
 [86419.7 153514.11 0.0 'New York']
 [76253.86 113867.3 298664.47 'California']
 [78389.47 153773.43 299737.29 'New York']
 [73994.56 122782.75 303319.26 'Florida']
 [67532

# One-Hot Encoding: Neden ve NasÄ±l KullanÄ±lÄ±r?

One-Hot Encoding, kategorik verileri sayÄ±sal formata dÃ¶nÃ¼ÅŸtÃ¼rmek iÃ§in kullanÄ±lan Ã¶nemli bir tekniktir. Bu yÃ¶ntemin kullanÄ±lmasÄ±nÄ±n birÃ§ok nedeni vardÄ±r:

## 1. Kategorik Verilerin SayÄ±sallaÅŸtÄ±rÄ±lmasÄ±
- Makine Ã¶ÄŸrenimi algoritmalarÄ± genellikle sayÄ±sal verilerle Ã§alÄ±ÅŸÄ±r.
- One-Hot Encoding, kategorik verileri bu algoritmalarÄ±n anlayabileceÄŸi bir formata dÃ¶nÃ¼ÅŸtÃ¼rÃ¼r.

## 2. SÄ±ralama OlmamasÄ±
- Kategoriler arasÄ±nda doÄŸal bir sÄ±ralama yoksa (Ã¶rneÄŸin, ÅŸehir isimleri) ideal bir seÃ§enektir.
- Her kategori eÅŸit Ã¶neme sahip olur.

## 3. EÅŸit AÄŸÄ±rlÄ±k
- Her kategori iÃ§in ayrÄ± bir sÃ¼tun oluÅŸturulur.
- Bu, tÃ¼m kategorilere eÅŸit aÄŸÄ±rlÄ±k verilmesini saÄŸlar.

## 4. Ã‡ok Boyutlu Uzayda Temsil
- Her kategori, Ã§ok boyutlu uzayda ayrÄ± bir boyut olarak temsil edilir.
- Bu, modelin kategoriler arasÄ±ndaki iliÅŸkileri daha iyi anlamasÄ±na yardÄ±mcÄ± olur.

## 5. Dummy Variable Trap'ten KaÃ§Ä±nma
- scikit-learn'in OneHotEncoder'Ä± otomatik olarak bir kategoriyi dÃ¼ÅŸÃ¼rÃ¼r.
- Bu, Ã§oklu doÄŸrusal baÄŸlantÄ± sorununu Ã¶nler.

## 6. Yorumlanabilirlik
- DÃ¶nÃ¼ÅŸtÃ¼rÃ¼lmÃ¼ÅŸ veriler, orijinal kategorilere kolayca geri dÃ¶nÃ¼ÅŸtÃ¼rÃ¼lebilir.
- Bu Ã¶zellik, model sonuÃ§larÄ±nÄ±n yorumlanmasÄ±nÄ± kolaylaÅŸtÄ±rÄ±r.

One-Hot Encoding, Ã¶zellikle Ã§oklu doÄŸrusal regresyon gibi doÄŸrusal modellerde kategorik deÄŸiÅŸkenlerin etkili bir ÅŸekilde kullanÄ±lmasÄ±nÄ± saÄŸlar. Bu yÃ¶ntem, veri bilimi ve makine Ã¶ÄŸrenimi projelerinde sÄ±kÃ§a kullanÄ±lan temel bir tekniktir.

In [None]:
## Encoding categorical data
# Kategorik verilerin kodlanmasÄ±

# Bu bÃ¶lÃ¼mde, 'State' sÃ¼tunundaki kategorik verileri sayÄ±sal formata dÃ¶nÃ¼ÅŸtÃ¼receÄŸiz.
# One-Hot Encoding yÃ¶ntemi kullanÄ±lacak, Ã§Ã¼nkÃ¼:
# 1. Kategoriler arasÄ±nda doÄŸal bir sÄ±ralama yok (Ã¶rn. New York > California gibi bir durum sÃ¶z konusu deÄŸil).
# 2. Bu yÃ¶ntem, her kategori iÃ§in ayrÄ± bir sÃ¼tun oluÅŸturarak modelin kategoriler arasÄ±ndaki farklarÄ± daha iyi anlamasÄ±nÄ± saÄŸlar.
# 3. Dummy Variable Trap'ten kaÃ§Ä±nmak iÃ§in, scikit-learn otomatik olarak bir kategoriyi dÃ¼ÅŸÃ¼rÃ¼r.

# Gerekli kÃ¼tÃ¼phaneleri iÃ§e aktarÄ±yoruz
from sklearn.compose import ColumnTransformer  # SÃ¼tun bazlÄ± dÃ¶nÃ¼ÅŸÃ¼mler iÃ§in
from sklearn.preprocessing import OneHotEncoder  # Kategorik verileri kodlamak iÃ§in

# ColumnTransformer oluÅŸturuyoruz
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [3])], remainder='passthrough')
# 'encoder': dÃ¶nÃ¼ÅŸÃ¼mÃ¼n adÄ±
# OneHotEncoder(): kullanÄ±lacak kodlama yÃ¶ntemi
# [3]: 'State' sÃ¼tununun indeksi (4. sÃ¼tun, 0'dan baÅŸlayarak sayÄ±ldÄ±ÄŸÄ±nda 3. indeks)
# remainder='passthrough': diÄŸer sÃ¼tunlarÄ± olduÄŸu gibi bÄ±rakÄ±r

# DÃ¶nÃ¼ÅŸÃ¼mÃ¼ uygulayÄ±p sonucu numpy dizisine Ã§eviriyoruz
X = np.array(ct.fit_transform(X))
# fit_transform: Hem Ã¶ÄŸrenme hem de dÃ¶nÃ¼ÅŸtÃ¼rme iÅŸlemini aynÄ± anda yapar
# np.array: Sonucu numpy dizisine Ã§evirir, bu sayede daha hÄ±zlÄ± iÅŸlemler yapÄ±labilir


In [7]:
print(X)  # DÃ¶nÃ¼ÅŸtÃ¼rÃ¼lmÃ¼ÅŸ X matrisini yazdÄ±rÄ±yoruz

[[0.0 0.0 1.0 165349.2 136897.8 471784.1]
 [1.0 0.0 0.0 162597.7 151377.59 443898.53]
 [0.0 1.0 0.0 153441.51 101145.55 407934.54]
 [0.0 0.0 1.0 144372.41 118671.85 383199.62]
 [0.0 1.0 0.0 142107.34 91391.77 366168.42]
 [0.0 0.0 1.0 131876.9 99814.71 362861.36]
 [1.0 0.0 0.0 134615.46 147198.87 127716.82]
 [0.0 1.0 0.0 130298.13 145530.06 323876.68]
 [0.0 0.0 1.0 120542.52 148718.95 311613.29]
 [1.0 0.0 0.0 123334.88 108679.17 304981.62]
 [0.0 1.0 0.0 101913.08 110594.11 229160.95]
 [1.0 0.0 0.0 100671.96 91790.61 249744.55]
 [0.0 1.0 0.0 93863.75 127320.38 249839.44]
 [1.0 0.0 0.0 91992.39 135495.07 252664.93]
 [0.0 1.0 0.0 119943.24 156547.42 256512.92]
 [0.0 0.0 1.0 114523.61 122616.84 261776.23]
 [1.0 0.0 0.0 78013.11 121597.55 264346.06]
 [0.0 0.0 1.0 94657.16 145077.58 282574.31]
 [0.0 1.0 0.0 91749.16 114175.79 294919.57]
 [0.0 0.0 1.0 86419.7 153514.11 0.0]
 [1.0 0.0 0.0 76253.86 113867.3 298664.47]
 [0.0 0.0 1.0 78389.47 153773.43 299737.29]
 [0.0 1.0 0.0 73994.56 122782.75 3

## Splitting the dataset into the Training set and Test set

In [11]:
# Veri Setinin EÄŸitim ve Test Setlerine BÃ¶lÃ¼nmesi

# Gerekli kÃ¼tÃ¼phaneyi iÃ§e aktarÄ±yoruz
from sklearn.model_selection import train_test_split

# Veri setini eÄŸitim ve test setlerine bÃ¶lÃ¼yoruz
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# AÃ§Ä±klamalar:
# - X_train: EÄŸitim seti iÃ§in baÄŸÄ±msÄ±z deÄŸiÅŸkenler
# - X_test: Test seti iÃ§in baÄŸÄ±msÄ±z deÄŸiÅŸkenler
# - y_train: EÄŸitim seti iÃ§in baÄŸÄ±mlÄ± deÄŸiÅŸken
# - y_test: Test seti iÃ§in baÄŸÄ±mlÄ± deÄŸiÅŸken
# - test_size=0.2: Veri setinin %20'si test seti olarak ayrÄ±lÄ±r
# - random_state=0: SonuÃ§larÄ±n tekrarlanabilir olmasÄ± iÃ§in sabit bir rastgele durum belirlenir

# Bu bÃ¶lme iÅŸlemi, modelimizin performansÄ±nÄ± doÄŸru bir ÅŸekilde deÄŸerlendirmemizi saÄŸlar:
# 1. EÄŸitim seti (X_train, y_train): Modeli eÄŸitmek iÃ§in kullanÄ±lÄ±r
# 2. Test seti (X_test, y_test): EÄŸitilmiÅŸ modelin performansÄ±nÄ± deÄŸerlendirmek iÃ§in kullanÄ±lÄ±r

# Not: Veri setinin bÃ¶lÃ¼nmesi, modelin genelleme yeteneÄŸini test etmek ve aÅŸÄ±rÄ± uyumu (overfitting) Ã¶nlemek iÃ§in Ã¶nemlidir.

## Training the Multiple Linear Regression model on the Training set

In [12]:
# Gerekli kÃ¼tÃ¼phaneyi iÃ§e aktarÄ±yoruz
from sklearn.linear_model import LinearRegression # DoÄŸrusal regresyon modeli

# Regresyon modelini oluÅŸturuyoruz
# LinearRegression() sÄ±nÄ±fÄ±, Ã§oklu doÄŸrusal regresyon iÃ§in kullanÄ±lÄ±r
# VarsayÄ±lan parametreler genellikle yeterlidir, bu yÃ¼zden ek argÃ¼man kullanmÄ±yoruz
regressor = LinearRegression()

# Modeli eÄŸitim seti Ã¼zerinde eÄŸitiyoruz
# fit() metodu, modeli verilen eÄŸitim verileri Ã¼zerinde eÄŸitir
# X_train: BaÄŸÄ±msÄ±z deÄŸiÅŸkenler (Ã¶zellikler) matrisi
# y_train: BaÄŸÄ±mlÄ± deÄŸiÅŸken (hedef) vektÃ¶rÃ¼
# Bu iÅŸlem, en kÃ¼Ã§Ã¼k kareler yÃ¶ntemi kullanarak regresyon katsayÄ±larÄ±nÄ± hesaplar
regressor.fit(X_train, y_train)

# EÄŸitim tamamlandÄ±ktan sonra, regressor nesnesi ÅŸunlarÄ± iÃ§erir:
# - coef_: Her bir Ã¶zellik iÃ§in hesaplanan regresyon katsayÄ±larÄ±
# - intercept_: Regresyon denkleminin sabit terimi (y-kesiÅŸimi)
# - score(): R-kare (RÂ²) deÄŸerini hesaplamak iÃ§in kullanÄ±labilecek bir metot

# Not: fit() metodu, modeli eÄŸitirken aynÄ± zamanda veri setindeki iliÅŸkileri de Ã¶ÄŸrenir
# Bu sayede, daha sonra predict() metodu ile yeni veriler Ã¼zerinde tahminler yapabiliriz

## Predicting the Test set results

In [13]:
# Test seti Ã¼zerinde tahminler yapÄ±yoruz
y_pred = regressor.predict(X_test)

# NumPy'Ä±n yazdÄ±rma seÃ§eneklerini ayarlÄ±yoruz
# precision=2: OndalÄ±k sayÄ±larÄ± virgÃ¼lden sonra 2 basamak gÃ¶sterir
np.set_printoptions(precision=2)

# Tahmin edilen ve gerÃ§ek deÄŸerleri yan yana yazdÄ±rÄ±yoruz
print(np.concatenate(
    (
        # y_pred.reshape(len(y_pred), 1):
        # - reshape() fonksiyonu, bir diziyi yeniden boyutlandÄ±rÄ±r.
        # - len(y_pred): y_pred dizisinin uzunluÄŸunu verir (Ã¶rnek sayÄ±sÄ±).
        # - 1: Her Ã¶rnek iÃ§in bir sÃ¼tun oluÅŸturur.
        # - SonuÃ§: (n, 1) ÅŸeklinde bir dizi oluÅŸturur, burada n Ã¶rnek sayÄ±sÄ±dÄ±r.
        # - Neden kullanÄ±yoruz? Tahminleri dikey bir vektÃ¶r haline getirmek iÃ§in.
        y_pred.reshape(len(y_pred), 1),

        # y_test.reshape(len(y_test), 1):
        # - AynÄ± iÅŸlemi gerÃ§ek test deÄŸerleri iÃ§in yapÄ±yoruz.
        # - GerÃ§ek deÄŸerleri de dikey bir vektÃ¶r haline getiriyoruz.
        y_test.reshape(len(y_test), 1)
    ),
    # axis=1:
    # - BirleÅŸtirme iÅŸlemini sÃ¼tunlar boyunca yapar (yatay birleÅŸtirme).
    # - Neden kullanÄ±yoruz? Tahmin edilen ve gerÃ§ek deÄŸerleri yan yana gÃ¶stermek iÃ§in.
    axis=1
))

# np.concatenate():
# - Ä°ki veya daha fazla diziyi birleÅŸtirir.
# - Burada, tahmin edilen deÄŸerler ve gerÃ§ek deÄŸerleri iÃ§eren iki diziyi birleÅŸtiriyoruz.

# - SonuÃ§: Her satÄ±rda bir Ã¶rnek iÃ§in tahmin edilen deÄŸer ve gerÃ§ek deÄŸer yan yana gÃ¶sterilir.

# Bu kod parÃ§asÄ±, model performansÄ±nÄ± hÄ±zlÄ±ca deÄŸerlendirmemizi saÄŸlar.
# Tahmin edilen ve gerÃ§ek deÄŸerleri yan yana gÃ¶rerek, modelin ne kadar doÄŸru tahminler yaptÄ±ÄŸÄ±nÄ± kolayca anlayabiliriz.

[[126362.88 134307.35]
 [ 84608.45  81005.76]
 [ 99677.49  99937.59]
 [ 46357.46  64926.08]
 [128750.48 125370.37]
 [ 50912.42  35673.41]
 [109741.35 105733.54]
 [100643.24 107404.34]
 [ 97599.28  97427.84]
 [113097.43 122776.86]]


# Multiple Linear Regression Analysis: Summary and Learning Notes (Ã‡oklu DoÄŸrusal Regresyon Analizi: Ã–zet ve Ã–ÄŸrenme NotlarÄ±)

Bu projede, Ã§oklu doÄŸrusal regresyon modelini kullanarak 50 startup ÅŸirketinin verilerini analiz ettik. Ä°ÅŸte Ã¶ÄŸrendiÄŸimiz Ã¶nemli noktalar ve projenin ana hatlarÄ±:

## 1. Data Preparation and Preprocessing (Veri HazÄ±rlama ve Ã–n Ä°ÅŸleme)
- CSV dosyasÄ±ndan veri okumayÄ± Ã¶ÄŸrendik (pandas kullanarak).
- BaÄŸÄ±mlÄ± ve baÄŸÄ±msÄ±z deÄŸiÅŸenleri ayÄ±rmayÄ± gÃ¶rdÃ¼k.
- Kategorik verileri One-Hot Encoding ile sayÄ±sallaÅŸtÄ±rdÄ±k.
  - One-Hot Encoding'in Ã¶nemini ve neden kullanÄ±ldÄ±ÄŸÄ±nÄ± anladÄ±k.

## 2. Splitting the Dataset (Veri Setinin BÃ¶lÃ¼nmesi)
- Veri setini eÄŸitim ve test setlerine ayÄ±rmayÄ± Ã¶ÄŸrendik.
- Bu bÃ¶lÃ¼nmenin neden Ã¶nemli olduÄŸunu anladÄ±k (overfitting'i Ã¶nlemek iÃ§in).

## 3. Model Training (Model EÄŸitimi)
- LinearRegression sÄ±nÄ±fÄ±nÄ± kullanarak Ã§oklu doÄŸrusal regresyon modelini oluÅŸturduk.
- fit() metoduyla modeli eÄŸitmeyi Ã¶ÄŸrendik.

## 4. Prediction and Evaluation (Tahmin ve DeÄŸerlendirme)
- predict() metoduyla test seti Ã¼zerinde tahminler yaptÄ±k.
- Tahmin edilen ve gerÃ§ek deÄŸerleri karÅŸÄ±laÅŸtÄ±rmayÄ± Ã¶ÄŸrendik.

## 5. Key Concepts (Ã–nemli Kavramlar)
- BaÄŸÄ±mlÄ± ve baÄŸÄ±msÄ±z deÄŸiÅŸenler
- Kategorik ve sayÄ±sal veriler
- One-Hot Encoding
- EÄŸitim ve test setleri
- Overfitting ve underfitting

## 6. Libraries Used (KullanÄ±lan KÃ¼tÃ¼phaneler)
- numpy: SayÄ±sal iÅŸlemler iÃ§in
- pandas: Veri manipÃ¼lasyonu iÃ§in
- sklearn: Makine Ã¶ÄŸrenimi modelleri ve veri Ã¶n iÅŸleme iÃ§in

## 7. Assumptions of Multiple Linear Regression (Ã‡oklu DoÄŸrusal Regresyonun VarsayÄ±mlarÄ±)
- DoÄŸrusallÄ±k (Linearity)
- Homojenlik (Homoscedasticity)
- Normallik (Normality)
- BaÄŸÄ±msÄ±zlÄ±k (Independence)
- Ã‡oklu doÄŸrusal baÄŸlantÄ± olmamasÄ± (Lack of Multicollinearity)

## 8. Practical Applications (Pratik Uygulamalar)
- Startup ÅŸirketlerinin performansÄ±nÄ± tahmin etme
- FarklÄ± faktÃ¶rlerin ÅŸirket baÅŸarÄ±sÄ±na etkisini anlama

## 9. Advanced Topics (Ä°leri Seviye Konular)
- Model performansÄ±nÄ± artÄ±rma yÃ¶ntemleri
- FarklÄ± regresyon teknikleri ile karÅŸÄ±laÅŸtÄ±rma

Bu proje, temel makine Ã¶ÄŸrenimi kavramlarÄ±nÄ± ve Ã§oklu doÄŸrusal regresyon modelinin nasÄ±l uygulanacaÄŸÄ±nÄ± pratik bir ÅŸekilde Ã¶ÄŸrenmemizi saÄŸladÄ±. Veri bilimi sÃ¼recinin temel adÄ±mlarÄ±nÄ± (veri hazÄ±rlama, model eÄŸitimi, tahmin ve deÄŸerlendirme) uygulamalÄ± olarak gÃ¶rdÃ¼k.