In [1]:
# 1️⃣ Import Library & Load Dataset
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
from sklearn.feature_selection import RFE
from sklearn.model_selection import train_test_split

# Load dataset Iris
iris = load_iris()
X = iris.data
y = iris.target

# Tampilkan nama fitur
feature_names = iris.feature_names
print("Fitur asli:", feature_names)


Fitur asli: ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']


In [2]:
# 2️⃣ Buat Model & Terapkan RFE

# Model yang akan digunakan (Random Forest)
model = RandomForestClassifier(n_estimators=100, random_state=42)

# Inisialisasi RFE (misalnya kita ingin memilih 2 fitur terbaik)
rfe = RFE(estimator=model, n_features_to_select=2)

# Fit RFE ke data
rfe.fit(X, y)

# Cek fitur yang dipilih
selected_features = np.array(feature_names)[rfe.support_]
print(f"Fitur yang dipilih: {selected_features}")


Fitur yang dipilih: ['petal length (cm)' 'petal width (cm)']


In [None]:
# 3️⃣ Ranking Fitur

# Tampilkan ranking tiap fitur
ranking = dict(zip(feature_names, rfe.ranking_))
print("Ranking tiap fitur:", ranking)


Ranking tiap fitur: {'sepal length (cm)': 2, 'sepal width (cm)': 3, 'petal length (cm)': 1, 'petal width (cm)': 1}


In [4]:
# 4️⃣ Split Data & Evaluasi Model dengan Fitur Terpilih
# Ambil hanya fitur yang dipilih oleh RFE
X_selected = rfe.transform(X)

# Split data
X_train, X_test, y_train, y_test = train_test_split(X_selected, y, test_size=0.2, random_state=42)

# Latih model dengan fitur yang sudah terseleksi
model.fit(X_train, y_train)

# Evaluasi akurasi model
accuracy = model.score(X_test, y_test)
print(f"Akurasi model dengan fitur terpilih: {accuracy:.2f}")


Akurasi model dengan fitur terpilih: 1.00


# Ganti Model dan Ganti Dataset

#### 🔥 Implementasi RFE dengan Dataset Diabetes & SVM
#### Langkah-langkahnya mirip seperti sebelumnya, tapi kita bakal:
#### ✅ Pakai dataset diabetes dari sklearn.datasets.load_diabetes
#### ✅ Pakai model SVM sebagai estimator di RFE

In [6]:
# 1️⃣ Import Library & Load Dataset
import numpy as np
import pandas as pd
from sklearn.datasets import load_diabetes
from sklearn.svm import SVR
from sklearn.feature_selection import RFE
from sklearn.model_selection import train_test_split

# Load dataset Diabetes
diabetes = load_diabetes()
X = diabetes.data
y = diabetes.target
feature_names = diabetes.feature_names

# Cek jumlah fitur awal
print(f"Jumlah fitur sebelum RFE: {X.shape[1]}")
print("Fitur asli:", feature_names)


Jumlah fitur sebelum RFE: 10
Fitur asli: ['age', 'sex', 'bmi', 'bp', 's1', 's2', 's3', 's4', 's5', 's6']


In [10]:
# 2️⃣ Terapkan RFE dengan Model SVM

# Gunakan model SVM dengan kernel linear untuk seleksi fitur
svm_model = SVR(kernel="linear")

# Inisialisasi RFE untuk memilih 5 fitur terbaik
rfe = RFE(estimator=svm_model, n_features_to_select=5)

# Fit RFE ke data
rfe.fit(X, y)

# Cek fitur yang dipilih
selected_features = np.array(feature_names)[rfe.support_]
print(f"Fitur yang dipilih: {selected_features}")


Fitur yang dipilih: ['bmi' 'bp' 's3' 's4' 's5']


In [11]:
# 3️⃣ Cek Ranking Setiap Fitur
# Tampilkan ranking fitur
ranking = dict(zip(feature_names, rfe.ranking_))
print("\nRanking tiap fitur:", ranking)


Ranking tiap fitur: {'age': 4, 'sex': 6, 'bmi': 1, 'bp': 1, 's1': 3, 's2': 5, 's3': 1, 's4': 1, 's5': 1, 's6': 2}


In [12]:
# Transformasi dataset dengan fitur yang sudah terseleksi
X_selected = rfe.transform(X)

# Split data menjadi train & test
X_train, X_test, y_train, y_test = train_test_split(X_selected, y, test_size=0.2, random_state=42)

# Latih model SVM dengan fitur yang sudah terseleksi
svm_model.fit(X_train, y_train)

# Evaluasi model
score = svm_model.score(X_test, y_test)
print(f"Score model SVM dengan fitur terpilih: {score:.2f}")


Score model SVM dengan fitur terpilih: 0.02
