In [2]:
from sklearn.datasets import load_diabetes
from sklearn.linear_model import LinearRegression,Ridge,Lasso,ElasticNet
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score

In [4]:
X,y = load_diabetes(return_X_y = True)

In [6]:
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,random_state=2)

In [10]:
# Linear Regression
reg = LinearRegression()
reg.fit(X_train,y_train)
y_pred = reg.predict(X_test)
r2_score(y_test,y_pred)

0.439933866156897

In [12]:
# Ridge Regression

reg = Ridge(alpha = 0.1)
reg.fit(X_train,y_train)
y_pred = reg.predict(X_test)
r2_score(y_test,y_pred)

0.45199494197195456

In [14]:
# Lasso
reg = Lasso(alpha=0.01)
reg.fit(X_train,y_train)
y_pred = reg.predict(X_test)
r2_score(y_test,y_pred)

0.44111855963110613

In [30]:
# ElasticNet Regression

reg = ElasticNet(alpha = 0.005, l1_ratio = 0.9)
reg.fit(X_train,y_train)
y_pred = reg.predict(X_test)
r2_score(y_test,y_pred)

0.4531474541554823

ElasticNet-এ `l1_ratio` বেছে নেওয়া আসলে একটা balance decide করা—`L1 (Lasso)` আর `L2 (Ridge)` regularization-এর মধ্যে। এখন দেখি কিভাবে তুমি বুঝবে `l1_ratio` কতো use করা উচিত।

---

### 🔍 `l1_ratio` মানে কী?

```python
ElasticNet(alpha = 0.005, l1_ratio = 0.9)
```

এখানে:

* `alpha = 0.005`: regularization এর strength। যত বড়, তত বেশি penalization।
* `l1_ratio = 0.9`: এর মানে 90% L1 penalty (Lasso) + 10% L2 penalty (Ridge)।
  L1 বেশি মানে model বেশি sparsity (অনেক coefficient শূন্য করে ফেলবে) চায়।

---

### 🧠 তাহলে কবে কেমন `l1_ratio` use করা উচিত?

#### ✅ যদি feature গুলোর মধ্যে অনেক গুলা zero হয়ে যাওয়া দরকার হয় (feature selection দরকার):

* `l1_ratio` → **0.7 - 1.0** (L1 বেশি → sparse solution)
* উদাহরণ: High-dimensional dataset (e.g., genomics, NLP)

#### ✅ যদি সবগুলো feature কে একটু একটু করে retain করতে চাও:

* `l1_ratio` → **0.1 - 0.4** (L2 বেশি → small but nonzero coefficients)
* উদাহরণ: Multicollinearity আছে, but feature discard করা risk আছে

#### ✅ যদি দুইটার balanced combination দরকার হয়:

* `l1_ratio` → **0.5**

---

### 📊 কিভাবে best `l1_ratio` খুঁজবে?

👉 **Use Grid Search / Cross-Validation!**

```python
from sklearn.linear_model import ElasticNet
from sklearn.model_selection import GridSearchCV

param_grid = {
    'alpha': [0.001, 0.01, 0.1, 1],
    'l1_ratio': [0.1, 0.5, 0.7, 0.9, 1.0]
}

model = ElasticNet()
grid = GridSearchCV(model, param_grid, cv=5)
grid.fit(X_train, y_train)

print("Best parameters:", grid.best_params_)
```

---

### 🎯 Bottom line:

* `l1_ratio = 0.9` মানে তুমি Lasso-dominant regularization দিচ্ছো।
* এটা ভালো কাজ করবে যদি তুমি মনে করো অনেক unimportant feature আছে।
* Best value automatically বের করতে চাইলে `GridSearchCV` ব্যবহার করো।

---

In [26]:
from sklearn.linear_model import ElasticNet
from sklearn.model_selection import GridSearchCV

param_grid = {
    'alpha': [0.001, 0.01, 0.1, 1],
    'l1_ratio': [0.1, 0.5, 0.7, 0.9, 1.0]
}

model = ElasticNet()
grid = GridSearchCV(model, param_grid, cv=5)
grid.fit(X_train, y_train)

print("Best parameters:", grid.best_params_)


Best parameters: {'alpha': 0.1, 'l1_ratio': 1.0}
