# 007 - Feature Engineering : Surfaces au Carré (Polynomial)

## Hypothèse
La relation entre la surface (`Area`) et le prix (`SalePrice`) n'est pas forcément parfaitement linéaire, même après transformation logarithmique.
- **Diminishing returns** : Ajouter 10m² à un manoir de 500m² vaut moins cher qu'ajouter 10m² à un studio de 20m².
- **Effets quadratiques** : Les très grandes maisons peuvent avoir une dynamique de prix différente (luxe).

## Méthode
Nous allons ajouter les **carrés** de nos features de surface principales :
- `GrLivArea` -> `GrLivArea_sq`
- `TotalBsmtSF` -> `TotalBsmtSF_sq`
- `GarageArea` -> `GarageArea_sq`
- `TotalSF` -> `TotalSF_sq`
- ... et d'autres.

Nous testons cela avec notre meilleur modèle simple : **XGBoost (Tuned)** (RUN 003).

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import sys
import os

# Ajout du path pour src
sys.path.append("../src")
from features import add_features, add_poly_features

In [None]:
# Visualisation de l'effet potentiel
df_train = pd.read_csv("../Data/train.csv")
df_proc = add_features(df_train)
df_proc = add_poly_features(df_proc)

plt.figure(figsize=(10, 6))
sns.scatterplot(x=df_proc["TotalSF"], y=df_proc["SalePrice"])
plt.title("TotalSF vs SalePrice")
plt.show()

print("Nouvelles colonnes générées :")
print([c for c in df_proc.columns if "_sq" in c])

## Exécution du Run
Nous lançons le script `src/run_007_xgb_poly_area.py` pour valider en CV (5 folds).

In [None]:
!python ../src/run_007_xgb_poly_area.py