You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
@@ -108,6 +108,8 @@ le LASSO permet de fixer un certain nombre de coefficients à 0.
108
108
Les variables dont la norme est non nulle passent ainsi le test de sélection.
109
109
110
110
::: {.callout-tip}
111
+
## Le programme d'optimisation du LASSO
112
+
111
113
Le LASSO est un programme d'optimisation sous contrainte. On cherche à trouver l'estimateur $\beta$ qui minimise l'erreur quadratique (régression linéaire) sous une contrainte additionnelle régularisant les paramètres:
112
114
$$
113
115
\min_{\beta} \frac{1}{2}\mathbb{E}\bigg( \big( X\beta - y \big)^2 \bigg) \\
@@ -149,6 +151,8 @@ LASSO allows certain coefficients to be set to 0.
149
151
Variables with non-zero norms thus pass the selection test.
150
152
151
153
::: {.callout-tip}
154
+
## LASSO optimization program
155
+
152
156
LASSO is a constrained optimization problem. It seeks to find the estimator $\beta$ that minimizes the quadratic error (linear regression) under an additional constraint regularizing the parameters:
153
157
$$
154
158
\min_{\beta} \frac{1}{2}\mathbb{E}\bigg( \big( X\beta - y \big)^2 \bigg) \\
@@ -203,6 +207,110 @@ df2 = df2.loc[
203
207
df2 = df2.loc[:,~df2.columns.duplicated()]
204
208
```
205
209
210
+
:::: {.content-visible when-profile="fr"}
211
+
Dans le prochain exercice, nous allons utiliser la fonction suivante pour avoir une matrice de corrélation plus esthétique que celle permise par défaut avec `Pandas`.
212
+
:::
213
+
214
+
215
+
:::: {.content-visible when-profile="en"}
216
+
We will use the following function to represent correlation matrix.
217
+
:::
218
+
219
+
220
+
```{python}
221
+
#| echo: true
222
+
#| code-fold: true
223
+
import numpy as np
224
+
import pandas as pd
225
+
import plotly.express as px
226
+
227
+
228
+
def plot_corr_heatmap(
229
+
df: pd.DataFrame,
230
+
drop_cols=None,
231
+
column_labels: dict | None = None,
232
+
decimals: int = 2,
233
+
width: int = 600,
234
+
height: int = 600,
235
+
show_xlabels: bool = False
236
+
):
237
+
"""
238
+
Trace une heatmap de corrélation (triangle inférieur) à partir d'un DataFrame.
239
+
240
+
Paramètres
241
+
----------
242
+
df : pd.DataFrame
243
+
DataFrame d'entrée.
244
+
drop_cols : list ou None
245
+
Liste de colonnes à supprimer avant le calcul de la corrélation
246
+
(ex: ['winner']).
247
+
column_labels : dict ou None
248
+
Dictionnaire pour renommer les colonnes (ex: column_labels).
0 commit comments