Modularise la partie import pour l'avoir partout

linogaliana · Dec 5, 2023 · 7d12af8 · 7d12af8
1 parent 417fb66
commit 7d12af8
Show file tree

Hide file tree

Showing 4 changed files with 4 additions and 97 deletions.
diff --git a/content/modelisation/2_SVM.qmd b/content/modelisation/2_SVM.qmd
@@ -43,35 +43,8 @@ print_badges("content/modelisation/2_SVM.qmd")
 ```
 :::
 
-```{python}
-#| eval: false
-!pip install --upgrade xlrd
-!pip install geopandas
-```
-
-Nous allons partir du même jeu de données que précédemment,
-c'est-à-dire les résultats des élections US 2020 présentés dans l'[introduction
-de cette partie](index.qmd) : les données de vote aux élections présidentielles américaines
-croisées à des variables sociodémographiques.
-Le code 
-est disponible [sur `Github`](https://github.com/linogaliana/python-datascientist/blob/master/content/modelisation/get_data.py).
-
+{{< include _import_data_ml.qmd >}}
 
-::: {.python}
-```{python}
-#| echo: true
-#| output: false
-
-import requests
-
-url = 'https://raw.githubusercontent.com/linogaliana/python-datascientist/master/content/modelisation/get_data.py'
-r = requests.get(url, allow_redirects=True)
-open('getdata.py', 'wb').write(r.content)
-
-import getdata
-votes = getdata.create_votes_dataframes()
-```
-:::
 
 
 Pour ce TP, nous aurons besoin des packages suivants :

diff --git a/content/modelisation/3_regression.qmd b/content/modelisation/3_regression.qmd
@@ -55,30 +55,7 @@ Nous ignorerons le fait que ses bornes se trouvent entre 0 et 100 et donc
 qu'il faudrait, pour être rigoureux, transformer l'échelle afin d'avoir 
 des données dans cet intervalle. 
 
-Ce chapitre utilise toujours le même jeu de données, présenté dans l'[introduction
-de cette partie](index.qmd) : les données de vote aux élections présidentielles américaines
-croisées à des variables sociodémographiques.
-Le code 
-est disponible [sur Github](https://github.com/linogaliana/python-datascientist/blob/master/content/modelisation/get_data.py).
-
-::: {.python}
-```{python}
-#| include: false
-#| echo: true
-
-#!pip install --upgrade xlrd #colab bug verson xlrd
-#!pip install geopandas
-
-import requests
-
-url = 'https://raw.githubusercontent.com/linogaliana/python-datascientist/master/content/modelisation/get_data.py'
-r = requests.get(url, allow_redirects=True)
-open('getdata.py', 'wb').write(r.content)
-
-import getdata
-votes = getdata.create_votes_dataframes()
-```
-:::
+{{< include _import_data_ml.qmd >}}
 
 Ce chapitre va utiliser plusieurs _packages_ 
 de modélisation, les principaux étant `Scikit` et `Statsmodels`. 

diff --git a/content/modelisation/4_featureselection.qmd b/content/modelisation/4_featureselection.qmd
@@ -52,30 +52,8 @@ print_badges("content/modelisation/4_featureselection.qmd")
 
 
 
-Pour illustrer le travail de données nécessaire pour faire de la sélection de variables,
-nous allons partir du même jeu de données que précédemment,
-c'est-à-dire les résultats des élections US 2020 présentés dans l'[introduction
-de cette partie](index.qmd) : les données de vote aux élections présidentielles américaines
-croisées à des variables sociodémographiques.
-Le code 
-est disponible [sur Github](https://github.com/linogaliana/python-datascientist/blob/master/content/modelisation/get_data.py).
 
-
-::: {.python}
-```{python}
-#| echo: true
-#| output: false
-
-import requests
-
-url = 'https://raw.githubusercontent.com/linogaliana/python-datascientist/master/content/modelisation/get_data.py'
-r = requests.get(url, allow_redirects=True)
-open('getdata.py', 'wb').write(r.content)
-
-import getdata
-votes = getdata.create_votes_dataframes()
-```
-:::
+{{< include _import_data_ml.qmd >}}
 
 
 Jusqu'à présent, nous avons supposé que les variables utiles à la prévision du

diff --git a/content/modelisation/5_clustering.qmd b/content/modelisation/5_clustering.qmd
@@ -48,30 +48,9 @@ print_badges("content/modelisation/5_clustering.qmd")
 
 
 
-Nous allons continuer avec le même jeu de données que précédemment,
-c'est-à-dire les résultats des élections US 2020 présentés dans l'[introduction
-de cette partie](index.qmd) : les données de vote aux élections présidentielles américaines
-croisées à des variables sociodémographiques.
-Le code 
-est disponible [sur Github](https://github.com/linogaliana/python-datascientist/blob/master/content/modelisation/get_data.py).
+{{< include _import_data_ml.qmd >}}
 
 
-::: {.python}
-```{python}
-#| echo: true
-#| output: false
-
-import requests
-
-url = 'https://raw.githubusercontent.com/linogaliana/python-datascientist/master/content/modelisation/get_data.py'
-r = requests.get(url, allow_redirects=True)
-open('getdata.py', 'wb').write(r.content)
-
-import getdata
-votes = getdata.create_votes_dataframes()
-```
-:::
-
 
 ## Introduction sur le *clustering*