Skip to content

Commit

Permalink
Modularise la partie import pour l'avoir partout
Browse files Browse the repository at this point in the history
  • Loading branch information
linogaliana committed Dec 5, 2023
1 parent 417fb66 commit 7d12af8
Show file tree
Hide file tree
Showing 4 changed files with 4 additions and 97 deletions.
29 changes: 1 addition & 28 deletions content/modelisation/2_SVM.qmd
Expand Up @@ -43,35 +43,8 @@ print_badges("content/modelisation/2_SVM.qmd")
```
:::

```{python}
#| eval: false
!pip install --upgrade xlrd
!pip install geopandas
```

Nous allons partir du même jeu de données que précédemment,
c'est-à-dire les résultats des élections US 2020 présentés dans l'[introduction
de cette partie](index.qmd) : les données de vote aux élections présidentielles américaines
croisées à des variables sociodémographiques.
Le code
est disponible [sur `Github`](https://github.com/linogaliana/python-datascientist/blob/master/content/modelisation/get_data.py).

{{< include _import_data_ml.qmd >}}

::: {.python}
```{python}
#| echo: true
#| output: false
import requests
url = 'https://raw.githubusercontent.com/linogaliana/python-datascientist/master/content/modelisation/get_data.py'
r = requests.get(url, allow_redirects=True)
open('getdata.py', 'wb').write(r.content)
import getdata
votes = getdata.create_votes_dataframes()
```
:::


Pour ce TP, nous aurons besoin des packages suivants :
Expand Down
25 changes: 1 addition & 24 deletions content/modelisation/3_regression.qmd
Expand Up @@ -55,30 +55,7 @@ Nous ignorerons le fait que ses bornes se trouvent entre 0 et 100 et donc
qu'il faudrait, pour être rigoureux, transformer l'échelle afin d'avoir
des données dans cet intervalle.

Ce chapitre utilise toujours le même jeu de données, présenté dans l'[introduction
de cette partie](index.qmd) : les données de vote aux élections présidentielles américaines
croisées à des variables sociodémographiques.
Le code
est disponible [sur Github](https://github.com/linogaliana/python-datascientist/blob/master/content/modelisation/get_data.py).

::: {.python}
```{python}
#| include: false
#| echo: true
#!pip install --upgrade xlrd #colab bug verson xlrd
#!pip install geopandas
import requests
url = 'https://raw.githubusercontent.com/linogaliana/python-datascientist/master/content/modelisation/get_data.py'
r = requests.get(url, allow_redirects=True)
open('getdata.py', 'wb').write(r.content)
import getdata
votes = getdata.create_votes_dataframes()
```
:::
{{< include _import_data_ml.qmd >}}

Ce chapitre va utiliser plusieurs _packages_
de modélisation, les principaux étant `Scikit` et `Statsmodels`.
Expand Down
24 changes: 1 addition & 23 deletions content/modelisation/4_featureselection.qmd
Expand Up @@ -52,30 +52,8 @@ print_badges("content/modelisation/4_featureselection.qmd")



Pour illustrer le travail de données nécessaire pour faire de la sélection de variables,
nous allons partir du même jeu de données que précédemment,
c'est-à-dire les résultats des élections US 2020 présentés dans l'[introduction
de cette partie](index.qmd) : les données de vote aux élections présidentielles américaines
croisées à des variables sociodémographiques.
Le code
est disponible [sur Github](https://github.com/linogaliana/python-datascientist/blob/master/content/modelisation/get_data.py).


::: {.python}
```{python}
#| echo: true
#| output: false
import requests
url = 'https://raw.githubusercontent.com/linogaliana/python-datascientist/master/content/modelisation/get_data.py'
r = requests.get(url, allow_redirects=True)
open('getdata.py', 'wb').write(r.content)
import getdata
votes = getdata.create_votes_dataframes()
```
:::
{{< include _import_data_ml.qmd >}}


Jusqu'à présent, nous avons supposé que les variables utiles à la prévision du
Expand Down
23 changes: 1 addition & 22 deletions content/modelisation/5_clustering.qmd
Expand Up @@ -48,30 +48,9 @@ print_badges("content/modelisation/5_clustering.qmd")



Nous allons continuer avec le même jeu de données que précédemment,
c'est-à-dire les résultats des élections US 2020 présentés dans l'[introduction
de cette partie](index.qmd) : les données de vote aux élections présidentielles américaines
croisées à des variables sociodémographiques.
Le code
est disponible [sur Github](https://github.com/linogaliana/python-datascientist/blob/master/content/modelisation/get_data.py).
{{< include _import_data_ml.qmd >}}


::: {.python}
```{python}
#| echo: true
#| output: false
import requests
url = 'https://raw.githubusercontent.com/linogaliana/python-datascientist/master/content/modelisation/get_data.py'
r = requests.get(url, allow_redirects=True)
open('getdata.py', 'wb').write(r.content)
import getdata
votes = getdata.create_votes_dataframes()
```
:::


## Introduction sur le *clustering*

Expand Down

0 comments on commit 7d12af8

Please sign in to comment.