From eb8f9220cc00f468297593c7b313a8906a159df1 Mon Sep 17 00:00:00 2001 From: Lino Galiana <33896139+linogaliana@users.noreply.github.com> Date: Thu, 22 Sep 2022 17:40:43 +0200 Subject: [PATCH] Corrige bug TP pandas (#276) * tp pandas * eval false * Automated changes * Automated changes * solve pb * solve pb * Automated changes * Automated changes * typo * Automated changes * Automated changes * un mot sur l'install de pynsee * Automated changes * Automated changes Co-authored-by: github-actions[bot] --- .../02a_pandas_tutorial/index.qmd | 25 +++++++++++++------ .../manipulation/02b_pandas_TP/index.qmd | 6 ++--- 2 files changed, 20 insertions(+), 11 deletions(-) diff --git a/content/course/manipulation/02a_pandas_tutorial/index.qmd b/content/course/manipulation/02a_pandas_tutorial/index.qmd index 0d97d9d21..353480fe0 100644 --- a/content/course/manipulation/02a_pandas_tutorial/index.qmd +++ b/content/course/manipulation/02a_pandas_tutorial/index.qmd @@ -87,16 +87,25 @@ ou via des API. {{% box status="note" title="Note" icon="fa fa-comment" %}} Le package `pynsee` est relativement jeune et n'est disponible que sur [Github](https://github.com/InseeFrLab/Py-Insee-Data), pas sur `PyPi`. -Idéalement, on utilise la commande suivante, en ligne de commande, pour l'installer: +Idéalement, on utilise les commandes suivantes, +pour installer le package et quelques dépendances nécessaires : -~~~shell -pip install git+https://github.com/InseeFrLab/Py-Insee-Data.git -~~~ +```{python} +#| eval: false +!pip install pathlib2 +!pip install python-Levenshtein +!pip install xlrd +!pip install git+https://github.com/InseeFrLab/Py-Insee-Data.git +``` -Cependant, cela implique que `Jupyter` et `Git` sont capables de communiquer. Si -`Jupyter` ne sait pas où trouver `Git`, il est possible de rencontrer une erreur. +Cette approche, qui est la plus simple, +implique que `Jupyter` et `Git` sont capables de communiquer. Si +`Jupyter` ne sait pas où trouver `Git`, comme sur des ordinateurs +où `Git` a été installé en version portable sans ajout au `PATH`, +il est possible de rencontrer une erreur. -Dans ce cas, il faut télécharger le package compressé et l'installer localement : +Dans ce cas, +il faut télécharger le package compressé et l'installer localement : ```{python} #| eval: false @@ -108,7 +117,7 @@ with open("pynsee.zip" , 'wb') as zipfile: zipfile.write(r.content) ``` -L'installation se fait de la manière suivante: +L'installation se fait ensuite de la manière suivante: ```python !pip install --ignore-installed pynsee.zip diff --git a/content/course/manipulation/02b_pandas_TP/index.qmd b/content/course/manipulation/02b_pandas_TP/index.qmd index 900ac99e3..a6f78e2c7 100644 --- a/content/course/manipulation/02b_pandas_TP/index.qmd +++ b/content/course/manipulation/02b_pandas_TP/index.qmd @@ -19,7 +19,7 @@ summary: | ce chapitre vise à illustrer les fonctionalités du package à partir de données d'émissions de gaz à effet de serre de l'[`Ademe`](https://data.ademe.fr/). -echo: true +echo: false eval: false --- @@ -344,8 +344,8 @@ df_copy2 = df_copy2.reset_index() On présente généralement deux types de données: - * format __wide__: les données comportent des observations répétées, pour un même individu (ou groupe), dans des colonnes différentes - * format __long__: les données comportent des observations répétées, pour un même individu, dans des lignes différentes avec une colonne permettant de distinguer les niveaux d'observations +* format __wide__: les données comportent des observations répétées, pour un même individu (ou groupe), dans des colonnes différentes +* format __long__: les données comportent des observations répétées, pour un même individu, dans des lignes différentes avec une colonne permettant de distinguer les niveaux d'observations Un exemple de la distinction entre les deux peut être pris à l'ouvrage de référence d'Hadley Wickham, *R for Data Science*: