Skip to content

Commit 611be4d

Browse files
committed
modifs marginales
1 parent 0559398 commit 611be4d

File tree

1 file changed

+8
-4
lines changed

1 file changed

+8
-4
lines changed

content/01_data/02_pandas.Rmd

Lines changed: 8 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -370,20 +370,22 @@ Comme indiqué précédemment, il faut faire attention aux valeurs manquantes qu
370370
par défaut, sont traitées comme des 0.
371371
Il est ainsi recommandé de systématiquement
372372
ajouter l'argument skipna, par exemple,
373-
----->
374373
375374
```{python}
376375
df.mean(skipna=True)
377376
```
378377
378+
----->
379+
380+
379381
Le tableau suivant récapitule le code équivalent pour avoir des
380382
statistiques sur toutes les colonnes d'un dataframe en `R`.
381383

382384

383385
| Opération | SQL | pandas | dplyr (`R`) | data.table (`R`) |
384386
|-------------------------------|----------------|--------------|----------------|----------------------------|
385387
| Nombre de valeurs non manquantes | | `df.count()` | `df %>% summarise_each(funs(sum(!is.na(.))))` | `df[, lapply(.SD, function(x) sum(!is.na(x)))]`
386-
| Moyenne de toutes les variables | | `df.mean` | `df %>% summarise_each(funs(mean((., na.rm = TRUE))))` | `df[,lapply(.SD, function(x) mean(x, na.rm = TRUE))]`
388+
| Moyenne de toutes les variables | | `df.mean()` | `df %>% summarise_each(funs(mean((., na.rm = TRUE))))` | `df[,lapply(.SD, function(x) mean(x, na.rm = TRUE))]`
387389
| TO BE CONTINUED |
388390

389391
La méthode `describe` permet de sortir un tableau de statistiques
@@ -410,9 +412,8 @@ df.isnull().sum()
410412
Les méthodes par défaut de graphique
411413
(approfondies dans le chapitre matplotlib/seaborn) sont pratiques pour
412414
produire rapidement un graphique, notament après des opérations
413-
complexes de maniement de données
415+
complexes de maniement de données.
414416

415-
**cf. exo**
416417

417418
```{python matplotlib}
418419
fig = df['Déchets'].plot()
@@ -423,6 +424,9 @@ fig = df['Déchets'].plot(kind = 'hist', logy = True)
423424
plt.show()
424425
```
425426

427+
La sortie est un objet `matplotlib`. La *customisation* de ces figures est ainsi
428+
possible, nous en verrons quelques exemples.
429+
426430

427431
# Accéder à des éléments d'un DataFrame
428432

0 commit comments

Comments
 (0)