@@ -370,20 +370,22 @@ Comme indiqué précédemment, il faut faire attention aux valeurs manquantes qu
370
370
par défaut, sont traitées comme des 0.
371
371
Il est ainsi recommandé de systématiquement
372
372
ajouter l'argument skipna, par exemple,
373
- ----->
374
373
375
374
```{python}
376
375
df.mean(skipna=True)
377
376
```
378
377
378
+ ----->
379
+
380
+
379
381
Le tableau suivant récapitule le code équivalent pour avoir des
380
382
statistiques sur toutes les colonnes d'un dataframe en ` R ` .
381
383
382
384
383
385
| Opération | SQL | pandas | dplyr (` R ` ) | data.table (` R ` ) |
384
386
| -------------------------------| ----------------| --------------| ----------------| ----------------------------|
385
387
| Nombre de valeurs non manquantes | | ` df.count() ` | ` df %>% summarise_each(funs(sum(!is.na(.)))) ` | ` df[, lapply(.SD, function(x) sum(!is.na(x)))] `
386
- | Moyenne de toutes les variables | | ` df.mean ` | ` df %>% summarise_each(funs(mean((., na.rm = TRUE)))) ` | ` df[,lapply(.SD, function(x) mean(x, na.rm = TRUE))] `
388
+ | Moyenne de toutes les variables | | ` df.mean() ` | ` df %>% summarise_each(funs(mean((., na.rm = TRUE)))) ` | ` df[,lapply(.SD, function(x) mean(x, na.rm = TRUE))] `
387
389
| TO BE CONTINUED |
388
390
389
391
La méthode ` describe ` permet de sortir un tableau de statistiques
@@ -410,9 +412,8 @@ df.isnull().sum()
410
412
Les méthodes par défaut de graphique
411
413
(approfondies dans le chapitre matplotlib/seaborn) sont pratiques pour
412
414
produire rapidement un graphique, notament après des opérations
413
- complexes de maniement de données
415
+ complexes de maniement de données.
414
416
415
- ** cf. exo**
416
417
417
418
``` {python matplotlib}
418
419
fig = df['Déchets'].plot()
@@ -423,6 +424,9 @@ fig = df['Déchets'].plot(kind = 'hist', logy = True)
423
424
plt.show()
424
425
```
425
426
427
+ La sortie est un objet ` matplotlib ` . La * customisation* de ces figures est ainsi
428
+ possible, nous en verrons quelques exemples.
429
+
426
430
427
431
# Accéder à des éléments d'un DataFrame
428
432
0 commit comments