![rmotr](https://user-images.githubusercontent.com/7065401/52071918-bda15380-2562-11e9-828c-7f95297e4a82.png)
<hr style="margin-bottom: 40px;">

<img src="https://user-images.githubusercontent.com/7065401/75165824-badf4680-5701-11ea-9c5b-5475b0a33abf.png"
    style="width:300px; float: right; margin: 0 40px 40px 40px;"></img>

# Pandas - Series


![purple-divider](https://user-images.githubusercontent.com/7065401/52071927-c1cd7100-2562-11e9-908a-dde91ba14e59.png)

## Let's go!

In [None]:
import pandas as pd
import numpy as np

Nous commencerons à analyser « Le Groupe des Sept \(G7\) ». C'est une formation politique composée du Canada, de la France, de l'Allemagne, de l'Italie, du Japon, du Royaume-Uni et des États-Unis. Nous débuterons par l'analyse de la population, et pour cela, nous utiliserons un objet pandas.Series.

In [None]:
# En millions
g7_pop = pd.Series([38.5, 67.1, 84.3, 58.9, 124.5, 68.5, 337.0])

In [None]:
g7_pop

Quelqu'un pourrait ne pas savoir que nous représentons la population en millions d'habitants. Les séries peuvent avoir un `name`, pour mieux documenter l'objectif de la série

In [None]:
g7_pop.name = 'G7 Population en millions'

In [None]:
g7_pop

Les `Series` sont similaires à des arrays sur Numpy:

In [None]:
g7_pop.dtype

In [None]:
g7_pop.values

Et elles ressemblent à de simples listes Python ou tableaux NumPy. Mais elles sont en réalité plus similaires aux `dictionnaires` Python.

Une Serie possède un index, qui est similaire à l'index automatique attribué aux `listes` Python

In [None]:
g7_pop

In [None]:
g7_pop[0]

In [None]:
g7_pop[1]

In [None]:
g7_pop.index

In [None]:
l = ['a', 'b', 'c']

In [None]:
l

Mais, contrairement aux listes, nous pouvons définir explicitement l'index :

In [None]:
g7_pop.index = [
    'Canada',
    'France',
    'Allemagne',
    'Italie',
    'Japon',
    'Royaume Uni',
    'Etats Unis',
]

In [None]:
g7_pop

In [None]:
pd.Series({
    'Canada': 38.5,
    'France': 67.1,
    'Allemagne': 84.3,
    'Italie': 58.9,
    'Japon': 124.5,
    'Royaume Uni': 68.5,
    'Etats Unis': 337.0
}, name='G7: Population en millions')

In [None]:
g7_pop = pd.Series(
    [41.548, 66.650, 84.075, 59.146, 123.103, 69.551, 347.276],
    index=['Canada', 'France', 'Allemagne', 'Italie', 'Japon', 'Royaume-Uni', 'États-Unis'],
    name='Population du G7 en millions'
)


In [None]:
g7_pop

Vous pouvez également créer des séries à partir d'autres séries, en spécifiant les index :

In [None]:
pd.Series(g7_pop, index=['Canada', 'France', 'Allemagne', 'Italie', 'Japon', 'Royaume-Uni', 'États-Unis'])

![green-divider](https://user-images.githubusercontent.com/7065401/52071924-c003ad80-2562-11e9-8297-1c6595f8a7ff.png)

##Indexation

L'indexation fonctionne de manière similaire aux listes et aux dictionnaires, vous utilisez l'index de l'élément que vous recherchez :

In [None]:
g7_pop

In [None]:
g7_pop['Canada']

In [None]:
g7_pop['Japon'] 

Les positions numériques peuvent également être utilisées, avec l'attribut `iloc`

In [None]:
g7_pop.iloc[0]

In [None]:
g7_pop.iloc[-1]

Selection multiple:

In [None]:
g7_pop[['Italie', 'France']]

In [None]:
g7_pop.iloc[[0, 1]]   # Le résultat est une autre Serie

Le `licing` fonctionne également, mais important, en Pandas, la limite supérieure est également incluse :

In [None]:
g7_pop['Canada': 'Italie']

![green-divider](https://user-images.githubusercontent.com/7065401/52071924-c003ad80-2562-11e9-8297-1c6595f8a7ff.png)

##Sélection conditionnelle (tableaux booléens)

Les mêmes techniques de tableaux booléens que nous avons vues appliquées aux tableaux NumPy peuvent être utilisées pour les Series de Pandas :

In [None]:
g7_pop

In [None]:
g7_pop > 70

In [None]:
g7_pop[g7_pop > 70]

In [None]:
g7_pop.mean()

In [None]:
g7_pop[g7_pop > g7_pop.mean()]

In [None]:
g7_pop.std()

## Opérateurs logiques

In [None]:
~ not
| or
& and

In [None]:
g7_pop[(g7_pop > g7_pop.mean() - g7_pop.std() / 2) | (g7_pop > g7_pop.mean() + g7_pop.std() / 2)]

![green-divider](https://user-images.githubusercontent.com/7065401/52071924-c003ad80-2562-11e9-8297-1c6595f8a7ff.png)

## Opérations et méthodes

Les séries prennent également en charge les opérations vectorisées et les fonctions d'agrégation comme NumPy :

In [None]:
g7_pop

In [None]:
g7_pop * 1_000_000

In [None]:
g7_pop.mean()

In [None]:
np.log(g7_pop)

In [None]:
g7_pop['France': 'Italie'].mean()

![green-divider](https://user-images.githubusercontent.com/7065401/52071924-c003ad80-2562-11e9-8297-1c6595f8a7ff.png)

## Tableaux booléens
(Fonctionnent de la même manière que NumPy)

In [None]:
g7_pop

In [None]:
g7_pop > 80

In [None]:
g7_pop[g7_pop > 80]

In [None]:
g7_pop[(g7_pop > 80) | (g7_pop < 40)]

In [None]:
g7_pop[(g7_pop > 80) & (g7_pop < 200)]

![green-divider](https://user-images.githubusercontent.com/7065401/52071924-c003ad80-2562-11e9-8297-1c6595f8a7ff.png)

## Modifier les series


In [None]:
g7_pop['Canada'] = 40.5

In [None]:
g7_pop

In [None]:
g7_pop.iloc[-1] = 500

In [None]:
g7_pop

In [None]:
g7_pop[g7_pop < 70]

In [None]:
g7_pop[g7_pop < 70] = 99.99

In [None]:
g7_pop

![purple-divider](https://user-images.githubusercontent.com/7065401/52071927-c1cd7100-2562-11e9-908a-dde91ba14e59.png)


In [None]:
a = np.array(2)

In [None]:
np.array([1,2,3,4,5]).sum()

In [None]:
np.linspace(2,5,1).sum()