# Création de Series
La méthode de base pour créer une Series est: `>>> s = pd.Series(data, index=index)`

Ici, __data__ peut représenter:

- un dictionnaire Python

- un ndarray

- une valeur scalaire

L'indice défini en __index__ est une liste d'étiquettes d'axes. Ainsi, ceci se sépare en plusieurs cas selon la nature des données insérées :
## À partir d'un ndarray

Si __data__ est un ndarray, l'index doit être de la même longueur que data. Si aucun index n'est défini, un index sera créé avec les valeurs `[0, ..., len(data) - 1]`.

In [2]:
import pandas as pd
import numpy as np
s = pd.Series(np.random.randn(5), index=["a", "b", "c", "d", "e"])
print (s)
print ('\n', s.index)
pd.Series(np.random.randn(5))

a    0.088580
b    0.228316
c   -0.853468
d   -0.421447
e   -0.193266
dtype: float64

 Index(['a', 'b', 'c', 'd', 'e'], dtype='object')


0   -0.447902
1   -1.383383
2    0.427796
3   -1.206152
4    0.280409
dtype: float64

##  À partir d'un dictionnaire

Les séries peuvent être instanciées à partir de **dictionnaires :**

In [6]:
import pandas as pd
d = {"b": 3, "a": 15, "c": 2}

pd.Series((d), index =['a','b','c','d'])

a    15.0
b     3.0
c     2.0
d     NaN
dtype: float64

Si un index est défini, les valeurs des données correspondant aux étiquettes de l'index seront extraites.

In [10]:
d = {"a": 0.0, "b": 1.0, "c": 2.0}
pd.Series(d)

a    0.0
b    1.0
c    2.0
dtype: float64

**Remarque**

NaN (not a number) est le marqueur de données manquantes standard utilisé dans pandas.
##  A partir d'une valeur scalaire

Si la `data` est une valeur scalaire, un index **doit** être fourni. La valeur sera répétée pour correspondre à la longueur de l'index.

In [11]:
s1=pd.Series(5.0)
s2 = pd.Series(3 , index =['a','b','c','d'])
print (s1)
print(s2)

0    5.0
dtype: float64
a    3
b    3
c    3
d    3
dtype: int64


# Les attributs des Series
- ``index`` 
- ``name``
- ``shape`` 
- ``size``
- ``values``
 ## Attribut index
L'index (étiquettes d'axe) de la série

In [9]:
import pandas as pd
import numpy as np
print ("index par défaut:\n",pd.Series(d))

print ("\n Définition d'index personalisé:\n",pd.Series(d, index=["b", "c", "d", "a"]))

index par défaut:
 b     3
a    15
c     2
dtype: int64

 Définition d'index personalisé:
 b     3.0
c     2.0
d     NaN
a    15.0
dtype: float64


## Attribut de nom
Les séries ont également un attribut de nom`name`. Le nom de Series peut être attribué automatiquement dans de nombreux cas, notamment lors de la sélection d'une seule colonne dans un DataFrame, le nom sera attribué à l'étiquette de la colonne.

Pour renommer une série avec la méthode `Series.rename()`.

In [21]:
import pandas as pd
import numpy as np
s = pd.Series(np.random.randn(5), name="something")
print (s)
print ("Nom de la série", s.name)
# On renome notre série 
s2 = s.rename("different")
print ("Nouveau nom de la série ", s2.name)
print ("Forme de la série ", s2.shape)

0    1.559322
1    0.372971
2    1.413400
3    1.033905
4   -0.498670
Name: something, dtype: float64
Nom de la série something
Nouveau nom de la série  different
Forme de la série  (5,)


Notez que s et s2 font référence à des objets différents.
## L'attribut values
Retourne les séries sous forme de ndarray ou de ndarray-like en fonction du dtype.

In [26]:
import pandas as pd
pd.Series([1, 2, 3]).values

array([1, 2, 3], dtype=int64)

## Les attributs shape et size
``shape`` : Retourne un tuple de la forme des données.

``size`` : Retourne le nombre d'éléments dans les données.

In [31]:
pd.Series([1, 2, 3]).size

3

In [32]:
pd.Series([1, 2, 3, 4]).shape

(4,)

# Opérations mathématiques sur les séries
Lorsque vous travaillez avec des tableaux NumPy bruts, il n'est généralement pas nécessaire d'effectuer les opérations valeur par valeur. Il en va de même lorsque vous travaillez avec des séries dans pandas. Les séries peuvent également utiliser la plupart des méthodes NumPy.

In [18]:
import pandas as pd
import numpy as np
s = pd.Series(np.random.randn(5),index=["b", "c", "d", "a","e"] )
s2 = pd.Series(np.random.randn(5) , index=["a", "b", "z", "w","t"])
print (s + s2)

print (s * 3)

print (np.exp(s))

a    0.446429
b   -1.383216
c         NaN
d         NaN
e         NaN
t         NaN
w         NaN
z         NaN
dtype: float64
b   -0.207169
c    3.558916
d   -2.236187
a    2.546838
e   -0.373526
dtype: float64
b    0.933274
c    3.274959
d    0.474546
a    2.337182
e    0.882931
dtype: float64


# Indexation des Series
Une différence essentielle entre Series et ndarray est que les opérations entre Series alignent automatiquement les données en fonction de leur étiquette. Ainsi, vous pouvez écrire des calculs sans vous préoccuper de savoir si les séries concernées ont les mêmes étiquettes.

In [20]:
s[2:] + s1[:-2]

d   NaN
a   NaN
e   NaN
dtype: float64

Le résultat d'une opération entre des séries non alignées sera __l'union des index concernés__. Si une étiquette n'est pas trouvée dans une série ou l'autre, le résultat sera marqué comme manquant **`NaN`**. La possibilité d'écrire du code sans faire d'alignement de données explicite offre une liberté et une flexibilité immenses dans l'analyse et la recherche interactives de données. Les fonctions intégrées d'alignement des données des structures de données de pandas distinguent pandas de la majorité des outils connexes pour le travail avec des données étiquetées.

**Note**

En général, le résultat par défaut des opérations entre des objets indexés différemment donne l'union des index afin d'éviter toute perte d'information. Disposer d'une étiquette d'index, même si les données sont manquantes, est généralement une information importante dans le cadre d'un calcul. Vous avez bien sûr la possibilité d'abandonner les étiquettes avec des données manquantes via la fonction **`dropna`**.