In [1]:
import pandas as pd
import numpy as np


## Series

Series可以看成是一维numpy数组的扩展：
 * 存放一组数据，其中每个元素的类型都相同。大多数情况下可以当作一维numpy数组使用
 * 除了整数下标外，每个元素还可以有一个标签，可以使用标签作为下标获取对应的元素。
 * 与字典不同，多个元素的标签可以相同，即一个标签可以对应多个元素。
 * **注意**：两个序列进行运算时，会**按照标签**查找对应元素进行相应运算
 * Series各元素的标签组成的列表，称为Index


### 生成Series

可在列表、字典或者NumPy数组的基础上生成Series。

In [2]:
s = pd.Series(np.random.randn(5), index=["a", "a", "c", "d", "e"])
s

a    0.701349
a    1.072689
c    2.955502
d    0.545747
e   -0.841626
dtype: float64

In [3]:
# 用字典生成Series

dic={'a':1,'b':2,'c':3,'d':4,'e':5}
s2 = pd.Series(dic)
s2

a    1
b    2
c    3
d    4
e    5
dtype: int64

### 基本使用

series可直接作为一维数组使用。

In [4]:
# 用整数下标访问元素或切片
s[0]

0.7013494005496487

In [5]:
# 与数做运算
s+2

a    2.701349
a    3.072689
c    4.955502
d    2.545747
e    1.158374
dtype: float64

In [6]:
# 与NumPy数组做运算
s+np.linspace(1,5,1)

a    1.701349
a    2.072689
c    3.955502
d    1.545747
e    0.158374
dtype: float64

### 使用标签下标访问元素

In [7]:
s['c']

2.955502349243385

当一个标签对应不止一个元素时，返回Series形式的视图。

In [8]:
s['a']

a    0.701349
a    1.072689
dtype: float64

### Series和Series运算

当两个Series进行运算时，执行的是相同标签元素之间的两两运算，类似于SQL数据库的外部join操作。
因此，不需要两个Series的长度相同。

这个行为和numpy一维数组**不一致**，需要特别注意。

In [9]:
s+s2

a    1.701349
a    2.072689
b         NaN
c    5.955502
d    4.545747
e    4.158374
dtype: float64

In [10]:
pd.Series(np.linspace(1,5,5))+pd.Series([3,2,1])

0    4.0
1    4.0
2    4.0
3    NaN
4    NaN
dtype: float64