### Pandas中的Series数据结构
#### Series数据结构概念
Series是一种类似于一维数组的对象，它由一组数据（各种Numpy数据类型）以及一组与之相关的数据标签（即索引）组成
#### Series的生成

In [1]:
import pandas as pd

In [2]:
obj = pd.Series([3,4,5,6])

In [3]:
obj

0    3
1    4
2    5
3    6
dtype: int64

Series的字符串表现形式：左边是索引；右边是值；
如果没有指定索引，会自动生成一个0到N-1（N为数据的长度）的整数型索引
#### Series中的values和index属性
在Series中使用Series的**values**和**index**两个属性获取其数组的表现形式和索引对象

In [4]:
obj.values

array([3, 4, 5, 6], dtype=int64)

In [5]:
obj.index

RangeIndex(start=0, stop=4, step=1)

#### Series通过索引获取元素
我们希望所创建的Series带有一个可以对各个数据点进行标记的索引，如下

In [11]:
obj2 = pd.Series([-2,4,5,6], index = ['a','b','c','d'])

In [12]:
obj2

a   -2
b    4
c    5
d    6
dtype: int64

和Numpy一致，可以使用索引的方式获取Series中的单个或一组值：

In [13]:
obj2['a']

-2

In [14]:
obj2[['b','c','a']]

b    4
c    5
a   -2
dtype: int64

其中，['b','c','a']是索引列表
#### Series可以使用Numpy函数或类似Numpy的运算
使用Numpy函数或类似Numpy的运算（如根据布尔型数组进行过滤，标量乘法，应用数学函数等）都会保留索引值的链接

In [15]:
obj2[obj2>0]

b    4
c    5
d    6
dtype: int64

In [16]:
obj2 * 2

a    -4
b     8
c    10
d    12
dtype: int64

In [18]:
import numpy as np
np.exp(obj2)

a      0.135335
b     54.598150
c    148.413159
d    403.428793
dtype: float64

#### Series与Python中字典的关系
可以把Series看成是一个定长的有序字典，因为它是索引值到数据值的一个映射，它可以用在原本需要字典参数的函数中

In [19]:
'b' in obj2

True

In [21]:
'e' in obj2

False

如果数据被存放在一个Python字典中可以直接用这个字典创建Series

In [22]:
sdata_dic = {'zhao':23, 'hu':22,'li':21}

In [23]:
obj3 = pd.Series(sdata_dic)

In [24]:
obj3

zhao    23
hu      22
li      21
dtype: int64

#### 使用index改变Series中的排序
可以传入排好序的字典的键来改变原Series的顺序

In [28]:
states = ['hu','zhao','yang']

In [29]:
obj4 = pd.Series(sdata_dic, index = states)

In [30]:
obj4

hu      22.0
zhao    23.0
yang     NaN
dtype: float64

在上述代码中，sdata_dic和states中相匹配的3个值会被找出来，并放到相应的位置上，而'yang'所对应的值未被找到，所以其结果是NaN，而'li'并不在states中，所以从结果中除去。
#### Series中如何检测缺失值
在Series中使用缺失（missing）或NA表示缺失数据，在Pandas中，使用**isnull**和**notnull**来检测缺失数据

In [31]:
pd.isnull(obj4)

hu      False
zhao    False
yang     True
dtype: bool

In [32]:
pd.notnull(obj4)

hu       True
zhao     True
yang    False
dtype: bool

同样，可以通过实例方法：

In [33]:
obj4.isnull()

hu      False
zhao    False
yang     True
dtype: bool

In [34]:
obj4.notnull()

hu       True
zhao     True
yang    False
dtype: bool

#### Series中的自动对齐功能
Series的一个重要功能，它会根据运算的索引标签自动对齐数据

In [35]:
obj3

zhao    23
hu      22
li      21
dtype: int64

In [36]:
obj4

hu      22.0
zhao    23.0
yang     NaN
dtype: float64

In [37]:
obj3 + obj4

hu      44.0
li       NaN
yang     NaN
zhao    46.0
dtype: float64

数据对齐功能将在后面详细介绍，该功能类似于数据库中的join操作
#### Series中的name属性
Series对象本身及其索引都有一个'name'属性

In [39]:
obj4.name = 'population'

In [40]:
obj4.index.name = 'state'

In [41]:
obj4

state
hu      22.0
zhao    23.0
yang     NaN
Name: population, dtype: float64

#### 如何改变Series的索引呢
Series的索引可以通过赋值的方式就地修改

In [42]:
obj

0    3
1    4
2    5
3    6
dtype: int64

In [44]:
obj.index = ['Bob','Ani','Canni','Dony']

In [45]:
obj

Bob      3
Ani      4
Canni    5
Dony     6
dtype: int64