# 1.重建索引
索引对象是无法修改的，因此，重建索引是指对索引重新排序而不是重新命名，如果某个索引值不存在的话，会引入缺失值。

In [1]:
import pandas as pd

obj = pd.Series([7.2,-4.3,4.5,3.6],index=['b','a','d','c'])
print(obj)
obj.reindex(['a','b','c','d','e'])

b    7.2
a   -4.3
d    4.5
c    3.6
dtype: float64


a   -4.3
b    7.2
c    3.6
d    4.5
e    NaN
dtype: float64

对于重建索引引入的缺陷值，可以使用 fill_value 参数填充

In [3]:
# 重建索引时填充缺失值
obj.reindex(['a','b','c','d','e'],fill_value=0)

a   -4.3
b    7.2
c    3.6
d    4.5
e    0.0
dtype: float64

对于顺序数据，例如时间序列，重建索引时可能需要进行 插值 或 填值处理 ，使用参数 method 选项可以设置
method = 'ffill' 或 'pad'        表示前向值填充
         'bfill' 或 'backfill'   表示后向值填充

In [4]:
# 缺失值的前向填充
import numpy as np
obj1 = pd.Series(['blue','red','black'],index=[0,2,4])
obj1.reindex(np.arange(6),method='ffill')

# 后向填充同理

0     blue
1     blue
2      red
3      red
4    black
5    black
dtype: object

对于DataFrame，reindex可以修改（行）索引、列，或两个都修改。如果仅传入一个序列，则结果中的行会重建索引。

In [8]:
# DataFrame 数据
df4 = pd.DataFrame(np.arange(9).reshape(3,3),index=['a','c','d'],columns=['one','two','four'])
print(df4)

# 默认对索引重新排序

   one  two  four
a    0    1     2
c    3    4     5
d    6    7     8


In [9]:
# reindex 操作
df4.reindex(index=['a','b','c','d'],columns=['one','two','three','four'])

# 注：此操作建立在前一步的df4之上

Unnamed: 0,one,two,three,four
a,0.0,1.0,,2.0
b,,,,
c,3.0,4.0,,5.0
d,6.0,7.0,,8.0
