In [1]:
import pandas as pd
import numpy as np

## Series对象的索引操作

In [10]:
# 通过index参数指定series对象的行索引号
ser_obj = pd.Series(range(10, 15), index = ["a", "b", "c", "d", "e"])
print(ser_obj)

a    10
b    11
c    12
d    13
e    14
dtype: int32


In [12]:
# 通过行索引找到数据
print(ser_obj['c'])
print(ser_obj[2])

12
12


In [14]:
## 通过切片索引找到数据
print(ser_obj["b":"d"])
print(ser_obj[1:4])

b    11
c    12
d    13
dtype: int32
b    11
c    12
d    13
dtype: int32


In [18]:
## 通过不连续索引找到数据，索引参数是数据的 索引列表
print(ser_obj[[0, 1, 3]])
print(ser_obj[["a", "b", "d"]])

a    10
b    11
d    13
dtype: int32
a    10
b    11
d    13
dtype: int32


In [32]:
## 条件查找
after11_ser_obj = ser_obj > 11
next_obj = ser_obj < 12
#after11_ser_obj
print(ser_obj[after11_ser_obj])
print(ser_obj[next_obj])


c    12
d    13
e    14
dtype: int32
a    10
b    11
dtype: int32


## DataFrame对象的索引操作

In [9]:
# 通过index参数指定DataFrame对象的行索引号
# 通过columns参数指定DataFrame对象的列索引号
df_obj = pd.DataFrame(
        np.random.rand(5, 5),
        index = ["a", "b", "c", "d", "e"],
        columns = ['A', 'B','C','D','E']
    )
print(df_obj)

          A         B         C         D         E
a  0.435294  0.782211  0.240861  0.347172  0.302460
b  0.983611  0.501083  0.466091  0.621701  0.407381
c  0.561439  0.483462  0.550581  0.082875  0.195083
d  0.267857  0.374831  0.920902  0.845058  0.603401
e  0.129526  0.915040  0.526385  0.470437  0.637972


In [41]:
# 列索引 找到指定列
# 有列名称，没有行名
print(df_obj.C)
print(df_obj['C'])
print(df_obj[[2]])

a    0.240861
b    0.466091
c    0.550581
d    0.920902
e    0.526385
Name: C, dtype: float64
a    0.240861
b    0.466091
c    0.550581
d    0.920902
e    0.526385
Name: C, dtype: float64
          C
a  0.240861
b  0.466091
c  0.550581
d  0.920902
e  0.526385


In [43]:
## DataFrame对象的不连续索引，参数是需要匹配的 列索引列表
print(df_obj[["B", "D", "E"]])
print(df_obj[[1, 3, 4]])

          B         D         E
a  0.782211  0.347172  0.302460
b  0.501083  0.621701  0.407381
c  0.483462  0.082875  0.195083
d  0.374831  0.845058  0.603401
e  0.915040  0.470437  0.637972
          B         D         E
a  0.782211  0.347172  0.302460
b  0.501083  0.621701  0.407381
c  0.483462  0.082875  0.195083
d  0.374831  0.845058  0.603401
e  0.915040  0.470437  0.637972


## 高级索引，标签、位置和混合索引

#### loc 标签索引

In [46]:
# Series对象可以通过切片，也可以通过loc来索引
print(ser_obj["b":"d"])
print(ser_obj.loc["b":"d"])

b    11
c    12
d    13
dtype: int32
b    11
c    12
d    13
dtype: int32


In [53]:
## DataFrame对象不能直接通过切片来索引，但是可以通过loc来做切片索引
# [] 里的参数 第一个是 行切片索引， 第二个是 列切片索引
#print(df_obj['a':'c', 'D':'E'])
print(df_obj.loc['a':'c', 'D':'E'])
print("*" * 10)
# 通过loc找到 b行 D列 的数据
print(df_obj.loc['b', 'D'])

          D         E
a  0.347172  0.302460
b  0.621701  0.407381
c  0.082875  0.195083
**********
0.621701077643


#### iloc 位置索引

In [54]:
print(ser_obj)
print(df_obj)

a    10
b    11
c    12
d    13
e    14
dtype: int32
          A         B         C         D         E
a  0.435294  0.782211  0.240861  0.347172  0.302460
b  0.983611  0.501083  0.466091  0.621701  0.407381
c  0.561439  0.483462  0.550581  0.082875  0.195083
d  0.267857  0.374831  0.920902  0.845058  0.603401
e  0.129526  0.915040  0.526385  0.470437  0.637972


In [56]:
print(ser_obj[1:3])
print(ser_obj.iloc[1:3])

b    11
c    12
dtype: int32
b    11
c    12
dtype: int32


In [58]:
## DataFrame对象不能直接通过切片来索引，但是可以通过iloc来做切片索引
# [] 里的参数 第一个是 行切片索引， 第二个是 列切片索引
#print(df_obj[1:3, 2:4])
print(df_obj.iloc[1:3, 2:4])

          C         D
b  0.466091  0.621701
c  0.550581  0.082875


In [None]:
#### ix 混合索引（以上二者综合）

In [63]:
print(ser_obj.ix[1:3])
print(ser_obj.ix['b':'c'])

b    11
c    12
dtype: int32
b    11
c    12
dtype: int32


In [70]:
# ix 混合索引既可以用标签，也可以用位置，但是不推荐使用，容易造成索引混乱
print(df_obj.ix[1:3, 2:4])
print(df_obj.ix['b':'c', 'C':'D'])
print(df_obj.ix[3, 'D'])

          C         D
b  0.466091  0.621701
c  0.550581  0.082875
          C         D
b  0.466091  0.621701
c  0.550581  0.082875
0.845057868815
