# Series对象的索引操作

In [1]:
import pandas as pd
import numpy as np


In [2]:
# 通过index参数指定Series对象的行索引号
ser_obj = pd.Series(range(10, 15), index = ["a", "b", "c", "d", "e"])
print(ser_obj)

a    10
b    11
c    12
d    13
e    14
dtype: int32


In [3]:
# 通过行索引找到数据
print(ser_obj['c'])
print(ser_obj[2])


12
12


In [4]:
# 通过切片索引找到数据
print(ser_obj['b':'d'])
print(ser_obj[1:4])


b    11
c    12
d    13
dtype: int32
b    11
c    12
d    13
dtype: int32


In [5]:
# 通过不连续索引找到数据。索引参数是数据的 索引列表
print(ser_obj[[0, 1 ,3]])
print(ser_obj[['a', 'b', 'd']])

a    10
b    11
d    13
dtype: int32
a    10
b    11
d    13
dtype: int32


In [6]:
# 条件查找
a = ser_obj > 11
b = ser_obj < 12
print(ser_obj[a])
print(ser_obj[b])

c    12
d    13
e    14
dtype: int32
a    10
b    11
dtype: int32


# DataFrame 对象的索引操作

In [10]:
# 3 通过index参数指定DataFrame对象的行索引号
# 通过columns参数指定DataFrame对象的列索引号
df_obj6 = pd.DataFrame(
        np.random.rand(5, 5),
        index = ["a", "b", "c", "d", "e"],
        columns = ['A', 'B','C','D','E']
    )
print(df_obj6)


          A         B         C         D         E
a  0.393078  0.755034  0.281337  0.602575  0.616455
b  0.392678  0.129764  0.090930  0.680418  0.831275
c  0.576866  0.951882  0.008754  0.874356  0.692286
d  0.816547  0.048103  0.102378  0.052046  0.366409
e  0.884685  0.049395  0.134929  0.111296  0.858815


In [12]:
# 列索引 找到指定列
# 有列名称，没有行名
print(df_obj6.C)
print(df_obj6['C'])
print(df_obj6[[2]])


a    0.281337
b    0.090930
c    0.008754
d    0.102378
e    0.134929
Name: C, dtype: float64
a    0.281337
b    0.090930
c    0.008754
d    0.102378
e    0.134929
Name: C, dtype: float64
          C
a  0.281337
b  0.090930
c  0.008754
d  0.102378
e  0.134929


In [13]:
# DataFrame 对象的不连续索引，参数是需要匹配，列索引是列表
print(df_obj[["B", "D", "E"]])
print(df_obj[[1, 3, 4]])

          B         D         E
a  0.035327  0.817530  0.410539
b  0.190182  0.293765  0.912102
c  0.560440  0.116709  0.562393
d  0.917094  0.334340  0.140277
e  0.194486  0.110687  0.027988
          B         D         E
a  0.035327  0.817530  0.410539
b  0.190182  0.293765  0.912102
c  0.560440  0.116709  0.562393
d  0.917094  0.334340  0.140277
e  0.194486  0.110687  0.027988


# 高级索引，标签，位置和混合索引

### loc 标签索引

In [14]:
# Series 对象可以通过切片， 也可以通过loc来索引
print(ser_obj['b':'d'])
print(ser_obj.loc['b':'d'])

b    11
c    12
d    13
dtype: int32
b    11
c    12
d    13
dtype: int32


In [17]:
# DataFrame对象不能直接通过切片来索引，但是可以通过loc来做切片索引
# []里的参数 第一个是行切片索引，第二个是 列切片索引
print(df_obj.loc['a':'c', 'D':'E'])
print('*'*10)
# 通过loc找到b行，D列的数据
print(df_obj.loc['b', 'D'])


          D         E
a  0.817530  0.410539
b  0.293765  0.912102
c  0.116709  0.562393
**********
0.293765168824


### iloc 位置索引

In [18]:
print(ser_obj)
print(df_obj)

a    10
b    11
c    12
d    13
e    14
dtype: int32
          A         B         C         D         E
a  0.060446  0.035327  0.193643  0.817530  0.410539
b  0.725114  0.190182  0.618071  0.293765  0.912102
c  0.492970  0.560440  0.275894  0.116709  0.562393
d  0.370061  0.917094  0.313255  0.334340  0.140277
e  0.377745  0.194486  0.886315  0.110687  0.027988


In [19]:
print(ser_obj[1:3])
print(ser_obj.iloc[1:3])


b    11
c    12
dtype: int32
b    11
c    12
dtype: int32


In [20]:
## DataFrame对象不能直接通过切片来索引，但是可以通过iloc来做切片索引
# [] 里的参数 第一个是 行切片索引， 第二个是 列切片索引
print(df_obj.iloc[1:3, 2:4])

          C         D
b  0.618071  0.293765
c  0.275894  0.116709


### ix 混合索引（以上两者的综合）

In [21]:
print(ser_obj.ix[1:3])
print(ser_obj.ix['b':'c'])

b    11
c    12
dtype: int32
b    11
c    12
dtype: int32


In [22]:
# ix 混合索引既可以用标签，也可以用位置，但是不推荐使用，容易造成索引混乱
print(df_obj.ix[1:3, 2:4])
print(df_obj.ix['b':'c', 'C':'D'])
print(df_obj.ix[3, 'D'])

          C         D
b  0.618071  0.293765
c  0.275894  0.116709
          C         D
b  0.618071  0.293765
c  0.275894  0.116709
0.334340337387
