# 数据取值与选择

In [1]:
import numpy as np
import pandas as pd

## 1. Series数据选择方法

`Series` 对象与一维 `NumPy` 数组和标准 `Python` 字典在许多方面都一样。  
只要牢牢记住这两个类比，就可以帮助我们更好地理解 `Series` 对象的数据索引与选择模式。

### 1.1. 将Series看作字典

In [2]:
data = pd.Series([0.25, 0.5, 0.75, 1.0], index=['a', 'b', 'c', 'd'])
data

a    0.25
b    0.50
c    0.75
d    1.00
dtype: float64

In [3]:
data['b']

0.5

In [4]:
'a' in data

True

In [5]:
data.keys()

Index(['a', 'b', 'c', 'd'], dtype='object')

In [6]:
list(data.items())

[('a', 0.25), ('b', 0.5), ('c', 0.75), ('d', 1.0)]

In [7]:
data['e'] = 1.25
data

a    0.25
b    0.50
c    0.75
d    1.00
e    1.25
dtype: float64

### 1.2. 将Series看作一维数组

`Series` 不仅有着和字典一样的接口，而且还具备和 `NumPy` 数组一样的数组数据选择功能，包括索引、掩码、花哨的索引等操作。

在下面的示例中，切片是绝大部分混乱之源。需要注意的是，当使用显式索引（即 `data['a':'c']`）作切片时，结果包含最后一个索引；  
而当使用隐式索引（即 `data[0:2]`）作切片时，结果不包含最后一个索引。

In [8]:
data['a':'c']                  # 将显式索引作为切片

a    0.25
b    0.50
c    0.75
dtype: float64

In [9]:
data[0:2]                      # 将隐式整数索引作为切片

a    0.25
b    0.50
dtype: float64

In [10]:
data[(data>0.3) & (data<0.8)]  # 掩码

b    0.50
c    0.75
dtype: float64

In [11]:
data[['a', 'e']]               # 花哨的索引

a    0.25
e    1.25
dtype: float64

### 1.3. 索引器：loc、iloc和ix

In [12]:
data = pd.Series(['a', 'b', 'c'], index=[1, 3, 5])
data

1    a
3    b
5    c
dtype: object

In [13]:
data[1]    # 取值操作是显式索引

'a'

In [14]:
data[1:3]  # 切片操作是隐式索引

3    b
5    c
dtype: object

由于整数索引很容易造成混淆，所以 `Pandas` 提供了一些索引器（indexer）属性来作为取值的方法。  
它们不是 `Series` 对象的函数方法，而是暴露切片接口的属性。

#### 第一种索引器是 loc 属性，表示取值和切片都是显式的：

In [15]:
data.loc[1]

'a'

In [16]:
data.loc[1:3]

1    a
3    b
dtype: object

#### 第二种是 iloc 属性，表示取值和切片都是 Python 形式的隐式索引：

In [17]:
data.iloc[1]

'b'

In [18]:
data.iloc[1:3]

3    b
5    c
dtype: object

#### 第三种取值属性是 ix，它是前两种索引器的混合形式：

在 `Series` 对象中 `ix` 等价于标准的 `[]（Python 列表）` 取值方式。  
`ix` 索引器主要用于 `DataFrame` 对象，后面将会介绍。

`Python` 代码的设计原则之一是“显式优于隐式”。使用 `loc` 和 `iloc` 可以让代码更容易维护，可读性更高。  
特别是在处理整数索引的对象时，我强烈推荐使用这两种索引器。它们既可以让代码阅读和理解起来更容易，也能避免因误用索引 \/ 切片而产生的小 bug。

## 2. DataFrame数据选择方法