Python 和 NumPy 索引运算符 "[]" 和属性运算符 "." , 可以在广泛的用例中快速轻松地访问 Pandas 数据结构。然而，由于要访问的数据类型不是预先知道的，所以直接使用标准运算符具有一些优化限制。对于生产环境的代码，建议使用以下方式访问:

| 编号 | 索引 | 描述 |
| :--: | :--: | :--: |
| 1 | .loc() | 基于标签 |
| 2 | .iloc() | 基于整数 |
| 3 | .ix() | 基于标签和整数 |

## .loc[]

Pandas 提供了各种方法来完成基于标签的索引。切片时，也包括起始边界。整数是有效的标签，但他们是指标签而不是位置。

.loc() 具有多种访问方式, 如:

* 单个标量标签
* 标签列表
* 切片对象
* 一个布尔数组

loc 需要两个 单/列表/范围运算符， 用 "," 分隔。 第一个表示行， 第二个表示列

In [2]:
import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(8, 4), index=list('abcdefgh'),columns=list('ABCD'))

print(df.loc[:, 'A'])
print(df.loc[:, ['A', ]])

a   -1.707873
b    1.537729
c    0.707704
d   -1.145671
e    0.333450
f    1.395857
g   -0.632904
h   -0.031409
Name: A, dtype: float64
          A
a -1.707873
b  1.537729
c  0.707704
d -1.145671
e  0.333450
f  1.395857
g -0.632904
h -0.031409


In [3]:
print(df.loc[:, ['A', 'C']])

          A         C
a -1.707873 -1.982173
b  1.537729  0.127107
c  0.707704  0.263893
d -1.145671 -0.736044
e  0.333450 -1.278222
f  1.395857 -0.882508
g -0.632904 -0.163880
h -0.031409 -0.009822


In [4]:
print(df.loc[['a', 'b', 'f', 'h'], ['A', 'C']])

          A         C
a -1.707873 -1.982173
b  1.537729  0.127107
f  1.395857 -0.882508
h -0.031409 -0.009822


In [5]:
# 当不需要管列的时候，只有行标签需要特定，那么就可以省略行的中括号[]
print(df.loc['a':'h']) 

          A         B         C         D
a -1.707873 -0.141089 -1.982173 -1.040255
b  1.537729 -0.348599  0.127107  0.459725
c  0.707704 -0.002465  0.263893 -0.875694
d -1.145671 -0.789790 -0.736044  0.141928
e  0.333450  0.388362 -1.278222 -0.002634
f  1.395857 -0.504382 -0.882508  0.412188
g -0.632904 -0.688369 -0.163880  0.665897
h -0.031409  1.287384 -0.009822 -1.004669


In [7]:
print(df.loc['a'] > 0)
print(df[df.loc['a'] > 0])

A    False
B    False
C    False
D    False
Name: a, dtype: bool


  


IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match

## .iloc[]

Pandas 提供了各种方法，以获得纯数字索引， 像 python 和 numpy 一样， 第一个位置是基于 0 的索引，各种访问方式如下:

* 整数
* 整数列表
* 系列值

In [None]:
df = pd.DataFrame(np.random.randn(8, 4), columns=list('ABCD'))
print(df.iloc[: 4])

In [None]:
print(df.iloc[1:5, 2:4])

In [None]:
print(df.iloc[[1, 3, 5], [1, 3]])
print(df.iloc[1:3, :])
print(df.iloc[:, 1:3])

## .ix[]
除了基于纯标签和整数之外， Pandas 还提供了一种使用 .ix[] 运算符进行选择和子集化对象的混合方法。

In [None]:
df = pd.DataFrame(np.random.randn(8, 4), columns=list('ABCD'))
print(df.ix[:4])

In [None]:
print(df.ix[:, 'A'])

## 属性访问
可以使用属性运算符 . 来选择列

In [None]:
print(df.A)