Python 和 NumPy 索引运算符 "[]" 和属性运算符 "." , 可以在广泛的用例中快速轻松地访问 Pandas 数据结构。然而，由于要访问的数据类型不是预先知道的，所以直接使用标准运算符具有一些优化限制。对于生产环境的代码，建议使用以下方式访问:

| 编号 | 索引 | 描述 |
| :--: | :--: | :--: |
| 1 | .loc() | 基于标签 |
| 2 | .iloc() | 基于整数 |
| 3 | .ix() | 基于标签和整数 |

## .loc[]

Pandas 提供了各种方法来完成基于标签的索引。切片时，也包括起始边界。整数是有效的标签，但他们是指标签而不是位置。

.loc() 具有多种访问方式, 如:

* 单个标量标签
* 标签列表
* 切片对象
* 一个布尔数组

loc 需要两个 单/列表/范围运算符， 用 "," 分隔。 第一个表示行， 第二个表示列

In [4]:
import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(8, 4), index=list('abcdefgh'),columns=list('ABCD'))

print(df.loc[:, 'A'])
print(df.loc[:, ['A', ]])

a    0.794256
b    0.634884
c   -0.817373
d    0.342385
e   -1.079700
f   -2.017317
g   -1.611263
h    0.616694
Name: A, dtype: float64
          A
a  0.794256
b  0.634884
c -0.817373
d  0.342385
e -1.079700
f -2.017317
g -1.611263
h  0.616694


In [3]:
print(df.loc[:, ['A', 'C']])

          A         C
a -0.455529 -0.999112
b -0.523847  0.363561
c -2.074849  0.997300
d  1.820184  0.309310
e  0.405656  0.490985
f  0.787618 -0.314487
g  0.633574 -0.946082
h -1.365034 -0.549167


In [6]:
print(df.loc[['a', 'b', 'f', 'h'], ['A', 'C']])

          A         C
a  0.794256  0.961911
b  0.634884 -0.688074
f -2.017317  1.037095
h  0.616694  0.585171


In [9]:
# 当不需要管列的时候，只有行标签需要特定，那么就可以省略行的中括号[]
print(df.loc['a':'h']) 

          A         B         C         D
a  0.794256  0.197307  0.961911 -0.272544
b  0.634884 -1.367621 -0.688074 -0.800717
c -0.817373 -1.193071 -0.745504 -1.330599
d  0.342385  0.965560  0.147071 -1.497225
e -1.079700 -0.617586 -0.371146 -0.029225
f -2.017317 -1.673550  1.037095 -1.674562
g -1.611263 -0.476402 -0.616054  1.226752
h  0.616694  2.200041  0.585171  1.042220


In [10]:
print(df.loc['a'] > 0)

A     True
B     True
C     True
D    False
Name: a, dtype: bool


## .iloc[]

Pandas 提供了各种方法，以获得纯数字索引， 像 python 和 numpy 一样， 第一个位置是基于 0 的索引，各种访问方式如下:

* 整数
* 整数列表
* 系列值

In [11]:
df = pd.DataFrame(np.random.randn(8, 4), columns=list('ABCD'))
print(df.iloc[: 4])

          A         B         C         D
0  0.349248  0.321222  1.032232  1.642280
1  0.914556 -0.308331  0.999579  1.385866
2  1.541370  0.957296  0.750306 -0.450076
3  0.442266  0.827341  1.778581 -0.072902


In [12]:
print(df.iloc[1:5, 2:4])

          C         D
1  0.999579  1.385866
2  0.750306 -0.450076
3  1.778581 -0.072902
4 -0.503503  1.881340


In [14]:
print(df.iloc[[1, 3, 5], [1, 3]])
print(df.iloc[1:3, :])
print(df.iloc[:, 1:3])

          B         D
1 -0.308331  1.385866
3  0.827341 -0.072902
5  0.570654  0.087719
          A         B         C         D
1  0.914556 -0.308331  0.999579  1.385866
2  1.541370  0.957296  0.750306 -0.450076
          B         C
0  0.321222  1.032232
1 -0.308331  0.999579
2  0.957296  0.750306
3  0.827341  1.778581
4  0.294389 -0.503503
5  0.570654 -2.125928
6 -0.102183 -1.353226
7  0.997573 -0.818812


## .ix[]
除了基于纯标签和整数之外， Pandas 还提供了一种使用 .ix[] 运算符进行选择和子集化对象的混合方法。

In [15]:
df = pd.DataFrame(np.random.randn(8, 4), columns=list('ABCD'))
print(df.ix[:4])

          A         B         C         D
0  1.636024 -0.428863 -1.930451 -1.307685
1  0.245204  0.331620  0.401783  0.109807
2  0.017311  0.174162  1.414712 -0.710578
3  0.786688 -0.353512  0.071902 -2.933656
4  0.372607 -0.401849 -0.136066  0.925409


.ix is deprecated. Please use
.loc for label based indexing or
.iloc for positional indexing

See the documentation here:
http://pandas.pydata.org/pandas-docs/stable/indexing.html#ix-indexer-is-deprecated
  


In [16]:
print(df.ix[:, 'A'])

0    1.636024
1    0.245204
2    0.017311
3    0.786688
4    0.372607
5    0.263485
6    0.217363
7   -0.472382
Name: A, dtype: float64


## 属性访问
可以使用属性运算符 . 来选择列

In [17]:
print(df.A)

0    1.636024
1    0.245204
2    0.017311
3    0.786688
4    0.372607
5    0.263485
6    0.217363
7   -0.472382
Name: A, dtype: float64
