# 注意事项及陷阱

### 1. 在Pandas中使用If/Truth语句
当尝试将某些东西转换成布尔值时，Pandas遵循了numpy一样的错误惯例。这通常发生在使用布尔操作的if,when以及or,not语句中，但是却并不是很清楚结果应该是什么。因为非零长度所以结果是True？存在错误值所以结果是Fasle？Pandas中为了避免这种模糊，使用ValueError代替操作。

In [1]:
import pandas as pd
import numpy as np

if pd.Series([False,True,False]):
    print 'I am True'

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

上述结果显示在if条件中，它并不清楚需要去做什么。给出的建议是选择使用None或者any等等。

In [2]:
if pd.Series([False,True,False]).any():
    print 'I am any'

I am any


计算一个单一元素为布尔值的Pandas对象，使用.bool()

In [3]:
print pd.Series([True]).bool()

True


### 2. 按位布尔值

按位布尔值操作比如==和!=，通常都会返回一个布尔值序列

In [4]:
s = pd.Series(range(5))
print s == 4

0    False
1    False
2    False
3    False
4     True
dtype: bool


## 3. isin操作
isin()返回一个布尔值序列，用于展示Series中的每一个元素是否刚好包含在传入的值序列里

In [5]:
s = pd.Series(list('abc'))
s = s.isin(['a','c','e'])
print s

0     True
1    False
2     True
dtype: bool


### 4. 重建索引与ix索引释疑
许多使用Pandas的程序员都会使用ix索引作为从Pandas对象中选择数据的有效方法

In [6]:
df = pd.DataFrame(np.random.randn(6,4),columns=['one','two','three',
                'four'],index=list('abcdef'))
print df
print df.ix[['b','c','e']]

        one       two     three      four
a -0.877389 -0.555790  0.899977  0.136558
b -0.103574 -0.779504 -1.343671  0.495502
c -0.199091  1.916401  0.723781 -1.094855
d -0.516062 -0.856850 -1.706442  0.700111
e -1.772225  0.366969 -0.971277 -1.040466
f  0.057092  0.476584 -0.980486 -1.159709
        one       two     three      four
b -0.103574 -0.779504 -1.343671  0.495502
c -0.199091  1.916401  0.723781 -1.094855
e -1.772225  0.366969 -0.971277 -1.040466


.ix is deprecated. Please use
.loc for label based indexing or
.iloc for positional indexing

See the documentation here:
http://pandas.pydata.org/pandas-docs/stable/indexing.html#ix-indexer-is-deprecated
  after removing the cwd from sys.path.


在这种情境下，使用reindex方法与ix有完全相同的效果

In [7]:
print df.reindex(['b','c','e'])

        one       two     three      four
b -0.103574 -0.779504 -1.343671  0.495502
c -0.199091  1.916401  0.723781 -1.094855
e -1.772225  0.366969 -0.971277 -1.040466


绝大部分情况下，ix和reindex是相同作用，除了整数索引的情况。例如：

In [8]:
print df,'\n'
print df.ix[[1,2,4]],'\n'
print df.reindex([1,2,4])

        one       two     three      four
a -0.877389 -0.555790  0.899977  0.136558
b -0.103574 -0.779504 -1.343671  0.495502
c -0.199091  1.916401  0.723781 -1.094855
d -0.516062 -0.856850 -1.706442  0.700111
e -1.772225  0.366969 -0.971277 -1.040466
f  0.057092  0.476584 -0.980486 -1.159709 

        one       two     three      four
b -0.103574 -0.779504 -1.343671  0.495502
c -0.199091  1.916401  0.723781 -1.094855
e -1.772225  0.366969 -0.971277 -1.040466 

   one  two  three  four
1  NaN  NaN    NaN   NaN
2  NaN  NaN    NaN   NaN
4  NaN  NaN    NaN   NaN


**注意：**reindex是严格的只按标签索引函数，如果使用不当会有潜在的异常结果