## このページについて
pandasのDataFrameから、特定の条件を満たす行を削除する方法について。  
完成したブログ記事  
https://linus-mk.hatenablog.com/entry/2019/01/10/003349

In [1]:
import pandas as pd

pd.options.display.notebook_repr_html = False # DataFrameの表を綺麗にHTMLで表示されるとブログに貼り付けづらい。テキストにする

In [2]:
df = pd.DataFrame({
    'name'    : ['Alice', 'Bob', 'Charlie', 'David', 'Eve', 'Fred'],
    'English' : [12, 34, 56, 78, -1, 90],
    'Math'    : [88, 66, -1, 44, 22, -1]    
})

In [3]:
df

      name  English  Math
0    Alice       12    88
1      Bob       34    66
2  Charlie       56    -1
3    David       78    44
4      Eve       -1    22
5     Fred       90    -1

## 正解

In [4]:
df[df['Math'] != -1]

    name  English  Math
0  Alice       12    88
1    Bob       34    66
3  David       78    44
4    Eve       -1    22

In [5]:
df[df.Math != -1]

    name  English  Math
0  Alice       12    88
1    Bob       34    66
3  David       78    44
4    Eve       -1    22

## 一応、最初に思いついた方法も付記しておく：

以下の方法は簡潔ではないことを改めて警告しておく。参考と自分用の整理のために。    
pandas.DataFrame.drop  
https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.drop.html  
該当列の削除はdropでできるだろう、というところから考え始めると、こうなる。

該当する列を求めるのは以下のコードで可能である。

In [6]:
condition_boolen = (df["Math"] == -1)
condition_boolen

0    False
1    False
2     True
3    False
4    False
5     True
Name: Math, dtype: bool

しかし、pandas.DataFrame.drop 関数は、このTrue/Falseの並んだ配列を引数に取れない。

In [7]:
df.drop(condition_boolen)

KeyError: '[False False  True False False  True] not found in axis'

では何ならば良いかというと、  
drop関数の引数には、削除したい列のindexのリストを指定する必要がある。

> labels : single label or list-like  
> Index or column labels to drop.

In [8]:
rows_to_drop = df.index[df["Math"] == -1]
rows_to_drop

Int64Index([2, 5], dtype='int64')

In [9]:
df.drop(rows_to_drop)

    name  English  Math
0  Alice       12    88
1    Bob       34    66
3  David       78    44
4    Eve       -1    22

"Math"が-1の行を選択する操作と、indexを取る操作とは、交換可能である。

In [10]:
df[df["Math"] == -1].index

Int64Index([2, 5], dtype='int64')

余談だが、  
df.index は  
df['index']と書くことはできない。エラーになるよ。

In [11]:
df['index']

KeyError: 'index'

## 参考

http://accent.hatenablog.jp/entry/2016/11/23/165005  
http://www.datasciencemadesimple.com/drop-delete-rows-conditions-python-pandas/ ：理想的  
https://thispointer.com/python-pandas-how-to-drop-rows-in-dataframe-by-conditions-on-column-values/ ：非効率的な方のやり方やんけ。   
https://stackoverflow.com/questions/18172851/deleting-dataframe-row-in-pandas-based-on-column-value  
https://stackoverflow.com/questions/13851535/how-to-delete-rows-from-a-pandas-dataframe-based-on-a-conditional-expression ：応用編  


## 環境

In [13]:
!python --version
print(pd.__version__)

Python 3.7.1
0.23.4
