# a-2. 選択
---
# 1. Seriesの[]演算子
# 2. DataFrameの[]演算子
# 3. Seriesのloc[]とiloc[]
# 4. DataFrameのloc[]とiloc[]
# 5. 利用例
## &nbsp; 5-1.比較演算子によるデータの選択
## &nbsp; 5-2. 複数条件による選択
## &nbsp; 5-3.他のDataFrame(Series)によるデータの選択
---

In [2]:
import numpy as np
import pandas as pd

---
#  1.Seriesの[]演算子

一次元データであるSeriesの選択を直感的に指定/実行できる。
`[]`内には、単一のラベル、ラベルのリスト、ラベルスライサ、整数、整数のリスト、範囲スライサ、
そしてboolリストのいずれかを指定することが可能である。
ラベルによる指定は後述の`loc[]`演算子のように、
そして整数による指定は`iloc[]`演算子のように動作する

### 入力データ
`s`は整数indexで、`t`は日付のindexである。整数indexとそれ以外のindexでは少し違った動きをするので2つのindexを対比のため用意した。
`s`,`t`いずれも、値の位置番号は上から0, 1, 2, 3である。
また、sの整数indexは、位置番号と混同しないように、あえて1から始める連番とした。

<pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
s = pd.Series([9, 5, 7, 6], index=[1, 2, 3, 4], name='x')

dates　= pd.date_range('2021/1/1', periods=4)
t = pd.Series([9, 5, 7, 6], index=dates, name='x')
</pre>

<table border="1" style="table-layout:fixed;width:100%;">
    <colgroup>
      <col style="width:3%;">
      <col style="width:25%;">
      <col style="width:20%;">
      <col style="width:20%;">
      <col style="width:17%;">
      <col style="width:15%;">
    </colgroup>
<tbody>

<tr><th align="left">no.</th><th align="left">実行コード</th><th>入力</th><th>出力</th><th align="left">備考</th><th align="left">[]の内容 / 出力タイプ</th></tr>

<tr><td colspan=6 bgcolor="#a9a9a9"><b>単一のラベル、単一の整数</b></td></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-1</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s[2])
print(t['2021-01-02'])
</pre></td>
<td align="center"><img width="70%" src="./figures/select/select1-1data.png"></td>
<td align="center"><img width="30%" src="./figures/select/select1-1.png"></td>
<td>
単一のindexのラベルを指定すると、そのindexの値が選択される。
ただし、存在しないラベルを与えるとエラーとなる。
</td>
<td>ラベル / numpyスカラ</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-2</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s[2])
print(t[2])
</pre></td>
<td align="center"><img width="80%" src="./figures/select/select1-2data.png"></td>
<td align="center"><img width="32%" src="./figures/select/select1-2.png"></td>
<td>
単一の整数を指定すると、何行目か(先頭行は0行目)として解釈される。
tの2行目の値は7である。
ただし、整数indexをもつsについては、indexのラベルとして扱われることに注意する。
sの2行目の値も7であるが、整数indexなので、ラベルが2の値である5が選ばれている。
存在しない行数を与えるとエラーとなる。
</td>
<td>整数 / numpyスカラ</td>
</tr>
    
<tr><td colspan=7 bgcolor="#a9a9a9"><b>ラベルのリスト、整数のリスト</b></td></tr>    

<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-3</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s[[2, 1]])
print(t[['2021-01-02', '2021-01-01']])
</pre></td>
<td align="center"><img width="70%" src="./figures/select/select1-3data.png"></td>
<td align="center"><img width="70%" src="./figures/select/select1-3.png"></td>
<td>
ラベルのリストを与えると、そのリストで指定されたラベルの値が全てその順番で選択される。
リスト以外にもndarrayやSeriesによる指定も可能。
</td>
<td>ラベルリスト / Series</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-4</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s[[2,　1]])
print(t[[2,　1]])
</pre></td>
<td><img width="80%" src="./figures/select/select1-4data.png"></td>
<td><img width="80%" src="./figures/select/select1-4.png"></td>
<td>
整数をリストで与えると、no.1-2で見たように、整数indexにおいてはラベルとして、
それ以外のindexにおいては行番号として解釈される。
リスト以外にもndarrayやSeriesによる指定も可能。
</td>
<td>整数リスト / Series</td>
</tr>
  
<tr><td colspan=7 bgcolor="#a9a9a9"><b>ラベルスライサと範囲スライサ</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-5</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s[1:4])
print(t['2021-01-01':'2021-01-03'])
</pre></td>
<td><img width="80%" src="./figures/select/select1-5data.png"></td>
<td><img width="80%" src="./figures/select/select1-5.png"></td>
<td>
<b>[from:to]</b>のように<b>:</b>で２つのラベルを指定すれば、ラベルの範囲で選択できる(ラベルスライサ)。
ただし、整数ラベルは指定できない。なぜなら、整数を指定すれば、次のno.1-6のように範囲スライサとして認識されるからである。
ラベルスライサでは、末尾の条件が「未満」ではなく「以下」となることに注意する。
以下、s[1:4] は、sが整数indexなので、範囲スライサとして認識され、1行目から3行目までが選択される(no.1-6参照)。
tは日付ラベルのスライサであり、2011-01-01から2021-01-03までの3つの値が選択される。
</td>
<td>範囲スライサ / Series</td>
</tr>
 
<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-6</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s[1:3])
print(t[1:3])
</pre></td>
<td><img width="80%" src="./figures/select/select1-6data.png"></td>
<td><img width="80%" src="./figures/select/select1-6.png"></td>
<td>
[from:to]のように:で２つの整数を指定すれば、行番号の範囲で選択できる(範囲スライサ)。
これは整数indexであっても同様なので、s,tの結果は同じとなる。
範囲スライサ a:b はa以上b未満と解釈され、ここでの例では、1,2行目が選ばれることになる。
また、どちらの数字も省略することができ、省略した場合は先頭もしくは末尾が指定されたことになる。
例えば、s[1:] は1行目から最後の行までが選ばれ、s[:3] は先頭行から2行目までが選ばれる。

</td>
<td>ラベルスライサ / Series</td>
</tr>
  
<tr><td colspan=7 bgcolor="#a9a9a9"><b>boolのリスト</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-7</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s[[True, False, False, True]])
print(t[[True, False, False, True]])
</pre></td>
<td><img width="80%" src="./figures/select/select1-7data.png"></td>
<td><img width="80%" src="./figures/select/select1-7.png"></td>
<td>
Seriesと同じサイズのboolリストを与えると、Trueに対応する値を選択する。Seriesとboolリストのサイズは同じでなければならない。boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い(no.1-8を参照のこと)。
</td>
<td>boolリスト / Series</td>
</tr>

<tr><td colspan=7 bgcolor="#a9a9a9"><b>比較演算結果のリスト</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-8</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s[s > 6])
</pre></td>
<td align="center"><img width="40%" src="./figures/select/select1-8data.png"></td>
<td align="center"><img width="40%" src="./figures/select/select1-8.png"></td>
<td>
各行に対する比較演算の結果(条件）を指定してデータを取得する。内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
</td>
<td>比較演算結果のリスト / Series</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-9</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(t[t > 6])
</pre></td>
<td><img width="70%" src="./figures/select/select1-9data.png"></td>
<td><img width="80%" src="./figures/select/select1-9.png"></td>
<td>
各行に対する比較演算の結果(条件）を指定してデータを取得する。内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
</td>
<td>比較演算結果のリスト / Series</td>
</tr>        
   
</tbody>
</table>

In [16]:

print('''
# 入力データ（再掲）s
>>> s = pd.Series([9, 5, 7, 6], index=[1, 2, 3, 4], name='x')
>>> print(s)''')
s = pd.Series([9, 5, 7, 6], index=[1, 2, 3, 4], name='x')
print(s)

print('''
# 入力データ（再掲）t
>>> dates = pd.date_range('2021/1/1', periods=4)
>>> t = pd.Series([9, 5, 7, 6], index=dates, name='x')
>>> print(t)''')
dates = pd.date_range('2021/1/1', periods=4)
t = pd.Series([9, 5, 7, 6], index=dates, name='x')
print(t)

print('''
# no.1-1 
# 単一のindexのラベルを指定すると、そのindexの値が選択される。
# ただし、存在しないラベルを与えるとエラーとなる。
>>> print(s[2])
>>> print(t['2021-01-02'])''')
print(s[2])
print(t['2021-01-02'])

print('''
# no.1-2
# 単一の整数を指定すると、何行目か(先頭行は0行目)として解釈される。
# tの2行目の値は7である。
# ただし、整数indexをもつsについては、indexのラベルとして扱われることに注意する。
# sの2行目の値も7であるが、整数indexなので、ラベルが2の値である5が選ばれている。
# 存在しない行数を与えるとエラーとなる。
>>>  print(s[2])
>>>  print(t[2])''')
print(s[2])
print(t[2])

print('''
# no.1-3
# ラベルのリストを与えると、そのリストで指定されたラベルの値が全てその順番で選択される。
# リスト以外にもndarrayやSeriesによる指定も可能。
>>>  print(s[[2, 1]])
>>>  print(t[['2021-01-02', '2021-01-01']])''')
print(s[[2, 1]])
print(t[['2021-01-02', '2021-01-01']])

print('''
# no.1-4
# 整数をリストで与えると、no.1-2で見たように、整数indexにおいてはラベルとして、
# それ以外のindexにおいては行番号として解釈される。
# リスト以外にもndarrayやSeriesによる指定も可能。
>>>  print(s[[2, 1]])
>>>  print(t[[2, 1]])''')
print(s[[2, 1]])
print(t[[2, 1]])


print('''
# no.1-5
# [from:to]のように:で２つのラベルを指定すれば、ラベルの範囲で選択できる(ラベルスライサ)。
# ただし、整数ラベルは指定できない。なぜなら、整数を指定すればno.1-5のように範囲スライサとして認識されるからである。
# 範囲スライサとは違い、ラベルスライサでは、末尾の条件が「未満」ではなく「以下」となることに注意する。
# 以下、s[1:4] は、sが整数indexなので、範囲スライサとして認識され、1行目から3行目までが選択される。
# tは日付ラベルのスライサであり、2011-01-01から2021-01-03までの3つの値が選択される。
>>> print(s[1:4])
>>> print(t['2021-01-01':'2021-01-03'])''')
print(s[1:4])
print(t['2021-01-01':'2021-01-03'])

print('''
# no.1-6
# [from:to]のように:で２つの整数を指定すれば、行番号の範囲で選択できる(範囲スライサ)。
# これは整数indexであっても同様なので、s,tの結果は同じとなる。
# 範囲スライサ a:b はa以上b未満と解釈され、ここでの例では、1,2行目が選ばれることになる。
# また、どちらの数字も省略することができ、省略した場合は先頭もしくは末尾が指定されたことになる。
# 例えば、s[1:] は1行目から最後の行までが選ばれ、s[:3] は先頭行から2行目までが選ばれる。
>>>  print(s[1:3])
>>>  print(t[1:3])''')
print(s[1:3])
print(t[1:3])

print('''
# no.1-7
# Seriesと同じサイズのboolリストを与えると、Trueに対応する値を選択する。
# Seriesとboolリストのサイズは同じでなければならない。
# boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い(no.1-8を参照のこと)。
>>> print(s[[True, False, False, True]])
>>> print(t[[True, False, False, True]])''')
print(s[[True, False, False, True]])
print(t[[True, False, False, True]])

print('''
# no.1-8
# 各行に対する比較演算の結果(条件）を指定してデータを取得する。
# 内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
>>> print(s[s > 6])
''')
print(s[s > 6])

print('''
# no.1-9
# 各行に対する比較演算の結果(条件）を指定してデータを取得する。
# 内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
>>> print(t[t > 6])
''')
print(t[t > 6])


# 入力データ（再掲）s
>>> s = pd.Series([9, 5, 7, 6], index=[1, 2, 3, 4], name='x')
>>> print(s)
1    9
2    5
3    7
4    6
Name: x, dtype: int64

# 入力データ（再掲）t
>>> dates = pd.date_range('2021/1/1', periods=4)
>>> t = pd.Series([9, 5, 7, 6], index=dates, name='x')
>>> print(t)
2021-01-01    9
2021-01-02    5
2021-01-03    7
2021-01-04    6
Freq: D, Name: x, dtype: int64

# no.1-1 
# 単一のindexのラベルを指定すると、そのindexの値が選択される。
# ただし、存在しないラベルを与えるとエラーとなる。
>>> print(s[2])
>>> print(t['2021-01-02'])
5
5

# no.1-2
# 単一の整数を指定すると、何行目か(先頭行は0行目)として解釈される。
# tの2行目の値は7である。
# ただし、整数indexをもつsについては、indexのラベルとして扱われることに注意する。
# sの2行目の値も7であるが、整数indexなので、ラベルが2の値である5が選ばれている。
# 存在しない行数を与えるとエラーとなる。
>>>  print(s[2])
>>>  print(t[2])
5
7

# no.1-3
# ラベルのリストを与えると、そのリストで指定されたラベルの値が全てその順番で選択される。
# リスト以外にもndarrayやSeriesによる指定も可能。
>>>  print(s[[2, 1]])
>>>  print(t[['2021-01-02', '2021-01-01']])
2    5
1    9
Name: x, dtype: int64
2021-01-02    5
2021-01-01    9
Name: x, dtype: int64

# no.1-4
# 整数をリストで与えると、no.1-2で見たように、整数indexにおいては

---
# 2. DataFrameの[]演算子

二次元データであるDataFrameの選択を直感的に指定/実行できる。
`[]`内に、単一のラベルもしくはラベルのリストを指定すれば列選択に、
ラベルスライサもしくはboolリストを指定すれば行選択になる。
ラベルによる指定は後述の`loc[]`演算子のように、
そして整数による指定は`iloc[]`演算子のように動作する。


### 入力データ
`d`は整数indexで、`e`は日付のindexである。整数indexとそれ以外のindexでは少し違った動きをするので2つのindexを対比のため用意した。
`d`,`e`いずれも、値の位置番号は上から0, 1, 2, 3である。
また、dの整数indexは、位置番号と混同しないように、あえて1から始める連番とした。

<pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
d = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
    index = ['1', '2', '3', '4']
)

dates = pd.date_range('2021/1/1', periods=4)
e = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
    index=dates
)  
</pre>

<table border="1" style="table-layout:fixed;width:100%;">
    <colgroup>
      <col style="width:3%;">
      <col style="width:25%;">
      <col style="width:20%;">
      <col style="width:20%;">
      <col style="width:17%;">
      <col style="width:15%;">
    </colgroup>
<tbody>

<tr><th align="left">no.</th><th align="left">実行コード</th><th align="left">入力</th><th align="left">出力</th><th align="left">備考</th><th align="left">[]の内容 / 出力タイプ</th></tr>

<tr><td colspan=6 bgcolor="#a9a9a9"><b>単一のラベル => 列の選択</b></td></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-1</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d['y'])
print(e['y'])
print(e.y)
</pre></td>
<td><img width="90%" src="./figures/select/select2-1data.png"></td>
<td><img width="70%" src="./figures/select/select2-1.png"></td>
<td>
DataFrameでは単独のラベルを与えると列選択となる。
Seriesとは違い、整数値を与えてもそれはラベルとして扱われる。
列名はDataFrameの属性でもあるので、ドットに続けて列名を指定してもよい(ex. 'd.y')。
ただし、'y-1'のように列名に演算子が含まれる場合、'e.y-1'のように指定すると、y列から1を引くと解釈されるため、そのような列名は属性として利用できないことに注意されたい。
</td>
<td>ラベル / Series</td>
</tr>

<tr><td colspan=6 bgcolor="#a9a9a9"><b>ラベルのリスト => 列の選択</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-2</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d[['y', 'x']])
print(e[['y', 'x']])
</pre></td>
<td><img width="90%" src="./figures/select/select2-2data.png"></td>
<td><img width="90%" src="./figures/select/select2-2.png"></td>
<td>
ラベルのリストを指定すると列選択となる。リストに指定された順番で列を出力する。
</td>
<td>ラベルリスト / DataFrame</td>
</tr>
  
<tr><td colspan=6 bgcolor="#a9a9a9"><b>ラベルのスライサ、範囲スライサ => 行の選択</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-3</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d[1:4])
print(e['2021-01-01':'2021-01-03'])
</pre></td>
<td><img width="90%" src="./figures/select/select2-3data.png"></td>
<td><img width="90%" src="./figures/select/select2-3.png"></td>
<td>
<b>[from:to]</b>のように:で２つのラベルを指定すれば、ラベルの範囲で選択できる(ラベルスライサ)。
ただし、整数ラベルは指定できない。なぜなら、整数を指定すればno.2-4のように範囲スライサとして認識されるからである。
範囲スライサとは違い、ラベルスライサでは、末尾の条件が「未満」ではなく「以下」となることに注意する。
以下、<b>d[1:4]</b> は、<b>d</b>が整数indexなので、範囲スライサとして認識され、1行目から3行目までが選択される。
<b>t</b>は日付ラベルのスライサであり、2011-01-01から2021-01-03までの3つの値が選択される。
</td>
<td>ラベルスライサ / DataFrame</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-4</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d[1:3])
print(e[1:3])
</pre></td>
<td><img width="100%" src="./figures/select/select2-4data.png"></td>
<td><img width="100%" src="./figures/select/select2-4.png"></td>
<td>
<b>[from:to]</b>のように:で２つの整数を指定すれば、行番号の範囲で選択できる(範囲スライサ)。
これは整数indexであっても同様なので、d,eの結果は同じとなる。
範囲スライサ <b>a:b</b> はa以上b未満と解釈され、ここでの例では、1,2行目が選ばれることになる。
また、どちらの数字も省略することができ、省略した場合は先頭もしくは末尾が指定されたことになる。
例えば、<b>d[1:]</b> は1行目から最後の行までが選ばれ、<b>d[:3]</b> は先頭行から2行目までが選ばれる。
</td>
<td>範囲スライサ / DataFrame</td>
</tr>
  
<tr><td colspan=6 bgcolor="#a9a9a9"><b>boolのリスト => 行の選択</b></td></tr>
 
<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-5</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d[[True, False, False, True]])
print(e[[True, False, False, True]])
</pre></td>
<td><img width="100%" src="./figures/select/select2-5data.png"></td>
<td><img width="100%" src="./figures/select/select2-5.png"></td>
<td>
DataFrameと同じ行数のboolリストを与えると、Trueに対応する値を選択する。DataFrameとboolリストのサイズは同じでなければならない。boolリストを与えると行選択となる。boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い(no.2-6を参照のこと)。
</td>
<td>boolリスト / DataFrame</td>
</tr>
       
<tr><td colspan=6 bgcolor="#a9a9a9"><b>比較演算結果のリスト</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-6</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d[d['x'] > 6])
</pre></td>
<td><img width="70%" src="./figures/select/select2-6data.png"></td>
<td><img width="70%" src="./figures/select/select2-6.png"></td>
<td>
各行に対する比較演算の結果(条件）を指定してデータを取得する。内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
</td>
<td>比較演算結果リスト / DataFrame</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-7</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(e[e['x'] > 6])
</pre></td>
<td><img width="100%" src="./figures/select/select2-7data.png"></td>
<td><img width="90%" src="./figures/select/select2-7.png"></td>
<td>
各行に対する比較演算の結果(条件）を指定してデータを取得する。内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
</td>
<td>比較演算結果リスト / DataFrame</td>
</tr> 
 
</tbody>
</table>

In [11]:

print('''
# 入力データ（再掲）d
>>> d = pd.DataFrame(
        {'x':[9, 5, 7, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']},
        index = ['1', '2', '3', '4']
    )
>>> print(d)''')
d = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
    index = ['1', '2', '3', '4']
)
print(d)
      
print('''
#  入力データ（再掲）e
>>> dates = pd.date_range('2021/1/1', periods=4)
>>> e = pd.DataFrame(
        {'x':[9, 5, 7, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']},
        index=dates
    ) 
>>> print(e)''')
dates = pd.date_range('2021/1/1', periods=4)
e = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
    index=dates
)     
print(e)

print('''
# no.2-1
# DataFrameでは単独のラベルを与えると列選択となる。
# Seriesとは違い、整数値を与えてもそれはラベルとして扱われる。
# 列名はDataFrameの属性でもあるので、ドットに続けて列名を指定してもよい(ex. d.y)。
# ただし、'y-1'のように列名に演算子が含まれる場合、'e.y-1'のように指定すると、
# y列から1を引くと解釈されるため、そのような列名は属性として利用できないことに注意されたい。 
>>> print(d['y'])
>>> print(e['y'])
>>> print(e.y)''')
print(d['y'])
print(e['y'])
print(e.y)

print('''
# no.2-2
# ラベルのリストを指定すると列選択となる。リストに指定された順番で列を出力する。 
>>> print(d[['y', 'x']])
>>> print(e[['y', 'x']])''')
print(d[['y', 'x']])
print(e[['y', 'x']])

print('''
# no.2-3
# [from:to]のように:で２つのラベルを指定すれば、ラベルの範囲で選択できる(ラベルスライサ)。
# ただし、整数ラベルは指定できない。なぜなら、整数を指定すればno.2-4のように範囲スライサとして認識されるからである。
# 範囲スライサとは違い、ラベルスライサでは、末尾の条件が「未満」ではなく「以下」となることに注意する。
# 以下、d[1:4] は、dが整数indexなので、範囲スライサとして認識され、1行目から3行目までが選択される。
# tは日付ラベルのスライサであり、2011-01-01から2021-01-03までの3つの値が選択される。
>>> print(d[1:4])
>>> print(e['2021-01-01':'2021-01-03'])''')
print(d[1:4])
print(e['2021-01-01':'2021-01-03'])

print('''
#　no.2-4
# [from:to]のように:で２つの整数を指定すれば、行番号の範囲で選択できる(範囲スライサ)。
# これは整数indexであっても同様なので、d,eの結果は同じとなる。
# 範囲スライサ a:b はa以上b未満と解釈され、ここでの例では、1,2行目が選ばれることになる。
# また、どちらの数字も省略することができ、省略した場合は先頭もしくは末尾が指定されたことになる。
# 例えば、d[1:] は1行目から最後の行までが選ばれ、d[:3] は先頭行から2行目までが選ばれる。
>>> print(d[1:3])
>>> print(e[1:3])''')
print(d[1:3])
print(e[1:3])

print('''
#　no.2-5
# DataFrameと同じ行数のboolリストを与えると、Trueに対応する値を選択する。
# DataFrameとboolリストのサイズは同じでなければならない。
# boolリストを与えると行選択となる。boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い(no.2-6を参照のこと)。
>>> print(d[[True, False, False, True]])
>>> print(e[[True, False, False, True]])''')
print(d[[True, False, False, True]])
print(e[[True, False, False, True]])

print('''
#　no.2-6
# 各行に対する比較演算の結果(条件）を指定してデータを取得する。
#　　内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。 
>>> print(d[d['x'] > 6])''')
print(d[d['x'] > 6])

print('''
#　no.2-7
# 各行に対する比較演算の結果(条件）を指定してデータを取得する。
# 内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
>>> print(e[e['x'] > 6])
''')
print(e[e['x'] > 6])



# 入力データ（再掲）d
>>> d = pd.DataFrame(
        {'x':[9, 5, 7, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']},
        index = ['1', '2', '3', '4']
    )
>>> print(d)
   x    y    z
1  9  1.5  abc
2  5  2.0  ace
3  7  0.4  cce
4  6  1.0  dfa

#  入力データ（再掲）e
>>> dates = pd.date_range('2021/1/1', periods=4)
>>> e = pd.DataFrame(
        {'x':[9, 5, 7, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']},
        index=dates
    ) 
>>> print(e)
            x    y    z
2021-01-01  9  1.5  abc
2021-01-02  5  2.0  ace
2021-01-03  7  0.4  cce
2021-01-04  6  1.0  dfa

# no.2-1
# DataFrameでは単独のラベルを与えると列選択となる。
# Seriesとは違い、整数値を与えてもそれはラベルとして扱われる。
# 列名はDataFrameの属性でもあるので、ドットに続けて列名を指定してもよい(ex. d.y)。
# ただし、'y-1'のように列名に演算子が含まれる場合、'e.y-1'のように指定すると、
# y列から1を引くと解釈されるため、そのような列名は属性として利用できないことに注意されたい。 
>>> print(d['y'])
>>> print(e['y'])
>>> print(e.y)
1    1.5
2    2.0
3    0.4
4    1.0
Name: y, dtype: float64
2021-01-01    1.5
2021-01-02    2.0
2

---
# 3. Seriesのloc[]とiloc[]

`loc[]`はSeriesをラベルで選択し、`iloc[]`は位置で選択する。
`loc[]`内には、単一のラベル、ラベルのリスト、ラベルスライサが指定でき、
`iloc[]`内には、整数、整数のリスト、範囲スライサが指定できる。
また、`loc[]`、`iloc[]`ともにboolリストを指定することが可能である。
その他にも、より複雑な条件を関数として指定することも可能であるが、本ドキュメントの範囲を超えるのでここでは説明しない。

### 入力データ
`index=`を省くと0から始まる整数の`index`が振られるため、
`iloc[]`と`loc[]`の指定を混同しやすくなるので注意されたい。
`loc[]`は、あくまでも`index`の値とのマッチングにより位置が評価され、`iloc[]`は、何番目かによって位置が評価される。
そこで、sには整数indexとして1から始まる連番を振って違いをわかりやすくしている。
<pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
s = pd.Series([9, 5, 7, 6], index=[1, 2, 3, 4], name='x')

dates = pd.date_range('2021/1/1', periods=4)
t = pd.Series([9, 5, 7, 6], index=dates, name='x')
</pre>

<table border="1" style="table-layout:fixed;width:100%;">
    <colgroup>
      <col style="width:3%;">
      <col style="width:25%;">
      <col style="width:20%;">
      <col style="width:20%;">
      <col style="width:17%;">
      <col style="width:15%;">
    </colgroup>
<tbody>

<tr><th align="left">no.</th><th align="left">実行コード</th><th align="left">入力</th><th align="left">出力</th><th align="left">備考</th><th align="left">[]の内容 / 出力タイプ</th></tr>

<tr><td colspan=6 bgcolor="#a9a9a9"><b>単一のラベル</b></td></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-1</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s.loc[2])
print(t.loc['2021-01-02'])
</pre></td>
<td align="center"><img width="60%" src="./figures/select/select3-1data.png"></td>
<td align="center"><img width="25%" src="./figures/select/select3-1.png"></td>
<td>
Seriesの<TT>[]</TT>演算子とは違い<TT>loc[]</TT>に与えた値は必ずラベルとして解釈される。
</td>
<td>ラベル / numpyスカラ</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-2</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s.iloc[2])
print(t.iloc[2])
</pre></td>
<td align="center"><img width="70%" src="./figures/select/select3-2data.png"></td>
<td align="center"><img width="25%" src="./figures/select/select3-2.png"></td>
<td>
Seriesの[]演算子とは違いiloc[]に与えた値は位置(何番目か)として解釈される。
</td>
<td>整数 / numpyスカラ</td>
</tr>
   
<tr><td colspan=6 bgcolor="#a9a9a9"><b>ラベルのリスト</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-3</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s.loc[[3, 1]])
print(t.loc[['2021-01-03', '2021-01-01']])
</pre></td>
<td align="center"><img width="65%" src="./figures/select/select3-3data.png"></td>
<td><img width="65%" src="./figures/select/select3-3.png"></td>
<td>
loc[]にラベルのリストを指定すると、リストに指定されたindexの順番で行を出力する。
</td>
<td>ラベルリスト / Series</td>
</tr>
 
<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-4</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s.iloc[[3, 1]])
print(t.iloc[[3, 1]])
</pre></td>
<td align="center"><img width="75%" src="./figures/select/select3-4data.png"></td>
<td><img width="70%" src="./figures/select/select3-4.png"></td>
<td>
iloc[]に整数のリストを指定すると、リストに指定された行番号の順番で行を出力する。
</td>
<td>整数リスト / Series</td>
</tr>    
      
<tr><td colspan=6 bgcolor="#a9a9a9"><b>ラベルのスライシング</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-5</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s.loc[1:2])
print(t.loc['2021-01-01':'2021-01-02'])
</pre></td>
<td><img width="100%" src="./figures/select/select3-5data.png"></td>
<td><img width="70%" src="./figures/select/select3-5.png"></td>
<td>
locでのラベルスライサ[from:to]は、ラベルの範囲として解釈される。
ラベルスライサはfromを含みtoも含む。
[]演算子でのスライサ指定のように、整数indexかどうかで挙動が変わることはなく、あくまでもindexの範囲として解釈される。
</td>
<td>ラベルスライサ / Series</td>
</tr>  
 
<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-6</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s.iloc[1:3])
print(t.iloc[1:3])
</pre></td>
<td align="center"><img width="80%" src="./figures/select/select3-6data.png"></td>
<td><img width="80%" src="./figures/select/select3-6.png"></td>
<td>
ilocでの範囲スライサ[from:to]は、行番号として解釈される。
範囲スライサではfromは含むが、toを含まず未満となることに注意する。
</td>
<td>範囲スライサ / Series</td>
</tr>      

<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-7</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s.loc[3:1])
print(t.loc['2021-01-03':'2021-01-01'])
</pre></td>
<td><img width="100%" src="./figures/select/select3-7data.png"></td>
<td><img width="70%" src="./figures/select/select3-7.png"></td>
<td>
いずれの例もlocのラベルスライサで評価された位置が<tt>from>to</tt>であったために空のSeriesが出力される。
</td>
<td>ラベルスライサ / Series</td>
</tr>  
 
<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-8</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s.iloc[3:1])
print(t.iloc[3:1])
</pre></td>
<td align="center"><img width="70%" src="./figures/select/select3-8data.png"></td>
<td><img width="60%" src="./figures/select/select3-8.png"></td>
<td>
いずれの例もilocの範囲スライサで評価された位置が<tt>from>to</tt>であったために空のSeriesが出力される。
</td>
<td>範囲スライサ / Series</td>
</tr> 
    
<tr><td colspan=6 bgcolor="#a9a9a9"><b>boolのリスト</b></td></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-9</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s.loc[[True, False, False, True]])
print(t.loc[[True, False, False, True]])
</pre></td>
<td align="center"><img width="60%" src="./figures/select/select3-9data.png"></td>
<td><img width="60%" src="./figures/select/select3-9.png"></td>
<td>
loc、ilocともに、Seriesと同じサイズのboolリストを与えると、Trueに対応する値を選択する。但しboolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い(no.3-11を参照のこと)。
</td>
<td>boolリスト / Series</td>
</tr> 
   
<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-10</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s.iloc[[True, False, False, True]])
print(t.iloc[[True, False, False, True]])
</pre></td>
<td align="center"><img width="70%" src="./figures/select/select3-10data.png"></td>
<td><img width="80%" src="./figures/select/select3-10.png"></td>
<td>
loc、ilocともに、Seriesと同じサイズのboolリストを与えると、Trueに対応する値を選択する。但しboolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い(no.3-11を参照のこと)。
</td>
<td>boolリスト / Series</td>
</tr> 
  
<tr><td colspan=6 bgcolor="#a9a9a9"><b>比較演算結果のリスト</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-11</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(s.loc[s > 5])
</pre></td>
<td align="center"><img width="40%" src="./figures/select/select3-11data.png"></td>
<td><img width="40%" src="./figures/select/select3-11.png"><td>
各行に対する比較演算の結果(条件）を指定してデータを取得する。内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
</td>
<td>比較演算結果のリスト / Series</td>
</tr> 
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-12</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(t.loc[t > 5])
</pre></td>
<td align="center"><img width="70%" src="./figures/select/select3-12data.png"></td>
<td><img width="80%" src="./figures/select/select3-12.png"><td>
各行に対する比較演算の結果(条件）を指定してデータを取得する。内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
</td>
<td>比較演算結果のリスト / Series</td>
</tr>
   
</tbody>
</table>

In [22]:

print('''
# 入力データ（再掲） s
>>> s = pd.Series([9, 5, 7, 6], index=[1, 2, 3, 4], name='x')
>>> print(s)''')
s = pd.Series([9, 5, 7, 6], index=[1, 2, 3, 4], name='x')
print(s)

print('''
# 入力データ（再掲）t
>>> dates = pd.date_range('2021/1/1', periods=4)
>>> t = pd.Series([9, 5, 7, 6], index=dates, name='x')
>>> print(t)''')
dates = pd.date_range('2021/1/1', periods=4)
t = pd.Series([9, 5, 7, 6], index=dates, name='x')
print(t)

print('''
# no.3-1
# Seriesの[]演算子とは違いloc[]に与えた値は必ずラベルとして解釈される。
>>> print(s.loc[2])
>>> print(t.loc['2021-01-02'])''')
print(s.loc[2])
print(t.loc['2021-01-02'])

print('''
# no.3-2
# Seriesの[]演算子とは違いiloc[]に与えた値は位置(何番目か)として解釈される。 
>>> print(s.iloc[2])
>>> print(t.iloc[2])''')
print(s.iloc[2])
print(t.iloc[2])

print('''
# no.3-3
# loc[]にラベルのリストを指定すると、リストに指定されたindexの順番で行を出力する。 
>>> print(s.loc[[3, 1]])
>>> print(t.loc[['2021-01-03', '2021-01-01']])''')
print(s.loc[[3, 1]])
print(t.loc[['2021-01-03', '2021-01-01']])

print('''
# no.3-4
# iloc[]に整数のリストを指定すると、リストに指定された行番号の順番で行を出力する。 
>>> print(s.iloc[[3, 1]])
>>> print(t.iloc[[3, 1]])''')
print(s.iloc[[3, 1]])
print(t.iloc[[3, 1]])

print('''
# no.3-5
# locでのスライサ[from:to]について、ラベルスライサはtoを含むが、
# 範囲スライサではtoを含まず未満となることに注意する。
# []演算子でのスライサ指定のように、整数indexかどうかで挙動が変わることはなく、あくまでもindexの範囲として解釈される。 
>>> print(s.loc[1:2])]
>>> print(t.loc['2021-01-01':'2021-01-02'])''')
print(s.loc[1:2])
print(t.loc['2021-01-01':'2021-01-02'])

print('''
# no.3-6
# ilocでの範囲スライサ[from:to]は、行番号として解釈される。
# 範囲スライサではfromは含むが、toを含まず未満となることに注意する。 
>>> print(s.iloc[1:3])
>>> print(t.iloc[1:3])''')
print(s.iloc[1:3])
print(t.iloc[1:3])

print('''
# no.3-7
# いずれの例もlocのラベルスライサで評価された位置がfrom>toであったために空のSeriesが出力される。 
>>> print(s.loc[3:1])
>>> print(t.loc['2021-01-03':'2021-01-01'])''')
print(s.loc[3:1])
print(t.loc['2021-01-03':'2021-01-01'])

print('''
# no.3-8
# いずれの例もilocの範囲スライサで評価された位置がfrom>toであったために空のSeriesが出力される。 
>>> print(s.iloc[3:1])
>>> print(t.iloc[3:1])''')
print(s.iloc[3:1])
print(t.iloc[3:1])

print('''
# no.3-9
# locでSeriesと同じサイズのboolリストを与えると、Trueに対応する値を選択する。
# 但しboolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い(no.3-11を参照のこと)。 
>>> print(s.loc[[True, False, False, True]])
>>> print(t.loc[[True, False, False, True]])''')
print(s.loc[[True, False, False, True]])
print(t.loc[[True, False, False, True]])

print('''
# no.3-10
# ilocも同様で、Seriesと同じサイズのboolリストを与えると、Trueに対応する値を選択する。
# 但しboolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い。 
>>> print(s.iloc[[True, False, False, True]])
>>> print(t.iloc[[True, False, False, True]])''')
print(s.iloc[[True, False, False, True]])
print(t.iloc[[True, False, False, True]])

print('''
# no.3-11
# 各行に対する比較演算の結果(条件）を指定してデータを取得する。内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。 
>>> print(s.loc[s > 6])
''')
print(s.loc[s > 6])

print('''
# no.3-12
# 各行に対する比較演算の結果(条件）を指定してデータを取得する。内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。 
>>> print(t.loc[t > 6])
''')
print(t.loc[t > 6])



# 入力データ（再掲） s
>>> s = pd.Series([9, 5, 7, 6], index=[1, 2, 3, 4], name='x')
>>> print(s)
1    9
2    5
3    7
4    6
Name: x, dtype: int64

# 入力データ（再掲）t
>>> dates = pd.date_range('2021/1/1', periods=4)
>>> t = pd.Series([9, 5, 7, 6], index=dates, name='x')
>>> print(t)
2021-01-01    9
2021-01-02    5
2021-01-03    7
2021-01-04    6
Freq: D, Name: x, dtype: int64

# no.3-1
# Seriesの[]演算子とは違いloc[]に与えた値は必ずラベルとして解釈される。
>>> print(s.loc[2])
>>> print(t.loc['2021-01-02'])
5
5

# no.3-2
# Seriesの[]演算子とは違いiloc[]に与えた値は位置(何番目か)として解釈される。 
>>> print(s.iloc[2])
>>> print(t.iloc[2])
7
7

# no.3-3
# loc[]にラベルのリストを指定すると、リストに指定されたindexの順番で行を出力する。 
>>> print(s.loc[[3, 1]])
>>> print(t.loc[['2021-01-03', '2021-01-01']])
3    7
1    9
Name: x, dtype: int64
2021-01-03    7
2021-01-01    9
Name: x, dtype: int64

# no.3-4
# iloc[]に整数のリストを指定すると、リストに指定された行番号の順番で行を出力する。 
>>> print(s.iloc[[3, 1]])
>>> print(t.iloc[[3, 1]])
4    6
2    5
Name: x, dtype: int64
2021-01-04    6
2021-01-02    5
Freq: -2D, Name: x, dt

---
# 4. DataFrameのloc[]とiloc[]

`loc[]`はDataFrameを行と列のラベルで選択し、`iloc[]`は位置で選択する。
`loc[]`、`iloc[]`ともに、`[行条件, 列条件]` のように指定する。
列条件は省略できるが、
行条件は省略できず、列条件だけを指定したい場合は`[:,列条件]`のように空のスライサを指定しなければならない。
行条件/列条件としては、`iloc[]`には、単一のラベル、ラベルのリスト、ラベルスライサが指定でき、
`iloc[]`には、整数、整数のリスト、範囲スライサが指定できる。
また、`loc[]`、`iloc[]`ともにboolリストを指定することが可能である。
その他にも、より複雑な条件を関数として指定することも可能であるが、本書の範囲を超えるのでここでは説明しない。

以下の例のように index を文字列として与えるとわかりやすいが、`index=`を省くと整数の`index`が振られるため、
`iloc[]`と`loc[]`の指定を混同しやすくなるので注意されたい。
`loc[]`は、あくまでも`index`の値とのマッチングにより位置が評価され、`iloc[]`は、何番目かによって位置が評価される。


### 入力データ

<pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
d = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
     index=[1, 2, 3, 4]
)

dates = pd.date_range('2021/1/1', periods=4)
e = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
     index=dates
) 
</pre>

<table border="1" style="table-layout:fixed;width:100%;">
    <colgroup>
      <col style="width:3%;">
      <col style="width:25%;">
      <col style="width:20%;">
      <col style="width:20%;">
      <col style="width:17%;">
      <col style="width:15%;">
    </colgroup>
<tbody>

<tr><th align="left">no.</th><th align="left">実行コード</th><th align="left">入力</th><th align="left">出力</th><th align="left">備考</th><th align="left">[]の内容 / 出力タイプ</th></tr>

<tr><td colspan=6 bgcolor="#a9a9a9"><b>単一のラベル</b></td></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-1</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.loc[2])
print(e.loc['2021-01-02'])
</pre></td>
<td><img width="100%" src="./figures/select/select4-1data.png"></td>
<td><img width="90%" src="./figures/select/select4-1.png"></td>
<td>
locに単独のラベルを与えると一行をSeriesとして選択する。この例のように、複数列の型が異なる場合の型はdtype=objectとなる。
</td>
<td>ラベル / Series</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-2</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.iloc[2])
print(e.iloc[2])
</pre></td>
<td><img width="100%" src="./figures/select/select4-2data.png"></td>
<td><img width="80%" src="./figures/select/select4-2.png"></td>
<td>
ilocに単独の整数を与えると一行をSeriesとして選択する。この例のように、複数列の型が異なる場合の型はdtype=objectとなる。
</td>
<td>整数 / Series</td>
</tr>
  
<tr><td colspan=6 bgcolor="#a9a9a9"><b>ラベルのリスト</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-3</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.loc[[3, 1]])
print(e.loc[['2021-01-03', '2021-01-01']])
</pre></td>
<td><img width="100%" src="./figures/select/select4-3data.png"></td>
<td><img width="100%" src="./figures/select/select4-3.png"></td>
<td>
locにラベル/整数のリストを指定すると、リストに指定された位置の行を、その順番で出力する。一つの列しか指定しなくてもDataFrameが出力される。
</td>
<td>ラベルリスト / DataFrame</td>
</tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-4</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.iloc[[3, 1]])
print(e.iloc[[3, 1]])
</pre></td>
<td><img width="100%" src="./figures/select/select4-4data.png"></td>
<td><img width="100%" src="./figures/select/select4-4.png"></td>
<td>
ilocにラベル/整数のリストを指定すると、リストに指定されたラベルの行を、その順番で出力する。一つの列しか指定しなくてもDataFrameが出力される。
</td>
<td>整数リスト / DataFrame</td>
</tr>
   
<tr><td colspan=6 bgcolor="#a9a9a9"><b>ラベルのスライシング</b></td></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-5</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.loc[1:2])
print(e.loc['2021-01-01':'2021-01-02'])
</pre></td>
<td><img width="100%" src="./figures/select/select4-5data.png"></td>
<td><img width="100%" src="./figures/select/select4-5.png"></td>
<td>
locにラベルスライサを指定すると行ラベルの範囲で行を選択する。スライサ[from:to]について、ラベルスライサはtoを含むが、範囲スライサではtoを含まず未満となることに注意する。
</td>
<td>ラベルスライサ / DataFrame</td>
</tr>    
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-6</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.iloc[1:3])
print(e.iloc[1:3])
</pre></td>
<td><img width="100%" src="./figures/select/select4-6data.png"></td>
<td><img width="100%" src="./figures/select/select4-6.png"></td>
<td>
ilocに範囲スライサを指定すると行を位置の範囲で選択する。スライサ[from:to]について、ラベルスライサはtoを含むが、範囲スライサではtoを含まず未満となることに注意する。
</td>
<td>範囲スライサ / DataFrame</td>
</tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-7</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.loc[1:0])
print(e.loc['2021-01-02':'2021-01-01'])
</pre></td>
<td><img width="100%" src="./figures/select/select4-7data.png"></td>
<td><img width="60%" src="./figures/select/select4-7.png"></td>
<td>
いずれの例もラベルスライサで評価された位置がfrom > toであったために空のDataFrameが出力される。
</td>
<td>ラベルスライサ / DataFrame</td>
</tr> 
    
<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-8</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.iloc[1:0])
print(e.iloc[1:0])
</pre></td>
<td><img width="100%" src="./figures/select/select4-8data.png"></td>
<td><img width="60%" src="./figures/select/select4-8.png"></td>
<td>
いずれの例も範囲スライサで評価された位置がfrom > toであったために空のDataFrameが出力される。
</td>
<td>範囲スライサ / DataFrame</td>
</tr> 
  
<tr><td colspan=6 bgcolor="#a9a9a9"><b>boolのリスト</b></td></tr> 
    
<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-9</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.loc[[True, False, False, True]])
print(e.loc[[True, False, False, True]])
</pre></td>
<td><img width="100%" src="./figures/select/select4-9data.png"></td>
<td><img width="100%" src="./figures/select/select4-9.png"></td>
<td>
locにboolリストを与えるとTrueに対応する行のみ選択される。boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い(4-21を参照のこと)。
</td>
<td>boolリスト / DataFrame</td>
</tr> 
    
<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-10</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.iloc[[True, False, False, True]])
print(e.iloc[[True, False, False, True]])
</pre></td>
<td><img width="100%" src="./figures/select/select4-10data.png"></td>
<td><img width="100%" src="./figures/select/select4-10.png"></td>
<td>
ilocにboolリストを与えるとTrueに対応する行のみ選択される。boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い。
</td>
<td>boolリスト / DataFrame</td>
</tr>     
        
<td colspan=6 bgcolor="#a9a9a9"><b>ラベルのスライシング</b></td></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-11</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.loc[1:2, 'y':'z'])
print(e.loc['2021-01-01':'2021-01-02', 'y':'z'])
</pre></td>
<td><img width="100%" src="./figures/select/select4-11data.png"></td>
<td><img width="90%" src="./figures/select/select4-11.png"></td>
<td>
locに行/列の条件をともに指定する例で、ともにラベルスライサで指定している。
</td>
<td>行:ラベルスライサ 列:ラベルスライサ / DataFrame</td>
</tr> 

<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-12</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.iloc[1:3, 1:3])
print(e.iloc[1:3, 1:3])
</pre></td>
<td><img width="100%" src="./figures/select/select4-12data.png"></td>
<td><img width="100%" src="./figures/select/select4-12.png"></td>
<td>
ilocに行/列の条件をともに指定する例で、ともに範囲スライサで指定している。
</td>
<td>行:範囲スライサ 列:範囲スライサ / DataFrame</td>
</tr>  

<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-13</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.loc[:, ['x', 'z']])
print(e.loc[:, ['x', 'z']])
</pre></td>
<td><img width="100%" src="./figures/select/select4-13data.png"></td>
<td><img width="80%" src="./figures/select/select4-13.png"></td>
<td>
locで列条件のみ指定する時は、行条件には空のスライサを指定する。
</td>
<td>行:ラベルスライサ 列:ラベルスライサ / DataFrame</td>
</tr>      

<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-14</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.iloc[:, [0, 2]])
print(e.iloc[:, [0, 2]])
</pre></td>
<td><img width="100%" src="./figures/select/select4-14data.png"></td>
<td><img width="90%" src="./figures/select/select4-14.png"></td>
<td>
ilocで列条件のみ指定する時は、行条件には空のスライサを指定する。
</td>
<td>行:範囲スライサ 列:範囲スライサ / DataFrame</td>
</tr>   
 
<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-15</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.loc[:, 'y'])
print(e.loc[:, 'y'])
</pre></td>
<td><img width="100%" src="./figures/select/select4-15data.png"></td>
<td><img width="70%" src="./figures/select/select4-15.png"></td>
<td>
locで列条件として単一のラベル/整数を指定すると、その列のSeriesを出力する。
</td>
<td>行:ラベルスライサ 列:ラベル / Series</td>
</tr> 

<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-16</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.iloc[:, 1])
print(e.iloc[:, 1])
</pre></td>
<td><img width="100%" src="./figures/select/select4-16data.png"></td>
<td><img width="80%" src="./figures/select/select4-16.png"></td>
<td>
ilocで列条件として単一のラベル/整数を指定すると、その列のSeriesを出力する。
</td>
<td>行:範囲スライサ 列:整数 / Series</td>
</tr>     

<tr><td colspan=6 bgcolor="#a9a9a9"><b>単一のラベル</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-17</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.loc[1, 'y'])
print(e.loc['2021-01-01', 'y'])
</pre></td>
<td><img width="100%" src="./figures/select/select4-17data.png"></td>
<td><img width="40%" src="./figures/select/select4-17.png"></td>
<td>
locで行/列ともに単一のラベルを指定すると、対応する行/列ラベルの一つの値のみがnumpyスカラとして選択される。
</td>
<td>行:ラベル 列:ラベル / numpyスカラ</td>
</tr>    

<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-18</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.iloc[1, 2])
print(e.iloc[1, 2])
</pre></td>
<td><img width="100%" src="./figures/select/select4-18data.png"></td>
<td><img width="40%" src="./figures/select/select4-18.png"></td>
<td>
ilocで行/列ともに単一の整数を指定すると、対応する行/列の位置の一つの値のみがnumpyスカラとして選択される。
</td>
<td>行:整数 列:整数 / numpyスカラ</td>
</tr>    
    
<tr><td colspan=6 bgcolor="#a9a9a9"><b>boolのリスト</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-19</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.loc[[True, False, True, False], [True, False, True]])
print(e.loc[[True, False, True, False], [True, False, True]])
</pre></td>
<td><img width="100%" src="./figures/select/select4-19data.png"></td>
<td><img width="80%" src="./figures/select/select4-19.png"></td>
<td>
locで行/列ともにboolリストを指定することも可能。与えるboolリストのサイズは行/列のサイズと同じでなければならない。boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い(no.4-21参照)。
</td>
<td>行:boolリスト 列:boolリスト / DataFrame</td>
</tr>       

<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-20</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.iloc[[True, False, True, False], [True, False, True]])
print(e.iloc[[True, False, True, False], [True, False, True]])
</pre></td>
<td><img width="100%" src="./figures/select/select4-20data.png"></td>
<td><img width="80%" src="./figures/select/select4-20.png"></td>
<td>
ilocで行/列ともにboolリストを指定することも可能。与えるboolリストのサイズは行/列のサイズと同じでなければならない。boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い。
</td>
<td>行:boolリスト 列:boolリスト / DataFrame</td>
</tr>       

    
<tr><td colspan=6 bgcolor="#a9a9a9"><b>比較演算結果のリスト</b></td></tr>

<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-21</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.loc[d['x'] > 6])
</pre></td>
<td><img width="70%" src="./figures/select/select4-21data.png"></td>
<td><img width="70%" src="./figures/select/select4-21.png"></td>
<td>
各行に対する比較演算の結果(条件）を指定してデータを取得する。内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
</td>
<td>行:比較演算結果のリスト 列:比較演算結果のリスト / DataFrame</td>
</tr>      

<tr style="background:#fff; border:1px solid #cc0000;">    
<td>4-22</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(e.loc[e['x'] > 6])
</pre></td>
<td><img width="100%" src="./figures/select/select4-22data.png"></td>
<td><img width="100%" src="./figures/select/select4-22.png"></td>
<td>
各行に対する比較演算の結果(条件）を指定してデータを取得する。内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
</td>
<td>行:比較演算結果のリスト 列:比較演算結果のリスト / DataFrame</td>
</tr> 

 
</tbody>
</table>

In [4]:

print('''
# 入力データ（再掲） d
>>> d = pd.DataFrame(
        {'x':[9, 5, 7, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']},
         index=[1, 2, 3, 4]
    )
>>> print(d)''')
d = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
     index=[1, 2, 3, 4]
)
print(d)

print('''
#  入力データ（再掲）e
>>> dates = pd.date_range('2021/1/1', periods=4)
>>> e = pd.DataFrame(
        {'x':[9, 5, 7, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']},
         index=dates
    ) 
>>> print(e)''')
dates = pd.date_range('2021/1/1', periods=4)
e = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
     index=dates
)     
print(e)

print('''
# no.4-1
# locに単独のラベルを与えると一行をSeriesとして選択する。
# この例のように、複数列の型が異なる場合の型はdtype=objectとなる。 
>>> print(d.loc[2])
>>> print(e.loc['2021-01-02'])''')
print(d.loc[2])
print(e.loc['2021-01-02'])

print('''
# no.4-2
# ilocに単独の整数を与えると一行をSeriesとして選択する。
# この例のように、複数列の型が異なる場合の型はdtype=objectとなる。
>>> print(d.iloc[2])
>>> print(e.iloc[2])''')
print(d.iloc[2])
print(e.iloc[2])

print('''
# no.4-3
# locにラベル/整数のリストを指定すると、リストに指定された位置の行を、その順番で出力する。
# 一つの列しか指定しなくてもDataFrameが出力される。
>>> print(d.loc[[3, 1]])
>>> print(e.loc[['2021-01-03', '2021-01-01']])''')
print(d.loc[[3, 1]])
print(e.loc[['2021-01-03', '2021-01-01']])

print('''
# no.4-4
# ilocにラベル/整数のリストを指定すると、リストに指定されたラベルの行を、その順番で出力する。
# 一つの列しか指定しなくてもDataFrameが出力される。 
>>> print(d.iloc[[3, 1]])
>>> print(e.iloc[[3, 1]])''')
print(d.iloc[[3, 1]])
print(e.iloc[[3, 1]])

print('''
#　no.4-5
# locにラベルスライサを指定すると行ラベルの範囲で行を選択する。
# スライサ[from:to]について、ラベルスライサはtoを含むが、範囲スライサではtoを含まず未満となることに注意する。 
>>> print(d.loc[1:2])
>>> print(e.loc['2021-01-01':'2021-01-02'])''')
print(d.loc[1:2])
print(e.loc['2021-01-01':'2021-01-02'])

print('''
# no.4-6
# ilocに範囲スライサを指定すると行を位置の範囲で選択する。
# スライサ[from:to]について、ラベルスライサはtoを含むが、範囲スライサではtoを含まず未満となることに注意する。 
>>> print(d.iloc[1:3])
>>>print(e.iloc[1:3])''')
print(d.iloc[1:3])
print(e.iloc[1:3])

print('''
# no.4-7
# いずれの例もラベルスライサで評価された位置がfrom > toであったために空のDataFrameが出力される。 
>>> print(d.loc[1:0])]
>>> print(e.loc['2021-01-02':'2021-01-01'])''')
print(d.loc[1:0])
print(e.loc['2021-01-02':'2021-01-01'])

print('''
# no.4-8
# いずれの例も範囲スライサで評価された位置がfrom > toであったために空のDataFrameが出力される。 
>>> print(d.iloc[1:0])
>>> print(e.iloc[1:0])''')
print(d.iloc[1:0])
print(e.iloc[1:0])


print('''
# no.4-9
# locにboolリストを与えるとTrueに対応する行のみ選択される。
# boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い(4-21を参照のこと)。 
>>> print(d.loc[[True, False, False, True]])
>>> print(e.loc[[True, False, False, True]])''')
print(d.loc[[True, False, False, True]])
print(e.loc[[True, False, False, True]])


print('''
# no.4-10
# ilocにboolリストを与えるとTrueに対応する行のみ選択される。
# boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い。
>>> print(d.iloc[[True, False, False, True]])
>>> print(e.iloc[[True, False, False, True]])''')
print(d.iloc[[True, False, False, True]])
print(e.iloc[[True, False, False, True]])


print('''
# no.4-11
# locに行/列の条件をともに指定する例で、ともにラベルスライサで指定している。
>>> print(d.loc[1:2, 'y':'z'])
>>> print(e.loc['2021-01-01':'2021-01-02', 'y':'z'])''')
print(d.loc[1:2, 'y':'z'])
print(e.loc['2021-01-01':'2021-01-02', 'y':'z'])


print('''
# no.4-12
# ilocに行/列の条件をともに指定する例で、ともに範囲スライサで指定している。
>>> print(d.iloc[1:3, 1:3])
>>> print(e.iloc[1:3, 1:3])''')
print(d.iloc[1:3, 1:3])
print(e.iloc[1:3, 1:3])


print('''
# no.4-13
# locで列条件のみ指定する時は、行条件には空のスライサを指定する。
>>> print(d.loc[:, ['x', 'z']])
>>> print(e.loc[:, ['x', 'z']])''')
print(d.loc[:, ['x', 'z']])
print(e.loc[:, ['x', 'z']])


print('''
# no.4-14
# ilocで列条件のみ指定する時は、行条件には空のスライサを指定する。 
>>> print(d.iloc[:, [0, 2]])
>>> print(e.iloc[:, [0, 2]])''')
print(d.iloc[:, [0, 2]])
print(e.iloc[:, [0, 2]])


print('''
# no.4-15
# locで列条件として単一のラベル/整数を指定すると、その列のSeriesを出力する。
>>> print(d.loc[:, 'y'])
>>> print(e.loc[:, 'y'])''')
print(d.loc[:, 'y'])
print(e.loc[:, 'y'])

print('''
# no.4-16
# ilocで列条件として単一のラベル/整数を指定すると、その列のSeriesを出力する。 
>>> print(d.iloc[:, 1])
>>> print(e.iloc[:, 1])''')
print(d.iloc[:, 1])
print(e.iloc[:, 1])

print('''
# no.4-17
# locで行/列ともに単一のラベルを指定すると、対応する行/列ラベルの一つの値のみがnumpyスカラとして選択される。
>>> print(d.loc[1, 'y'])
>>> print(e.loc['2021-01-01', 'y'])''')
print(d.loc[1, 'y'])
print(e.loc['2021-01-01', 'y'])

print('''
# no.4-18
# ilocで行/列ともに単一の整数を指定すると、対応する行/列の位置の一つの値のみがnumpyスカラとして選択される。
>>> print(d.iloc[1, 2])
>>> print(e.iloc[1, 2])''')
print(d.iloc[1, 2])
print(e.iloc[1, 2])


print('''
# no.4-19
# locで行/列ともにboolリストを指定することも可能。与えるboolリストのサイズは行/列のサイズと同じでなければならない。
# boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い(no.4-21参照)。 
>>> print(d.loc[[True, False, True, False], [True, False, True]])
>>> print(e.loc[[True, False, True, False], [True, False, True]])''')
print(d.loc[[True, False, True, False], [True, False, True]])
print(e.loc[[True, False, True, False], [True, False, True]])

print('''
# no.4-20
# ilocで行/列ともにboolリストを指定することも可能。与えるboolリストのサイズは行/列のサイズと同じでなければならない。
# boolリストを直接与えることは稀で、各行に対する比較演算の結果を利用することが多い。 
>>> print(d.iloc[[True, False, True, False], [True, False, True]])
>>> print(e.iloc[[True, False, True, False], [True, False, True]])''')
print(d.iloc[[True, False, True, False], [True, False, True]])
print(e.iloc[[True, False, True, False], [True, False, True]])

print('''
# no.4-21
# 各行に対する比較演算の結果(条件）を指定してデータを取得する。内部的な詳細な動作は「5-1.比較演算子によるデータの選択」を参照されたい。
>>> print(d.loc[d['x'] > 6])''')
print(d.loc[d['x'] > 6])

print('''
# no.4-22
# eでも同様。
>>> print(e.loc[e['x'] > 6])''')
print(e.loc[e['x'] > 6])



# 入力データ（再掲） d
>>> d = pd.DataFrame({
        'x':[9, 5, 7, 6],
        'y':[1.5, 2.0, 0.4, 1.0],
        'z':['abc', 'ace', 'cce', 'dfa']},
        index=[1, 2, 3, 4])
>>> print(d)
   x    y    z
1  9  1.5  abc
2  5  2.0  ace
3  7  0.4  cce
4  6  1.0  dfa

#  入力データ（再掲）e
>>> dates = pd.date_range('2021/1/1', periods=4)
>>> e = pd.DataFrame({
        'x':[9, 5, 7, 6],
        'y':[1.5, 2.0, 0.4, 1.0],
        'z':['abc', 'ace', 'cce', 'dfa']},
        index=dates) 
>>> print(e)
            x    y    z
2021-01-01  9  1.5  abc
2021-01-02  5  2.0  ace
2021-01-03  7  0.4  cce
2021-01-04  6  1.0  dfa

# no.4-1
# locに単独のラベルを与えると一行をSeriesとして選択する。
# この例のように、複数列の型が異なる場合の型はdtype=objectとなる。 
>>> print(d.loc[2])
>>> print(e.loc['2021-01-02'])
x      5
y    2.0
z    ace
Name: 2, dtype: object
x      5
y    2.0
z    ace
Name: 2021-01-02 00:00:00, dtype: object

# no.4-2
# ilocに単独の整数を与えると一行をSeriesとして選択する。
# この例のように、複数列の型が異なる場合の型はdtype=objectとなる。
>>> print(d.iloc[2])
>>> print(e.iloc[2])
x      7
y    

---
# 5.応用例

## 5-1.比較演算子によるデータの選択
DataFrameの`[]`演算子による行選択でよく用いられるのは表題のようなboolリストによる方法である。
`[]`演算子の中に`[]`演算子が入っておりややこしく見えるが、以下のように分解して考えると分かりやすい。
### 入力データ

<pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
d = pd.DataFrame(
    {'x':[4, 2, 3, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
     index=[0, 1, 2, 3]
)
</pre>
<table border="1" style="table-layout:fixed;width:100%;">
    <colgroup>
      <col style="width:5%;">
      <col style="width:40%;">
      <col style="width:40%;">
      <col style="width:15%;">
    </colgroup>
<tbody>

<tr><th align="left">no.</th><th align="left">実行コード</th><th align="left">入力</th><th align="left">出力</th>
<tr style="background:#fff; border:1px solid #cc0000;">
<td>5-1</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
sel = d[d['x']>=4]
print(sel)

s = d['x'] 
print(s)

c = s>=4 
print(c)

sel = d[c] 
print(sel)
</pre></td>
<td><img width="40%" src="./figures/select/select5-1data.png"></td>
<td>下記参照</td>
</tr>
    </tbody>
    </table>


<center><img width="60%" src="./figures/select/select5-1.png"></center>

---

In [19]:
print('''
\n# no.5-1
# 比較演算子によるデータの選択（行選択 d[d['x'] >= 4]の分解）
\n#入力データ(再掲)
>>> d = pd.DataFrame(
        {'x':[4, 2, 3, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']},
         index=[0, 1, 2, 3]
    )
''')
d = pd.DataFrame(
    {'x':[4, 2, 3, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
     index=[0, 1, 2, 3]
)
print(d)
#    x    y    z
# 0  4  1.5  abc
# 1  2  2.0  ace
# 2  3  0.4  cce
# 3  6  1.0  dfa

print('''\n>>> sel = d[d['x']>=4]''')
sel = d[d['x']>=4]
print(sel)
#    x    y    z
# 0  4  1.5  abc
# 3  6  1.0  dfa

print('''
\n# 上の行選択の式は以下の３つに分解して考えれば分かりやすい
# x列の選択(no.2-1参照)
>>> s = d['x']''')
s = d['x'] 
print(s)
# 0    4
# 1    2
# 2    3
# 3    6
# Name: x, dtype: int64

print('''
\n# 比較演算(no.2-6参照)
>>> c = s>=4''')
c = s>=4 
print(c)
# 0     True
# 1    False
# 2    False
# 3     True
# Name: x, dtype: bool

print('''
\n# boolリスト(Series)によるDataFrameの選択(no.2-6参照)
>>> sel = d[c]''')
sel = d[c] 
print(sel)
#    x    y    z
# 0  4  1.5  abc
# 3  6  1.0  dfa



# no.5-1
# 比較演算子によるデータの選択（行選択 d[d['x'] >= 4]の分解）

#入力データ(再掲)
>>> d = pd.DataFrame(
        {'x':[4, 2, 3, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']},
         index=[0, 1, 2, 3]
    )

   x    y    z
0  4  1.5  abc
1  2  2.0  ace
2  3  0.4  cce
3  6  1.0  dfa

>>> sel = d[d['x']>=4]
   x    y    z
0  4  1.5  abc
3  6  1.0  dfa


# 上の行選択の式は以下の３つに分解して考えれば分かりやすい
# x列の選択(no.2-1参照)
>>> s = d['x']
0    4
1    2
2    3
3    6
Name: x, dtype: int64


# 比較演算(no.2-6参照)
>>> c = s>=4
0     True
1    False
2    False
3     True
Name: x, dtype: bool


# boolリスト(Series)によるDataFrameの選択(no.2-6参照)
>>> sel = d[c]
   x    y    z
0  4  1.5  abc
3  6  1.0  dfa


---
## 5-2. 複数条件による選択
前項のような条件を複数指定することも可能である。複数の条件を論理演算子で組み合わせればよい。
論理演算子として、ブール変数`a`と`b`について、下表に示すような４種類の論理演算が利用可能である。
なお、論理演算子の優先順位は比較的高いために、条件式は括弧でくくる必要があることに注意されたい。
例えば、`x>1 & y<1`では、最初に`1 & y`が評価されるためにエラーとなる。
正しくは、 `(x>1) & (y<1)`としなければならない。
<br>
<center><img width="70%" src="./figures/select/select5-2_ab.png"><br>
</center>
<br>
<hr style="width:700px; height:1px; background-color:#ffffff;">
<br>
<center><img width="50%" src="./figures/select/select5-2.png">
</center>

---



### 入力データ

<pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
d = pd.DataFrame(
    {'x':[4, 2, 3, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
     index=[0, 1, 2, 3]
)
</pre>

<table border="1" style="table-layout:fixed;width:100%;">
    <colgroup>
      <col style="width:5%;">
      <col style="width:30%;">
      <col style="width:23%;">
      <col style="width:23%;">
      <col style="width:19%;">
    </colgroup>
<tbody>

<tr><th align="left">no.</th><th align="left">実行コード</th><th align="left">入力</th><th align="left">出力</th><th align="left">備考</th></tr>

<tr><td colspan=5 bgcolor="#a9a9a9"><b>& (AND) 論理積　</b></td></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>5-2-1</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d[(d['x']>=3) & (d['y']>=1.0)])
</pre></td>
<td><img width="80%" src="./figures/select/select5-2-1data.png"></td>
<td><img width="70%" src="./figures/select/select5-2-1.png"></td>
<td>
「x列が3以上」かつ<br>「y列が1.0以上」の行を選択する。
</td>
</tr>
 
<tr><td colspan=5 bgcolor="#a9a9a9"><b>| (OR) 論理和 </b></td></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>5-2-2</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d[(d['x']>=5) | (d['y']>=2.0)])
</pre></td>
<td><img width="80%" src="./figures/select/select5-2-2data.png"></td>
<td><img width="70%" src="./figures/select/select5-2-2.png"></td>
<td>
「x列が5以上」もしくは<br>「y列が2.0以上」の行を選択する。
</td>
</tr>

<tr><td colspan=5 bgcolor="#a9a9a9"><b>~ (NOT) 否定</b></td></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>5-2-3</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d[~((d['x']>=5) | (d['y']>=2.0))])
</pre></td>
<td><img width="80%" src="./figures/select/select5-2-3data.png"></td>
<td><img width="70%" src="./figures/select/select5-2-3.png"></td>
<td>
前例の否定(「x列が5以上」もしくは「y列が2.0以上」でない)の行を選択する。
</td>
</tr>
    
</tbody>
</table>

In [21]:
import pandas as pd

print('''
# 複数条件による選択
# 入力データ(再掲)
>>> d = pd.DataFrame(
        {'x':[4, 2, 3, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']},
         index=[0, 1, 2, 3]
    )
>>> print(d)''')
d = pd.DataFrame(
    {'x':[4, 2, 3, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']},
     index=[0, 1, 2, 3]
)
print(d)
# x y z
# 0 4 1.5 abc
# 1 2 2.0 ace
# 2 3 0.4 cce
# 3 6 1.0 dfa

print('''
# no.5-2-1
# 「x列が3以上」かつ「y列が1.0以上の行を選択する。
>>> print(d[(d['x']>=3) & (d['y']>=1.0)])''')
print(d[(d['x']>=3) & (d['y']>=1.0)])

print('''
# no.5-2-2
# 「x列が5以上」もしくは「y列が2.0以上の行を選択する。
>>> print(d[(d['x']>=5) | (d['y']>=2.0)])''')
print(d[(d['x']>=5) | (d['y']>=2.0)])

print('''
# no.5-2-3
# 前例の否定(「x列が5以上」もしくは「y列が2.0以上」でない)の行を選択する。
>>> print(d[~((d['x']>=5) | (d['y']>=2.0))])''')
print(d[~((d['x']>=5) | (d['y']>=2.0))])


# 複数条件による選択
# 入力データ(再掲)
>>> d = pd.DataFrame(
        {'x':[4, 2, 3, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']},
         index=[0, 1, 2, 3]
    )
>>> print(d)
   x    y    z
0  4  1.5  abc
1  2  2.0  ace
2  3  0.4  cce
3  6  1.0  dfa

# no.5-2-1
# 「x列が3以上」かつ「y列が1.0以上の行を選択する。
>>> print(d[(d['x']>=3) & (d['y']>=1.0)])
   x    y    z
0  4  1.5  abc
3  6  1.0  dfa

# no.5-2-2
# 「x列が5以上」もしくは「y列が2.0以上の行を選択する。
>>> print(d[(d['x']>=5) | (d['y']>=2.0)])
   x    y    z
1  2  2.0  ace
3  6  1.0  dfa

# no.5-2-3
# 前例の否定(「x列が5以上」もしくは「y列が2.0以上」でない)の行を選択する。
>>> print(d[~((d['x']>=5) | (d['y']>=2.0))])
   x    y    z
0  4  1.5  abc
2  3  0.4  cce


---
## 5-3.他のDataFrame(Series)によるデータの選択
あるDataFrameを他のDetaFrameやSeriesの値で選択したいケースは多くある。a-5で解説されているmergeやjoinでinner結合のように行を選択したいが、列は結合する必要はないといったケースである。
そのような場合、<b>isin</b>演算子を使うことで実現できる。

### 入力データ

<pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
df = pd.DataFrame(
    {'k1':[1, 2, 2, 3, 5],
     'k2':[0, 0, 1, 0, 1],
     'v':[1.1, 1.2, 1.3, 1.4, 1.5]}
)
mf = pd.DataFrame({'key1':[2, 5], 'key2':[1, 1]})
</pre>

<table border="1" style="table-layout:fixed;width:100%;">
    <colgroup>
      <col style="width:5%;">
      <col style="width:30%;">
      <col style="width:23%;">
      <col style="width:23%;">
      <col style="width:19%;">
    </colgroup>
<tbody>

<tr><th align="left">no.</th><th align="left">実行コード</th><th align="left">入力</th><th align="left">出力</th><th align="left">備考</th></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>5-3-1</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(df[df['k1'].isin(mf['key1'])])
</pre></td>
<td><img width="70%" src="./figures/select/select5-3-1data.png"></td>
<td><img width="80%" src="./figures/select/select5-3-1.png"></td>
<td>
dfの列k1をmfの列key1で選択する。Series1.isin(Series2)によって、Series1の各値が、Series2に存在すればTrue、なければFalseを返す。

</td>
</tr>
    
  
<tr style="background:#fff; border:1px solid #cc0000;">
<td>5-3-2</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(df[df['k1'].isin(mf['key1']) & df['k2'].isin(mf['key2'])])
</pre></td>
<td><img width="70%" src="./figures/select/select5-3-2data.png"></td>
<td><img width="80%" src="./figures/select/select5-3-2.png"></td>
<td>
複数列で選択したければ&(論理積)で2つの条件を書けばよい。k1がkey1に、かつk2がkey2に存在する行を選択する。
</td>
</tr>
    
</tbody>
</table>

---

In [6]:
print('''
# no.5-3
# 他のDataFrame(Series)によるデータの選択
>>> df = pd.DataFrame(
        {'k1':[1, 2, 2, 3, 5],
         'k2':[0, 0, 1, 0, 1],
         'v':[1.1, 1.2, 1.3, 1.4, 1.5]}
    )
>>> mf = pd.DataFrame({'key1':[2, 5], 'key2':[1, 1]})''')
df = pd.DataFrame(
    {'k1':[1, 2, 2, 3, 5],
     'k2':[0, 0, 1, 0, 1],
     'v':[1.1, 1.2, 1.3, 1.4, 1.5]}
)
mf = pd.DataFrame({'key1':[2, 5], 'key2':[1, 1]})
print(df)
print(mf)

print('''
# no.5-3-1
# dfの列k1をmfの列key1で選択する。
# Series1.isin(Series2)によって、Series1の各値が、Series2に存在すればTrue、なければFalseを返す。
>>> print(df[df['k1'].isin(mf['key1'])])''')
print(df[df['k1'].isin(mf['key1'])])

print('''
# no.5-3-2
# 複数列で選択したければ&(論理積)で2つの条件を書けばよい。
# k1がkey1に、かつk2がkey2に存在する行を選択する。
>>> print(df[df['k1'].isin(mf['key1']) & df['k2'].isin(mf['key2'])])
''')
print(df[df['k1'].isin(mf['key1']) & df['k2'].isin(mf['key2'])])

print('''
# no.5-3-3
# indexが同じ行を選びたければloc[]にmfのindexを指定すればよい。
>>> print(df.loc[mf.index])
''')
print(df.loc[mf.index])


# no.5-3
# 他のDataFrame(Series)によるデータの選択
>>> df = pd.DataFrame(
        {'k1':[1, 2, 2, 3, 5],
         'k2':[0, 0, 1, 0, 1],
         'v':[1.1, 1.2, 1.3, 1.4, 1.5]}
    )
>>> mf = pd.DataFrame({'key1':[2, 5], 'key2':[1, 1]})
   k1  k2    v
0   1   0  1.1
1   2   0  1.2
2   2   1  1.3
3   3   0  1.4
4   5   1  1.5
   key1  key2
0     2     1
1     5     1

# no.5-3-1
# dfの列k1をmfの列key1で選択する。
# Series1.isin(Series2)によって、Series1の各値が、Series2に存在すればTrue、なければFalseを返す。
>>> print(df[df['k1'].isin(mf['key1'])])
   k1  k2    v
1   2   0  1.2
2   2   1  1.3
4   5   1  1.5

# no.5-3-2
# 複数列で選択したければ&(論理積)で2つの条件を書けばよい。
# k1がkey1に、かつk2がkey2に存在する行を選択する。
>>> print(df[df['k1'].isin(mf['key1']) & df['k2'].isin(mf['key2'])])

   k1  k2    v
2   2   1  1.3
4   5   1  1.5

# no.5-3-3
# indexが同じ行を選びたければloc[]にmfのindexを指定すればよい。
>>> print(df.loc[mf.index])

   k1  k2    v
0   1   0  1.1
1   2   0  1.2
