# a-3. 値のセット
---
## 1. []による値のセット
## 2. loc[],iloc[]による値のセット
## 3. assign(), insert(), append()
## 4. 条件による値の置換(whereとmask)
---

In [1]:
import numpy as np
import pandas as pd

---

# 1. []による値のセット

a-2_selectionの章では[]演算子を使ってデータを選択する方法を解説したが、同じ演算子を使って値をセットすることもできる。

### 関連ドキュメント
- [indexing and selecting data](https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html)

### 入力データ

<pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
d = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']}
)
s = pd.Series([9, 5, 7, 6], name='x')
</pre>

<table border="1" style="table-layout:fixed;width:100%;">
    <colgroup>
      <col style="width:3%;">
      <col style="width:30%;">
      <col style="width:25%;">  
      <col style="width:25%;">
      <col style="width:17%;">
    </colgroup>
<tbody>

<tr><th align="left">no.</th><th align="left">実行コード</th><th>入力</th><th>出力</th><th>備考</th></tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-1</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd['a'] = [4, 3, 2, 1]
dd
</pre></td>
<td align="center"><img width="60%" src="./figures/setvalues/set1-1data.png"></td>
<td><img width="70%" src="./figures/setvalues/set1-1.png"></td>
<td>
[]に新しい列名を指定して列をlistで指定して追加。list以外にもSeriesやnumpy.ndarrayでも可能。この節での例は全ては元データを更新するので、copy()してから使う。
</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-2</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd['a'] = pd.Series([4, 3, 2, 1], index=[3, 2, 1, 0])
dd
</pre></td>
<td align="center"><img width="60%" src="./figures/setvalues/set1-2data.png"></td>
<td><img width="70%" src="./figures/setvalues/set1-2.png"></td>
<td>
Seriesを追加する場合は、indexに一致した行に追加される。以下ではindexを逆順に振ることでその様子を明示している。
</td>
</tr>
    
<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-3</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd['a'] = dd['x'] * 2
dd
</pre></td>
<td align="center"><img width="60%" src="./figures/setvalues/set1-3data.png"></td>
<td><img width="70%" src="./figures/setvalues/set1-3.png"></td>
<td>
Seriesの計算結果を新たにセットする例。x列を2倍してa列を新たに追加する例。
</td>
</tr>
   
<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-4</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd['a'] = 1
dd
</pre></td>
<td align="center"><img width="60%" src="./figures/setvalues/set1-4data.png"></td>
<td><img width="70%" src="./figures/setvalues/set1-4.png"></td>
<td>
listやSeriesでなく、1つの値を指定すると全ての行にその値が展開セットされる(ブロードキャストと呼ぶ)。
</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-5</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd['y'] = [4, 3, 2, 1]
dd
</pre></td>
<td align="center"><img width="60%" src="./figures/setvalues/set1-5data.png"></td>
<td><img width="60%" src="./figures/setvalues/set1-5.png"></td>
<td>
既存の列名を指定すると、列ごと新しい値に更新される。
</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>1-6</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
ss = s.copy()
ss[2] = 0
ss
</pre></td>
<td align="center"><img width="30%" src="./figures/setvalues/set1-6data.png"></td>
<td><img width="30%" src="./figures/setvalues/set1-6.png"></td>
<td>
Seiesも同じ要領で、指定したラベルに値をセット可能。ラベル2の値7を0に更新する。
</td>
</tr>  
    
</tbody>
</table>

In [2]:
print('''
# 入力データ d（再掲）
>>> d = pd.DataFrame(
        {'x':[9, 5, 7, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']}
    )
>>> print(d)''')
d = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']}
)
print(d)

print('''
# 入力データ s（再掲）
>>> s = pd.Series([9, 5, 7, 6], name='x')
>>> print(s)''')
s = pd.Series([9, 5, 7, 6], name='x')
print(s)


print('''
# no.1-1
# []に新しい列名を指定して列をlistで指定して追加
# list以外にもSeriesやnumpy.ndarrayでも可能
>>> dd = d.copy()  # この節での例は全ては元データを更新するので、copy()してから使う
>>> dd['a'] = [4, 3, 2, 1]
>>> print(dd)''')
dd = d.copy()
dd['a'] = [4, 3, 2, 1]
print(dd)

print('''
# no.1-2
# Seriesを追加する場合は、indexに一致した行に追加される。
# 以下ではindexを逆順に振ることでその様子を明示している。
>>> dd = d.copy()
>>> dd['a'] = pd.Series([4, 3, 2, 1], index=[3, 2, 1, 0])
>>> print(dd)''')
dd = d.copy()
dd['a'] = pd.Series([4, 3, 2, 1], index=[3, 2, 1, 0])
print(dd)

print('''
# no.1-3
# Seriesの計算結果を新たにセットする例。
# x列を2倍してA列を新たに追加する例。
>>> dd = d.copy()
>>> dd['a'] = dd['x'] * 2
>>> print(dd)''')
dd = d.copy()
dd['a'] = dd['x'] * 2
print(dd)

print('''
# no.1-4
# listやSeriesでなく、1つの値を指定すると全ての行にその値が展開セットされる(ブロードキャストと呼ぶ)
>>> dd = d.copy()
>>> dd['a'] = 1
>>> print(dd)''')
dd = d.copy()
dd['a'] = 1
print(dd)

print('''
# no.1-5
# 既存の列名を指定すると、列ごと新しい値に更新される。
>>> dd = d.copy()
>>> dd['y'] = [4, 3, 2, 1]
>>> print(dd)''')
dd = d.copy()
dd['y'] = [4, 3, 2, 1]
print(dd)

print('''
# no.1-6
# Seiesも同じ要領で、指定したラベルに値をセット可能。
# ラベル2の値7を0に更新する。
>>> ss = s.copy()
>>> ss[2] = 0
>>> print(ss)''')
ss = s.copy()
ss[2] = 0
print(ss)



# 入力データ d（再掲）
>>> d = pd.DataFrame(
        {'x':[9, 5, 7, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']}
    )
>>> print(d)
   x    y    z
0  9  1.5  abc
1  5  2.0  ace
2  7  0.4  cce
3  6  1.0  dfa

# 入力データ s（再掲）
>>> s = pd.Series([9, 5, 7, 6], name='x')
>>> print(s)
0    9
1    5
2    7
3    6
Name: x, dtype: int64

# no.1-1
# []に新しい列名を指定して列をlistで指定して追加
# list以外にもSeriesやnumpy.ndarrayでも可能
>>> dd = d.copy()  # この節での例は全ては元データを更新するので、copy()してから使う
>>> dd['a'] = [4, 3, 2, 1]
>>> print(dd)
   x    y    z  a
0  9  1.5  abc  4
1  5  2.0  ace  3
2  7  0.4  cce  2
3  6  1.0  dfa  1

# no.1-2
# Seriesを追加する場合は、indexに一致した行に追加される。
# 以下ではindexを逆順に振ることでその様子を明示している。
>>> dd = d.copy()
>>> dd['a'] = pd.Series([4, 3, 2, 1], index=[3, 2, 1, 0])
>>> print(dd)
   x    y    z  a
0  9  1.5  abc  1
1  5  2.0  ace  2
2  7  0.4  cce  3
3  6  1.0  dfa  4

# no.1-3
# Seriesの計算結果を新たにセットする例。
# x列を2倍してA列を新たに追加する例。
>>> dd = d.copy()
>>> dd['a'] = dd['x'] * 2
>>> print(dd)
   x    y

---

# 2. loc[],iloc[]による値のセット

loc[],iloc[]を使えば、より柔軟に値をセットすることもできる。

### APIリファレンス
- [Series.loc](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.loc.html)
- [Series.iloc](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.iloc.html)
- [DataFrame.loc](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.loc.html)
- [DataFrame.iloc](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.iloc.html)

### 関連ドキュメント
- [indexing and selecting data](https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html)

### 入力データ

<pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
d = pd.DataFrame(
    {'x':[9, 5, 7, 6], 
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']}
)
</pre>

<table border="1" style="table-layout:fixed;width:100%;">
    <colgroup>
      <col style="width:3%;">
      <col style="width:30%;">
      <col style="width:25%;">  
      <col style="width:25%;">
      <col style="width:17%;">
    </colgroup>
<tbody>


<tr><th align="left">no.</th><th align="left">実行コード</th><th>入力</th><th>出力</th><th>備考</th></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-1</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd.loc[2, 'x'] = 10
dd
</pre></td>
<td><img width="60%" src="./figures/setvalues/set2-1data.png"></td>
<td><img width="60%" src="./figures/setvalues/set2-1.png"></td>
<td>
loc[]を使えば、部分的に値を更新/追加できる。行ラベルが2、列ラベルが'x'の値7を10に更新する。
</td>
</tr>
  
<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-2</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd.loc[2, 'a'] = 10
dd
</pre></td>
<td><img width="60%" src="./figures/setvalues/set2-2data.png"></td>
<td><img width="70%" src="./figures/setvalues/set2-2.png"></td>
<td>
loc[]で存在しないラベルを指定すれば、新たに行や列が追加される。行ラベルが2、列ラベルを新たに'a'に10をセットする。セットされた行以外の値はNaNとなる。
</td>
</tr> 
   
<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-3</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd.loc[dd['x']>=7, 'x'] = 0
dd
</pre></td>
<td><img width="60%" src="./figures/setvalues/set2-3data.png"></td>
<td><img width="60%" src="./figures/setvalues/set2-3.png"></td>
<td>
条件式と組合わせれば、その条件にマッチしたデータをセットすることも可能。<br> x列が7以上の値を0クリアする例。
</tr>
   
<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-4</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd.iloc[2, 1] = 0
dd
</pre></td>
<td><img width="60%" src="./figures/setvalues/set2-4data.png"></td>
<td><img width="60%" src="./figures/setvalues/set2-4.png"></td>
<td>
ilocを使えば、行と列の番号で値をセットすることも可能。<br>(行,列)=(2,1)に0をセットする例。
</tr> 

<tr style="background:#fff; border:1px solid #cc0000;">
<td>2-5</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd.iloc[1] = [0, 0.0, 'ooo']
dd
</pre></td>
<td><img width="60%" src="./figures/setvalues/set2-5data.png"></td>
<td><img width="60%" src="./figures/setvalues/set2-5.png"></td>
<td>
リストで行ごとセットすることも可能。
</tr> 
    

</tbody>
</table>

In [3]:
print('''
# 入力データ（再掲）
>>> d = pd.DataFrame(
        {'x':[9, 5, 7, 6], 
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']}
    )
>>> print(d)''')
d = pd.DataFrame(
    {'x':[9, 5, 7, 6], 
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']}
)
print(d)

print('''
# no.2-1
# loc[]を使えば、部分的に値を更新/追加できる。
# 行ラベルが2、列ラベルが'x'の値7を10に更新する。
>>> dd = d.copy()
>>> dd.loc[2, 'x'] = 10
>>> print(dd)''')
dd = d.copy()
dd.loc[2, 'x'] = 10
print(dd)

print('''
# no.2-2
# loc[]で存在しないラベルを指定すれば、新たに行や列が追加される。
# 行ラベルが2、列ラベルを新たに'a'に10をセットする。
# セットされた行以外の値はNaNとなる。
>>> dd = d.copy()
>>> dd.loc[2, 'a'] = 10
>>> print(dd)''')
dd = d.copy()
dd.loc[2, 'a'] = 10
print(dd)

print('''
# no.2-3
# 条件式と組合わせれば、その条件にマッチしたデータをセットすることも可能。
# x列が7以上の値を0クリアする例。
>>> dd = d.copy()
>>> dd.loc[dd['x']>=7, 'x'] = 0
>>> print(dd)''')
dd = d.copy()
dd.loc[dd['x']>=7, 'x'] = 0
print(dd)

print('''
# no.2-4
# ilocを使えば、行と列の番号で値をセットすることも可能。
# (行,列)=(2,1)に0をセットする例。
>>> dd = d.copy()
>>> dd.iloc[2, 1] = 0
>>> print(dd)''')
dd = d.copy()
dd.iloc[2, 1] = 0
print(dd)

print('''
# no.2-5
# リストで行ごとセットすることも可能。
>>> dd = d.copy()
>>> dd.iloc[1] = [0, 0.0, 'ooo']
>>> print(dd)''')
dd = d.copy()
dd.iloc[1] = [0, 0.0, 'ooo']
print(dd)



# 入力データ（再掲）
>>> d = pd.DataFrame(
        {'x':[9, 5, 7, 6], 
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']}
    )
>>> print(d)
   x    y    z
0  9  1.5  abc
1  5  2.0  ace
2  7  0.4  cce
3  6  1.0  dfa

# no.2-1
# loc[]を使えば、部分的に値を更新/追加できる。
# 行ラベルが2、列ラベルが'x'の値7を10に更新する。
>>> dd = d.copy()
>>> dd.loc[2, 'x'] = 10
>>> print(dd)
    x    y    z
0   9  1.5  abc
1   5  2.0  ace
2  10  0.4  cce
3   6  1.0  dfa

# no.2-2
# loc[]で存在しないラベルを指定すれば、新たに行や列が追加される。
# 行ラベルが2、列ラベルを新たに'a'に10をセットする。
# セットされた行以外の値はNaNとなる。
>>> dd = d.copy()
>>> dd.loc[2, 'a'] = 10
>>> print(dd)
   x    y    z     a
0  9  1.5  abc   NaN
1  5  2.0  ace   NaN
2  7  0.4  cce  10.0
3  6  1.0  dfa   NaN

# no.2-3
# 条件式と組合わせれば、その条件にマッチしたデータをセットすることも可能。
# x列が7以上の値を0クリアする例。
>>> dd = d.copy()
>>> dd.loc[dd['x']>=7, 'x'] = 0
>>> print(dd)
   x    y    z
0  0  1.5  abc
1  5  2.0  ace
2  0  0.4  cce
3  6  1.0  dfa

# no.2-4
# ilocを使えば、行と列の番号で値をセットすることも可能。
# (行,列)=(2,1)に0をセットする例。
>>> dd = d.copy()
>>> dd.i

---

# 3. assign(), insert(), append()
[],loc[],iloc[]以外にも行や列を追加する方法として、assign(), insert(), append()がある。
細かな違いはあるが、[],loc[],iloc[]でも同様のことは可能である。

### APIリファレンス
- [Series.append()](https://pandas.pydata.org/docs/reference/api/pandas.Series.append.html)
- [DataFrame.assign()](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.assign.html)
- [DataFrame.insert()](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.insert.html)
- [DataFrame.append()](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.append.html)

### 入力データ

<pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
d = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']}
)
</pre>

<table border="1" style="table-layout:fixed;width:100%;">
    <colgroup>
      <col style="width:3%;">
      <col style="width:30%;">
      <col style="width:25%;">  
      <col style="width:25%;">
      <col style="width:17%;">
    </colgroup>
<tbody>

<tr><th align="left">no.</th><th align="left">実行コード</th><th>入力</th><th>出力</th><th>備考</th></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-1</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.assign(a=[1, 2, 3, 4]))
</pre></td>
<td><img width="70%" src="./figures/setvalues/set3-1data.png"></td>
<td><img width="70%" src="./figures/setvalues/set3-1.png"></td>
<td>
assign()で新しい列aを追加する。assign()ではキーワードで列名を指定するので、キーワードで利用できない記号などの文字は使えない。また、元のデータを更新せず、新しいDataFrameを返す点が、loc[]などの方法と異なる。
</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-2</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd.insert(2, 'a', [1, 2, 3, 4])
dd
</pre></td>
<td><img width="70%" src="./figures/setvalues/set3-2data.png"></td>
<td><img width="70%" src="./figures/setvalues/set3-2.png"></td>
<td>
insert()を用いれば、任意の位置に新しい列aを追加する。1列目(y列)の後ろに挿入する。
</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>3-3</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.append(pd.Series({'x':1, 'y':1.5, 'z':'xyz'}), ignore_index=True))
</pre></td>
<td><img width="80%" src="./figures/setvalues/set3-3data.png"></td>
<td><img width="80%" src="./figures/setvalues/set3-3.png"></td>
<td>
append()は行を後ろに追加する。元のデータを更新せず、新しいDataFrameを返す。同じ列名を持ったSeriesやDataFrameを追加することが一般的である。列名がない場合は、NaNがセットされる。
</td>
</tr>
    

</tbody>
</table>

In [4]:
print('''
# 入力データ（再掲）
>>> d = pd.DataFrame(
        {'x':[9, 5, 7, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']}
    )
>>> print(d)''')
d = pd.DataFrame(
    {'x':[9, 5, 7, 6],
     'y':[1.5, 2.0, 0.4, 1.0],
     'z':['abc', 'ace', 'cce', 'dfa']}
)
print(d)

print('''
# no.3-1
# assign()で新しい列aを追加する。
# assign()ではキーワードで列名を指定するので、キーワードで利用できない文字は使えない。
# また、元のデータを更新せず、新しいDataFrameを返す点が、loc[]などの方法と異なる。
>>> print(d.assign(a=[1, 2, 3, 4]))
''')
print(d.assign(a=[1, 2, 3, 4]))

print('''
# no.3-2
# insert()を用いれば、任意の位置に新しい列aを追加する。
# 1列目(y列)の後ろに挿入する。
>>> dd = d.copy()
>>> dd.insert(2,'a', [1,2,3,4])
>>> print(dd)''')
dd = d.copy()
dd.insert(2,'a', [1,2,3,4])
print(dd)

print('''
# no.3-3
# append()は行を後ろに追加する。
# 元のデータを更新せず、新しいDataFrameを返す。
# 同じ列名を持ったSeriesやDataFrameを追加することが一般的である。
# 列名がない場合は、NaNがセットされる。
>>> print(d.append(pd.Series({'x':1, 'y':1.5, 'z':'xyz'}), ignore_index=True))''')
print(d.append(pd.Series({'x':1, 'y':1.5, 'z':'xyz'}), ignore_index=True))


# 入力データ（再掲）
>>> d = pd.DataFrame(
        {'x':[9, 5, 7, 6],
         'y':[1.5, 2.0, 0.4, 1.0],
         'z':['abc', 'ace', 'cce', 'dfa']}
    )
>>> print(d)
   x    y    z
0  9  1.5  abc
1  5  2.0  ace
2  7  0.4  cce
3  6  1.0  dfa

# no.3-1
# assign()で新しい列aを追加する。
# assign()ではキーワードで列名を指定するので、キーワードで利用できない文字は使えない。
# また、元のデータを更新せず、新しいDataFrameを返す点が、loc[]などの方法と異なる。
>>> print(d.assign(a=[1, 2, 3, 4]))

   x    y    z  a
0  9  1.5  abc  1
1  5  2.0  ace  2
2  7  0.4  cce  3
3  6  1.0  dfa  4

# no.3-2
# insert()を用いれば、任意の位置に新しい列aを追加する。
# 1列目(y列)の後ろに挿入する。
>>> dd = d.copy()
>>> dd.insert(2,'a', [1,2,3,4])
>>> print(dd)
   x    y  a    z
0  9  1.5  1  abc
1  5  2.0  2  ace
2  7  0.4  3  cce
3  6  1.0  4  dfa

# no.3-3
# append()は行を後ろに追加する。
# 元のデータを更新せず、新しいDataFrameを返す。
# 同じ列名を持ったSeriesやDataFrameを追加することが一般的である。
# 列名がない場合は、NaNがセットされる。
>>> print(d.append(pd.Series({'x':1, 'y':1.5, 'z':'xyz'}), ignore_index=True))
   x    y    z
0  9  1.5  abc
1  5  2.0  ace
2  7  0.4  cce
3  6  1.0  dfa
4  1  1.5

---

# 4. where()とmask()
与えた条件によって値をNullもしくは指定した値に置換する。

### APIリファレンス
- [Series.where](https://pandas.pydata.org/docs/reference/api/pandas.Series.where.html)
- [Series.mask](https://pandas.pydata.org/docs/reference/api/pandas.Series.mask.html)
- [DataFrame.where](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.where.html)
- [DataFrame.mask](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.mask.html)
- [numpy.where](https://numpy.org/doc/stable/reference/generated/numpy.where.html)

### 入力データ

<pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
d = pd.DataFrame({'x':[9, 2, 7, 6], 'y':[1, 2, 3, 4]})
</pre>

<table border="1" style="table-layout:fixed;width:100%;">
    <colgroup>
      <col style="width:3%;">
      <col style="width:30%;">
      <col style="width:25%;">  
      <col style="width:25%;">
      <col style="width:17%;">
    </colgroup>
<tbody>
 

<tr><th align="left">no.</th><th align="left">実行コード</th><th>入力</th><th>出力</th><th>備考</th></tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-1</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd['x'] = dd['x'].where(dd['x']>=7)
dd
</pre></td>
<td align="center"><img width="55%" src="./figures/setvalues/set4-1data.png"></td>
<td><img width="55%" src="./figures/setvalues/set4-1.png"></td>
<td>
Series.where()は、与えた条件に一致する値を残して、あとはnull値(NaN)に置換する。x列(Series)が7以上はそのままに、それ以外をNanに置換し、x列にセットする。
</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-2</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd['x'] = dd['x'].mask(dd['x']>=7)
dd
</pre></td>
<td align="center"><img width="55%" src="./figures/setvalues/set4-2data.png"></td>
<td><img width="50%" src="./figures/setvalues/set4-2.png"></td>
<td>
逆にmask()は、与えた条件に一致する値をnull値に置換して(マスクして)、あとは元のまま残す。x列が7以上はnull値置換し、それ以外はそのまま。
</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-3</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd['x'] = dd['x'].where(dd['x']>=7, 0)
dd
</pre></td>
<td align="center"><img width="50%" src="./figures/setvalues/set4-3data.png"></td>
<td><img width="50%" src="./figures/setvalues/set4-3.png"></td>
<td>
null値でなく、ある値に置換したければ、その値を指定する。x列が7以上はそのままに、それ以外を0に置換。
</td>
</tr>
 
<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-4</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd['x'] = dd['x'].where(dd['x']>=7, dd['y'])
dd
</pre></td>
<td align="center"><img width="50%" src="./figures/setvalues/set4-4data.png"></td>
<td><img width="50%" src="./figures/setvalues/set4-4.png"></td>
<td>
ある値でなくSeriesを与えると、null値に該当する位置の値で置換できる。x列が7以上はそのままに、それ以外をy列の値で置換。
</td>
</tr>
 
<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-5</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(d.where(d&lt;=2))
</pre></td>
<td align="center"><img width="50%" src="./figures/setvalues/set4-5data.png"></td>
<td><img width="50%" src="./figures/setvalues/set4-5.png"></td>
<td>
DataFrameに適用することも可能。2以下はそのままに、それ以外をnull値に置換。
</td>
</tr>

<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-6</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
dd = d.copy()
dd['x'] = np.where(dd['x']&lt;=2, 1, 0)
dd
</pre></td>
<td align="center"><img width="50%" src="./figures/setvalues/set4-6data.png"></td>
<td><img width="50%" src="./figures/setvalues/set4-6.png"></td>
<td>
np.weherを使えば、if elseによる置換が可能。x列の2以下は1に、それ以外を0に置換。
</td>
</tr>
   
<tr style="background:#fff; border:1px solid #cc0000;">
<td>4-7</td>
<td><pre style="overflow-x:auto;white-space:pre;padding: 1em; border-radius: 5px; background: #eeeeee">
print(pd.DataFrame(np.where(d&lt;=2, 1, 0), index=d.index, columns=d.columns))
</pre></td>
<td align="center"><img width="50%" src="./figures/setvalues/set4-7data.png"></td>
<td><img width="50%" src="./figures/setvalues/set4-7.png"></td>
<td>
np.weher()はDataFrameにも適用可能。2以下は1に、それ以外を0に置換。ただし、DataFrame全体に適用することで、返り値はnumpy.ndarrayとなるので、DataFrameに戻してやる必要がある。
</td>
</tr>
    


</tbody>
</table>

In [5]:
print('''
# 入力データ
>>> d = pd.DataFrame({'x':[9, 5, 7, 6], 'y':[1, 2, 3, 4]})
>>> print(d)''')
d = pd.DataFrame({'x':[9, 2, 7, 6], 'y':[1, 2, 3, 4]})
print(d)

print('''
# no.4-1
# Series.where()は、与えた条件に一致する値を残して、あとはnull値(NaN)に置換する。
# x列が7以上はそのままに、それ以外をnull値置換し、x列にセットする。
>>> dd = d.copy()
>>> dd['x'] = dd['x'].where(dd['x']>=7)
>>> print(dd)''')
dd = d.copy()
dd['x'] = dd['x'].where(dd['x']>=7)
print(dd)

print('''
# no.4-2
# 逆にmask()は、与えた条件に一致する値をnull値に置換して(マスクして)、あとは元のまま残す。
# x列が7以上はnull値置換し、それ以外はそのまま。
>>> dd = d.copy()
>>> dd['x'] = dd['x'].mask(dd['x']>=7)
>>> print(dd)''')
dd = d.copy()
dd['x'] = dd['x'].mask(dd['x']>=7)
print(dd)

print('''
# no.4-3
# null値でなく、ある値に置換したければ、その値を指定する。
# x列が7以上はそのままに、それ以外を0に置換。
>>> dd = d.copy()
>>> dd['x'] = dd['x'].where(dd['x']>=7, 0)
>>> print(dd)''')
dd = d.copy()
dd['x'] = dd['x'].where(dd['x']>=7, 0)
print(dd)

print('''
# no.4-4
# ある値でなくSeriesを与えると、null値に該当する位置の値で置換できる。
# x列が7以上はそのままに、それ以外をy列の値で置換。
>>> dd = d.copy()
>>> dd['x'] = dd['x'].where(dd['x']>=7, dd['y'])
>>> print(dd)''')
dd = d.copy()
dd['x'] = dd['x'].where(dd['x']>=7, dd['y'])
print(dd)

print('''
# no.4-5
# DataFrame全体に適用することも可能。
# 2以下はそのままに、それ以外をnull値に置換。
>>> print(d.where(d<=2))''')
print(d.where(d<=2))

print('''
# no.4-6
# np.weherを使えば、if elseによる置換が可能。
# x列の2以下は1に、それ以外を0に置換。
>>> dd = d.copy()
>>> dd['x'] = np.where(dd['x']<=2, 1, 0)
>>> print(dd)''')
dd = d.copy()
dd['x'] = np.where(dd['x']<=2, 1, 0)
print(dd)

print('''
# no.4-7
# np.weher()はDataFrameにも適用可能。
# 2以下は1に、それ以外を0に置換。
# ただし、DataFrame全体に適用することで、返り値はnumpy.ndarrayとなるので、DataFrameに戻してやる必要がある。
>>> print(pd.DataFrame(np.where(d<=2, 1, 0), index=d.index, columns=d.columns))''')
print(pd.DataFrame(np.where(d<=2, 1, 0), index=d.index, columns=d.columns))



# 入力データ
>>> d = pd.DataFrame({'x':[9, 5, 7, 6], 'y':[1, 2, 3, 4]})
>>> print(d)
   x  y
0  9  1
1  2  2
2  7  3
3  6  4

# no.4-1
# Series.where()は、与えた条件に一致する値を残して、あとはnull値(NaN)に置換する。
# x列が7以上はそのままに、それ以外をnull値置換し、x列にセットする。
>>> dd = d.copy()
>>> dd['x'] = dd['x'].where(dd['x']>=7)
>>> print(dd)
     x  y
0  9.0  1
1  NaN  2
2  7.0  3
3  NaN  4

# no.4-2
# 逆にmask()は、与えた条件に一致する値をnull値に置換して(マスクして)、あとは元のまま残す。
# x列が7以上はnull値置換し、それ以外はそのまま。
>>> dd = d.copy()
>>> dd['x'] = dd['x'].mask(dd['x']>=7)
>>> print(dd)
     x  y
0  NaN  1
1  2.0  2
2  NaN  3
3  6.0  4

# no.4-3
# null値でなく、ある値に置換したければ、その値を指定する。
# x列が7以上はそのままに、それ以外を0に置換。
>>> dd = d.copy()
>>> dd['x'] = dd['x'].where(dd['x']>=7, 0)
>>> print(dd)
   x  y
0  9  1
1  0  2
2  7  3
3  0  4

# no.4-4
# ある値でなくSeriesを与えると、null値に該当する位置の値で置換できる。
# x列が7以上はそのままに、それ以外をy列の値で置換。
>>> dd = d.copy()
>>> dd['x'] = dd['x'].where(dd['x']>=7, dd['y'])
>>> print(dd)
   x  y
0  9  1
1  2  2
2  7  3
3  4  4

# no.4-5
# DataFrame全体に適用することも可能。
# 2以下はそのままに、それ以外をnul