In [1]:
import pandas as pd
import numpy as np

pd.__version__

'0.23.4'

<img src="img/styling_overview.png">

# 最初の一歩

In [3]:
exam_df = pd.read_csv('data/styling_sample.csv', index_col='index', encoding='utf-8')

In [4]:
exam_df

Unnamed: 0_level_0,Araki,Baba,Chou
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
国語,75,80,95
数学,55,80,70
理科,80,90,85
社会,90,30,70


In [7]:
exam_df.style

Unnamed: 0_level_0,Araki,Baba,Chou
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
国語,75,80,95
数学,55,80,70
理科,80,90,85
社会,90,30,70


In [8]:
type(exam_df.style)

pandas.io.formats.style.Styler

In [9]:
# のぞいてみよう
exam_df.style.render().split('\n')[:20]

['<style  type="text/css" >',
 '</style>  ',
 '<table id="T_3180095a_7f62_11e9_abcd_94942601c652" > ',
 '<thead>    <tr> ',
 '        <th class="blank level0" ></th> ',
 '        <th class="col_heading level0 col0" >Araki</th> ',
 '        <th class="col_heading level0 col1" >Baba</th> ',
 '        <th class="col_heading level0 col2" >Chou</th> ',
 '    </tr>    <tr> ',
 '        <th class="index_name level0" >index</th> ',
 '        <th class="blank" ></th> ',
 '        <th class="blank" ></th> ',
 '        <th class="blank" ></th> ',
 '    </tr></thead> ',
 '<tbody>    <tr> ',
 '        <th id="T_3180095a_7f62_11e9_abcd_94942601c652level0_row0" class="row_heading level0 row0" >国語</th> ',
 '        <td id="T_3180095a_7f62_11e9_abcd_94942601c652row0_col0" class="data row0 col0" >75</td> ',
 '        <td id="T_3180095a_7f62_11e9_abcd_94942601c652row0_col1" class="data row0 col1" >80</td> ',
 '        <td id="T_3180095a_7f62_11e9_abcd_94942601c652row0_col2" class="data row0 col2" >95</td

In [10]:
# スタイル関数の定義
def color_all_red(val):
    return 'color: red'

In [11]:
# 全てのセルの文字色を赤くする
s = exam_df.style.applymap(color_all_red)
s

Unnamed: 0_level_0,Araki,Baba,Chou
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
国語,75,80,95
数学,55,80,70
理科,80,90,85
社会,90,30,70


In [12]:
s.render().split('\n')[:20]

['<style  type="text/css" >',
 '    #T_326adb68_7f62_11e9_9ebd_94942601c652row0_col0 {',
 '            color:  red;',
 '            color:  red;',
 '        }    #T_326adb68_7f62_11e9_9ebd_94942601c652row0_col1 {',
 '            color:  red;',
 '            color:  red;',
 '        }    #T_326adb68_7f62_11e9_9ebd_94942601c652row0_col2 {',
 '            color:  red;',
 '            color:  red;',
 '        }    #T_326adb68_7f62_11e9_9ebd_94942601c652row1_col0 {',
 '            color:  red;',
 '            color:  red;',
 '        }    #T_326adb68_7f62_11e9_9ebd_94942601c652row1_col1 {',
 '            color:  red;',
 '            color:  red;',
 '        }    #T_326adb68_7f62_11e9_9ebd_94942601c652row1_col2 {',
 '            color:  red;',
 '            color:  red;',
 '        }    #T_326adb68_7f62_11e9_9ebd_94942601c652row2_col0 {']

In [13]:
type(s)

pandas.io.formats.style.Styler

やっていることは次の2点です
- **スタイル関数**を用意する
    - ここでは、`color_all_red`関数を自分で定義している
- スタイル関数を、`apply_map`メソッドを使って要素全体に適用する
    - `apply_map`は`Styler`オブジェクトを返す

# データによって色を変えてみよう
## 赤点（60点未満）を赤字で、それ以外を黒字で表示する
先ほど作ったスタイル関数`color_all_red`は、「常に`'color: red'`（文字色を赤にする）を返す」という処理でした。   
ですが実務的には「値が●●以上のセルは、赤文字にする」「nullのセルは背景色をグレーにする」など、「データの条件によってスタイルを変える」ことが普通です。    
そのため実際には、スタイル関数の中でセルの値に応じて異なるスタイルを返す処理を書きます。   
   
以下は、「60点未満の値だったら赤字で、それ以外の場合は黒字で表示する」スタイル関数を適用する例です。

In [14]:
def color_red_akaten(val):
    color = 'red' if val < 60 else 'black'
    return f'color: {color}'

In [15]:
s = exam_df.style.applymap(color_red_akaten)
s

Unnamed: 0_level_0,Araki,Baba,Chou
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
国語,75,80,95
数学,55,80,70
理科,80,90,85
社会,90,30,70


In [16]:
s.render().split('\n')[:20]

['<style  type="text/css" >',
 '    #T_344d8ae8_7f62_11e9_b489_94942601c652row0_col0 {',
 '            color:  black;',
 '            color:  black;',
 '        }    #T_344d8ae8_7f62_11e9_b489_94942601c652row0_col1 {',
 '            color:  black;',
 '            color:  black;',
 '        }    #T_344d8ae8_7f62_11e9_b489_94942601c652row0_col2 {',
 '            color:  black;',
 '            color:  black;',
 '        }    #T_344d8ae8_7f62_11e9_b489_94942601c652row1_col0 {',
 '            color:  red;',
 '            color:  red;',
 '        }    #T_344d8ae8_7f62_11e9_b489_94942601c652row1_col1 {',
 '            color:  black;',
 '            color:  black;',
 '        }    #T_344d8ae8_7f62_11e9_b489_94942601c652row1_col2 {',
 '            color:  black;',
 '            color:  black;',
 '        }    #T_344d8ae8_7f62_11e9_b489_94942601c652row2_col0 {']

### 演習問題
「80点以上のセルの背景色を水色にする」ように、スタイル関数を変えてみよう。

# 列全体、行全体
先ほどまでの「値が負値かどうか」「値がnullかどうか」は、その要素単体を見れば判断できました。   
では、「全ての行で一番大きい値の背景色を黄色にする」「全ての列で一番小さい値の文字を太字にする」といった場合はどうすればよいでしょうか。   
このようなケースでは、要素単体の値からは判断できないので、「列全体」「行全体」「テーブル全体」を見て判断する必要があります。   
このような場合は、 `apply_map` ではなく、`apply`を使います。  
`apply`が返す値をイメージしやすくするため、まずは「常に背景色を黄色にする」関数を作成します。

In [17]:
def highlight_green_max(series):
    # 最大値だったらyellow, それ以外だったらnone(スタイルなし)にする
    color_list = ['lightgreen' if val == series.max() else 'none' for val in series]
    
    # 中身の確認
    print(color_list)
    
    return [f'background-color: {color}' for color in color_list]

In [18]:
# 各生徒において一番成績がよかった教科はどれ？
exam_df.style.apply(highlight_green_max, axis=0) # axis=0だと、列全体を見る

['none', 'none', 'none', 'lightgreen']
['none', 'none', 'lightgreen', 'none']
['lightgreen', 'none', 'none', 'none']


Unnamed: 0_level_0,Araki,Baba,Chou
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
国語,75,80,95
数学,55,80,70
理科,80,90,85
社会,90,30,70


In [19]:
exam_df.style.apply(highlight_green_max, axis=1) # axis=1だと、行全体を見る

['none', 'none', 'lightgreen']
['none', 'lightgreen', 'none']
['none', 'lightgreen', 'none']
['lightgreen', 'none', 'none']


Unnamed: 0_level_0,Araki,Baba,Chou
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
国語,75,80,95
数学,55,80,70
理科,80,90,85
社会,90,30,70


# `applymap`と`apply`のまとめ
<img src="img/applymap_apply.png">

# スタイルの重ねがけ

In [20]:
exam_df.style.apply(highlight_green_max, axis=0).applymap(color_red_akaten)

['none', 'none', 'none', 'lightgreen']
['none', 'none', 'lightgreen', 'none']
['lightgreen', 'none', 'none', 'none']


Unnamed: 0_level_0,Araki,Baba,Chou
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
国語,75,80,95
数学,55,80,70
理科,80,90,85
社会,90,30,70


# ビルトインのスタイル関数
## よく使うやつは、あらかじめ準備されている

### highlight_max, highlight_min

In [21]:
exam_df.style.highlight_max()

Unnamed: 0_level_0,Araki,Baba,Chou
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
国語,75,80,95
数学,55,80,70
理科,80,90,85
社会,90,30,70


In [22]:
exam_df.style.highlight_min()

Unnamed: 0_level_0,Araki,Baba,Chou
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
国語,75,80,95
数学,55,80,70
理科,80,90,85
社会,90,30,70


### highlight_null

In [26]:
sample_df = pd.read_csv('data/styling_sample_02.csv')

In [27]:
sample_df

Unnamed: 0,A,B
0,0.0,
1,10.0,80.0
2,20.0,60.0
3,30.0,40.0
4,40.0,20.0
5,,0.0
6,60.0,-20.0
7,70.0,-40.0
8,80.0,-60.0
9,100.0,-80.0


In [28]:
sample_df.style.highlight_null()

Unnamed: 0,A,B
0,0.0,
1,10.0,80.0
2,20.0,60.0
3,30.0,40.0
4,40.0,20.0
5,,0.0
6,60.0,-20.0
7,70.0,-40.0
8,80.0,-60.0
9,100.0,-80.0


### bar

In [30]:
sample_df.style.bar()

Unnamed: 0,A,B
0,0.0,
1,10.0,80.0
2,20.0,60.0
3,30.0,40.0
4,40.0,20.0
5,,0.0
6,60.0,-20.0
7,70.0,-40.0
8,80.0,-60.0
9,100.0,-80.0


In [31]:
sample_df.style.bar(align='mid')

Unnamed: 0,A,B
0,0.0,
1,10.0,80.0
2,20.0,60.0
3,30.0,40.0
4,40.0,20.0
5,,0.0
6,60.0,-20.0
7,70.0,-40.0
8,80.0,-60.0
9,100.0,-80.0


In [32]:
sample_df.style.bar(align='mid', color='skyblue')

Unnamed: 0,A,B
0,0.0,
1,10.0,80.0
2,20.0,60.0
3,30.0,40.0
4,40.0,20.0
5,,0.0
6,60.0,-20.0
7,70.0,-40.0
8,80.0,-60.0
9,100.0,-80.0


In [33]:
sample_df.style.bar(align='mid', color=['red', 'lightgreen'])

Unnamed: 0,A,B
0,0.0,
1,10.0,80.0
2,20.0,60.0
3,30.0,40.0
4,40.0,20.0
5,,0.0
6,60.0,-20.0
7,70.0,-40.0
8,80.0,-60.0
9,100.0,-80.0


# スタイルを適用する範囲を絞る

In [34]:
sample_df.style.bar(subset=['A'])

Unnamed: 0,A,B
0,0.0,
1,10.0,80.0
2,20.0,60.0
3,30.0,40.0
4,40.0,20.0
5,,0.0
6,60.0,-20.0
7,70.0,-40.0
8,80.0,-60.0
9,100.0,-80.0


# キャプションをつける(`set_caption`)

In [35]:
exam_df.style.applymap(color_red_akaten).set_caption("期末試験の結果")

Unnamed: 0_level_0,Araki,Baba,Chou
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
国語,75,80,95
数学,55,80,70
理科,80,90,85
社会,90,30,70


# Excelにスタイル付でエクスポートする

## to_excel
openpyxlを別途インストールする必要があります。

In [36]:
exam_df.style.highlight_max().to_excel('exam_df.xlsx')

# Stylingの注意点

- まだ開発途上だよ
- スタイルのデコりすぎに注意しよう
    - コードがどんどん長くなる
- GitHubにupしたときはスタイルが消えるよ
    - nbviewerを使うとスタイルが保持されるよ

# より詳しくは
**User Guide**   
https://pandas.pydata.org/pandas-docs/stable/user_guide/style.html   

**API Reference**   
https://pandas.pydata.org/pandas-docs/stable/reference/style.html