https://pythonviz.com/pandas/pandas-series-map-dataframe-applymap/
分析數據時，我們經常需要對每一個元素（element）進行計算和轉換（Transform）。

比方說，我們想將一群學生身高的列（column）的單位從釐米轉成米時，便需要把每個元素除以 100。

我們如何妙用 pandas 內置的功能完成這個任務？

- 可以用apply function

#### 在 Series 的 map 功能
我們首先介紹在 pandas Series (即一個列 Column）的方法。

map 功能是一個可以幫我們把一個行動（operation）按元素地使用。比方說，將身高從米轉成釐米時，map 把「乘以 10」這個行動向每一個元素使用。

Series 上的 map 主要有以下 3 個用途：

1. 使用 map 進行簡單算法運算（arithmetic operation）或條件運算（conditional operation）
2. 使用 map 映射數據
3. 使用 map 將一個 Python 功能使用在每一個元素


In [2]:
import pandas as pd
# 使用 map 進行簡單算法運算
height = pd.Series([1.67, 1.78, 1.45, 1.20])

print(height.map(lambda x: x * 100))
print(height.map(lambda x: x > 1.5))

0    167.0
1    178.0
2    145.0
3    120.0
dtype: float64
0     True
1     True
2    False
3    False
dtype: bool


使用 map 映射數據
- 這個用途比較貼近 map 這個字原來的意思。

- 譬如我們有一個我們去過的國家名稱列表（例如 ['Canada', 'Canada', 'Japan', 'Japan', 'Japan', 'Taiwan', 'Taiwan', 'United Kingdom']），而我們希望數算有多少個國家在亞洲、美洲等，如何達至這個目的？

- map 除了可以用 lambda 的型態處理每一個元素以外，我們亦可以輸入一個字典（dictionary）讓 pandas 知道每一個獨特（unique）的元素應該輸出甚麼結果（例如 Canada -> Americas，Taiwan -> Asia 等）。

In [3]:
import pandas as pd
countries_visited = pd.Series(['Canada', 'Canada', 'Japan', 'Japan', 'Japan', 'Taiwan', 'Taiwan', 'United Kingdom'])

countries_visited.map({'Canada': 'Americas', 'Japan': 'Asia', 'Taiwan': 'Asia', 'United Kingdom': 'Europe'}) #inputting a dictionary into map()

0    Americas
1    Americas
2        Asia
3        Asia
4        Asia
5        Asia
6        Asia
7      Europe
dtype: object

In [4]:
# 第 3 個用途：將 Python 功能使用在每一個元素
import pandas as pd
names = pd.Series(['Chan, Siu Wan','Lam, Tai Ming','Yung, Hong Chi'])

names.map(len)

0    13
1    13
2    14
dtype: int64

In [6]:
# 我們也可以把自訂功能使用在每一個元素上。 沿用我們國家名稱的例子，我們也可以自訂一個 continent() 的 Python 功能達到相同效果：

import pandas as pd
countries_visited = pd.Series(['Canada', 'Canada', 'Japan', 'Japan', 'Japan', 'Taiwan', 'Taiwan', 'United Kingdom'])

def continent(country):
  if country in ['Canada']: return 'Americas'
  if country in ['Japan', 'Taiwan']: return 'Asia'
  if country in ['United Kingdom']: return 'Europe'

countries_visited.map(continent) #inputting a function indicating what to return is an alternative to inputting a dictionary.

0    Americas
1    Americas
2        Asia
3        Asia
4        Asia
5        Asia
6        Asia
7      Europe
dtype: object

#### 在 DataFrame 的 applymap 功能
 pandas DataFrame 也有 applymap 這一個功能。

本質上，DataFrame 的 applymap 跟 Series 的 map 的作用一樣，但 DataFrame 的 applymap 會將您提供的字典/功能**應用在每一個 DataFrame 的元素裡**。

譬如我們有一個量度 2 個箱子長闊高（單位是米）的 DataFrame，有 3 個列（column）：height, width 和 depth。如果我們想將全部的數字變成釐米，怎麼使用 applymap 達至目的？

In [9]:
import pandas as pd
measures = pd.DataFrame({'height': [1.3,0.6],'width': [0.8,0.9],'depth':[2.5,1.5]})

measures.applymap(lambda x: x * 100)
#But note that this is just returning a new dataframe, so save it to a variable if you want to use it later on.

Unnamed: 0,height,width,depth
0,130.0,80.0,250.0
1,60.0,90.0,150.0


In [10]:
#Using apply works as well
measures.apply(lambda x: x*100)

Unnamed: 0,height,width,depth
0,130.0,80.0,250.0
1,60.0,90.0,150.0


#### map 與 apply 的分別


<img src='Difference_between_map&apply.png' width=500>
