### transformation
假如有一列数据需要转换为以1为标准差以0为平均数的标准分数，如何用pandas实现？今天我们一边介绍数据的标准化，一边感受一下transformation的用法。要知道transformation不仅仅可以实现数据的标准化，它可以实现任何你能想到的数据转换。

In [1]:
import pandas as pd
import numpy as np

In [2]:
# 创建一个Series对象
index = pd.date_range('20180823',periods=100)
# np.random.normal参数 均值 标准差 个数
ts = pd.Series(np.random.normal(0.5,2,100),index)
print(ts.head())

2018-08-23   -3.674232
2018-08-24   -1.033121
2018-08-25    3.885498
2018-08-26   -1.708932
2018-08-27    1.656924
Freq: D, dtype: float64


In [3]:
# 使用两个lambda函数key和zscore，其中zscore是transform的参数，key是groupby的参数
key = lambda x:x.month
zscore = lambda x:(x-x.mean())/x.std()
transformed = ts.groupby(key).transform(zscore)
print(type(transformed))

<class 'pandas.core.series.Series'>


In [4]:
# 经过这样的转换，每个月的数据已经转换为标准分数（每月数据平均数为0标准差为1），查看一下得到的结果的数据类型，它还是一个series对象
#验证一下结果是否正确，我们先按照月分组数据，然后再计算标准差和平均数
print(transformed.groupby(key).mean())

8     1.233581e-17
9     3.700743e-17
10    7.341797e-17
11   -4.440892e-17
dtype: float64


In [5]:
print(transformed.groupby(key).std())

8     1.0
9     1.0
10    1.0
11    1.0
dtype: float64
