pandas的数据转换函数：map、apply、applymap
1. map：只用于series，实现每个值->值的映射
2. apply：用于series实现每个值的处理，用于df实现某个轴的series的处理
3. applymap：只能用于df，用于处理df中的每个元素

1. map用于series值的转换
实例：将股票代码英文名字转换为中文名字
series.map(dict) or series.map(function)均可

In [1]:
import pandas as pd
df=pd.read_csv('./data/stock/stock.csv')
df.head()

Unnamed: 0,日期,公司,收盘,开盘,高,低,交易量,涨跌幅
0,2023/3/27,BABA,86.12,87.13,88.22,85.5,18.18M,-0.90%
1,2023/3/24,BABA,86.9,85.87,88.11,85.63,20.35M,0.44%
2,2023/3/23,BABA,86.52,87.68,88.38,85.26,26.79M,3.43%
3,2023/3/22,BABA,83.65,84.84,85.39,83.51,21.08M,-0.06%
4,2023/3/21,BABA,83.7,82.46,84.09,82.0,16.44M,3.33%


In [2]:
df['公司'].unique()

array(['BABA', 'JD', 'BAIDU'], dtype=object)

In [9]:
# 公司名字的中文映射
dict_company_name={
    'baba':'阿里巴巴',
    'baidu':'百度',
    'jd':'京东'
}

方法1：series.map(dict)

In [11]:
df['中文名字1']=df['公司'].str.lower().map(dict_company_name)
df.head()

Unnamed: 0,日期,公司,收盘,开盘,高,低,交易量,涨跌幅,中文名字1,中文名字2
0,2023/3/27,BABA,86.12,87.13,88.22,85.5,18.18M,-0.90%,阿里巴巴,阿里巴巴
1,2023/3/24,BABA,86.9,85.87,88.11,85.63,20.35M,0.44%,阿里巴巴,阿里巴巴
2,2023/3/23,BABA,86.52,87.68,88.38,85.26,26.79M,3.43%,阿里巴巴,阿里巴巴
3,2023/3/22,BABA,83.65,84.84,85.39,83.51,21.08M,-0.06%,阿里巴巴,阿里巴巴
4,2023/3/21,BABA,83.7,82.46,84.09,82.0,16.44M,3.33%,阿里巴巴,阿里巴巴


方法2：series.map(function)

In [12]:
df['中文名字2']=df['公司'].map(lambda x: dict_company_name[x.lower()])
df.head()

Unnamed: 0,日期,公司,收盘,开盘,高,低,交易量,涨跌幅,中文名字1,中文名字2
0,2023/3/27,BABA,86.12,87.13,88.22,85.5,18.18M,-0.90%,阿里巴巴,阿里巴巴
1,2023/3/24,BABA,86.9,85.87,88.11,85.63,20.35M,0.44%,阿里巴巴,阿里巴巴
2,2023/3/23,BABA,86.52,87.68,88.38,85.26,26.79M,3.43%,阿里巴巴,阿里巴巴
3,2023/3/22,BABA,83.65,84.84,85.39,83.51,21.08M,-0.06%,阿里巴巴,阿里巴巴
4,2023/3/21,BABA,83.7,82.46,84.09,82.0,16.44M,3.33%,阿里巴巴,阿里巴巴


2. apply用于series和df的转换
- series.apply(function),函数的参数是每个值
- df.apply(function),函数的参数是series

series.apply(function)
函数的参数是每个值

In [13]:
df['中文名字3']=df['公司'].apply(
    lambda x:dict_company_name[x.lower()]
)
df.head()

Unnamed: 0,日期,公司,收盘,开盘,高,低,交易量,涨跌幅,中文名字1,中文名字2,中文名字3
0,2023/3/27,BABA,86.12,87.13,88.22,85.5,18.18M,-0.90%,阿里巴巴,阿里巴巴,阿里巴巴
1,2023/3/24,BABA,86.9,85.87,88.11,85.63,20.35M,0.44%,阿里巴巴,阿里巴巴,阿里巴巴
2,2023/3/23,BABA,86.52,87.68,88.38,85.26,26.79M,3.43%,阿里巴巴,阿里巴巴,阿里巴巴
3,2023/3/22,BABA,83.65,84.84,85.39,83.51,21.08M,-0.06%,阿里巴巴,阿里巴巴,阿里巴巴
4,2023/3/21,BABA,83.7,82.46,84.09,82.0,16.44M,3.33%,阿里巴巴,阿里巴巴,阿里巴巴


df.apply(function)
函数的参数是series

In [15]:
df['中文名字4']=df.apply(
    lambda x: dict_company_name[x['公司'].lower()],axis=1
)
df.head()

Unnamed: 0,日期,公司,收盘,开盘,高,低,交易量,涨跌幅,中文名字1,中文名字2,中文名字3,中文名字4
0,2023/3/27,BABA,86.12,87.13,88.22,85.5,18.18M,-0.90%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
1,2023/3/24,BABA,86.9,85.87,88.11,85.63,20.35M,0.44%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
2,2023/3/23,BABA,86.52,87.68,88.38,85.26,26.79M,3.43%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
3,2023/3/22,BABA,83.65,84.84,85.39,83.51,21.08M,-0.06%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
4,2023/3/21,BABA,83.7,82.46,84.09,82.0,16.44M,3.33%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴


注意这个代码：
    1. apply是在df上调用的
    2. lambda x的x是一个series，因为指定了axis=1，所以series的key是列明，可以用x['公司']获取到

3. applymap用于df所有值的转换

In [18]:
sub_df=df[['收盘','开盘','高','低']]

In [19]:
sub_df.head()

Unnamed: 0,收盘,开盘,高,低
0,86.12,87.13,88.22,85.5
1,86.9,85.87,88.11,85.63
2,86.52,87.68,88.38,85.26
3,83.65,84.84,85.39,83.51
4,83.7,82.46,84.09,82.0


In [20]:
# 将这些数字取整数，应用于所有元素
sub_df.applymap(lambda x : int(x))

Unnamed: 0,收盘,开盘,高,低
0,86,87,88,85
1,86,85,88,85
2,86,87,88,85
3,83,84,85,83
4,83,82,84,82
5,81,80,81,79
6,81,84,84,80
7,82,81,82,80
8,81,81,82,80
9,83,82,83,82


In [21]:
df.head()

Unnamed: 0,日期,公司,收盘,开盘,高,低,交易量,涨跌幅,中文名字1,中文名字2,中文名字3,中文名字4
0,2023/3/27,BABA,86.12,87.13,88.22,85.5,18.18M,-0.90%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
1,2023/3/24,BABA,86.9,85.87,88.11,85.63,20.35M,0.44%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
2,2023/3/23,BABA,86.52,87.68,88.38,85.26,26.79M,3.43%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
3,2023/3/22,BABA,83.65,84.84,85.39,83.51,21.08M,-0.06%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
4,2023/3/21,BABA,83.7,82.46,84.09,82.0,16.44M,3.33%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴


In [24]:
# 直接修改原表
df.loc[:,['收盘','开盘','高','低']]=sub_df.applymap(lambda x : int(x))

  df.loc[:,['收盘','开盘','高','低']]=sub_df.applymap(lambda x : int(x))


In [25]:
df.head()

Unnamed: 0,日期,公司,收盘,开盘,高,低,交易量,涨跌幅,中文名字1,中文名字2,中文名字3,中文名字4
0,2023/3/27,BABA,86,87,88,85,18.18M,-0.90%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
1,2023/3/24,BABA,86,85,88,85,20.35M,0.44%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
2,2023/3/23,BABA,86,87,88,85,26.79M,3.43%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
3,2023/3/22,BABA,83,84,85,83,21.08M,-0.06%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
4,2023/3/21,BABA,83,82,84,82,16.44M,3.33%,阿里巴巴,阿里巴巴,阿里巴巴,阿里巴巴
