In [1]:
import pandas as pd
import numpy as np

In [28]:
df = pd.DataFrame(data={
    "boss":["A"]*3+["B"]*3+["C"]*4,
    "owner":["A1","A1","A2","B1","B2","B2","C1","C1","C2","C2"],
    "month":[1,2,1,1,1,2,1,2,1,2],
    "fk_money":[10,20,30,40,50,60,70,80,90,100],
})

In [29]:
df

Unnamed: 0,boss,owner,month,fk_money
0,A,A1,1,10
1,A,A1,2,20
2,A,A2,1,30
3,B,B1,1,40
4,B,B2,1,50
5,B,B2,2,60
6,C,C1,1,70
7,C,C1,2,80
8,C,C2,1,90
9,C,C2,2,100


### 数据解释：
比如第一条数据，老板A手下的业务员A1，在第1个月放款金额为10万。

### 问题一：每个老板手下，那个业务员放款金额最多？
解决方法：
- 按照owner分组，对fk_money降序排列，取第一个数据


In [48]:
result1_df = df.sort_values(by="fk_money",ascending=False).groupby(by="owner").head(1)

In [49]:
result1_df

Unnamed: 0,boss,owner,month,fk_money
9,C,C2,2,100
7,C,C1,2,80
5,B,B2,2,60
3,B,B1,1,40
2,A,A2,1,30
1,A,A1,2,20


#### 拓展：如何取第二大的数据呢？
- GroupBy.nth()，取每一组第n行的数据，n从0开始。0代表第一行。
- 没有第n行的时候，不取。

In [52]:
result1_df = df.sort_values(by="fk_money",ascending=False).groupby(by="owner").nth(1)

In [53]:
result1_df

Unnamed: 0_level_0,boss,month,fk_money
owner,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
A1,A,1,10
B2,B,1,50
C1,C,1,70
C2,C,1,90


### 问题二：业务员每个月的放款金额占比情况？
解决方案：
1. 计算出每个业务员总的放款金额owner_total_fk_money
2. 将df与计算好的owner_total_fk_money合并
3. fk_money除以owner_total_fk_money得到需要的数据

In [33]:
### 代码实现：
owner_total_fk_money = df.groupby(by="owner",as_index=False).agg({"fk_money":"sum"})

In [37]:
result1_df = pd.merge(df,owner_total_fk_money,on="owner",how="left",suffixes=("","_total"))

In [39]:
result1_df["rate"] = (result1_df["fk_money"]/result1_df["fk_money_total"]).map(lambda x:"{:.2%}".format(x))

In [40]:
result1_df

Unnamed: 0,boss,owner,month,fk_money,fk_money_total,rate
0,A,A1,1,10,30,33.33%
1,A,A1,2,20,30,66.67%
2,A,A2,1,30,30,100.00%
3,B,B1,1,40,40,100.00%
4,B,B2,1,50,110,45.45%
5,B,B2,2,60,110,54.55%
6,C,C1,1,70,150,46.67%
7,C,C1,2,80,150,53.33%
8,C,C2,1,90,190,47.37%
9,C,C2,2,100,190,52.63%


### 结果解释：
A1业务员在第一个月放款10万，占其总放款（30万）比例为33.33%，第二个月放款20万，占比为66.67%

### 问题三：每个老板手下业务员放款占比？
解决思路：
1. 需要知道每个老板总的放款金额，boss_df
2. 需要知道每个业务员的放款金额，owner_df
3. 马昭boss字段合并boss_df和owner_df
4. 业务员的放款金额除以每个老板总的放款金额

In [23]:
# 计算每一个boss的总fk_money
boss_df = df.groupby(by="boss",as_index=False).agg({"fk_money":"sum"})

In [24]:
# 计算每一个owner的总fk_money
owner_df = df.groupby(by=["boss","owner"],as_index=False).agg({"fk_money":"sum"})

In [41]:
# 合并owner_df和boss_df
result2_df = pd.merge(owner_df,boss_df,on="boss",how="left",suffixes=("_owner","_boss"))

In [42]:
result2_df["占比"] = (result_df["fk_money_owner"]/result_df["fk_money_boss"]).map(lambda x:"{:.2%}".format(x))

In [43]:
result2_df

Unnamed: 0,boss,owner,fk_money_owner,fk_money_boss,占比
0,A,A1,30,60,50.00%
1,A,A2,30,60,50.00%
2,B,B1,40,150,26.67%
3,B,B2,110,150,73.33%
4,C,C1,150,340,44.12%
5,C,C2,190,340,55.88%
