In [None]:

import numpy as np
import pandas as pd
from dataclass import Potential
from data_prepare import prepare_data

df = prepare_data()

filter_name = "全国"
filter_mask = (df["省份"]!="台湾")

# filter_name = "北京"
# filter_mask = (df["省份"].isin(["北京"]))

mask = filter_mask
pt_total = Potential(
    df.loc[mask, :], name="%s城市医院整体市场" % filter_name, savepath="./plots/%s/" % filter_name
)
mask = (df["医院类型"] == "公立医院") & filter_mask
pt_hp = Potential(
    df.loc[mask, :], name="%s等级医院" % filter_name, savepath="./plots/%s/" % filter_name
)
mask = (df["医院类型"] == "社区医院") & filter_mask
pt_cm = Potential(
    df.loc[mask, :], name="%s社区医院" % filter_name, savepath="./plots/%s/" % filter_name
)
mask = (df["销售状态"] == "有销量目标医院") & filter_mask
pt_total_hassale = Potential(
    df.loc[mask, :], name="%s有量城市医院整体市场" % filter_name, savepath="./plots/%s/" % filter_name
)
mask = (df["医院类型"] == "社区医院") & (df["销售状态"] == "有销量目标医院") & filter_mask
pt_cm_hassale = Potential(
    df.loc[mask, :], name="%s有量社区医院" % filter_name, savepath="./plots/%s/" % filter_name
)
mask = (df["医院类型"] == "公立医院") & (df["销售状态"] == "有销量目标医院") & filter_mask
pt_hp_hassale = Potential(
    df.loc[mask, :], name="%s有量等级医院" % filter_name, savepath="./plots/%s/" % filter_name
)

In [None]:
# 不同医院类型潜力/指标/销售的占比饼图
pt_total.plot_share_pie(value="终端潜力值", index="医院类型")
pt_total.plot_share_pie(value="信立坦2021指标", index="医院类型")
pt_total.plot_share_pie(value="信立坦MAT销量", index="医院类型")

In [None]:
# 不同省份，城市，Decile医院类型占比
pt_total.plot_pivot_stackedbar(value="终端潜力值", 
                               index="省份", 
                               column="医院类型", 
                               line_share="社区医院",
                               unit_index="百万", 
                               y1labelthreshold=10)
pt_total.plot_pivot_stackedbar(value="终端潜力值", 
                               index="城市", 
                               column="医院类型", 
                               line_share="社区医院",
                               top=30, 
                               unit_index="百万", 
                               y1labelthreshold=10)
# pt_total.plot_pivot_stackedbar(value="终端潜力值", 
#                                index="区县", 
#                                column="医院类型", 
#                                line_share="社区医院",
#                                unit_index="百万", 
#                                y1labelthreshold=5)
pt_total.plot_pivot_stackedbar(
    value="医院名称", index="潜力分位", column="医院类型", percentage=True, y1labelthreshold=0
)

In [None]:
# 不同地区经理医院类型占比
pt_total.plot_pivot_stackedbar(value="终端潜力值", 
                               index="地区经理", 
                               column="医院类型", 
                               line_share="社区医院",
                               unit_index="百万", 
                               y1labelthreshold=10)

In [None]:
# 社区医院不同省份/城市的潜力值
pt_cm.plot_contrib_barline(value="终端潜力值", index="省份", unit_index="百万") 
pt_cm.plot_contrib_barline(value="终端潜力值", index="城市", unit_index="百万", top=30) 
# pt_cm.plot_contrib_barline(value="终端潜力值", index="区县", unit_index="百万") 

In [None]:
pt_cm.table_to_excel("医院名称", top=30)
pt_cm_hassale.table_to_excel("医院名称", top=30, sort_by="信立坦MAT销量(DOT)")

In [None]:
# 社区医院不同销售状态的家数和潜力值
pt_cm.plot_share_pie(value="终端潜力值", index="销售状态")
pt_cm.plot_share_pie(value="医院名称", index="销售状态")
pt_cm_hassale.plot_share_pie(value="终端潜力值", index="信立坦销售表现")
pt_cm_hassale.plot_share_pie(value="医院名称", index="信立坦销售表现")

In [None]:
# 社区医院不同省份/城市下分销售状态的潜力值
pt_cm.plot_pivot_stackedbar(
    value="终端潜力值", index="省份", column="销售状态", percentage=True, y1labelthreshold=2
) 
pt_cm.plot_pivot_stackedbar(
    value="终端潜力值", index="城市", column="销售状态", top=30, percentage=True, y1labelthreshold=2
) 
# pt_cm.plot_pivot_stackedbar(
#     value="终端潜力值", index="区县", column="销售状态", percentage=True, y1labelthreshold=2
# ) 
pt_cm_hassale.plot_pivot_stackedbar(
    value="终端潜力值", index="省份", column="信立坦销售表现", percentage=True, y1labelthreshold=2
) 
pt_cm_hassale.plot_pivot_stackedbar(
    value="终端潜力值", index="城市", column="信立坦销售表现", top=30, percentage=True, y1labelthreshold=2
) 
# pt_cm_hassale.plot_pivot_stackedbar(
#     value="终端潜力值", index="区县", column="信立坦销售表现", percentage=True, y1labelthreshold=2
# ) 

In [None]:
# 社区医院不同潜力分位下的销售状态
pt_cm.plot_pivot_stackedbar(
    value="终端潜力值", index="潜力分位", column="销售状态", percentage=True, percentage_label=True
) 
# 社区医院不同潜力分位下的销售状态
pt_cm_hassale.plot_pivot_stackedbar(
    value="终端潜力值", index="潜力分位", column="信立坦销售表现", percentage=True, percentage_label=True
) 

In [None]:
# 数据汇总表
pt_cm.table_to_excel(index="省份")
pt_cm.table_to_excel(index="城市", top=30)
# pt_cm.table_to_excel(index="区县")
pt_cm.table_to_excel(index="潜力分位")
pt_cm_hassale.table_to_excel(index="医院名称", top=30)
pt_cm_hassale.table_to_excel(index="医院名称", top=30, sort_by="信立坦MAT销量(DOT)")

In [None]:
# 终端潜力 vs 信立坦份额 气泡图
pt_cm.plot_2d_bubble(
    value_x="终端潜力值",
    value_y="信立坦销售份额",
    index="医院名称",
    log_x=False,
    log_y=False,
    z_scale=0.000001,
    label_limit=0,
    with_reg=False,
    fmt_y="{:.0%}",
    lim_y=[0, 1],
)


In [None]:
# 不同省份/城市的潜力 vs 信立坦销量对比
pt_cm.plot_2d_bubble(
    value_x="终端潜力值",
    value_y="信立坦MAT销量",
    index="省份",
    log_x=True,
    log_y=True,
    z_scale=15,
    label_limit=100,
)

pt_cm.plot_2d_bubble(
    value_x="终端潜力值",
    value_y="信立坦MAT销量",
    index="城市",
    log_x=True,
    log_y=True,
    z_scale=15,
    top=30,
)


In [None]:
# 不同省份/城市的潜力 vs 销售代表人数
pt_cm.plot_2d_bubble(
    value_x="终端潜力值", value_y="销售代表", index="省份", log_x=True, z_scale=15, label_limit=100
)
pt_cm.plot_2d_bubble(
    value_x="终端潜力值", value_y="销售代表", index="城市", log_x=True, z_scale=15, top=30
)

In [None]:
# 数据汇总表
pt_total.table_to_excel(lst_index=["省份", "城市","潜力分位","医院名称","事业部","区域","大区经理","地区经理"])
pt_total_hassale.table_to_excel(index="医院名称", sort_by="信立坦MAT销量(DOT)")