In [None]:
import numpy as np
import pandas as pd
from dataclass import Potential
from data_prepare import prepare_data

df = prepare_data()
mask = df["省份"].isin(["上海", "江苏", '山东', '安徽'])
pt_total = Potential(df.loc[mask, :], name="东区市场", savepath="./plots/东区/")
mask = (df["医院类型"] == "公立医院") & (df["省份"].isin(["上海", "江苏", '山东', '安徽']))
pt_hp = Potential(df.loc[mask, :], name="东区等级医院", savepath="./plots/东区/")
mask = (df["医院类型"] == "社区医院") & (df["省份"].isin(["上海", "江苏", '山东', '安徽']))
pt_cm = Potential(df.loc[mask, :], name="东区社区医院", savepath="./plots/东区/")

mask = (df["医院类型"] == "社区医院") & (df["销售状态"] == "有销量目标医院") & df["省份"].isin(["上海", "江苏", '山东', '安徽'])
pt_cm_hassale = Potential(df.loc[mask, :], name="东区有量社区医院", savepath="./plots/东区/")

In [None]:
# 不同医院类型潜力/指标/销售的占比饼图
pt_total.plot_share_pie(value="终端潜力值", index="医院类型")
pt_total.plot_share_pie(value="信立坦2021指标", index="医院类型")
pt_total.plot_share_pie(value="信立坦同期销量", index="医院类型")

In [None]:
# 不同省份，城市，Decile医院类型占比
pt_total.plot_pivot_stackedbar(value="终端潜力值", 
                               index="省份", 
                               column="医院类型", 
                               line_share="社区医院",
                               unit_index="百万", 
                               y1labelthreshold=10)
pt_total.plot_pivot_stackedbar(value="终端潜力值", 
                               index="城市", 
                               column="医院类型", 
                               line_share="社区医院",
                               top=30, 
                               unit_index="百万", 
                               y1labelthreshold=10)

In [None]:
# 社区医院不同省份/城市的潜力值
pt_cm.plot_contrib_barline(value="终端潜力值", index="省份", unit_index="百万") 
pt_cm.plot_contrib_barline(value="终端潜力值", index="城市", unit_index="百万", top=30) 
# 不同潜力分位下的医院类型
pt_total.plot_pivot_stackedbar(
    value="医院名称", index="潜力分位", column="医院类型", percentage=True, y1labelthreshold=0
)

In [None]:
pt_cm.table_to_excel("医院名称", top=30)

In [None]:
# 社区医院不同销售状态的家数和潜力值
pt_cm.plot_share_pie(value="终端潜力值", index="销售状态")
pt_cm.plot_share_pie(value="医院名称", index="销售状态")
pt_cm_hassale.plot_share_pie(value="终端潜力值", index="信立坦销售表现")
pt_cm_hassale.plot_share_pie(value="医院名称", index="信立坦销售表现")

In [None]:
# 社区医院不同省份/城市下分销售状态的潜力值
pt_cm.plot_pivot_stackedbar(
    value="终端潜力值", index="省份", column="销售状态", unit_index="百万", y1labelthreshold=2
) 
pt_cm.plot_pivot_stackedbar(
    value="终端潜力值", index="城市", column="销售状态", unit_index="百万", top=30, y1labelthreshold=2
) 
pt_cm_hassale.plot_pivot_stackedbar(
    value="终端潜力值", index="省份", column="信立坦销售表现", unit_index="百万", y1labelthreshold=2
) 
pt_cm_hassale.plot_pivot_stackedbar(
    value="终端潜力值", index="城市", column="信立坦销售表现", unit_index="百万", top=30, y1labelthreshold=2
) 

In [None]:
# 社区医院不同潜力分位下的销售状态
pt_cm.plot_pivot_stackedbar(
    value="医院名称", index="潜力分位", column="销售状态", percentage=True
) 
# 社区医院不同潜力分位下的销售状态
pt_cm_hassale.plot_pivot_stackedbar(
    value="医院名称", index="潜力分位", column="信立坦销售表现", percentage=True
) 

In [6]:
# 数据汇总表
pt_cm.table_to_excel(index="省份")
pt_cm.table_to_excel(index="城市", top=30)
pt_cm.table_to_excel(index="潜力分位")
pt_cm_hassale.table_to_excel(index="医院名称", top=30)

In [4]:
# 终端潜力 vs 信立坦份额 气泡图
pt_cm.plot_2d_bubble(
    value_x="终端潜力值",
    value_y="信立坦销售份额",
    index="医院名称",
    log_x=False,
    log_y=False,
    z_scale=0.000001,
    label_limit=0,
    with_reg=False,
    fmt_y="{:.0%}"
)


                          终端潜力值
医院名称                           
张家港市杨舍镇社区卫生服务中心    3.425263e+06
南京市建邺区南湖社区卫生服务中心   2.756794e+06
张家港市金港镇社区卫生服务中心    2.487387e+06
锦丰镇社区卫生服务中心        2.371262e+06
苏州工业园区唯亭社区卫生服务中心   2.157652e+06
...                         ...
孚玉镇社区卫生服务中心        2.721059e+01
亳州市涡阳县城东社区卫生服务中心   2.673461e+01
亳州市利辛县城关镇社区卫生服务中心  2.666978e+01
亳州市谯城区花戏楼社区卫生服务中心  2.658310e+01
利辛县城南社区卫生服务中心      2.579002e+01

[2729 rows x 1 columns]
                                    信立坦销售份额
医院名称                                       
南京市玄武区新街口社区卫生服务中心（玄武医院）            0.815271
南京市鼓楼区小市社区卫生服务中（原：南京市下关区小市医院）      0.814577
南京市鼓楼区热河南路街道社区卫生服务中心               0.814459
华润苏州礼安医药有限公司太仓分公司【太仓市城厢镇社区卫生服务中心】  0.809078
市北区辽源路社区卫生服务中心                     0.809078
...                                     ...
龙口市惠民医保门诊部(原：龙口市社会劳动保险卫生所)         0.000000
市北华夏门诊部                           -0.000479
河西街道军益民社区卫生服务站                    -0.000519
李沧明岐医疗刘家医务室                       -0.001848
青岛市北区同安路街道社区卫生服务站              

In [None]:
# 不同省份/城市的潜力 vs 信立坦销量对比
pt_cm.plot_2d_bubble(
    value_x="终端潜力值",
    value_y="信立坦同期销量",
    index="省份",
    log_x=True,
    log_y=True,
    z_scale=15,
    label_limit=100,
)

pt_cm.plot_2d_bubble(
    value_x="终端潜力值",
    value_y="信立坦同期销量",
    index="城市",
    log_x=True,
    log_y=True,
    z_scale=15,
    top=30,
)


In [None]:
# 不同省份/城市的潜力 vs 销售代表人数
pt_cm.plot_2d_bubble(
    value_x="终端潜力值", value_y="销售代表", index="省份", log_x=True, z_scale=15, label_limit=100
)
pt_cm.plot_2d_bubble(
    value_x="终端潜力值", value_y="销售代表", index="城市", log_x=True, z_scale=15, top=30
)