In [None]:
import numpy as np
import pandas as pd
from dataclass import Potential
from data_prepare import prepare_data

df = prepare_data()
pt_total = Potential(df, name="城市医院整体市场")
pt_hp = Potential(df[df["医院类型"] == "公立医院"], name="公立医院")
pt_cm = Potential(df[df["医院类型"] == "社区医院"], name="社区医院")

In [None]:
# 不同医院类型潜力/指标/销售的占比饼图
pt_total.plot_share_pie(value="终端潜力值", index="医院类型", aggfunc=sum)
pt_total.plot_share_pie(value="信立坦2021指标", index="医院类型", aggfunc=sum)
pt_total.plot_share_pie(value="信立坦同期销量", index="医院类型", aggfunc=sum)

In [None]:
# 不同省份，城市医院类型占比
pt_total.plot_pivot_stackedbar(value="终端潜力值", 
                               index="省份", 
                               column="医院类型", 
                               line_share="社区医院",
                               aggfunc=sum, 
                               unit_index="百万", 
                               y1labelthreshold=10)
pt_total.plot_pivot_stackedbar(value="终端潜力值", 
                               index="城市", 
                               column="医院类型", 
                               line_share="社区医院",
                               top=30, 
                               aggfunc=sum, 
                               unit_index="百万", 
                               y1labelthreshold=10)

In [11]:
# 社区医院不同省份/城市的潜力值
pt_cm.plot_contrib_barline(value="终端潜力值", index="省份", unit_index="百万", aggfunc=sum) 
pt_cm.plot_contrib_barline(value="终端潜力值", index="城市", unit_index="百万", top=30, aggfunc=sum) 

            终端潜力值
省份               
江苏   1.866328e+08
北京   1.850880e+08
浙江   1.709857e+08
上海   1.162377e+08
广东   5.273818e+07
山东   5.256143e+07
福建   4.334211e+07
河北   4.131629e+07
四川   3.319368e+07
湖北   2.869159e+07
辽宁   2.682517e+07
黑龙江  2.659888e+07
内蒙古  2.157682e+07
湖南   1.975845e+07
天津   1.866037e+07
河南   1.809699e+07
山西   1.704712e+07
重庆   1.301787e+07
吉林   1.148131e+07
新疆   1.138347e+07
陕西   9.435972e+06
江西   8.969678e+06
云南   7.539573e+06
安徽   7.304917e+06
贵州   6.470266e+06
广西   6.433273e+06
甘肃   5.398086e+06
海南   2.063695e+06
青海   1.974511e+06
宁夏   1.761529e+06
西藏   1.085755e+06
./plots/社区医院各省份潜力DOT（百万）贡献及累积占比柱状图.png has been saved...
            终端潜力值
城市               
北京市  1.850880e+08
上海市  1.162377e+08
苏州市  7.382222e+07
南京市  6.062784e+07
杭州市  5.434202e+07
..            ...
济源市  5.320290e+04
崇左市  4.518508e+04
儋州市  2.337897e+04
滁州市  1.290296e+04
蚌埠市  6.428962e+03

[333 rows x 1 columns]
./plots/社区医院TOP30城市潜力DOT（百万）贡献及累积占比柱状图.png has been saved...


In [12]:
# 社区医院不同省份/城市下分销售状态的潜力值
pt_cm.plot_pivot_stackedbar(
    value="终端潜力值", index="省份", column="销售状态", unit_index="百万", aggfunc=sum, y1labelthreshold=2
) 
pt_cm.plot_pivot_stackedbar(
    value="终端潜力值", index="城市", column="销售状态", unit_index="百万", top=30, aggfunc=sum, y1labelthreshold=2
) 

          有销量目标医院       无销量目标医院         非目标医院
省份                                           
江苏   5.197249e+07  9.059704e+07  4.406324e+07
北京   9.151544e+07  8.341557e+07  1.015697e+07
浙江   5.687388e+07  6.563864e+07  4.847319e+07
上海   6.316328e+07  2.030581e+07  3.276859e+07
广东   5.730866e+06  1.653858e+07  3.046874e+07
山东   2.255869e+07  9.964654e+06  2.003808e+07
福建   2.927629e+07  5.235901e+06  8.829915e+06
河北   4.244304e+05  1.813595e+06  3.907827e+07
四川   3.654904e+06  5.461310e+06  2.407747e+07
湖北   2.354577e+05  1.312606e+06  2.714352e+07
辽宁            NaN           NaN  2.682517e+07
黑龙江           NaN           NaN  2.659888e+07
内蒙古           NaN           NaN  2.157682e+07
湖南   1.978449e+05  5.245042e+04  1.950815e+07
天津   8.768601e+06  7.513492e+06  2.378275e+06
河南   1.539269e+05  3.576222e+04  1.790730e+07
山西   5.998898e+04  5.817721e+04  1.692895e+07
重庆   5.501981e+05  1.272378e+06  1.119529e+07
吉林   7.577797e+04  3.976509e+04  1.136577e+07
新疆   5.353304e+05  1.077293e+06  9

In [None]:
# 不同潜力分位下的医院类型
pt_total.plot_pivot_stackedbar(
    value="医院名称", index="潜力分位", column="医院类型", aggfunc=len, percentage=True
)
# 社区医院不同潜力分位下的销售状态
pt_cm.plot_pivot_stackedbar(
    value="医院名称", index="潜力分位", column="销售状态", aggfunc=len, percentage=True
) 