## 1. 编程目标
编写本程序的目的旨在自动获取某家企业最近几年内的财务数据，并完成数据可视化。具体来说，可分为如下几步：

1. 通过Akshare模块获取某一特定个股的财务数据，包括资产负债表、利润表和现金流量表；

2. 编写一个模块使得特定年的财务数据表格能够直观的展示；


3. 提取其中较为有意义的数据进行可视化

   
4. 计算特殊的指标变化情况。

**使用前请在“输出图表”文件夹中创建一个 以股票代码数字命名的 文件夹**

## 2. 获取某一个股的财报数据
基于Akshare模块，通过同花顺网站获取数据。

In [1]:
import akshare as ak
import pandas as pd
import numpy as np
# 目标股票代码
stock_code = '688271'
# 目标信息
stock_individual_info_em_df = ak.stock_individual_info_em(symbol=stock_code)
print(stock_individual_info_em_df)

   item               value
0  股票代码              688271
1  股票简称                联影医疗
2   总股本         824157988.0
3   流通股         593298976.0
4   总市值  86726145077.240005
5  流通市值  62432851244.480003
6    行业                医疗器械
7  上市时间            20220822


股票名称是我们比较需要的数据

In [2]:
stock_name = stock_individual_info_em_df.loc[1,'value']
stock_name

'联影医疗'

同花顺数据库提供了**按照报告期、按照季度和按照年度**排列的财务数据，这里我们将分开获取不同时间跨度的财务信息。

通过indicator关键字访问不同的时间跨度的财务信息。indicator="按报告期"; choice of {"按报告期", "按年度", "按单季度"}

### 2.1 利润表
#### 2.1.1 按照年排序的利润表


In [3]:
benefit_ths_df = ak.stock_financial_benefit_ths(symbol=stock_code, indicator="按年度")
print(benefit_ths_df)

    报告期 报表核心指标       *净利润   *营业总收入  *营业总成本 *归属于母公司所有者的净利润 *扣除非经常性损益后的净利润  \
0  2023            19.78亿  114.11亿  99.60亿         19.74亿         16.65亿   
1  2022            16.50亿   92.38亿  79.43亿         16.56亿         13.28亿   
2  2021            14.04亿   72.54亿  60.49亿         14.17亿         11.66亿   
3  2020             9.37亿   57.61亿  49.62亿          9.03亿          8.78亿   
4  2019         -4804.76万   29.79亿  33.59亿      -7351.98万         -2.55亿   
5  2018            -1.32亿   20.35亿  25.56亿         -1.26亿         -3.01亿   

  报表全部指标  一、营业总收入  其中：营业收入  ...     少数股东损益 扣除非经常性损益后的净利润 六、每股收益 （一）基本每股收益  \
0         114.11亿  114.11亿  ...    346.25万        16.65亿             2.40   
1          92.38亿   92.38亿  ...   -599.84万        13.28亿             2.19   
2          72.54亿   72.54亿  ...  -1367.55万        11.66亿             1.96   
3          57.61亿   57.61亿  ...   3372.86万         8.78亿             1.30   
4          29.79亿   29.79亿  ...   2547.22万        -2.55亿            False   
5    

现在让我们看一看利润表包含哪些栏目

In [4]:
pd.set_option('display.max_columns', None)
benefit_ths_df.columns

Index(['报告期', '报表核心指标', '*净利润', '*营业总收入', '*营业总成本', '*归属于母公司所有者的净利润',
       '*扣除非经常性损益后的净利润', '报表全部指标', '一、营业总收入', '其中：营业收入', '二、营业总成本', '其中：营业成本',
       '营业税金及附加', '销售费用', '管理费用', '研发费用', '财务费用', '其中：利息费用', '利息收入', '资产减值损失',
       '信用减值损失', '加：公允价值变动收益', '投资收益', '其中：联营企业和合营企业的投资收益', '资产处置收益', '其他收益',
       '三、营业利润', '加：营业外收入', '减：营业外支出', '四、利润总额', '减：所得税费用', '五、净利润',
       '（一）持续经营净利润', '归属于母公司所有者的净利润', '少数股东损益', '扣除非经常性损益后的净利润', '六、每股收益',
       '（一）基本每股收益', '（二）稀释每股收益', '七、其他综合收益', '归属母公司所有者的其他综合收益', '八、综合收益总额',
       '归属于母公司股东的综合收益总额', '归属于少数股东的综合收益总额'],
      dtype='object')

需要将数据转化一下。

In [5]:
def money_str_to_float(money_str):
    if type(money_str)==str:
        if '万' in money_str:
            return round(float(money_str.replace('万', '')) * 0.0001,2)
        elif '亿' in money_str:
            return round(float(money_str.replace('亿', '')) *1, 2)
        else:
            return 0
    else:
        return money_str
# 将所有金钱单位转化为亿元
benefit_df_yearly = benefit_ths_df.map(money_str_to_float)[::-1]
benefit_df_yearly[['报告期','*营业总收入','*扣除非经常性损益后的净利润']]

Unnamed: 0,报告期,*营业总收入,*扣除非经常性损益后的净利润
5,2018,20.35,-3.01
4,2019,29.79,-2.55
3,2020,57.61,8.78
2,2021,72.54,11.66
1,2022,92.38,13.28
0,2023,114.11,16.65


#### a.营收利润柱状图
下面我们来作一个新图：**营业收入和净利润柱状图**

In [6]:
import pyecharts.options as opts
from pyecharts.charts import Bar, Line, Grid

"""
Gallery 使用 pyecharts 1.0.0
参考地址: https://echarts.apache.org/examples/editor.html?c=multiple-y-axis

目前无法实现的功能:

1、暂无
"""

colors = ["#5793f3", "#d14a61", "#675bba"]
x_data = [str(x) for x in benefit_df_yearly['报告期'].to_list()]
legend_list = ["利润率", "营业收入", "净利润"]
income = benefit_df_yearly['*营业总收入'].to_list()
profit = benefit_df_yearly['*扣除非经常性损益后的净利润'].to_list()
profit_rate = benefit_df_yearly['*扣除非经常性损益后的净利润']/benefit_df_yearly['*营业总收入']*100
profit_rate = profit_rate.round(1).to_list()
print(x_data)
print(income)
print(profit)
print(profit_rate)

['2018', '2019', '2020', '2021', '2022', '2023']
[20.35, 29.79, 57.61, 72.54, 92.38, 114.11]
[-3.01, -2.55, 8.78, 11.66, 13.28, 16.65]
[-14.8, -8.6, 15.2, 16.1, 14.4, 14.6]


对于图表取值范围需要做出一些限定

In [7]:
df = benefit_df_yearly[['*营业总收入','*扣除非经常性损益后的净利润']]
max_value = np.max(df)
min_value = np.min(df)
print(max_value, min_value)
topmark = np.ceil(max_value/50)*50
botmark = (np.ceil(min_value/50)-1)*50
top_rate = np.max(profit_rate)
bot_rate = np.min(profit_rate)


114.11 -3.01


In [8]:
bar = (
    Bar()
    .add_xaxis(xaxis_data=x_data)
    .add_yaxis(
        series_name="营业总收入", y_axis=income, yaxis_index=0, color=colors[1]
    )
    .add_yaxis(
        series_name="净利润", y_axis=profit, yaxis_index=1, color=colors[0]
    )
    .extend_axis(
        yaxis=opts.AxisOpts(
            name="净利润",
            type_="value",
            min_=min_value,
            max_=max_value,
            position="",
            axisline_opts=opts.AxisLineOpts(
                linestyle_opts=opts.LineStyleOpts(color=colors[0])
            ),
            axislabel_opts=opts.LabelOpts(formatter="{value} 亿元"),
        ),

    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{stock_name}营业收入-利润表", subtitle="按年度"),
        datazoom_opts=opts.DataZoomOpts(orient='horizontal'),
        xaxis_opts=opts.AxisOpts(
            axisline_opts=opts.AxisLineOpts(
                is_show=True,
                is_on_zero=True,
                on_zero_axis_index=0),
        ),
        yaxis_opts=opts.AxisOpts(
            type_="value",
            name="营收",
            min_=min_value,
            max_=max_value,
            position="left",
            offset=0,
            axisline_opts=opts.AxisLineOpts(
                linestyle_opts=opts.LineStyleOpts(color=colors[1])
            ),
            axislabel_opts=opts.LabelOpts(formatter="{value} 亿元"),
        ),
        tooltip_opts=opts.TooltipOpts(trigger="axis", axis_pointer_type="cross"),
    )
    .set_series_opts(label_opts=opts.LabelOpts(position='outside'),
                    )
)


grid = Grid(init_opts=opts.InitOpts(width="1200px", height="600px"))
grid.add(bar
         ,grid_opts=opts.GridOpts(pos_top="15%"),is_control_axis_index=True)
grid.render(f"./输出图表/{stock_code}/年度营收与利润图.html")

'/media/colin_han/数据/Coding/Data-Science-Study/financial-report-analysis/输出图表/688271/年度营收与利润图.html'

展示一下这个图表

In [9]:
from IPython.display import HTML

# 读取HTML文件内容
with open(f"./输出图表/{stock_code}/年度营收与利润图.html", 'r') as file:
    html_content = file.read()


# 在Notebook中显示HTML内容
HTML(html_content)

#### b.利润表瀑布图
先让我们看一下索引：

In [17]:
benefit_ths_df.columns

Index(['报告期', '报表核心指标', '*净利润', '*营业总收入', '*营业总成本', '*归属于母公司所有者的净利润',
       '*扣除非经常性损益后的净利润', '报表全部指标', '一、营业总收入', '其中：营业收入', '二、营业总成本', '其中：营业成本',
       '营业税金及附加', '销售费用', '管理费用', '研发费用', '财务费用', '其中：利息费用', '利息收入', '资产减值损失',
       '信用减值损失', '加：公允价值变动收益', '投资收益', '其中：联营企业和合营企业的投资收益', '资产处置收益', '其他收益',
       '三、营业利润', '加：营业外收入', '减：营业外支出', '四、利润总额', '减：所得税费用', '五、净利润',
       '（一）持续经营净利润', '归属于母公司所有者的净利润', '少数股东损益', '扣除非经常性损益后的净利润', '六、每股收益',
       '（一）基本每股收益', '（二）稀释每股收益', '七、其他综合收益', '归属母公司所有者的其他综合收益', '八、综合收益总额',
       '归属于母公司股东的综合收益总额', '归属于少数股东的综合收益总额'],
      dtype='object')

摘取有用的信息

In [22]:
cut_df = benefit_ths_df[['一、营业总收入', '其中：营业收入', '其中：营业成本',
       '营业税金及附加', '销售费用', '管理费用', '研发费用', '财务费用','加：公允价值变动收益','其中：利息费用', '投资收益', '加：公允价值变动收益', '投资收益']]
cut_df

Unnamed: 0,一、营业总收入,其中：营业收入,其中：营业成本,营业税金及附加,销售费用,管理费用,研发费用,财务费用,加：公允价值变动收益,其中：利息费用,投资收益,加：公允价值变动收益.1,投资收益.1
0,114.11亿,114.11亿,58.79亿,6949.20万,17.70亿,5.61亿,17.29亿,-1.49亿,-606.27万,702.22万,1.10亿,-606.27万,1.10亿
1,92.38亿,92.38亿,47.70亿,3835.10万,13.28亿,4.31亿,13.06亿,-9872.53万,2849.95万,642.43万,1266.70万,2849.95万,1266.70万
2,72.54亿,72.54亿,36.69亿,4313.10万,10.29亿,3.19亿,9.68亿,-2442.96万,-1058.76万,566.56万,6225.00万,-1058.76万,6225.00万
3,57.61亿,57.61亿,29.60亿,4698.27万,7.56亿,3.90亿,7.56亿,2429.10万,490.59万,4904.67万,2881.25万,490.59万,2881.25万
4,29.79亿,29.79亿,17.34亿,2905.65万,6.94亿,2.05亿,5.79亿,3968.51万,81.75万,6356.55万,2143.61万,81.75万,2143.61万
5,20.35亿,20.35亿,12.40亿,3221.72万,4.72亿,1.77亿,5.51亿,3420.07万,2.02万,4254.55万,1.02亿,2.02万,1.02亿


In [16]:
from pyecharts.charts import Bar
from pyecharts import options as opts

data = benefit_ths_df

def creat_profit_waterfall_chart(data):
# 假设你有一个DataFrame 'df'，其中包含现金流量数据
# 请根据实际情况替换这些数据
# 计算净现金流量的变化
    cumulative_data = []
    cumulative_value = 0
    for amount in data["金额"]:
        cumulative_value += amount
        cumulative_data.append(cumulative_value)

    # 创建瀑布图
    bar = (
        Bar()
        .add_xaxis(data["项目"])
        .add_yaxis("金额", data["金额"], label_opts=opts.LabelOpts(is_show=False))
        .set_global_opts(
            title_opts=opts.TitleOpts(title="现金流量瀑布图"),
            xaxis_opts=opts.AxisOpts(type_="category"),
            yaxis_opts=opts.AxisOpts(type_="value"),
        )
        .set_series_opts(
            markline_opts=opts.MarkLineOpts(
                data=[opts.MarkLineItem(type_="min"), opts.MarkLineItem(type_="max")]
            )
        )
    )
    return bar

# 渲染图表到HTML文件
bar.render("cash_flow_waterfall_chart.html")

'/media/colin_han/数据/Coding/Data-Science-Study/financial-report-analysis/cash_flow_waterfall_chart.html'

### 2.1.2 按照季度排序的利润表

单季度的表我们取最近三年的数据

In [10]:
benefit_season_df = ak.stock_financial_benefit_ths(symbol=stock_code, indicator="按单季度")
print(benefit_season_df)

           报告期 报表核心指标   *净利润  *营业总收入  *营业总成本 *归属于母公司所有者的净利润 *扣除非经常性损益后的净利润  \
0   2024-06-30         5.83亿  29.83亿  25.20亿          5.87亿          4.98亿   
1   2024-03-31         3.62亿  23.50亿  20.79亿          3.63亿          3.00亿   
2   2023-12-31         9.12亿  39.78亿  32.27亿          9.10亿          8.36亿   
3   2023-09-30         1.26亿  21.61亿  21.93亿          1.27亿       4175.81万   
4   2023-06-30         6.14亿  30.58亿  25.62亿          6.08亿          5.10亿   
5   2023-03-31         3.26亿  22.13亿  19.78亿          3.30亿          2.77亿   
6   2022-12-31         7.71亿  33.80亿  27.36亿          7.57亿          6.08亿   
7   2022-09-30         1.21亿  16.87亿  16.92亿          1.25亿       3225.45万   
8   2022-06-30         4.57亿  25.13亿  20.90亿          4.68亿          4.19亿   
9   2022-03-31         3.02亿  16.59亿  14.26亿          3.06亿          2.68亿   
10  2021-12-31         6.46亿  25.87亿  19.77亿          6.46亿         11.66亿   
11  2021-09-30         1.18亿  15.81亿  15.15亿          1.23亿     

In [11]:
a = benefit_season_df['报告期']
data = pd.concat((a,benefit_season_df[['*营业总收入','*扣除非经常性损益后的净利润']].map(money_str_to_float)),axis=1)
season_data = data[-2::-1]
season_data

Unnamed: 0,报告期,*营业总收入,*扣除非经常性损益后的净利润
12,2021-06-30,17.04,3.06
11,2021-09-30,15.81,-5.59
10,2021-12-31,25.87,11.66
9,2022-03-31,16.59,2.68
8,2022-06-30,25.13,4.19
7,2022-09-30,16.87,0.32
6,2022-12-31,33.8,6.08
5,2023-03-31,22.13,2.77
4,2023-06-30,30.58,5.1
3,2023-09-30,21.61,0.42


In [12]:
colors = ["#5793f3", "#d14a61", "#675bba"]
x_data = [str(x) for x in season_data['报告期'].to_list()]
legend_list = ["利润率", "营业收入", "净利润"]
income = season_data['*营业总收入'].to_list()
profit = season_data['*扣除非经常性损益后的净利润'].to_list()
profit_rate = season_data['*扣除非经常性损益后的净利润']/season_data['*营业总收入']*100
profit_rate = profit_rate.round(1).to_list()
print(x_data)
print(income)
print(profit)
print(profit_rate)

['2021-06-30', '2021-09-30', '2021-12-31', '2022-03-31', '2022-06-30', '2022-09-30', '2022-12-31', '2023-03-31', '2023-06-30', '2023-09-30', '2023-12-31', '2024-03-31', '2024-06-30']
[17.04, 15.81, 25.87, 16.59, 25.13, 16.87, 33.8, 22.13, 30.58, 21.61, 39.78, 23.5, 29.83]
[3.06, -5.59, 11.66, 2.68, 4.19, 0.32, 6.08, 2.77, 5.1, 0.42, 8.36, 3.0, 4.98]
[18.0, -35.4, 45.1, 16.2, 16.7, 1.9, 18.0, 12.5, 16.7, 1.9, 21.0, 12.8, 16.7]


In [13]:
df = season_data[['*营业总收入','*扣除非经常性损益后的净利润']]
max_value =np.ceil(np.max(df)/10)*10
min_value = np.ceil(np.min(df)/10-1)*10
print(max_value, min_value)

top_rate = np.max(profit_rate)
bot_rate = np.min(profit_rate)

40.0 -10.0


做一个新图表，只有净利润和营业收入

In [14]:
bar = (
    Bar()
    .add_xaxis(xaxis_data=x_data)
    .add_yaxis(
        series_name="营业总收入", y_axis=income, yaxis_index=0, color=colors[1]
    )
    .add_yaxis(
        series_name="净利润", y_axis=profit, yaxis_index=1, color=colors[0]
    )
    .extend_axis(
        yaxis=opts.AxisOpts(
            name="净利润",
            type_="value",
            min_=min_value,
            max_=max_value,
            position="",
            axisline_opts=opts.AxisLineOpts(
                linestyle_opts=opts.LineStyleOpts(color=colors[0])
            ),
            axislabel_opts=opts.LabelOpts(formatter="{value} 亿元"),
        ),

    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title=f"{stock_name}营业收入-利润表", subtitle="按年度"),
        datazoom_opts=opts.DataZoomOpts(orient='horizontal'),
        xaxis_opts=opts.AxisOpts(
            axisline_opts=opts.AxisLineOpts(
                is_show=True,
                is_on_zero=True,
                on_zero_axis_index=0),
        ),
        yaxis_opts=opts.AxisOpts(
            type_="value",
            name="营收",
            min_=min_value,
            max_=max_value,
            position="left",
            offset=0,
            axisline_opts=opts.AxisLineOpts(
                linestyle_opts=opts.LineStyleOpts(color=colors[1])
            ),
            axislabel_opts=opts.LabelOpts(formatter="{value} 亿元"),
        ),
        tooltip_opts=opts.TooltipOpts(trigger="axis", axis_pointer_type="cross"),
    )
    .set_series_opts(label_opts=opts.LabelOpts(position='outside'),
                    )
)


grid = Grid(init_opts=opts.InitOpts(width="1200px", height="600px"))
grid.add(bar
         ,grid_opts=opts.GridOpts(pos_top="15%"),is_control_axis_index=True)
grid.render(f"./输出图表/{stock_code}/最近三年单季度营收与利润图.html")

'/media/colin_han/数据/Coding/Data-Science-Study/financial-report-analysis/输出图表/688271/最近三年单季度营收与利润图.html'

In [15]:
# 读取HTML文件内容
with open(f'{stock_name}最近三年单季度营收与利润图.html', 'r') as file:
    html_content = file.read()


# 在Notebook中显示HTML内容
HTML(html_content)