## 浙江省财政收入规模与增速变化

In [2]:
import polars as pl
import altair as alt
import pandas as pd

# 读取Excel文件
df_raw = pl.read_excel(
    "../data/12-2 地方一般预算收入和支出（2018-2022年）.xlsx",
    sheet_name="12-2 地方一般预算收入和支出（2018-2022年）",
    read_options={"header_row": 2}  # 作为列名
)
# # 查看数据结构和列名
# print("原始数据列名：")
# print(df_raw.columns)
# print("\n原始数据预览：")
# print(df_raw.head())

# 根据您提供的表格结构，调整列名
# Excel中的列名可能需要清理
df = df_raw.clone()

# 重命名列以便使用
df = df.rename({
    "项目": "指标",
    "2018": "2018",
    "2019": "2019", 
    "2020": "2020",
    "2021": "2021",
    "2022": "2022",
    "2023": "2023"
})

print("\n清理后的数据预览：")
print(df.head())#head只有前五行




清理后的数据预览：
shape: (5, 7)
┌────────────────────┬─────────┬─────────┬─────────┬─────────┬─────────┬─────────┐
│ 指标               ┆ 2018    ┆ 2019    ┆ 2020    ┆ 2021    ┆ 2022    ┆ 2023    │
│ ---                ┆ ---     ┆ ---     ┆ ---     ┆ ---     ┆ ---     ┆ ---     │
│ str                ┆ f64     ┆ f64     ┆ f64     ┆ f64     ┆ f64     ┆ f64     │
╞════════════════════╪═════════╪═════════╪═════════╪═════════╪═════════╪═════════╡
│ 一般预算收入合计   ┆ 6598.08 ┆ 7048.0  ┆ 7248.24 ┆ 8262.57 ┆ 8039.38 ┆ 8600.02 │
│     税收收入小计   ┆ 5586.63 ┆ 5898.17 ┆ 6261.75 ┆ 7171.91 ┆ 6619.86 ┆ 7124.06 │
│         国内增值税 ┆ 2408.84 ┆ 2374.58 ┆ 2317.15 ┆ 2687.98 ┆ 2251.36 ┆ 3011.46 │
│         企业所得税 ┆ 972.46  ┆ 1115.55 ┆ 1145.02 ┆ 1443.97 ┆ 1517.29 ┆ 1311.36 │
│         个人所得税 ┆ 465.86  ┆ 412.94  ┆ 468.79  ┆ 532.11  ┆ 592.16  ┆ 582.55  │
└────────────────────┴─────────┴─────────┴─────────┴─────────┴─────────┴─────────┘


In [3]:
# 提取需要的收入支出数据
# 找到"一般预算收入合计"和"一般预算支出合计"所在的行
income_row = df.filter(pl.col("指标") == "一般预算收入合计")
expense_row = df.filter(pl.col("指标") == "一般预算支出合计")

print("\n收入数据：")
print(income_row)
print("\n支出数据：")
print(expense_row)


收入数据：
shape: (1, 7)
┌──────────────────┬─────────┬────────┬─────────┬─────────┬─────────┬─────────┐
│ 指标             ┆ 2018    ┆ 2019   ┆ 2020    ┆ 2021    ┆ 2022    ┆ 2023    │
│ ---              ┆ ---     ┆ ---    ┆ ---     ┆ ---     ┆ ---     ┆ ---     │
│ str              ┆ f64     ┆ f64    ┆ f64     ┆ f64     ┆ f64     ┆ f64     │
╞══════════════════╪═════════╪════════╪═════════╪═════════╪═════════╪═════════╡
│ 一般预算收入合计 ┆ 6598.08 ┆ 7048.0 ┆ 7248.24 ┆ 8262.57 ┆ 8039.38 ┆ 8600.02 │
└──────────────────┴─────────┴────────┴─────────┴─────────┴─────────┴─────────┘

支出数据：
shape: (1, 7)
┌──────────────────┬─────────┬──────────┬──────────┬──────────┬─────────┬──────────┐
│ 指标             ┆ 2018    ┆ 2019     ┆ 2020     ┆ 2021     ┆ 2022    ┆ 2023     │
│ ---              ┆ ---     ┆ ---      ┆ ---      ┆ ---      ┆ ---     ┆ ---      │
│ str              ┆ f64     ┆ f64      ┆ f64      ┆ f64      ┆ f64     ┆ f64      │
╞══════════════════╪═════════╪══════════╪══════════╪══════════╪═══════

In [4]:
# 创建整理后的数据表
years = ["2018", "2019", "2020", "2021", "2022", "2023"]
data = {
    "年份": years,
    "一般预算收入合计": [income_row[year][0] for year in years],
    "一般预算支出合计": [expense_row[year][0] for year in years]
}

df_clean = pl.DataFrame(data)

print("\n整理后的财政收支数据：")
print(df_clean)



整理后的财政收支数据：
shape: (6, 3)
┌──────┬──────────────────┬──────────────────┐
│ 年份 ┆ 一般预算收入合计 ┆ 一般预算支出合计 │
│ ---  ┆ ---              ┆ ---              │
│ str  ┆ f64              ┆ f64              │
╞══════╪══════════════════╪══════════════════╡
│ 2018 ┆ 6598.08          ┆ 8627.51          │
│ 2019 ┆ 7048.0           ┆ 10053.03         │
│ 2020 ┆ 7248.24          ┆ 10082.01         │
│ 2021 ┆ 8262.57          ┆ 11016.87         │
│ 2022 ┆ 8039.38          ┆ 12017.7          │
│ 2023 ┆ 8600.02          ┆ 12353.09         │
└──────┴──────────────────┴──────────────────┘


In [5]:
# 计算各项指标（与之前相同）
df_clean = df_clean.with_columns([
    ((pl.col("一般预算收入合计") - pl.col("一般预算收入合计").shift(1)) / 
     pl.col("一般预算收入合计").shift(1) * 100).alias("收入同比增长率(%)")
])

df_clean = df_clean.with_columns([
    ((pl.col("一般预算支出合计") - pl.col("一般预算支出合计").shift(1)) / 
     pl.col("一般预算支出合计").shift(1) * 100).alias("支出同比增长率(%)")
])

df_clean = df_clean.with_columns([
    (pl.col("一般预算收入合计") - pl.col("一般预算支出合计")).alias("财政收支差额")
])

base_2018 = df_clean.filter(pl.col("年份") == "2018")["一般预算收入合计"][0]
df_clean = df_clean.with_columns([
    ((pl.col("一般预算收入合计") - base_2018) / base_2018 * 100).alias("累计增长率(%)")
])

print("\n浙江省财政收支数据分析表:")
print(df_clean.to_pandas().to_string(index=False))

# 将数据转换为Pandas格式供Altair使用
df_pd = df_clean.to_pandas()


浙江省财政收支数据分析表:
  年份  一般预算收入合计  一般预算支出合计  收入同比增长率(%)  支出同比增长率(%)   财政收支差额  累计增长率(%)
2018   6598.08   8627.51         NaN         NaN -2029.43  0.000000
2019   7048.00  10053.03    6.818953   16.522960 -3005.03  6.818953
2020   7248.24  10082.01    2.841090    0.288271 -2833.77  9.853776
2021   8262.57  11016.87   13.994156    9.272556 -2754.30 25.226884
2022   8039.38  12017.70   -2.701218    9.084522 -3978.32 21.844233
2023   8600.02  12353.09    6.973672    2.790800 -3753.07 30.341251


In [6]:
import polars as pl
import altair as alt
import pandas as pd

# 1. 首先需要将数据从宽格式转换为长格式
# 当前数据格式（宽格式）：
# 年份 | 一般预算收入合计 | 一般预算支出合计

# 转换为长格式：
# 年份 | 指标类型 | 金额
df_long = df_clean.select(["年份", "一般预算收入合计", "一般预算支出合计"]).melt(
    id_vars=["年份"],
    value_vars=["一般预算收入合计", "一般预算支出合计"],
    variable_name="指标类型",
    value_name="金额"
)

# 2. 创建分组柱状图
chart1 = alt.Chart(df_long.to_pandas()).mark_bar(
    opacity=0.8
).encode(
    x=alt.X('年份:N', axis=alt.Axis(title='年份', labelAngle=0)),
    y=alt.Y('金额:Q', axis=alt.Axis(title='金额（亿元）')),
    xOffset=alt.XOffset('指标类型:N'),  # 分组偏移
    color=alt.Color('指标类型:N', 
                   scale=alt.Scale(
                       domain=['一般预算收入合计', '一般预算支出合计'],
                       range=['#4C78A8', '#F58518']
                   ),
                   legend=alt.Legend(title="指标类型"))
).properties(
    title='浙江省一般预算收入与支出对比（2018-2023年）',
    width=600,
    height=400
)

chart1.show()

  df_long = df_clean.select(["年份", "一般预算收入合计", "一般预算支出合计"]).melt(


In [7]:
# 2. 同比增长率折线图
chart2 = alt.Chart(df_pd.iloc[1:]).mark_line(point=True, strokeWidth=2).encode(
    x=alt.X('年份:O', axis=alt.Axis(title='年份', labelAngle=0)),
    y=alt.Y('收入同比增长率(%):Q', axis=alt.Axis(title='同比增长率(%)')),
    color=alt.value('#2E91E5')
).properties(
    title='浙江省一般预算收入同比增长率变化',
    width=600,
    height=300
)

zero_line = alt.Chart(pd.DataFrame({'y': [0]})).mark_rule(
    strokeDash=[5, 5], color='gray'
).encode(y='y:Q')
chart2 = chart2 + zero_line
chart2.show()

In [8]:
# 3. 累计增长率折线图
chart3 = alt.Chart(df_pd).mark_line(point=True, strokeWidth=3, color='#E45756').encode(
    x=alt.X('年份:O', axis=alt.Axis(title='年份', labelAngle=0)),
    y=alt.Y('累计增长率(%):Q', axis=alt.Axis(title='累计增长率(%)')),
    tooltip=['年份', '累计增长率(%)', '一般预算收入合计']
).properties(
    title='浙江省一般预算收入累计增长趋势（以2018年为基期）',
    width=600,
    height=300
)
chart3

In [9]:
# 4. 财政收支差额面积图
chart4 = alt.Chart(df_pd).mark_area(
    opacity=0.5,
    line=True,
    color='#72B7B2'
).encode(
    x=alt.X('年份:O', axis=alt.Axis(title='年份', labelAngle=0)),
    y=alt.Y('财政收支差额:Q', axis=alt.Axis(title='财政收支差额（亿元）')),
    tooltip=['年份', '财政收支差额', '一般预算收入合计', '一般预算支出合计']
).properties(
    title='浙江省财政收支差额变化（收入-支出）',
    width=600,
    height=300
)

zero_line2 = alt.Chart(pd.DataFrame({'y': [0]})).mark_rule(
    strokeDash=[5, 5], color='gray'
).encode(y='y:Q')
chart4 = chart4 + zero_line2
chart4.show()

In [13]:
# 5. 复合增长率分析
years_count = 5
cagr = ((df_pd['一般预算收入合计'].iloc[-1] / df_pd['一般预算收入合计'].iloc[0]) ** (1/years_count) - 1) * 100

# 创建收入柱状图
bar_income_single = alt.Chart(df_pd).mark_bar(
    color='#4C78A8',
    opacity=0.7
).encode(
    x=alt.X('年份:O', axis=alt.Axis(title='年份', labelAngle=0)),
    y=alt.Y('一般预算收入合计:Q', axis=alt.Axis(title='一般预算收入（亿元）'))
)

# 添加增长率文本
text_df = pd.DataFrame({
    'text': [f'年均复合增长率(CAGR): {cagr:.2f}%'],
    'x': [2.5],  # 调整x位置
    'y': [max(df_pd['一般预算收入合计']) * 0.85]  # 调整y位置
})

text_chart = alt.Chart(text_df).mark_text(
    fontSize=14,
    fontWeight='bold',
    color='#E45756'
).encode(
    x='x:Q',
    y='y:Q',
    text='text:N'
)

chart5 = alt.layer(bar_income_single, text_chart).properties(
    title=f'浙江省一般预算收入增长分析（2018-2023年，CAGR={cagr:.2f}%）',
    width=600,
    height=400
)

print(f"\n年均复合增长率(CAGR): {cagr:.2f}%")
chart5.show()




年均复合增长率(CAGR): 5.44%
