In [9]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

# 加载数据集
df_2015 = pd.read_csv('2015年国内主要城市年度数据.csv')
df_2016 = pd.read_csv('2016年国内主要城市年度数据.csv')
df_2017 = pd.read_csv('2017年国内主要城市年度数据.csv')

# 纵向连接数据
combined_df = pd.concat([df_2015, df_2016, df_2017], axis=0)

# 处理缺省值，填充为0
combined_df = combined_df.fillna(0)

# 按年份聚合数据并求每年的国内生产总值
gdp_per_year = combined_df.groupby('年份')['国内生产总值'].sum()

print('每年的国内生产总值：')
print(gdp_per_year)

# 任务 5: 计算每个城市 2015 - 2017 年 GDP 的年均增长率，并找出增长率最高和最低的五个城市
def calculate_growth_rate(df):
    gdp_2015 = df[df['年份'] == 2015]['国内生产总值'].values[0]
    gdp_2017 = df[df['年份'] == 2017]['国内生产总值'].values[0]
    return ((gdp_2017 / gdp_2015) ** (1/2) - 1) * 100

# 修改此处以消除警告
growth_rates = combined_df.groupby('地区')[['年份', '国内生产总值']].apply(calculate_growth_rate).reset_index(name='年均增长率(%)')
top_five = growth_rates.nlargest(5, '年均增长率(%)')
bottom_five = growth_rates.nsmallest(5, '年均增长率(%)')

print('GDP 年均增长率最高的五个城市：')
print(top_five)
print('GDP 年均增长率最低的五个城市：')
print(bottom_five)

# 任务 6: 对医院、卫生院数进行归一化处理（Min - Max 标准化），并按年份比较各城市医疗资源的变化
scaler = MinMaxScaler()
combined_df['归一化医院、卫生院数'] = scaler.fit_transform(combined_df[['医院、卫生院数']])

# 按年份和地区查看归一化后的医院、卫生院数
normalized_hospitals_by_year = combined_df.pivot_table(index='地区', columns='年份', values='归一化医院、卫生院数')
print('按年份和地区归一化后的医院、卫生院数：')
print(normalized_hospitals_by_year)

# 任务 7: 提取北京、上海、广州、深圳四个城市 2015 - 2017 的 GDP 和社会商品零售总额数据，用新的 csv 呈现
selected_cities = ['北京', '上海', '广州', '深圳']
selected_data = combined_df[combined_df['地区'].isin(selected_cities)][['地区', '年份', '国内生产总值', '社会商品零售总额']]
selected_data.to_csv('selected_cities_data.csv', index=False, encoding='utf-8-sig')

每年的国内生产总值：
年份
2015    277958.37
2016    300696.10
2017    332562.43
Name: 国内生产总值, dtype: float64
GDP 年均增长率最高的五个城市：
    地区   年均增长率(%)
28  西安  13.474172
16  成都  13.398259
24  深圳  13.355030
8   合肥  12.889341
17  拉萨  12.788795
GDP 年均增长率最低的五个城市：
      地区   年均增长率(%)
21    沈阳 -10.195788
9   呼和浩特  -5.777610
11    大连  -2.406989
1   乌鲁木齐   2.109128
10   哈尔滨   5.118674
按年份和地区归一化后的医院、卫生院数：
年份        2015      2016      2017
地区                                
上海    0.390368  0.397972  0.212294
乌鲁木齐  0.093156  0.078580  0.062738
兰州    0.086185  0.091255  0.062738
北京    0.426489  0.434094  0.397972
南京    0.117237  0.124842  0.121673
南宁    0.124842  0.126743  0.055133
南昌    0.105830  0.105196  0.057034
厦门    0.019011  0.020279  0.014575
合肥    0.280101  0.275032  0.091255
呼和浩特  0.092522  0.099493  0.050697
哈尔滨   0.275032  0.280735  0.178707
大连    0.174905  0.181876  0.079214
天津    0.401141  0.344106  0.252218
太原    0.138783  0.137516  0.093156
宁波    0.136248  0.141318  0.079848
广州    0.146388  0.155260