# 章节练习

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [None]:
%matplotlib inline

In [None]:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

1. 2012~2020年我国人均可支配收入（单位：万元）为`[1.47, 1.62, 1.78, 1.94, 2.38, 2.60, 2.82, 3.07, 3.21]`。

（1）绘制人均可支配收入折线图（如下图）。数据点用**小矩形**标记、**黑色虚线**，并用注解标出**最高点**，图**标题**为`Income`, 设置**坐标轴标题**，最后将图形保存为`income.jpg`文件

![](./img/人均可支配收入.png)

In [None]:
year = np.arange(2012, 2021)
income = [1.47, 1.62, 1.78, 1.94, 2.38, 2.60, 2.82, 3.07, 3.21]

In [None]:
plt.plot(year, income, marker='s', linestyle=':', color='black')

plt.title('2012-2020年人均可支配收入')
plt.xlabel('Year')
plt.ylabel('Income (RMB Ten Thousand)')
plt.xlim(2012, 2020)
plt.ylim(0, 3.5)

plt.grid()
plt.legend(['Income'], loc='upper left')
plt.annotate('Largest!', xy=(2020, 3.21), xytext=(2018, 2.5), arrowprops=dict(arrowstyle='->'))

plt.savefig('income.jpg')
plt.show()

（2）使用多个子图分别绘制人均可支配收入的折线图、箱形图及柱状图，如下图

![](./img/多子图展示各年度人均可支配收入.png)

In [None]:
fig = plt.figure()

ax1 = fig.add_subplot(2, 2, 1)
ax2 = fig.add_subplot(2, 2, 2)
ax3 = fig.add_subplot(2, 1, 2)

ax1.plot(df.index, df['Income'])
ax1.set_title('Line Chart')
ax1.set_xlabel('Year')
ax1.set_ylabel('Income')

ax2.boxplot(df['Income'], labels=['2012-2020'])
ax2.set_title('Box-Whisker Plot')
ax2.set_ylabel('Income')

ax3.bar(df.index, df['Income'], width=0.5)
ax3.set_title('Bar Chart')
ax3.set_xlabel('Year')
ax3.set_ylabel('Income')
ax3.legend(['Income'])

plt.tight_layout()
plt.show()

2. 文件`High-speed rail.csv`中存放着世界各国高铁的情况，数据格式如下表所示，请对世界各国高铁的数据进行绘图分析。

| Country | Operation | Under-construction | Planning |
| --- | --- | --- | --- |
| 国家 | 运营里程（千米） | 在建里程（千米） | 计划里程（千米） |

In [None]:
df = pd.read_csv('data/High-speed rail.csv', index_col='Country')
df

（1）各国运营里程对比柱状图，标注`China`为`Longest`, 如下图：

![](./img/各国高铁运营里程柱状图.png)

In [None]:
plt.bar(df.index, df['Operation'], width=0.5)

plt.title('Operation Mileage')
plt.xticks(rotation=45)
plt.annotate('Longest!', xy=(0, 20000), xytext=(1, 20000), arrowprops=dict(arrowstyle='->'))

plt.show()

（2）各国运营里程现状和发展堆叠柱状图，如下图：

![](./img/各国高铁发展情况堆叠图.png)

In [None]:
df[['Operation', 'Under-construction', 'Planning']].plot(kind='barh', stacked=True)
plt.title('Global trends of high-speed rail')
plt.xlabel('Mileage (km)')
plt.show()

（3）各国运营里程占比饼图，其中`China`扇形离开中心点，如下图：

![](./img/各国高铁运营里程分布饼图.png)

In [None]:
plt.pie(df['Operation'], labels=df.index, autopct='%.1f%%', startangle=60, explode=[0.1, 0, 0, 0, 0, 0])
plt.show()

（4）绘制现有里程的地图，用不同颜色表示数量从大到小。

In [None]:
!pip install pyecharts

In [None]:
from pyecharts.charts import Map
from pyecharts import options as opts
from pyecharts.globals import ThemeType

In [None]:
(
    Map(init_opts=opts.InitOpts(theme=ThemeType.WESTEROS))
        .add('Operation', [list(z) for z in zip(df.index, df['Operation'])], 'world', is_map_symbol_show=False)
        .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
        .set_global_opts(title_opts=opts.TitleOpts(
            title='Global trends of high-speed rail',
            pos_left='center',
            title_textstyle_opts=opts.TextStyleOpts(font_size=25)
        ),
        visualmap_opts=opts.VisualMapOpts(
            is_piecewise=True,
            pieces=[
                {'max': 2000, 'min': 1, 'label': '1~2000', 'color': '#00FFFF'},
                {'max': 4000, 'min': 2001, 'label': '2001~4000', 'color': '#FF1493'},
                {'max': 25000, 'min': 4001, 'label': '>=4001', 'color': '#FF0000'},
            ]
        )
    ).render('high_speed_map.html')
)