# Python获取财经数据和可视化分析

## 1、引入需要的包

In [None]:
import tushare as ts
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

## 2、获取需要的数据

In [None]:
CPI=ts.get_cpi() # 获取cpi数据
print(CPI.head())

## 3、保存到本地文件夹

使用to_csv将数据保存到本地 ~/code/python/finance/data/cpi.csv

In [None]:
CPI=CPI.sort_values('month') # 根据时间顺序排序（升序）
CPI['cpi']=CPI['cpi']-100.0 # 转化成百分比数据
CPI.to_csv("~/code/python/finance/data/cpi.csv")

## 4、读取数据和可视化

In [None]:
# 使用pandas读取刚刚保存的数据，注意pandas的缩写是pd
df=pd.read_csv("~/code/python/finance/data/cpi.csv")
# 解决matplotlib中文标签乱码的问题
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimHei'] # 设置识别中文字体
# 设置图形大小
plt.figure(figsize=(12,6))
# month数据为x轴，cpi数据为y轴
plt.plot(df['month'], df['cpi'], linewidth=1.2)
# plt.grid(True) 加网格线
plt.axis('tight')
plt.xlabel('年度', size=12)
plt.ylabel('%', size=15)
plt.title('CPI月度同比', size=12)

In [None]:
# 货币供应量
money_supply=ts.get_money_supply()
money_supply.head()

In [None]:
# 删除m2_yoy缺失值，或者取出连续不缺失的观测值，并保存到本地
money_supply=money_supply.sort_values('month').iloc[228:,:]
money_supply.to_csv("~/code/python/finance/data/MoneySupply.csv")
money_supply.head()

使用pandas读取数据并进行数据清洗

In [None]:
date=pd.date_range('1997-1-1', periods=len(money_supply),freq='M')
df=pd.read_csv("~/code/python/finance/data/MoneySupply.csv")
df.index=date
# 只保留所需要的数据m2_yoy m1_yoy mo_yoy 即M2、M1、M0的月度同比增长率
df=df.iloc[:, 2:8]
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimHei']
df.rename(columns={'m2_yoy': 'M2增长率', 'm1_yoy':'M1增长率', 'm0_yoy':'M0增长率'}, inplace=True)
df.head()

对M1和M2数据进行可视化，并与重大经济金融事件联系起来，这里主要加入1997年的亚洲金融危机、2007年开始的美国次贷危机、2009年的四万亿刺激计划和2017年的金融去杠杆。代码如下：

In [None]:
df[['M2增长率', 'M1增长率']].plot(figsize=(12,6))
plt.xlabel('Date', size=15)
plt.ylabel('%', size=15)
plt.title('M2和M1月度同比增长%', size=16)
plt.annotate('亚洲金融危机', size=13, xy=('1997-7-1', 24),
             xytext=('1998-1-1', 27), arrowprops=dict(facecolor='black', shrink=0.05),)
plt.annotate('美国次贷危机', size=13, xy=('2007-8-1', 20),
             xytext=('2008-1-1', 24), arrowprops=dict(facecolor='red', shrink=0.05),)
plt.annotate(u'四万亿刺激计划', size=13, xy=('2009-1-1', 30),
             xytext=('2010-1-1', 32), arrowprops=dict(facecolor='black', shrink=0.05),)
plt.annotate(u'金融去杠杆', size=13, xy=('2016-8-1', 12),
             xytext=('2017-1-1', 15), arrowprops=dict(facecolor='black', shrink=0.05),)
plt.grid(True)