# 《数据可视化》 　—— 　基于Python的应用

## 第1章  数据分析软件简介

## 第2章  数据的收集与整理

## 第3章  Python编程基础

## 第4章  数据的探索分析

## 第5章  数据的直观分析

## 第6章  数据的统计分析

## 第7章  数据的模型分析

# 第8章 数据的预测分析及可视化

<img src="./Fig/Mind8.png" width="1100">

## 8.1 动态数列的基本分析

### 　8.1.1 动态数列的介绍

In [None]:
#%config InlineBackend.figure_format = 'retina' #可提高图形显示的清晰度

In [None]:
import pandas as pd                     #加载数据分析包pandas
pd.set_option('display.precision',4)    #设置pandas输出精度

In [None]:
YQdata=pd.read_excel('DaPy_data.xlsx','YQdata',index_col=0)
YQdata

In [None]:
QTdata=pd.read_excel('DaPy_data.xlsx','QTdata',index_col=0)
QTdata

In [None]:
QTdata.plot(grid=True);

In [None]:
#生成年度变量 
QTdata['Year']=QTdata.index.str[:4];QTdata

In [None]:
#形成年度时序数据 
YGDP=QTdata.groupby(['Year'])['GDP'].sum();YGDP 

In [None]:
YGDP.plot(grid=True);

### 　8.1.2 动态数列的分析

In [None]:
YGDP
YGDPds=pd.DataFrame(YGDP);  #构建年度动态序列框
YGDPds

In [None]:
YGDPds['定基数']= YGDP-YGDP[:1].values; YGDPds 

In [None]:
YGDPds['环基数']= YGDP-YGDP.shift(1); YGDPds #shift(1)向下移动1个单位 

In [None]:
YGDPds['定基比']=YGDP/YGDP[:1].values; YGDPds 

In [None]:
YGDPds['环基比']=YGDP/YGDP.shift(1);YGDPds 

In [None]:
n=len(YGDP);n

In [None]:
ADR=(YGDP[-1:].values/YGDP[:1].values)**(1/n)
print('\n  平均增长量 = %5.3f' % ADR)

## 8.2 动态数列预测分析

### 　8.2.1 趋势预测模型构建

In [None]:
import numpy as np
n=20
x=np.arange(n)+1       #生成1:n的等差数列
y=1+2*x    

In [None]:
import matplotlib.pyplot as plt 
plt.plot(x,y,'o-');    #点线图

In [None]:
y=1+0.2*np.log(x)
plt.plot(x,y,'o-'); 

（3）指数模型：y=ae^(bx) 

In [None]:
y=0.2*np.exp(0.1*x)
plt.plot(x,y,'o-');

In [None]:
y=0.2*x**0.1
plt.plot(x,y,'o-'); 

In [None]:
x.corr(y)

In [None]:
import statsmodels.api as sm 
Yt=YGDP       #Yt=YGDP=QTdata.groupby(['Year'])['GDP'].sum()
plt.plot(Yt,'.')

In [None]:
Xt=np.arange(len(Yt))+1; #自变量序列1:n，建模时最好不直接用年份
Xt

In [None]:
Yt_L1=sm.OLS(Yt,sm.add_constant(Xt)).fit(); 
Yt_L1.summary().tables[1]

In [None]:
#构建一个简单的趋势函数来进行模型选择。
import warnings #忽视警告信息,当例数较少时会有警告 
warnings.filterwarnings("ignore") 

def trendmodel(y,x): #定义直线回归模型, x为自变量, y为因变量
    fm=sm.OLS(y,sm.add_constant(x)).fit() 
    sfm=fm.summary2() 
    print("模型检验:\n",sfm.tables[1]) 
    R2=np.corrcoef(x,y)[0,1]**2 #相关系数平方=sfm.tables[0][1][6])
    print("决定系数：%5.4f"%R2)   
    return fm.fittedvalues

In [None]:
L1=trendmodel(Yt,Xt); 
plt.plot(Yt,'o',L1,'r-'); 

In [None]:
L2=trendmodel(np.log(Yt),np.log(Xt));      #对Yt取对数
plt.plot(Yt,'o',np.exp(L2),'r-');  #对Yt的拟合值取反对数

### 　8.2.2 平滑预测方法

（1）简单平均法 

In [None]:
Qt=QTdata.GDP;Qt

In [None]:
Qt.plot()

In [None]:
Qt.mean() #季节数据的平均 

In [None]:
QtM=pd.DataFrame(Qt);QtM

In [None]:
QtM['M2']=Qt.rolling(3).mean(); #2 阶移动平均 
QtM.plot()

In [None]:
QtM['M4']=Qt.rolling(5).mean(); #4 阶移动平均 
#QtM

In [None]:
QtM.plot();

In [None]:
QtE=pd.DataFrame(Qt); 
QtE['E03']=Qt.ewm(alpha=0.3).mean(); #平滑系数=0.3 
QtE.plot()

In [None]:
QtE['E08']=Qt.ewm(alpha=0.8).mean(); #平滑系数=0.8 
QtE.plot()

In [None]:
QtE.plot();

## 8.3  时间序列数据的可视化分析

In [None]:
import pandas as pd
stock=pd.read_excel('DaPy_data.xlsx','Stock',index_col=0); 
stock.info()

In [None]:
stock

In [None]:
stock=stock.dropna() #由于数据中有 15 个缺失值，故须删除缺失数据 NA 
stock#.info()

In [None]:
stock.describe().round(2)  #round(stock.describe(),3) 

### 　8.3.1 股票数据可视化分析

In [None]:
stock[['Close','Volume']]      #收盘价与成交量数据

In [None]:
stock['2015']['Close']         #年度收盘价数据

In [None]:
stock['2017-12']['Close']      #月度价格
#plt.plot(df.index,df.values);  #stock['2015']['Close'].plot();  

In [None]:
stock['Close'].plot();  #收盘价数据框图

In [None]:
YC=stock['2015']['Close'];            #年度收盘价数据
YC.index=YC.index.strftime('%Y-%m-%d');  #将横坐标设置为年-月格式
YC.plot();

In [None]:
stock['Volume'].hist();  #成交量分布情况 

In [None]:
CV=stock[['Close','Volume']];CV.plot()         #收盘价和成交量数据

In [None]:
CV.index=CV.index.strftime('%Y');     #将横坐标设置为年格式
CV.plot(secondary_y='Volume');        #右坐标轴绘制成交量 

In [None]:
YCV=stock['2015'][['Close','Volume']]     #年度收盘价和成交量数据
YCV.index=YCV.index.strftime('%Y-%m'); #将横坐标设置为年-月-日格式
YCV.plot(secondary_y='Volume');

In [None]:
SC=stock['2015']['Close']; SC           #2015年收盘价数据  

In [None]:
SCM=pd.DataFrame(SC);SCM                #构建数据框
SCM['MA5']=SC.rolling(6).mean();        #5日移动平均 
SCM['MA20']=SC.rolling(21).mean();      #20日移动平均 
SCM['MA60']=SC.rolling(61).mean();      #60日移动平均
SCM.index=SCM.index.strftime('%Y-%m-%d');  #设定时间轴：月-天
SCM.plot(figsize=(10,6),grid=True); # 移动平均线 

In [None]:
SCM.plot(subplots=False,figsize=(12,7),grid=True);

In [None]:
SCM.plot(subplots=True,figsize=(12,14),grid=True); 

>- https://pypi.tuna.tsinghua.edu.cn/simple
>- https://blog.csdn.net/qq_41437512/article/details/105319421

In [None]:
#!pip install mplfinance --upgrade 

In [None]:
OHLCV=stock['2015-10':'2015-12'][['Open','High','Low','Close','Volume']];OHLCV

In [None]:
import matplotlib.pyplot as plt
import mplfinance as mpf         #加载matplotlib的金融分析模块
mpf.plot(OHLCV,type='ohlc');     #ohlc图

In [None]:
mpf.plot(OHLCV,type='candle');   #candle图

In [None]:
mpf.plot(OHLCV,type='candle',volume=True) #价格candle图及成交量直方图

In [None]:
mpf.plot(OHLCV,type='candle',volume=True,mav=(3,6)) #增加3与6日移动平均线

### 　8.3.2 股票收益率分析

In [None]:
def Return(Yt):           #计算收益率函数
    Rt=Yt/Yt.shift(1)-1   #Yt_1=Yt.shift(1)
    return(Rt)

In [None]:
SA=stock['2015']['Adjusted']; SA[:10]  #2015年调整收盘价
SA_R=Return(SA); SA_R.plot()

In [None]:
SA_R.index=SA_R.index.strftime('%m-%d');  #设定时间轴：月-天
plt.rcParams['axes.unicode_minus']=False; #正常显示图中正负号
plt.stem(SA_R);  #SA_R.plot(x=SA_R.index).axhline(y=0);

In [None]:
 YR=pd.DataFrame({'Year':stock.index.year,'Adjusted':
                  Return(stock['Adjusted'])});YR

In [None]:
YRm=YR.groupby(['Year']).mean();YRm   #年度平均收益率

In [None]:
YRm.plot(kind='bar').axhline(y=0); 

In [None]:
YMR=pd.DataFrame({'Year':stock.index.year,'Month':stock.index.month,
                  'Adjusted':Return(stock['Adjusted'])}); YMR 

In [None]:
YMRm=YMR.groupby(['Year','Month']).mean(); YMRm  #按年度和月度计算平均收益率

In [None]:
YMRm.unstack().round(4)   #结果重排

In [None]:
YMRm.plot().axhline(y=0);

In [None]:
MRm=YMR['2005'].groupby(['Month']).mean();MRm  #2005年每月平均收益率

In [None]:
MRm['Adjusted'].plot(kind='bar').axhline(y=0);