#                                Statistic Functions 统计学指标

In [1]:
import tushare as ts
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import talib as ta

pro = ts.pro_api()
df = pro.daily(ts_code='000001.SZ', start_date='20200101', end_date='20200301')


In [2]:
open = df.open
high = df.high
low = df.low
close = df.close
pre_close = df.pre_close
change = df.change
pct_chg = df.pct_chg
volume = df.vol
amount = df.amount
df.head()

Unnamed: 0,ts_code,trade_date,open,high,low,close,pre_close,change,pct_chg,vol,amount
0,000001.SZ,20200228,14.85,15.04,14.46,14.5,15.11,-0.61,-4.0371,1300644.45,1906892.413
1,000001.SZ,20200227,14.96,15.15,14.89,15.11,14.99,0.12,0.8005,975270.9,1464605.739
2,000001.SZ,20200226,14.77,15.27,14.7,14.99,15.04,-0.05,-0.3324,1176599.15,1769612.245
3,000001.SZ,20200225,15.0,15.13,14.78,15.04,15.23,-0.19,-1.2475,1144575.02,1710369.786
4,000001.SZ,20200224,15.46,15.46,15.15,15.23,15.58,-0.35,-2.2465,1191794.5,1820183.854


## BETA     -            Beta - 贝塔系数

函数名：BETA

名称：β系数也称为贝塔系数

简介：一种风险指数，用来衡量个别股票或 股票基金相对于整个股市的价格波动情况 贝塔系数衡量股票收益相对于业绩评价基准收益的总体波动性，是一个相对指标。 β 越高，意味着股票相对于业绩评价基准的波动性越大。 β 大于 1 ， 则股票的波动性大于业绩评价基准的波动性。反之亦然。 

用途：
1）计算资本成本，做出投资决策（只有回报率高于资本成本的项目才应投资）；
2）计算资本成本，制定业绩考核及激励标准；
3）计算资本成本，进行资产估值（Beta是现金流贴现模型的基础）；
4）确定单个资产或组合的系统风险，用于资产组合的投资管理，特别是股指期货或其他金融衍生品的避险（或投机）

In [3]:
real = ta.BETA(high, low, timeperiod=5)

## CORREL       -        Pearson's Correlation Coefficient (r) - 皮尔逊相关系数

函数名：CORREL

名称：皮尔逊相关系数

简介：用于度量两个变量X和Y之间的相关（线性相关），其值介于-1与1之间

皮尔逊相关系数是一种度量两个变量间相关程度的方法。它是一个介于 1 和 -1 之间的值， 其中，1 表示变量完全正相关， 0 表示无关，-1 表示完全负相关。

In [4]:
real = ta.CORREL(high, low, timeperiod=30)

## LINEARREG       -     Linear Regression - 线性回归

函数名：LINEARREG

名称：线性回归

简介：来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法

其表达形式为y = w’x+e，e为误差服从均值为0的正态分布。

In [5]:
real = ta.LINEARREG(close, timeperiod=14)

## LINEARREG_ANGLE     -  Linear Regression Angle - 线性回归的角度

函数名：LINEARREG_ANGLE

名称：线性回归的角度

简介：来确定价格的角度变化

In [6]:
real = ta.LINEARREG_ANGLE(close, timeperiod=14)

## LINEARREG_INTERCEPT  -  Linear Regression Intercept - 线性回归截距

函数名：LINEARREG_INTERCEPT

名称：线性回归截距

In [7]:
real = ta.LINEARREG_INTERCEPT(close, timeperiod=14)

## LINEARREG_SLOPE  -    Linear Regression Slope - 线性回归斜率指标

函数名：LINEARREG_SLOPE

名称：线性回归斜率指标

In [8]:
real = ta.LINEARREG_SLOPE(close, timeperiod=14)

## STDDEV      -         Standard Deviation - 标准偏差

函数名：STDDEV

名称：标准偏差

简介：种量度数据分布的分散程度之标准，用以衡量数据值偏离算术平均值的程度。标准偏差越小，这些值偏离平均值就越少，反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。

In [9]:
real = ta.STDDEV(close, timeperiod=5, nbdev=1)

## TSF        -          Time Series Forecast - 时间序列预测

函数名：TSF

名称：时间序列预测

简介：一种历史资料延伸预测，也称历史引伸预测法。是以时间数列所能反映的社会经济现象的发展过程和规律性，进行引伸外推，预测其发展趋势的方法

In [10]:
real = ta.TSF(close, timeperiod=14)

## VAR  -                Variance - 方差

函数名： VAR 

名称：方差

简介：方差用来计算每一个变量（观察值）与总体均数之间的差异。为避免出现离均差总和为零，离均差平方和受样本含量的影响，统计学采用平均离均差平方和来描述变量的变异程度

In [11]:
real = ta.VAR(close, timeperiod=5, nbdev=1)