## 组合投资的统计

一个投资标的关键关心的几个指标是:
1. 累计收益(Cumulative Return)
2. 平均每日收益(Average daily return)
3. 每日收益的标准差(std_daily_return),也叫风险(Risk)
4. 夏普比率(Sharpe Ratio)

对计算夏普比率，需要做一些说明。夏普比率考虑了收益率的高低，以及风险的高低，同时还考虑到了无风险收益率(risk free):
```math
S = K * E[R_p - R_f} / std[R_p - R_f]
```
最初的夏普比率是一个年化测量值，为了进行校正，添加了为采样频率的系数K。K其实就是每年的采样数量值的平方根，每年一共252个交易日，所以K是252的平方根。

- 对于日K = sqrt(252)
- 对于月K = sqrt(12)
- 对于周K = sqrt(52)



In [3]:
#*-* coding:utf-8 *-*

import numpy as np
import tushare as ts
import pandas as pd
import matplotlib.pyplot as plt


def get_stocks_data(stocks_name_code, start_date, end_date):
    '''
    根据股票名称列表，获取股票信息
    参数：
        start_date:开始时间
        end_date:  结束时间
    返回：股票组合DataFrame
    '''
    # 创建一个时间的空dataframe
    dates = pd.date_range(start_date, end_date)
    stocks = pd.DataFrame(index=dates)
    for name in stocks_name_code.keys():
        data = ts.get_k_data(stocks_name_code[name], start=start_date, end=end_date)
        data = data.set_index(['date'])
        data = data[['close']]
        data = data.rename(columns={'close': name})
        stocks = stocks.join(data, how='inner')

    return stocks


def get_daily_portfolio_value(stocks, allocs, start_value):
    '''
    获得日组合投资值。
    参数:
        stocks:      股票组合DataFrame
        allocs:      资金比例
        start_value: 开始金额
    返回：日组合投资值。
    '''
    # 归一化
    normed_stocks = stocks / stocks.iloc[0, :]
    # 计算每日资金额
    pos_values = normed_stocks * np.array(allocs) * start_value
    pos_values = pos_values.sum(axis=1)

    return pos_values


def get_portfolio_statistics(pos_values, K=1, daily_risk_free=0):
    '''
    由每日收益列表得到组合统计变量
    变量：
        pos_values：每日资金金额列表
        K：采样频率系数
        daily_risk_free: 无风险收益
    '''


    cumulative_return = (pos_values[-1] / pos_values[0]) - 1
    # 第一天的收益实际为0，去掉第一天的收益
    daily_returns = (pos_values[1:] / pos_values.values[:-1]) - 1
    avg_daily_return = daily_returns.mean()
    std_daily_return = daily_returns.std()
    sharpe_ratio = K * (avg_daily_return - daily_risk_free) / std_daily_return

    return cumulative_return, avg_daily_return, std_daily_return, sharpe_ratio


def main():
    # 股票名称和代码的映射字典
    stocks_name_code = {
        # 'hs300' : 'hs300',
        'zgpa': '601318',  # 中国平安
        'zgsh': '600028',  # 中国石化
        'gzmt': '600519',  # 贵州茅台
        'nfhk': '600029',  # 南方航空
    }


    start_date = '2012-01-01'
    end_date = '2012-12-31'
    stocks = get_stocks_data(stocks_name_code, start_date, end_date)

    # 资金比例
    allocs = [0.4, 0.4, 0.1, 0.1]
    start_value = 1e5

    # 每日收益列表
    pos_values = get_daily_portfolio_value(stocks, allocs, start_value)

    K = 1
    cumulative_return, avg_daily_return, std_daily_return, \
            sharpe_ratio = get_portfolio_statistics(pos_values, K=1, daily_risk_free=0)

    print("夏普比率为:", sharpe_ratio)
        
if __name__ == '__main__':
    main()

    

夏普比率为: 0.048400768362827584
