# 投资组合理论 马克维茨均值方差模型 CAPM

1.  投资者在考虑每一次投资选择时，其依据是某一持仓时间内的证券收益的概率分布。
2. 投资者是根据证券的期望收益率的方差或标准差估测证券组合的风险。
3.  投资者的决定仅仅是依据证券的风险和收益。
4. 在一定的风险水平上，投资者期望收益最大；相对应的是在一定的收益水平上，投资者希望风险最小。

## 使用Python的numpy和pandas来计算方差和标准差

In [1]:
import numpy as np
R = [0.01, 0.05, 0.02, -0.03]
var1 = np.var(R)
std1 = np.std(R)
print('var is', var1)
print('std is', std1)

var is 0.00081875
std is 0.028613807855648994


## 引入股票数据

In [3]:
# !#/usr/bin/python3
import pandas as pd
from pandas_datareader import data
import datetime
 
start = datetime.datetime(2016,1,1)
end = datetime.date.today()
apple = data.DataReader("AAPL", "yahoo", start, end)
#type(apple)
apple.head()

Unnamed: 0_level_0,High,Low,Open,Close,Volume,Adj Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2015-12-31,107.029999,104.82,107.010002,105.260002,40912300.0,98.129669
2016-01-04,105.370003,102.0,102.610001,105.349998,67649400.0,98.213585
2016-01-05,105.849998,102.410004,105.75,102.709999,55791000.0,95.752419
2016-01-06,102.370003,99.870003,100.559998,100.699997,68457400.0,93.878586
2016-01-07,100.129997,96.43,98.68,96.449997,81094400.0,89.916473


# 获取A股K线数据

In [4]:
import baostock as bs
import pandas as pd

#### 登陆系统 ####
lg = bs.login()
# 显示登陆返回信息
print('login respond error_code:'+lg.error_code)
print('login respond  error_msg:'+lg.error_msg)

#### 获取沪深A股历史K线数据 ####
# 详细指标参数，参见“历史行情指标参数”章节；“分钟线”参数与“日线”参数不同。
# 分钟线指标：date,time,code,open,high,low,close,volume,amount,adjustflag
rs = bs.query_history_k_data_plus("sh.600000",
    "date,code,open,high,low,close,preclose,volume,amount,adjustflag,turn,tradestatus,pctChg,isST",
    start_date='2017-07-01', end_date='2017-12-31',
    frequency="d", adjustflag="3")
print('query_history_k_data_plus respond error_code:'+rs.error_code)
print('query_history_k_data_plus respond  error_msg:'+rs.error_msg)

#### 打印结果集 ####
data_list = []
while (rs.error_code == '0') & rs.next():
    # 获取一条记录，将记录合并在一起
    data_list.append(rs.get_row_data())
result = pd.DataFrame(data_list, columns=rs.fields)

#### 结果集输出到csv文件 ####   
result.to_csv("D:\\history_A_stock_k_data.csv", index=False)
print(result)

#### 登出系统 ####
bs.logout()

ModuleNotFoundError: No module named 'baostock'

## 指数数据

1. 综合指数，例如：sh.000001 上证指数，sz.399106 深证综指 等；
2. 规模指数，例如：sh.000016 上证50，sh.000300 沪深300，sh.000905 中证500，sz.399001 深证成指等；
3. 一级行业指数，例如：sh.000037 上证医药，sz.399433 国证交运 等；
4. 二级行业指数，例如：sh.000952 300地产，sz.399951 300银行 等；
5. 策略指数，例如：sh.000050 50等权，sh.000982 500等权 等；
6. 成长指数，例如：sz.399376 小盘成长 等；
7. 价值指数，例如：sh.000029 180价值 等；
8. 主题指数，例如：sh.000015 红利指数，sh.000063 上证周期 等；
9. 基金指数，例如：sh.000011 上证基金指数 等；
10. 债券指数，例如：sh.000012 上证国债指数 等；

In [None]:
import baostock as bs
import pandas as pd

# 登陆系统
lg = bs.login()
# 显示登陆返回信息
print('login respond error_code:'+lg.error_code)
print('login respond  error_msg:'+lg.error_msg)

# 获取指数(综合指数、规模指数、一级行业指数、二级行业指数、策略指数、成长指数、价值指数、主题指数)K线数据
# 综合指数，例如：sh.000001 上证指数，sz.399106 深证综指 等；
# 规模指数，例如：sh.000016 上证50，sh.000300 沪深300，sh.000905 中证500，sz.399001 深证成指等；
# 一级行业指数，例如：sh.000037 上证医药，sz.399433 国证交运 等；
# 二级行业指数，例如：sh.000952 300地产，sz.399951 300银行 等；
# 策略指数，例如：sh.000050 50等权，sh.000982 500等权 等；
# 成长指数，例如：sz.399376 小盘成长 等；
# 价值指数，例如：sh.000029 180价值 等；
# 主题指数，例如：sh.000015 红利指数，sh.000063 上证周期 等；

# 详细指标参数，参见“历史行情指标参数”章节
rs = bs.query_history_k_data_plus("sh.000001",
    "date,code,open,high,low,close,preclose,volume,amount,pctChg",
    start_date='2017-01-01', end_date='2017-06-30', frequency="d")
print('query_history_k_data_plus respond error_code:'+rs.error_code)
print('query_history_k_data_plus respond  error_msg:'+rs.error_msg)

# 打印结果集
data_list = []
while (rs.error_code == '0') & rs.next():
    # 获取一条记录，将记录合并在一起
    data_list.append(rs.get_row_data())
result = pd.DataFrame(data_list, columns=rs.fields)
# 结果集输出到csv文件
result.to_csv("D:\\history_Index_k_data.csv", index=False)
print(result)

# 登出系统
bs.logout()