# Day 2：基于交易量的量化指标 - 指标计算与可视化

本notebook主要介绍如何计算常见的基于交易量的指标，并进行可视化分析。

## 1. 导入必要的库

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.gridspec as gridspec
import matplotlib.dates as mdates
import seaborn as sns
import warnings

# 忽略警告信息
warnings.filterwarnings('ignore')

# 设置绘图风格
plt.style.use('ggplot')
%matplotlib inline

# 设置中文显示
plt.rcParams['font.sans-serif'] = ['SimHei']  # 设置中文字体
plt.rcParams['axes.unicode_minus'] = False    # 解决负号显示问题

## 2. 加载数据

从前一个notebook保存的CSV文件或直接从Tushare获取数据。

In [None]:
# 从CSV文件加载数据
def load_data_from_csv(file_path):
    df = pd.read_csv(file_path, index_col=0)
    df.index = pd.to_datetime(df.index)
    return df

# 尝试从CSV加载数据，如果文件不存在，则从Tushare获取
import os

stock_names = ['平安银行', '贵州茅台', '中国平安']
stock_codes = ['000001.SZ', '600519.SH', '601318.SH']
stock_data = {}

for i, name in enumerate(stock_names):
    file_path = f'data/{name}_data.csv'
    if os.path.exists(file_path):
        stock_data[name] = load_data_from_csv(file_path)
        print(f"从CSV文件加载{name}的数据")
    else:
        import tushare as ts
        ts.set_token('YOUR_TUSHARE_TOKEN')  # 替换为您的Token
        pro = ts.pro_api()
        
        # 获取数据
        df = pro.daily(ts_code=stock_codes[i], start_date='20220101', end_date='20230101')
        df = df.sort_values('trade_date')
        df['trade_date'] = pd.to_datetime(df['trade_date'])
        df.set_index('trade_date', inplace=True)
        
        stock_data[name] = df
        print(f"从Tushare获取{name}的数据")

In [None]:
# 查看数据
stock_data['平安银行'].head()

## 3. 定义交易量指标计算函数

In [None]:
def calculate_OBV(data):
    """
    计算On Balance Volume (OBV) / 累积能量线
    
    参数:
    data: DataFrame, 包含'close'和'vol'列的DataFrame
    
    返回:
    带有OBV列的DataFrame
    """
    data = data.copy()  # 创建副本以避免修改原始数据
    obv = [0]  # 初始OBV值
    
    for i in range(1, len(data)):
        if data['close'].iloc[i] > data['close'].iloc[i-1]:
            obv.append(obv[-1] + data['vol'].iloc[i])
        elif data['close'].iloc[i] < data['close'].iloc[i-1]:
            obv.append(obv[-1] - data['vol'].iloc[i])
        else:
            obv.append(obv[-1])
    
    data['OBV'] = obv
    return data

In [None]:
def calculate_volume_ma(data, windows=[5, 10, 20]):
    """
    计算成交量移动平均线
    
    参数:
    data: DataFrame, 包含'vol'列的DataFrame
    windows: list, 移动平均的窗口大小列表，默认为[5, 10, 20]
    
    返回:
    带有成交量MA列的DataFrame
    """
    data = data.copy()  # 创建副本以避免修改原始数据
    
    for window in windows:
        data[f'vol_ma{window}'] = data['vol'].rolling(window=window).mean()
    
    return data

In [None]:
def calculate_volume_ratio(data, window=5):
    """
    计算量比
    
    参数:
    data: DataFrame, 包含'vol'列的DataFrame
    window: int, 计算平均成交量的窗口大小，默认为5
    
    返回:
    带有量比列的DataFrame
    """
    data = data.copy()  # 创建副本以避免修改原始数据
    
    # 计算过去window天的平均成交量
    data['vol_ma'] = data['vol'].rolling(window=window).mean().shift(1)
    # 计算量比
    data['vol_ratio'] = data['vol'] / data['vol_ma']
    
    return data

In [None]:
def calculate_mfi(data, period=14):
    """
    计算Money Flow Index (MFI) / 资金流量指标
    
    参数:
    data: DataFrame, 包含'high', 'low', 'close'和'vol'列的DataFrame
    period: int, 计算周期，默认为14
    
    返回:
    带有MFI列的DataFrame
    """
    data = data.copy()  # 创建副本以避免修改原始数据
    
    # 1. 计算典型价格 (TP)
    data['tp'] = (data['high'] + data['low'] + data['close']) / 3
    
    # 2. 计算资金流 (Money Flow)
    data['money_flow'] = data['tp'] * data['vol']
    
    # 3. 判断正向和负向资金流
    data['tp_diff'] = data['tp'].diff()
    data['positive_flow'] = np.where(data['tp_diff'] > 0, data['money_flow'], 0)
    data['negative_flow'] = np.where(data['tp_diff'] < 0, data['money_flow'], 0)
    
    # 4. 计算period周期内的资金流
    data['positive_flow_sum'] = data['positive_flow'].rolling(window=period).sum()
    data['negative_flow_sum'] = data['negative_flow'].rolling(window=period).sum()
    
    # 5. 计算资金流比率和MFI
    data['money_ratio'] = data['positive_flow_sum'] / data['negative_flow_sum']
    data['MFI'] = 100 - (100 / (1 + data['money_ratio']))
    
    # 删除中间计算列
    data = data.drop(['tp', 'money_flow', 'tp_diff', 'positive_flow', 'negative_flow', 
                       'positive_flow_sum', 'negative_flow_sum', 'money_ratio'], axis=1)
    
    return data

In [None]:
def calculate_price_ma(data, windows=[5, 10, 20, 60]):
    """
    计算价格移动平均线
    
    参数:
    data: DataFrame, 包含'close'列的DataFrame
    windows: list, 移动平均的窗口大小列表，默认为[5, 10, 20, 60]
    
    返回:
    带有价格MA列的DataFrame
    """
    data = data.copy()  # 创建副本以避免修改原始数据
    
    for window in windows:
        data[f'ma{window}'] = data['close'].rolling(window=window).mean()
    
    return data

## 4. 计算指标

以平安银行为例，计算并可视化各种交易量指标。

In [None]:
# 选择平安银行的数据进行分析
pingan_data = stock_data['平安银行']

# 计算所有指标
pingan_data = calculate_OBV(pingan_data)
pingan_data = calculate_volume_ma(pingan_data)
pingan_data = calculate_volume_ratio(pingan_data)
pingan_data = calculate_mfi(pingan_data)
pingan_data = calculate_price_ma(pingan_data)

# 查看结果
pingan_data.tail()

## 5. 可视化分析

### 5.1 OBV与价格

In [None]:
# 创建OBV与价格的对比图
fig, axes = plt.subplots(2, 1, figsize=(14, 10), sharex=True, gridspec_kw={'height_ratios': [2, 1]})

# 绘制价格图
axes[0].plot(pingan_data.index, pingan_data['close'], label='收盘价', color='blue')
axes[0].set_title('平安银行 - 收盘价走势')
axes[0].set_ylabel('价格')
axes[0].legend(loc='upper left')
axes[0].grid(True)

# 绘制OBV图
axes[1].plot(pingan_data.index, pingan_data['OBV'], label='OBV', color='orange')
axes[1].set_title('平安银行 - OBV指标')
axes[1].set_xlabel('日期')
axes[1].set_ylabel('OBV值')
axes[1].legend(loc='upper left')
axes[1].grid(True)

# 添加日期格式化
date_format = mdates.DateFormatter('%Y-%m')
axes[1].xaxis.set_major_formatter(date_format)
fig.autofmt_xdate()

plt.tight_layout()
plt.show()

### 5.2 成交量与成交量MA

In [None]:
# 创建成交量与成交量MA的对比图
fig, axes = plt.subplots(2, 1, figsize=(14, 10), sharex=True, gridspec_kw={'height_ratios': [2, 1]})

# 绘制价格图
axes[0].plot(pingan_data.index, pingan_data['close'], label='收盘价', color='blue')
axes[0].set_title('平安银行 - 收盘价走势')
axes[0].set_ylabel('价格')
axes[0].legend(loc='upper left')
axes[0].grid(True)

# 绘制成交量和成交量MA
axes[1].bar(pingan_data.index, pingan_data['vol'], label='成交量', alpha=0.3, color='gray')
axes[1].plot(pingan_data.index, pingan_data['vol_ma5'], label='5日成交量MA', color='red')
axes[1].plot(pingan_data.index, pingan_data['vol_ma10'], label='10日成交量MA', color='blue')
axes[1].plot(pingan_data.index, pingan_data['vol_ma20'], label='20日成交量MA', color='green')
axes[1].set_title('平安银行 - 成交量与成交量MA')
axes[1].set_xlabel('日期')
axes[1].set_ylabel('成交量')
axes[1].legend(loc='upper left')
axes[1].grid(True)

# 添加日期格式化
date_format = mdates.DateFormatter('%Y-%m')
axes[1].xaxis.set_major_formatter(date_format)
fig.autofmt_xdate()

plt.tight_layout()
plt.show()

### 5.3 量比

In [None]:
# 创建量比图
fig, axes = plt.subplots(2, 1, figsize=(14, 10), sharex=True, gridspec_kw={'height_ratios': [2, 1]})

# 绘制价格图
axes[0].plot(pingan_data.index, pingan_data['close'], label='收盘价', color='blue')
axes[0].set_title('平安银行 - 收盘价走势')
axes[0].set_ylabel('价格')
axes[0].legend(loc='upper left')
axes[0].grid(True)

# 绘制量比图
axes[1].plot(pingan_data.index, pingan_data['vol_ratio'], label='量比', color='purple')
axes[1].axhline(y=1, color='r', linestyle='--', alpha=0.5)  # 添加参考线，量比=1
axes[1].axhline(y=2, color='g', linestyle='--', alpha=0.5)  # 添加参考线，量比=2
axes[1].axhline(y=3, color='b', linestyle='--', alpha=0.5)  # 添加参考线，量比=3
axes[1].set_title('平安银行 - 量比 (相对于5日平均成交量)')
axes[1].set_xlabel('日期')
axes[1].set_ylabel('量比')
axes[1].legend(loc='upper left')
axes[1].grid(True)

# 添加日期格式化
date_format = mdates.DateFormatter('%Y-%m')
axes[1].xaxis.set_major_formatter(date_format)
fig.autofmt_xdate()

plt.tight_layout()
plt.show()

### 5.4 MFI与价格

In [None]:
# 创建MFI与价格的对比图
fig, axes = plt.subplots(2, 1, figsize=(14, 10), sharex=True, gridspec_kw={'height_ratios': [2, 1]})

# 绘制价格图
axes[0].plot(pingan_data.index, pingan_data['close'], label='收盘价', color='blue')
axes[0].set_title('平安银行 - 收盘价走势')
axes[0].set_ylabel('价格')
axes[0].legend(loc='upper left')
axes[0].grid(True)

# 绘制MFI图
axes[1].plot(pingan_data.index, pingan_data['MFI'], label='MFI', color='green')
axes[1].axhline(y=20, color='r', linestyle='--', alpha=0.5)  # 添加超卖线
axes[1].axhline(y=80, color='r', linestyle='--', alpha=0.5)  # 添加超买线
axes[1].set_title('平安银行 - MFI指标')
axes[1].set_xlabel('日期')
axes[1].set_ylabel('MFI值')
axes[1].set_ylim(0, 100)  # 设置y轴范围
axes[1].legend(loc='upper left')
axes[1].grid(True)

# 添加日期格式化
date_format = mdates.DateFormatter('%Y-%m')
axes[1].xaxis.set_major_formatter(date_format)
fig.autofmt_xdate()

plt.tight_layout()
plt.show()

### 5.5 价格MA与成交量

In [None]:
# 创建价格MA与成交量的对比图
fig, axes = plt.subplots(2, 1, figsize=(14, 10), sharex=True, gridspec_kw={'height_ratios': [2, 1]})

# 绘制价格图与价格MA
axes[0].plot(pingan_data.index, pingan_data['close'], label='收盘价', color='black', alpha=0.5)
axes[0].plot(pingan_data.index, pingan_data['ma5'], label='5日MA', color='red')
axes[0].plot(pingan_data.index, pingan_data['ma10'], label='10日MA', color='blue')
axes[0].plot(pingan_data.index, pingan_data['ma20'], label='20日MA', color='green')
axes[0].plot(pingan_data.index, pingan_data['ma60'], label='60日MA', color='purple')
axes[0].set_title('平安银行 - 价格与价格MA')
axes[0].set_ylabel('价格')
axes[0].legend(loc='upper left')
axes[0].grid(True)

# 绘制成交量图
axes[1].bar(pingan_data.index, pingan_data['vol'], label='成交量', alpha=0.3, color='gray')
axes[1].set_title('平安银行 - 成交量')
axes[1].set_xlabel('日期')
axes[1].set_ylabel('成交量')
axes[1].legend(loc='upper left')
axes[1].grid(True)

# 添加日期格式化
date_format = mdates.DateFormatter('%Y-%m')
axes[1].xaxis.set_major_formatter(date_format)
fig.autofmt_xdate()

plt.tight_layout()
plt.show()

## 6. 量价配合分析

我们来分析一下平安银行的量价配合情况，寻找一些典型的量价关系模式。

In [None]:
# 计算价格变化率和成交量变化率
pingan_data['price_change'] = pingan_data['close'].pct_change() * 100  # 百分比变化
pingan_data['vol_change'] = pingan_data['vol'].pct_change() * 100  # 百分比变化

# 创建量价配合的分类
pingan_data['price_up'] = pingan_data['price_change'] > 0
pingan_data['vol_up'] = pingan_data['vol_change'] > 0

# 定义量价配合类型
conditions = [
    (pingan_data['price_up'] & pingan_data['vol_up']),  # 价涨量增
    (pingan_data['price_up'] & ~pingan_data['vol_up']),  # 价涨量减
    (~pingan_data['price_up'] & pingan_data['vol_up']),  # 价跌量增
    (~pingan_data['price_up'] & ~pingan_data['vol_up']),  # 价跌量减
]
choices = ['价涨量增', '价涨量减', '价跌量增', '价跌量减']
pingan_data['vol_price_pattern'] = np.select(conditions, choices, default=np.nan)

# 查看近期的量价配合情况
pingan_data[['close', 'vol', 'price_change', 'vol_change', 'vol_price_pattern']].tail(10)

In [None]:
# 统计量价配合类型的频率
pattern_counts = pingan_data['vol_price_pattern'].value_counts()
print("量价配合类型统计：")
print(pattern_counts)

# 可视化量价配合类型的频率
plt.figure(figsize=(10, 6))
pattern_counts.plot(kind='bar', color=['green', 'orange', 'red', 'gray'])
plt.title('平安银行 - 量价配合类型统计')
plt.xlabel('量价配合类型')
plt.ylabel('频率')
plt.grid(True, axis='y')
plt.show()

In [None]:
# 分析不同量价配合类型下的平均收益率
next_day_returns = pingan_data['close'].pct_change().shift(-1) * 100  # 下一日收益率
pingan_data['next_day_return'] = next_day_returns

# 计算每种量价配合类型的平均下一日收益率
pattern_returns = pingan_data.groupby('vol_price_pattern')['next_day_return'].mean()
print("各量价配合类型的平均下一日收益率（%）：")
print(pattern_returns)

# 可视化
plt.figure(figsize=(10, 6))
pattern_returns.plot(kind='bar', color=['green', 'orange', 'red', 'gray'])
plt.title('平安银行 - 不同量价配合类型的平均下一日收益率')
plt.xlabel('量价配合类型')
plt.ylabel('平均下一日收益率（%）')
plt.grid(True, axis='y')
plt.show()

## 7. OBV背离分析

OBV背离是一种常见的交易信号，我们可以尝试识别OBV与价格的背离情况。

In [None]:
# 定义一个简单的背离检测函数
def detect_divergence(data, price_col='close', obv_col='OBV', window=20):
    """
    检测价格与OBV的背离
    
    参数:
    data: DataFrame
    price_col: str, 价格列名
    obv_col: str, OBV列名
    window: int, 检测窗口大小
    
    返回:
    带有背离标记的DataFrame
    """
    data = data.copy()
    data['price_high'] = data[price_col].rolling(window=window).apply(lambda x: x.iloc[-1] > x.max())
    data['price_low'] = data[price_col].rolling(window=window).apply(lambda x: x.iloc[-1] < x.min())
    data['obv_high'] = data[obv_col].rolling(window=window).apply(lambda x: x.iloc[-1] > x.max())
    data['obv_low'] = data[obv_col].rolling(window=window).apply(lambda x: x.iloc[-1] < x.min())
    
    # 看跌背离：价格创新高，但OBV未创新高
    data['bearish_divergence'] = data['price_high'] & ~data['obv_high']
    
    # 看涨背离：价格创新低，但OBV未创新低
    data['bullish_divergence'] = data['price_low'] & ~data['obv_low']
    
    return data

In [None]:
# 尝试检测背离
pingan_data = detect_divergence(pingan_data)

# 查看背离情况
divergence_dates = pingan_data[(pingan_data['bearish_divergence'] | pingan_data['bullish_divergence'])].index
print(f"检测到的背离日期数量: {len(divergence_dates)}")

# 查看背离日期
if len(divergence_dates) > 0:
    for date in divergence_dates:
        if pingan_data.loc[date, 'bearish_divergence']:
            print(f"{date.date()}: 看跌背离")
        elif pingan_data.loc[date, 'bullish_divergence']:
            print(f"{date.date()}: 看涨背离")

In [None]:
# 可视化背离
# 注意：这个简单的背离检测算法可能不够精确，仅作为示例

# 如果检测到背离，则绘制图表
if len(divergence_dates) > 0:
    fig, axes = plt.subplots(2, 1, figsize=(14, 10), sharex=True, gridspec_kw={'height_ratios': [2, 1]})
    
    # 绘制价格图
    axes[0].plot(pingan_data.index, pingan_data['close'], label='收盘价', color='blue')
    
    # 标记看跌背离
    bearish_dates = pingan_data[pingan_data['bearish_divergence']].index
    if len(bearish_dates) > 0:
        axes[0].scatter(bearish_dates, pingan_data.loc[bearish_dates, 'close'], 
                        color='red', marker='v', s=100, label='看跌背离')
    
    # 标记看涨背离
    bullish_dates = pingan_data[pingan_data['bullish_divergence']].index
    if len(bullish_dates) > 0:
        axes[0].scatter(bullish_dates, pingan_data.loc[bullish_dates, 'close'], 
                        color='green', marker='^', s=100, label='看涨背离')
    
    axes[0].set_title('平安银行 - 收盘价走势与OBV背离')
    axes[0].set_ylabel('价格')
    axes[0].legend(loc='upper left')
    axes[0].grid(True)
    
    # 绘制OBV图
    axes[1].plot(pingan_data.index, pingan_data['OBV'], label='OBV', color='orange')
    axes[1].set_title('平安银行 - OBV指标')
    axes[1].set_xlabel('日期')
    axes[1].set_ylabel('OBV值')
    axes[1].legend(loc='upper left')
    axes[1].grid(True)
    
    # 添加日期格式化
    date_format = mdates.DateFormatter('%Y-%m')
    axes[1].xaxis.set_major_formatter(date_format)
    fig.autofmt_xdate()
    
    plt.tight_layout()
    plt.show()

## 总结

在本notebook中，我们完成了以下任务：

1. 编写了各种交易量指标的计算函数，包括OBV、成交量MA、量比和MFI
2. 对平安银行的历史数据计算了这些指标
3. 通过可视化分析了价格与各种交易量指标的关系
4. 分析了量价配合情况，并统计了不同量价配合类型下的平均收益率
5. 尝试进行了OBV背离的检测和分析

这些分析为下一步的量价结合策略开发奠定了基础。通过这些指标，我们可以更好地理解市场的资金流向和交易动力，从而做出更明智的交易决策。