# Day 2：基于交易量的量化指标 - 使用Backtrader进行回测

本notebook展示如何使用Backtrader框架对之前定义的量价结合策略进行更系统化、专业化的回测。Backtrader是一个功能强大的Python回测框架，提供了更完善的回测环境和分析工具。

## 1. Backtrader简介和安装

Backtrader是一个用Python编写的开源回测框架，具有以下特点：

- **易于使用**：API简洁明了，上手难度低
- **功能完善**：支持多种指标、策略和分析方法
- **可扩展性强**：可以自定义指标、策略、分析器等
- **支持多种数据源**：CSV、Pandas DataFrame、实时数据等
- **支持多资产回测**：可以同时回测多种资产
- **内置绘图功能**：可视化策略执行过程和结果

首先，我们需要安装Backtrader库：

In [1]:
# 安装backtrader（如果尚未安装）
# !pip install backtrader
# !pip install matplotlib==3.2.2  # Backtrader可能与最新版matplotlib不兼容

# 导入必要的库
import backtrader as bt
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import os
import warnings
import datetime
from dotenv import load_dotenv, find_dotenv

# Find the .env file in the parent directory
dotenv_path = find_dotenv("../../.env")

# Load it explicitly
load_dotenv(dotenv_path)

# 忽略警告信息
warnings.filterwarnings('ignore')

# 设置中文显示
plt.rcParams['font.sans-serif'] = ['PingFang HK']  # 设置中文字体
plt.rcParams['axes.unicode_minus'] = False    # 解决负号显示问题

# 2. 数据获取函数

In [2]:
def get_ts_data(ts_token, ts_code, start_date, end_date, freq='30min'):
    # 文件路径
    file_path = f'./data/{ts_code}-{start_date}-{end_date}-{freq}.csv'
    
    # 检查本地是否已存在该文件
    if os.path.exists(file_path):
        print(f"从本地文件加载数据: {file_path}")
        df = pd.read_csv(file_path, parse_dates=['trade_time'])  # 读取并解析时间列
        return df
    
    # 设置Tushare token
    ts.set_token(ts_token)
    pro = ts.pro_api()

    # 获取数据
    df = ts.pro_bar(
        ts_code=ts_code,
        start_date=start_date,
        end_date=end_date,
        freq=freq,  
        asset='E',       # 股票类型
        adj='qfq',       # 前复权
    )

    if df is None or df.empty:
        print("从 Tushare 获取的数据为空，请检查权限或参数设置。")
        return None

    # 创建目录（如果不存在）
    os.makedirs('./data', exist_ok=True)

    # 保存数据到本地文件
    df.to_csv(file_path, index=False)
    print(f"数据已保存至: {file_path}")

    return df

In [3]:
ts_token = os.getenv('TUSHARE_API_KEY')
ts_code = '002745.SZ'
start_date = '2022-03-03'
end_date = '2025-02-28'

stock_data = get_ts_data(ts_token, ts_code, start_date, end_date, freq='30min')

从本地文件加载数据: ./data/002745.SZ-2022-03-03-2025-02-28-30min.csv


In [4]:
stock_data = stock_data.sort_values('trade_time').reset_index(drop=True)

In [5]:
stock_data.head()

Unnamed: 0,ts_code,trade_time,close,open,high,low,vol,amount
0,002745.SZ,2022-03-03 09:30:00,11.73,11.74,11.74,11.73,19700.0,257449.0
1,002745.SZ,2022-03-03 10:00:00,11.61,11.74,11.75,11.59,3537808.0,45884940.0
2,002745.SZ,2022-03-03 10:30:00,11.62,11.61,11.65,11.6,2231278.0,28897008.0
3,002745.SZ,2022-03-03 11:00:00,11.64,11.62,11.65,11.61,673100.0,8719710.0
4,002745.SZ,2022-03-03 11:30:00,11.61,11.63,11.65,11.61,1379400.0,17854952.0


# 3. DataFrame转换为Backtrader Feed的函数

In [6]:
# 1. 将DataFrame转换为Backtrader Feed的函数
def df_to_btfeed(df):
    """
    将Pandas DataFrame转换为Backtrader的数据源
    
    参数:
    df (pandas.DataFrame): 包含OHLCV数据的DataFrame
    
    返回:
    backtrader.feeds.PandasData: 可用于Backtrader的数据源
    """
    # 确保索引是datetime类型
    if not isinstance(df.index, pd.DatetimeIndex):
        df = df.copy()
        df['datetime'] = pd.to_datetime(df['trade_time'])
        df.set_index('datetime', inplace=True)
    
    # 创建用于backtrader的PandasData类
    class PandasDataCustom(bt.feeds.PandasData):
        params = (
            ('datetime', None),  # 已设置为索引
            ('open', 'open'),
            ('high', 'high'),
            ('low', 'low'),
            ('close', 'close'),
            ('volume', 'vol'),
            ('openinterest', None)  # 不使用持仓量数据
        )
    
    # 返回backtrader的数据源
    return PandasDataCustom(dataname=df)

# 4. 回测执行函数

In [14]:
# 3. 回测函数
def run_backtest(df, strategy=VolumeBreakoutStrategy, 
                 strategy_params=None, initial_cash=100000.0,
                 commission=0.001, plot=True, plot_args=None):
    """
    运行回测
    
    参数:
    df (pandas.DataFrame): 包含OHLCV数据的DataFrame
    strategy (backtrader.Strategy): 回测使用的策略类
    strategy_params (dict): 策略参数字典
    initial_cash (float): 初始资金
    commission (float): 交易佣金比例
    plot (bool): 是否绘制回测结果图表
    plot_args (dict): 图表参数字典，可包含:
        - start_date (str): 绘图开始日期 'YYYY-MM-DD'
        - end_date (str): 绘图结束日期 'YYYY-MM-DD'
        - style (str): 图表风格，如'candle', 'bar', 'line'等
        - width (int): 图表宽度
        - height (int): 图表高度
        - num_plots (int): 只显示最近的N个交易点
        - skip_plotlines (bool): 是否跳过绘制交易线
    
    返回:
    dict: 包含回测结果的字典
    """
    # 创建cerebro引擎
    cerebro = bt.Cerebro()
    
    # 添加策略
    if strategy_params:
        cerebro.addstrategy(strategy, **strategy_params)
    else:
        cerebro.addstrategy(strategy)
    
    # 添加数据
    # 如果指定了绘图时间范围，则提前过滤数据
    plot_df = df.copy()
    if plot_args and 'start_date' in plot_args:
        start_date = pd.to_datetime(plot_args['start_date'])
        if isinstance(plot_df.index, pd.DatetimeIndex):
            plot_df = plot_df[plot_df.index >= start_date]
        elif 'trade_time' in plot_df.columns:
            plot_df = plot_df[pd.to_datetime(plot_df['trade_time']) >= start_date]
    
    if plot_args and 'end_date' in plot_args:
        end_date = pd.to_datetime(plot_args['end_date'])
        if isinstance(plot_df.index, pd.DatetimeIndex):
            plot_df = plot_df[plot_df.index <= end_date]
        elif 'trade_time' in plot_df.columns:
            plot_df = plot_df[pd.to_datetime(plot_df['trade_time']) <= end_date]
            
    # 如果只需显示最近N个交易点
    if plot_args and 'num_plots' in plot_args:
        num_plots = plot_args['num_plots']
        if len(plot_df) > num_plots:
            plot_df = plot_df.iloc[-num_plots:]
    
    # 正常回测使用完整数据
    data = df_to_btfeed(df)
    cerebro.adddata(data)
    
    # 设置初始资金和佣金
    cerebro.broker.setcash(initial_cash)
    cerebro.broker.setcommission(commission=commission)
    
    # 添加分析器
    cerebro.addanalyzer(bt.analyzers.SharpeRatio, _name='sharpe')
    cerebro.addanalyzer(bt.analyzers.DrawDown, _name='drawdown')
    cerebro.addanalyzer(bt.analyzers.Returns, _name='returns')
    cerebro.addanalyzer(bt.analyzers.TradeAnalyzer, _name='trade')
    
    # 运行回测
    print(f'初始资金: {initial_cash:.2f}')
    results = cerebro.run()
    strat = results[0]
    
    # 获取回测结果数据
    final_value = cerebro.broker.getvalue()
    total_return = (final_value - initial_cash) / initial_cash * 100
    
    sharpe_ratio = strat.analyzers.sharpe.get_analysis().get('sharperatio', 0.0)
    if np.isnan(sharpe_ratio):
        sharpe_ratio = 0.0
    
    max_drawdown = strat.analyzers.drawdown.get_analysis().get('max', {}).get('drawdown', 0.0)
    
    # 获取交易分析
    trade_analysis = strat.analyzers.trade.get_analysis()
    
    total_trades = trade_analysis.get('total', {}).get('total', 0)
    
    winning_trades = trade_analysis.get('won', {}).get('total', 0)
    losing_trades = trade_analysis.get('lost', {}).get('total', 0)
    
    if total_trades > 0:
        win_rate = winning_trades / total_trades * 100
    else:
        win_rate = 0.0
    
    # 打印回测结果
    print(f'最终资金: {final_value:.2f}')
    print(f'总收益率: {total_return:.2f}%')
    print(f'夏普比率: {sharpe_ratio:.2f}')
    print(f'最大回撤: {max_drawdown:.2f}%')
    print(f'总交易次数: {total_trades}')
    print(f'胜率: {win_rate:.2f}%')
    
    # 绘制回测结果
    if plot:
        try:
            # 获取默认或自定义图表参数
            if plot_args is None:
                plot_args = {}
            
            style = plot_args.get('style', 'candle')
            width = plot_args.get('width', 1200)  # 更宽的默认宽度
            height = plot_args.get('height', 800)  # 较合理的默认高度
            
            # 处理绘图选项
            skip_plotlines = plot_args.get('skip_plotlines', False)
            
            plot_kwargs = {
                'style': style,
                'barup': 'red',  # 中国市场习惯
                'bardown': 'green',
                'width': width,
                'height': height,
                'volume': True
            }
            
            # 如果需要跳过绘制交易线
            if skip_plotlines:
                plot_kwargs['plotlines'] = False
            
            # 使用过滤后的数据创建新的cerebro进行绘图
            if len(plot_df) < len(df):
                plot_cerebro = bt.Cerebro()
                
                # 添加策略，但禁用打印输出
                class QuietStrategy(strategy):
                    def __init__(self):
                        super().__init__()
                        
                    def log(self, txt, dt=None):
                        pass
                        
                if strategy_params:
                    plot_cerebro.addstrategy(QuietStrategy, **strategy_params)
                else:
                    plot_cerebro.addstrategy(QuietStrategy)
                
                # 添加过滤后的数据
                plot_data = df_to_btfeed(plot_df)
                plot_cerebro.adddata(plot_data)
                
                # 设置与原回测相同的参数
                plot_cerebro.broker.setcash(initial_cash)
                plot_cerebro.broker.setcommission(commission=commission)
                
                # 运行并绘图
                %matplotlib inline
                plot_cerebro.run()
                plot_cerebro.plot(**plot_kwargs,iplot=False)
            else:
                # 直接使用原cerebro绘图
                 %matplotlib inline
                cerebro.plot(**plot_kwargs,iplot=False)
        except Exception as e:
            print(f"绘图错误: {e}")
            print("提示: 尝试减少数据量或使用plot_args参数控制绘图范围")
    
    # 返回回测结果
    return {
        'initial_cash': initial_cash,
        'final_value': final_value,
        'total_return': total_return,
        'sharpe_ratio': sharpe_ratio,
        'max_drawdown': max_drawdown,
        'total_trades': total_trades,
        'winning_trades': winning_trades,
        'losing_trades': losing_trades,
        'win_rate': win_rate,
        'strat': strat  # 返回策略实例以便进一步分析
    }


# 5: 交易量突破策略

In [15]:
# 2. 交易量突破策略
class VolumeBreakoutStrategy(bt.Strategy):
    """
    交易量突破策略
    
    参数:
    volume_period (int): 用于计算平均交易量的周期数
    volume_mult (float): 触发买入信号的交易量倍数
    exit_bars (int): 持有的bar数量，过后卖出
    stop_loss (float): 止损比例 (0.05 = 5%)
    take_profit (float): 止盈比例 (0.10 = 10%)
    """
    params = (
        ('volume_period', 20),   # 计算平均交易量的周期
        ('volume_mult', 2.0),    # 交易量倍数阈值
        ('exit_bars', 5),        # 持有的bar数量
        ('stop_loss', 0.05),     # 止损比例
        ('take_profit', 0.10),   # 止盈比例
    )
    
    def __init__(self):
        # 初始化变量
        self.volume_ma = bt.indicators.SimpleMovingAverage(
            self.data.volume, period=self.params.volume_period)
        
        # 跟踪持仓和买入价格
        self.bar_executed = None
        self.buy_price = None
        
    def next(self):
        # 如果没有持仓
        if not self.position:
            # 检查交易量是否突破
            if self.data.volume[0] > self.volume_ma[0] * self.params.volume_mult:
                self.buy()
                self.bar_executed = len(self)
                self.buy_price = self.data.close[0]
                print(f'BUY: {self.data.datetime.date(0)} | 价格: {self.data.close[0]:.2f} | 交易量: {self.data.volume[0]:,.0f} | 平均交易量: {self.volume_ma[0]:,.0f}')
                
        # 如果有持仓，检查是否应该卖出
        else:
            # 基于持有期的退出策略
            if len(self) >= (self.bar_executed + self.params.exit_bars):
                self.sell()
                print(f'SELL (时间退出): {self.data.datetime.date(0)} | 价格: {self.data.close[0]:.2f}')
                return
            
            # 止损退出策略
            if self.data.close[0] < self.buy_price * (1 - self.params.stop_loss):
                self.sell()
                print(f'SELL (止损): {self.data.datetime.date(0)} | 价格: {self.data.close[0]:.2f}')
                return
                
            # 止盈退出策略
            if self.data.close[0] > self.buy_price * (1 + self.params.take_profit):
                self.sell()
                print(f'SELL (止盈): {self.data.datetime.date(0)} | 价格: {self.data.close[0]:.2f}')
                return



# 6. 执行回测

In [16]:
stock_data

Unnamed: 0,ts_code,trade_time,close,open,high,low,vol,amount
0,002745.SZ,2022-03-03 09:30:00,11.73,11.74,11.74,11.73,19700.0,257449.0
1,002745.SZ,2022-03-03 10:00:00,11.61,11.74,11.75,11.59,3537808.0,45884940.0
2,002745.SZ,2022-03-03 10:30:00,11.62,11.61,11.65,11.60,2231278.0,28897008.0
3,002745.SZ,2022-03-03 11:00:00,11.64,11.62,11.65,11.61,673100.0,8719710.0
4,002745.SZ,2022-03-03 11:30:00,11.61,11.63,11.65,11.61,1379400.0,17854952.0
...,...,...,...,...,...,...,...,...
6520,002745.SZ,2025-02-28 11:30:00,9.04,9.05,9.05,9.00,2877500.0,25952448.0
6521,002745.SZ,2025-02-28 13:30:00,8.96,9.03,9.03,8.92,4458100.0,40014516.0
6522,002745.SZ,2025-02-28 14:00:00,8.91,8.96,8.96,8.88,4356200.0,38851072.0
6523,002745.SZ,2025-02-28 14:30:00,8.79,8.90,8.90,8.75,7360100.0,64833540.0


In [17]:
# 数据预处理
stock_data['trade_time'] = pd.to_datetime(stock_data['trade_time'])

# 设置策略参数
strategy_params = {
    'volume_period': 15,   # 计算平均交易量的周期
    'volume_mult': 2.0,    # 交易量倍数阈值
    'exit_bars': 3,        # 持有的bar数量
    'stop_loss': 0.03,     # 止损比例
    'take_profit': 0.06    # 止盈比例
}

# 绘图参数 - 解决图表过大问题
plot_args = {
    'width': 1200,          # 图表宽度
    'height': 800,          # 图表高度
    'num_plots': 500,       # 只显示最近的500个数据点
    'style': 'candle',      # 图表风格
    'skip_plotlines': True  # 跳过绘制交易线，减少图表复杂度
}

# 运行回测
results = run_backtest(stock_data, 
       strategy=VolumeBreakoutStrategy,
       strategy_params=strategy_params,
       initial_cash=100000.0,
       commission=0.0003,  # 0.03% 佣金
       plot=True,
       plot_args=plot_args)

初始资金: 100000.00
BUY: 2022-03-07 | 价格: 11.25 | 交易量: 3,838,782 | 平均交易量: 1,418,156
SELL (时间退出): 2022-03-07 | 价格: 11.11
BUY: 2022-03-08 | 价格: 11.01 | 交易量: 4,226,800 | 平均交易量: 1,775,308
SELL (时间退出): 2022-03-08 | 价格: 10.69
BUY: 2022-03-09 | 价格: 10.29 | 交易量: 5,506,274 | 平均交易量: 2,395,508
SELL (时间退出): 2022-03-10 | 价格: 10.95
BUY: 2022-03-10 | 价格: 10.86 | 交易量: 7,569,304 | 平均交易量: 2,495,138
SELL (时间退出): 2022-03-10 | 价格: 10.79
BUY: 2022-03-14 | 价格: 10.77 | 交易量: 3,489,557 | 平均交易量: 1,416,869
SELL (时间退出): 2022-03-14 | 价格: 10.73
BUY: 2022-03-15 | 价格: 10.26 | 交易量: 4,213,000 | 平均交易量: 1,430,419
SELL (时间退出): 2022-03-15 | 价格: 10.29
BUY: 2022-03-15 | 价格: 9.96 | 交易量: 4,247,326 | 平均交易量: 1,785,138
SELL (时间退出): 2022-03-16 | 价格: 9.95
BUY: 2022-03-17 | 价格: 10.40 | 交易量: 5,854,600 | 平均交易量: 2,394,718
SELL (时间退出): 2022-03-17 | 价格: 10.58
BUY: 2022-03-21 | 价格: 10.53 | 交易量: 3,471,113 | 平均交易量: 1,409,167
SELL (时间退出): 2022-03-21 | 价格: 10.53
BUY: 2022-03-23 | 价格: 10.60 | 交易量: 3,491,400 | 平均交易量: 1,570,932
SELL (时间退出): 2022-03-2

<IPython.core.display.Javascript object>

In [11]:
stock_data['trade_time'] = pd.to_datetime(stock_data['trade_time'])
print(stock_data['trade_time'].dtype)  # 确认输出为 datetime64[ns]


datetime64[ns]


In [12]:
from IPython.display import display
figs = cerebro.plot(style='candlestick', iplot=False)
for fig_group in figs:
    for fig in fig_group:
        display(fig)


KeyboardInterrupt



In [13]:
# 绘制回测结果图形（可以选择不同的样式，如 'candlestick' 或 'bar'）
%matplotlib inline
cerebro.plot(style='candlestick', iplot=False)
plt.show()

In [15]:
cerebro

<backtrader.cerebro.Cerebro at 0x1357d93d0>

In [14]:
plt.show()

In [119]:
%matplotlib inline
# 使用Backtrader的特定参数来控制绘图
figs = cerebro.plot(
    style='candlestick',
    volume=False,
    iplot=False,
    figsize=(12, 8),
    plotdist=0.1,  # 减小子图之间的距离
    barup='g',     # 简化上涨蜡烛图样式
    bardown='r',   # 简化下跌蜡烛图样式
    grid=False,    # 关闭网格线
    rows=1,        # 限制为单行图表
    cols=1,        # 限制为单列图表
    **{'start': len(stock_data) - 100, 'end': len(stock_data)}  # 只显示最后100个数据点
)

[]

# 8. 参数优化

In [87]:
# 这个单元格是可选的，如果您想优化策略参数
def optimize_ma_strategy(data, ma_fast_range, ma_slow_range):
    """优化MA策略参数"""
    results = []
    
    for ma_fast in ma_fast_range:
        for ma_slow in ma_slow_range:
            if ma_fast >= ma_slow:
                continue  # 快速MA周期不应大于或等于慢速MA周期
                
            # 创建Cerebro引擎
            cerebro = bt.Cerebro(stdstats=False)
            
            # 添加数据
            if isinstance(data, pd.DataFrame):
                data_feed = df_to_btfeed(data)
                cerebro.adddata(data_feed)
            else:
                cerebro.adddata(data)
                
            # 添加策略
            cerebro.addstrategy(MAStrategy, ma_fast=ma_fast, ma_slow=ma_slow, printlog=False)
            
            # 设置初始资金和佣金
            cerebro.broker.setcash(100000.0)
            cerebro.broker.setcommission(commission=0.001)
            
            # 添加分析器
            cerebro.addanalyzer(bt.analyzers.Returns, _name='returns')
            cerebro.addanalyzer(bt.analyzers.SharpeRatio, _name='sharpe')
            cerebro.addanalyzer(bt.analyzers.DrawDown, _name='drawdown')
            
            # 执行回测
            print(f"测试参数: MA快速={ma_fast}, MA慢速={ma_slow}")
            res = cerebro.run()
            strat = res[0]
            
            # 收集结果
            ret = strat.analyzers.returns.get_analysis()
            dd = strat.analyzers.drawdown.get_analysis()
            sharpe = strat.analyzers.sharpe.get_analysis()
            
            # 存储结果
            results.append({
                'ma_fast': ma_fast,
                'ma_slow': ma_slow,
                'return': ret.get('rtot', 0) * 100,  # 总收益率(%)
                'annual_return': ret.get('rnorm100', 0),  # 年化收益率(%)
                'max_drawdown': dd.get('max', {}).get('drawdown', 0),  # 最大回撤(%)
                'sharpe': sharpe.get('sharperatio', 0),  # 夏普比率
                'final_value': cerebro.broker.getvalue()
            })
            
    # 转换为DataFrame并按总收益率排序
    results_df = pd.DataFrame(results)
    results_df = results_df.sort_values('return', ascending=False)
    
    return results_df

# 示例使用
# optimize_results = optimize_ma_strategy(
#     data=pingan_data,
#     ma_fast_range=[5, 10, 15, 20],
#     ma_slow_range=[20, 30, 40, 50]
# )
# optimize_results.head()

In [88]:
optimize_results = optimize_ma_strategy(
    data=pingan_data,
    ma_fast_range=[5, 10, 15, 20],
    ma_slow_range=[20, 30, 40, 50]
)
optimize_results.head()

测试参数: MA快速=5, MA慢速=20
2022-12-30, (MA周期 快速/慢速) 5/20
2022-12-30, 期末资金: 100000.59
测试参数: MA快速=5, MA慢速=30
2022-12-30, (MA周期 快速/慢速) 5/30
2022-12-30, 期末资金: 100001.55
测试参数: MA快速=5, MA慢速=40
2022-12-30, (MA周期 快速/慢速) 5/40
2022-12-30, 期末资金: 100002.62
测试参数: MA快速=5, MA慢速=50
2022-12-30, (MA周期 快速/慢速) 5/50
2022-12-30, 期末资金: 99998.82
测试参数: MA快速=10, MA慢速=20
2022-12-30, (MA周期 快速/慢速) 10/20
2022-12-30, 期末资金: 99998.30
测试参数: MA快速=10, MA慢速=30
2022-12-30, (MA周期 快速/慢速) 10/30
2022-12-30, 期末资金: 99998.00
测试参数: MA快速=10, MA慢速=40
2022-12-30, (MA周期 快速/慢速) 10/40
2022-12-30, 期末资金: 99999.15
测试参数: MA快速=10, MA慢速=50
2022-12-30, (MA周期 快速/慢速) 10/50
2022-12-30, 期末资金: 100000.89
测试参数: MA快速=15, MA慢速=20
2022-12-30, (MA周期 快速/慢速) 15/20
2022-12-30, 期末资金: 99994.15
测试参数: MA快速=15, MA慢速=30
2022-12-30, (MA周期 快速/慢速) 15/30
2022-12-30, 期末资金: 99997.62
测试参数: MA快速=15, MA慢速=40
2022-12-30, (MA周期 快速/慢速) 15/40
2022-12-30, 期末资金: 99999.58
测试参数: MA快速=15, MA慢速=50
2022-12-30, (MA周期 快速/慢速) 15/50
2022-12-30, 期末资金: 99999.39
测试参数: MA快速=20, MA慢速=30
2022-12-3

Unnamed: 0,ma_fast,ma_slow,return,annual_return,max_drawdown,sharpe,final_value
2,5,40,0.002624,0.002733,0.005771,,100002.62416
1,5,30,0.001547,0.001611,0.004243,,100001.5474
7,10,50,0.000893,0.00093,0.005831,,100000.89321
0,5,20,0.000587,0.000611,0.005539,,100000.58683
10,15,40,-0.000417,-0.000434,0.006621,,99999.58284
