前言
BackTrader的分析器主要使用的是analyzers模块,我们可以从Analyzers - Backtrader找到一个非常简单的示例。这个示例中使用方式很简单,其他分析器也可以通过如此简单封装方式进行装载。如果仅是复制粘贴官方教程,完全是制造互联网垃圾,更丝毫没必要写一篇博客来讨论。
但是,当我们关注微观时,我们的日线通常是通过Resample API(例如:多周期K线的Resampling)合并的,这时诸如PyFolio这样跟时序相关的分析器是否支持足够呢?同时,又有哪些框架内置的分析器?哪些分析器依赖于时序?哪些又需要哪些其他组件支持呢?如果我们定制Broker或者如前文所述基于Tick数据进行回测,那么应该如何使用框架提供的分析功能?
更进一步的,这些分析器是些个什么玩意?这些评测指标是什么?
本文将从这些问题出发,更包含了对一些框架提供的评测指标的文字解释和公式说明。阅读之前请参考官网示例实践几个分析器的挂载和使用。
Analyzer简述
要解答前面的问题,必不可少的是了解分析器内部的类关系,这是最简单但却重要的第一步。框架内部的内置分析器类层次结构如下所示:
而不同的分析器之间也存在相互依赖,比如PyFolio的结果则是另外三个分析器的汇总:
如下代码可以很简单的验证着点:
cerebro.addanalyzer(btanalyzers.Transactions, _name='mytran')
cerebro.addanalyzer(btanalyzers.PositionsValue, _name='mypos')
cerebro.addanalyzer(btanalyzers.GrossLeverage, _name='grosslv')
cerebro.addanalyzer(btanalyzers.PyFolio, _name='mypyfolio')
# ....
mytran = thestrat.analyzers.mytran.get_analysis()
series1 = ordered_dict_to_df('Transactions', mytran)
mypos = thestrat.analyzers.mypos.get_analysis()
series2 = ordered_dict_to_df('PositionsValue', mypos)
grosslv = thestrat.analyzers.grosslv.get_analysis()
series2 = ordered_dict_to_df('GrossLeverage', grosslv)
results = thestrat.analyzers.mypyfolio.get_analysis()
pyfolio_series = []
for key in results:
series = ordered_dict_to_df(key, results[key])
pyfolio_series.append(series)
如上代码使用Series对比:
分析器的next
上面的例子可以看到,多数分析器都会加入到策略的生命周期中,即使是直接继承自bt.Analyzer。以PositionsValue为例,在PositionsValue的实现中,分别会由框架调用start和next方法,如下调用堆栈:
start, positions.py:69
_start, analyzer.py:194
_start, strategy.py:397
runstrategies, cerebro.py:1269
run, cerebro.py:1132
<module>, MyAnalyzer.py:47
上述调用栈中,start, positions.py是PositionsValue分析器的实现,同样的也包括next方法实现。并且在方法中,调用了Broker的get_value和get_cash方法。而像杠杆率评测的GrossLeverage分析器则是直接在next方法中直接使用了data0的时间,而如果data0是tick级别考虑杠杆率这颗粒度显然太细了。
这对于本文开始的问题做出了一些解答:
- 框架自身的一些基础分析器默认适配Tick级别数据的分析并不合适。
- 分析器的很多实现需要调用Broker的接口方法。
虽然有一些计算器无法适配,但是前图中的bt.TimeFrameAnalyzerBase子类可以通过指定timeframe参数实现指定基于时间级别数据的分析。在TimeFrameAnalyzerBase的源码中可以看到:
class TimeFrameAnalyzerBase(with_metaclass(MetaTimeFrameAnalyzerBase,
Analyzer)):
params = (
('timeframe', None),
('compression', None),
('_doprenext', True),
)
def _start(self):
# Override to add specific attributes
self.timeframe = self.p.timeframe or self.data._timeframe
当然,一个成熟化的、准确的、产品级回测工具需要对这些分析指标进行充分的定制化的修改和拓展。这对于能够关注到这点的朋友来讲,从技术上解决起来是很容易的。本文不在过多赘述具体如何去定制化的细节实现。
分析器评测指标
为了方便实现上述的处于是配合定制化目的的修改和拓展,有必要结合BackTrader的实现,对于几个经典评测指标进行一些讨论。
AnnualReturn
标准的年化收益率,在回测结束的stop阶段计算。计算公式没有太特殊的地方:
分别基于期初净值和期末净值以及年数做出计算。当数据不足一年时,参数特化为:
框架中的代码页基本实现了类似的逻辑。
DrawDown
回撤是简单直白的风险度指标,在BT中返回在回测结束时最终的:
- 距离最高点的回撤比例和资金回撤
- 回测过程中的最大回撤
这个计算不复杂,即使完全自主实现也难度不大。
Calmar
卡玛比率为年化收益率与最大回撤的比值,主要为了突出风险度,同时也是一个很重要的评测指标。实际上Calmar将年化使用回撤进行了单位化。高Calmar意味着以回撤为单位的年化收益率。虽然通常的算法交易CTA在5以上都是很厉害的了,但是有些大牛高频量化系统将Calmar率控制在10以上并不少见。
BackTrader中Calmar主要使用了TimeDrawDown类。框架示例代码:“calmar-test.py”展示了使用方式。在框架源码实现中,calmar的计算实现于on_dt_over中,由上层的TimeFrameAnalyzerBase在next中调用,也就是每个数据源周期中都会发生计算(但是可以通过timeframe参数指定要计算的周期)。
SharpeRatio
标准的夏普率计算,框架的夏普率的计算依赖于AnnualReturn。夏普率几乎是公认的最常用评测指标,虽然他的争议较大。夏普率计算公式为:
夏普率计算中主要是标准差的计算稍微有些难以理解,其实在源码中可以看到BT的实现方式主要是对年华收益率计算:
math.sqrt(average(variance(self.AnnualReturn.rets, \
average([r - rate for r in returns])), \
bessel=self.p.stddev_sample))
其中贝塞尔方程可以通过参数指定(具体参考SharpeRatio - Backtrader)。除了贝塞尔以外,还要考虑配置若干参数,比如无风险利率、timeframe等。参数的不同配置可能会造成结果有较大出入,也容易产生争议(争论策略的夏普率之前最好双方Sync一下夏普率参数)
关于BackTrader夏普率的讨论和介绍在CSDN有大量专题讨论,此处不再过多赘述。
GrossLeverage
当我们讨论回测的时候,毛杠杆率主要目的还是体现资金的利用率。“Gross Leverage”的原始定义为:
从源码中可以看到GrossLeverage的实现相对简单。即:
lev = (self._value - self._cash) / self._value
不过需要注意的是,杠杆率的计算是逐数据帧的,并且没有提供timeframe参数,如果想要考虑这个指标可能需要有一个最终汇总操作,给策略一个整体的杠杆率评价。否则如果在微观中逐tick的评价意义不大,并且观测难度也很大(可能画图是个办法)。
几点结论
对于前言中的一些问题:
- 诸如PyFolio这样跟时序相关的分析器是否支持足够呢?
- 如果我们定制Broker或者如前文所述基于Tick数据进行回测,那么应该如何使用框架提供的分析功能?
继承自TimeFrameAnalyzerBase的分析器可以支持指定timeframe,但是如果考虑定制化和细颗粒度,以及从性能优化角度,特别是针对tick源数据,这些基于timeframe的分析器尚显不足。
- 又有哪些框架内置的分析器?哪些分析器依赖于时序?
我们列出了分析器的完整框架,同时可以看出哪些分析器支持timeframe。如果这些内置分析器,则可以根据自己回测评测的需求去定制对应的分析器。
- 哪些又需要哪些其他组件支持呢?
首先分析器多数需要Broker支持。Broker提供了标准接口,如果是自定义Broker,实现对应接口即可。同时分析器互相之间存在大量依赖,例如文中提到过得Calmar对TimerDrawDown和AnnualReturn的依赖,以及类似于前面提到的PyFolio就是对几个分析器的汇总。
- 这些分析器是些个什么玩意?这些评测指标是什么?
本文第二部分介绍了一些常用的评测指标是什么。处于篇幅原因,没有过度展开。实际上不少指标如果微调一些参数会有很大出入。所以如果是自己的回测系统大可以根据自己需要去定制,不必过分追求指标好看。除非为了忽悠资金或者抬杠,否则纠结这些指标意义很小。
最后,愿点赞的朋友早日打造出Calmar大于20甚至50的策略。