龙空技术网

金融工程高智威|基于多目标、多模型的机器学习指数增强策略

国金证券研究所 43

前言:

此时你们对“多目标优化决策方法”大体比较注意,同学们都想要学习一些“多目标优化决策方法”的相关知识。那么小编也在网上汇集了一些对于“多目标优化决策方法””的相关知识,希望朋友们能喜欢,兄弟们快快来了解一下吧!

机器学习与量化投资的应用

各类机器学习算法近年来在量化投资领域得到了越来越多的应用,各种模型借助于其巧妙的模型设计有效挖掘到特征或因子间的非线性关系,完成各类因子合成或因子生成的任务,进而形成有效的量化策略,相较于传统人工挖掘因子或简单线性因子合成有着更高的效率和更好的策略效果。

我们着重探讨了基于决策树的GBDT类模型和各种神经网络类模型的算法设计,其中GBDT类模型是通过将多个简单的决策树进行集成,每轮迭代时训练目标为前一轮的预测残差,不断逼近真实值。XGBoost、LightGBM和CatBoost都是三种典型的GBDT算法改进模型。而神经网络类模型通过模仿生物神经元相互传递信号的方式构造。模型结构包括输入层、输出层和多个隐藏层,每一层均有若干个神经元可与其他节点连接。为了解决不同应用场景也出现了不同的网络结构设计,包括专门用于解决时序预测问题的LSTM&GRU、用于结合卷积思路用于时序预测的TCN、以及引入了自注意力机制的Transformer模型。我们在本篇报告中对这些模型分别进行测试比较,最终形成有效的量化投资策略。

两类模型在A股各宽基指数的测试效果

在特征层面,我们使用包括Alpha158、GJQuant基本与日频量价因子和Ta-Lib各类技术指标因子作为模型的输入特征进行测试。发现Alpha158和GJQuant两类特征的结合在GBDT类模型中表现较好,而神经网络类模型中仅使用Alpha158表现更优。在预测标签层面,除了传统的未来20日超额收益率外,我们添加了信息比率和Calmar比率同样作为预测目标对模型进行训练。发现以信息比率和超额收益率作为预测目标的模型信号各类投资组合指标表现相对更好。就模型对比来看,GBDT类模型预测信号的多头超额收益率明显更优,而神经网络类模型的最大回撤明显更低。两类模型的相关性约为0.4-0.5之间,因此我们将两大类模型等权合成,构造最终的选股因子。在沪深300上,GBDT+NN模型因子IC均值达到10.40%,多头年化超额收益率14.44%,多头夏普比率0.73,超额最大回撤仅为5.54%。在中证500上,IC均值10.34%,多头年化超额收益率16.55%,多头夏普比率0.72,超额最大回撤12.84%。中证100成分股上表现更加亮眼,IC均值14.62%,多头年化超额收益率27.71%,多头夏普比率0.97,超额最大回撤4.74%。

基于GBDT+NN模型结合的指数增强策略

以上可以看出,融合了多种模型、多种预测目标的选股因子在各宽基指数成分股上表现优异。考虑贴合投资实际,我们使用马科维茨的均值方差优化模型,对投资组合的跟踪误差进行限制,最大化预期超额收益率的方式进行指数增强策略的构建。在假设单边千二的手续费率下,所得到GBDT+NN沪深300指数增强策略年化超额收益率15.85%,超额最大回撤3.12%。中证500指数增强策略年化超额20.74%,超额最大回撤6.36%。中证1000指数增强策略年化超额32.82%,超额最大回撤3.97%。

风险提示

以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在时效的风险。

策略通过一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出现亏损。

标签: #多目标优化决策方法 #多优化目标决策模型实例