龙空技术网

算法交易策略优化中的机器学习方法——设计和时间效率

三分观寰宇 114

前言:

今天你们对“组合优化算法pdf”可能比较关心,姐妹们都想要学习一些“组合优化算法pdf”的相关内容。那么小编在网摘上收集了一些对于“组合优化算法pdf””的相关知识,希望我们能喜欢,同学们一起来了解一下吧!

文|三分观寰宇 编辑|三分观寰宇

文摘:本文的主要目的是建立和分析适合于战略参数优化特点的机器学习方法。最重要的问题是策略性能对小的参数变化和以不规则方式分布在解空间上的大量局部极值的敏感性。这些方法旨在显著缩短计算时间,而不会造成策略质量的实质性损失。在移动平均线交叉系统的情况下,比较了三对不同资产的方法效率。这个问题是针对三组两种资产的投资组合提出的。在第一种情况下,一种策略是在标准普尔指数和DEMDAX指数期货上交易;第二,关于AAPL和MSFT股票;最后,在第三个案例中,HGF和CBF的商品期货。这些方法对包含1998年至2013年间16年每日价格的样本内数据进行操作,并在2014年至2017年的样本外期间得到验证。本文验证的主要假设是,机器学习方法选择的策略的评估标准接近最高标准,但执行时间明显低于蛮力方法(穷举搜索)

关键词:算法交易,投资策略,机器学习,优化,投资策略,差异进化方法,交叉验证,过度拟合。

1导言

在过去的几年里,机器学习的普及和快速发展取得了巨大的进步。新建立的算法被用来解决各种科学领域的许多难题,并产生促进生活许多领域的解决方案。因此,应用这些方法来改进战略调整过程似乎是一种自然的选择。

本研究的主要目的是制定和分析机器学习方法,以适应战略参数的优化特性。最重要的问题是策略性能对小的参数变化和以不规则方式分布在解空间上的大量局部极值的敏感性。设计这些方法的目的是在不显著损失策略质量的情况下显著缩短计算时间。在移动平均线交叉系统的情况下,比较了三对不同资产的方法效率。综合算法——扩展爬山法、网格法和差分进化法是基于众所周知的机器学习方法或基于对前面步骤观察的直观想法,以改进后面的步骤。

本文讨论的机器学习方法旨在选择策略参数,以使策略性能最大化,通过指定的优化标准来衡量。这些方法对包含16年每日价格的样本内数据进行操作,并在4年的样本外数据上验证了它们的结果。在第一种情况下,一种策略是在标准普尔指数和DEMDAX指数期货上交易,第二种策略是在AAPL和MSFT股票上交易,最后,第三种策略是在HGF和CBF商品期货上交易。

本文验证的主要假设是,机器学习方法的结果与通过穷举搜索(蛮力方法)获得的最高评估标准附近的结果相同或仅稍差,但是它们的执行所需的时间显著低于从解空间检查所有点的计算时间。额外的研究问题是,通过机器学习方法获得的策略比通过穷举搜索过程获得的策略具有更低的过拟合风险。

比较并给出了优化准则的分布和1000次不同方法执行的计算时间详尽的搜索结果。对样本内数据和额外的样本外数据进行调整质量评估,以

测试过度拟合趋势。让我们强调,本文的目的不是设计最有利可图的策略,而是比较不同机器学习方法和穷举搜索(蛮力)的效率。在样本外阶段进行测试,以评估过度拟合问题。针对不同资产组的模拟是在为本研究目的而实施的同一框架中执行的

基本的机器学习方法有严重的缺点。例如,众所周知的爬山法返回局部极值,但不能保证到达全局极值。该算法不足以解决全局搜索问题,但它可以作为更复杂和更有效的全局优化方法的主要组成部分。

由于机器学习方法通过解决大量复杂问题证明了它们的价值,因此,期望这些方法用于策略优化的满意结果是合理的。最初的直觉是,机器学习方法返回的结果会比最优方法差一点,但比检查所有可能性以获得最佳结果(穷举搜索)的时间要短得多。

此外,预计机器学习方法比穷举搜索更不可能过度使用策略。所讨论的方法基于这样一个假设,即对于被该准则的高值所包围的点,优化准则的条件期望值通常较高。因此,解空间的低正则性可能是该方法性能的真正障碍。没有理由假设甚至现代水平的空间规律性,所以机器学习方法可能找不到最佳点,如果它们不在高值邻域。这种特性可能会降低过度拟合的风险,因为通常情况下,那些策略表现相似的人所包围的参数向量在未来盈利的机会比那些来自不太稳定的地方的人更大。

本文的结构如下。第二章是文献综述。第三部分阐述了本文使用的机器学习方法,以及交易假设和基本术语。第四章是数据描述,第五章是效率测试。考虑机器学习方法,特别关注优化标准和计算时间分布。最后一部分是对结果和结论的总结。

2 文献综述

机器学习方法已经发展了几十年,甚至在这个术语在五十年代被创造出来之前(塞缪尔,1959)。然而,由于人工智能在科学和生活的各个领域应用的技术可能性,近年来人们对该领域的兴趣日益增加。维拉提(1984)讨论了从计算观点学习的现象。人类天生的学习和适应能力表现在信息的选择和自动调整过程,导致算法的修改。

这种方法被大量的现代机器学习方法所遵循,它接近于经典统计建模的一般思想,在经典统计建模中,包含新的数据集会导致模型本身的变化。传统的统计和计量经济模型通常假设数据是由特定类别的随机过程产生的。当机器学习方法通常基于迭代改进而没有指定的模型形式时,拟合过程旨在找到精确到实际数据的过程。Breiman (2001)广泛讨论了这两种方法(分别称为数据模型和算法模型)之间的差异。机器学习领域包含大量的各种算法和方法,用于解决各种各样的问题。有些方法有很强的数学基础,例如,基于马尔可夫链蒙特卡罗的方法(尼尔,1993),而其他方法,如爬山法或进化方法,则基于启发式方法(朱尔斯和瓦滕伯格,1994)。

Hastie等人(2013)和Hastie等人(2001)讨论了科学问题中常用的方法和算法。

算法策略在金融市场中被广泛使用,但由于其独特性,大多数算法策略并没有在论文中讨论。然而,一些类型的量化策略是广为人知的,因此,在书籍和论文中被讨论。基于技术分析指标的策略,如简单移动平均交叉法。

本文中所考虑的是针对Gunasekarage和Power (2001)中的特定案例进行分析的。自从机器学习方法开始流行以来,作为解决各种领域问题的工具,出现了许多将其用于交易策略的尝试。除了商业用途之外,许多描述战略的学术论文已经发表,其中逻辑基于机器学习。例如,Sankovi等人(2015年)的一组研究人员提出了基于技术分析和最小二乘支持向量机的策略。与本文相反,他们使用机器学习方法作为生成交易信号的系统的一部分,而不是作为系统优化过程的一部分。

最近的研究是由Ritter (2017)进行的,他使用带有适当奖励函数的Q学习来处理风险厌恶情况,并在模拟交易中测试策略。Dunis和Nathani (2007)提出了基于多层感知器(MLP)、高阶神经网络(HONN)等神经网络和K近邻方法的量化策略。作者证明了方法可以有效地用于从黄金和白银交易中产生超额收益。机器学习方法的性能与ARMA类型的线性模型之间的比较不仅导致构造更好的策略,而且还显示了所考虑的时间序列中非线性的存在。

应用机器学习方法来预测未来价格现在变得越来越流行。沈、姜和张(2012)提出了基于支持向量机的股票市场指数预测模型,并基于产生的预测结果对交易系统进行了测试。Choundhry和kum (2008)采 用了类似的方法,他们引入了混合机器学习系统,将支持向量机和遗传算法相结合来预测股票价格。帕特尔等人(2015年)在最近的一项研究中也使用了机器学习方法进行预测。本文主要研究数据预处理方法,以便进一步预测。因此,许多书籍和论文讨论了一般方面和方法,如向前行走优化(柯克帕特里克和达尔奎斯特,2011年或帕尔多,2011年)。

差分进化是本文考虑的方法之一,由Storn和Price (1997)设计,并在其他论文中讨论,如Price等人(2006)。该算法是为解决具有不规则解的复杂问题而提出的空间。它被用于解决Aria等人(2010)的非凸投资组合优化问题和Aria等人(2011a)的大规模投资组合的CVAR最小化问题。该方法被证明是优化复杂问题的有效方法。

标签: #组合优化算法pdf