技术 | 算法交易策略中的机器学习

算法交易依赖于执行算法的计算机程序,这种计算机程序可以自动化交易策略的部分或全部因素。在机器学习的方法下,算法追求学习其他算法的目标,例如最小化预测误差。在这篇文章中,我们来看一看机器学习是如何在算法交易策略中使用的

 

算法对投资组合经理的各种活动进行编码。而基金经理观察市场交易并分析相关数据,以决定是买入或卖出订单。订单序列决定投资组合的持有量。随着时间的推移,这些投资组合会在考虑投资者对风险偏好的同时,产生对投资者具有吸引力的回报。

 

这篇文章摘自 Stefan Jansen的《Hands-On Machine Learning for Algorithmic Trading》。这本书用NumPy、spaCy、pandas、scikit-learn和Keras(等Python包)探索现实世界中有效的交易策略。

 

最终,积极投资管理的目标在于超额回报,即回报超过用于业绩评估的基准回报。主动管理的基本法则是应用信息比率:信息比率=主动管理的回报-基准回报(一般是市场指数)/ 分子的标准差(也就是波动性)。它将信息比率近似为信息系数(IC)的乘积,它衡量结果相关性的预测质量。另外,策略的广度则表示为下注次数的平方根。

算法交易中的机器学习的使用特别使用在如何更有效地使用传统和替代数据,目的是更好和更具可操作性地预测,从而提高主动管理的价值。


 

量化策略在三次浪潮中演变并变得更加巧妙精密:


 

1.在1980年代和1990年代,信号经常出现在学术研究中,并且使用从市场和基础数据中获得的单一或非常少的输入。这些信号现在已经大量被商品化,就如ETF一样方便获得,例如如基本的均值回归策略。


 

2.21世纪,基于因子的投资策略激增。基金使用算法识别暴露于价值或动量等风险因子的资产,以寻求套利机会。金融危机早期的赎回引发了2007年8月的量化界地震,波及到了基于(风险)因子(投资策略)基金行业。这些策略也可以在这些基金设置的组合——基于给定一系列风险因子的只做多smart-beta策略的投资组合中看到。


 

3.第三个时代是由机器学习能力和替代数据的投资驱动的,以产生可重复交易策略的有利可图的信号。因子衰减是一个主要挑战:新的异常(事件)产生的超额回报从发现到发表下降了四分之一,然后由于竞争和拥挤,在策略被公开发表后下降达50%以上。

使用算法来执行交易规则的交易策略种类如下:


旨在从小的价格变动中获利的短期交易,例如套利


旨在利用对其他市场参与者行为预期进行获利的行为策略

 

旨在优化交易执行的程序

 

基于预测价格的一大组交易(执行策略)

 

以上讨论的HFT基金主要依靠短期持有,这些基金从基于买卖套利或统计套利的小幅价格变动中获益。行为算法通常在流动性低的市场中进行,旨在预测交易量大的市场玩家可能会对价格产生重大影响的行动。对价格影响的预期是基于嗅探算法,这种算法能洞察其他市场参与者的策略或市场模式——如ETF基金的强制交易模式。

 

交易执行计划旨在限制交易的市场影响,其范围从简单的交易分割到匹配时间加权平均定价(TWAP)或数量加权平均定价(VWAP)。简单的算法利用历史模式,而更复杂的算法考虑交易成本、执行落差或预测的价格变动。这些算法可以在证券或投资组合水平执行,例如,实现多级衍生工具或跨资产交易。现在让我们来看看在交易中最重要的机器学习算法的不同应用。

机器学习运用在交易中的案例

 

机器学习算法从广泛的市场、基础和替代数据中提取信号,并可应用于算法交易策略过程的所有步骤。重要应用包括:

模式识别和特征提取的数据挖掘

产生风险因子或阿尔法并创造交易理念的有监督的学习算法

将单个信号整合成一个策略

根据算法学习获得的风险概况的资产配置

策略的测试和评估,包括通过使用合成数据

使用强化学习对策略进行交互式、自动化的精细化改良

 

关于α因子创建和聚合的有监督学习

 

将机器学习算法应用于交易的主要理由是获得对资产基本面、价格变动或市场状况的预测。一个策略可以利用多个互为基础的机器学习算法。下游模型可以通过对单个资产前景、资本市场预期和证券相关性的预测的整合,在投资组合层面产生信号。或者,机器学习预测可以为自由交易提供信息,如上文概述的定量方法。机器学习预测也可以针对特定的风险因素,如价值、波动性,或技术方法的执行,如趋势跟踪或均值回归。

资产配置

机器学习已被用于基于决策树模型来分配投资组合,该模型计算风险平价的分层形式。因此,风险特征是由资产价格模式驱动的,而不是由资产类别驱动的,并且实现了(在业绩评估中卓越突出的)的风险回报特征。

 

交易想法回测

回测是选择成功算法交易策略的关键一步。使用合成数据的交叉检验是一项关键的机器学习技术。当它与适当的方法相结合以校正多重测试时,可产生可靠的样本外结果。财务数据的时间序列性质要求对标准方法进行修改,以避免前瞻性偏差或在其他方面污染了用于培训、验证和测试的数据。此外,历史数据的有限可获得性衍生出了使用合成数据的替代方法。
 

强化学习

交易发生在竞争激烈的互动市场中。强化学习旨在训练代理人学习基于奖励的政策功能。

 

在本文中,我们简要讨论了机器学习如何成为算法交易策略不同阶段的一个关键因素。如果你想更多地了解使用机器学习的交易策略,一定要看看《Hands-On Machine Learning for Algorithmic Trading》一书。