算法交易与深度学习

算法交易与深度学习

大家好,我是Lucy@FinTech社区,今天的文章将和大家分享算法交易与深度学习。欢迎添加以下微信:fintech78,加入社群,提认知,攒人脉,求职招聘!

Image

在开始进行金融机器学习建模时,将一堆技术信号粘贴到现成的 Keras RNN 或 CNN 中真的很诱人。不用说,这些项目中的大多数都失败了,原因很简单,这些模型是为完全不同的应用程序开发的,而这些应用程序并没有反映金融数据蕴涵的基本经济学理论。

 

今天,我们将跟大家分享

中开发的Multi-Graph Tensor Networks (多图张量网络模型MGTN),并探讨它如何结合经济理论来实现更好的算法交易。

 

01 技术背景

 

为了将经济原理融入我们的深度学习模型,我们不得不求助于图神经网络、张量网络和强化学习领域开发的工具。我们将在这里以非常概念性的方式讨论这些主题, 如果您已经熟悉这些主题,请跳过本节。

1.1 图神经网络

图神经网络 (GNN) 是一种深度学习模型,用于处理在描述为图的不规则域上定义的数据。与卷积神经网络 (CNN) 不同,它们不对底层数据几何做出假设,并且可以将卷积的概念推广到任何数据域。

 

下图提供了关于如何将图像上的经典 2D 卷积(左)视为常规网格(右)上互连像素图上卷积的特殊实例的可视化展示。

Image

 

1.2. 张量分解

张量将向量和矩阵推广到多维数组。例如,矩阵是 2 阶张量,向量是 1 阶张量,标量是 0 阶张量。它们能很自然地描述许多类型的数据,例如图像(具有 3 种模态的 3 阶张量:x 轴、y 轴和 RGB 颜色)以及财务数据。

 

与矩阵类似,张量可以通过张量分解以低秩形式分解。张量分解允许我们以对数方式大幅压缩高维数据,这使我们能够有效地绕过维度诅咒。

 

1.3. Deep-Q 强化学习

Deep-Q 强化学习训练神经网络与给定环境交互以最大化累积回报。这种学习框架特别适用于算法交易,因为回报直接转化为代理的买卖行为产生的利润。

Image

 

02 为什么金融深度学习经常失败

 

因为财务数据经常违反深度学习模型的假设。

 

在我们开发自己的金融深度学习模型之前,我们需要了解为什么传统的 CNN 和 RNN 通常不适用于金融数据,原因很简单:它们不是为这个领域开发的。

 

每个深度学习模型都有自己的一组关于基础数据的假设,这可能不适用于金融市场,因为它具有自己的一组独特特征。

 

例如,CNN 是为计算机视觉任务而开发的。他们假设基础数据是平移不变的,这对于图像是正确的,但对于金融数据则不然。另一方面,RNN 是为序列建模而开发的。他们假设过去的状态可以通过可预测的趋势和季节性影响未来,这部分适用于财务数据,但通常不是一个充分因素。

 

话虽如此,通过非常仔细的问题制定和数据预处理,我们可以规避很多这些问题,并将 CNN 和 RNN 非常成功地用于金融应用。因此,有必要仔细检查我们模型的基本假设,并确保它们能正确反映金融数据蕴涵的基本经济学原理。

 

数据本质上是多模态(多维)的,因为它们包含多个定价信息,这些信息随着时间的推移和多个相关资产关联,这就产生导致计算受到维数诅咒的高维张量。这对过度拟合具有严重影响,并且对于深度学习方法来说尤其成问题。

 

各种市场因素(如套利因素、价值因素、动量因素等)会因时间跨度不同程度地影响定价;这构成了许多机器学习算法无法处理的多分辨率问题。

 

2.1. 数据的驱动因素 - 对冲套利

有许多因素会影响股价,其中很重要的驱动因素可以说是对冲套利。

 

长话短说,对冲套利描述了股票之间此消彼长的一种关系。

 

例如,假设两只股票由于经济环境变化,其中一支股票看空未来下跌空间较大,而另一支股票看涨。你可以做的是通过融券的借入看空的股票,进行做空操作,获利之后再买入看涨的股票。

 

然而,在现实中,期望股价的波动变化很小是天真的。事实上,我们预计看空的股票的估值会大幅下跌,而看涨的股票会有较大涨幅,一涨一跌之间即可获得很大利润空间。

 

请注意,由于对冲数据的成对性质,我们可以为每支股票对定义一个套利值。这使我们能够定义如下图的进位图,它以经济上有意义的方式对不同股票之间的成对关系进行编码。

Image

03 对冲交易的多图张量网络

Multi-Graph Tensor Networks (https://arxiv.org/abs/2010.13209)  开发的多图张量网络(MGTN)模型不需要太多的数学细节,它既利用了张量分解对多维数据建模的能力,也利用了图对不规则区域上的数据建模的能力。这使MGTN能够应对对冲股票数据的几个挑战,如:

 

股价数据的多模态特性自然会导致张量表示,MGTN的张量结构很容易处理这种表示。

 

该模型可以利用张量分解强大的低秩压缩特性,这种特性本质上不受维数灾难的影响,并提供一个正则化框架来处理股价数据的低信噪比特性。

 

长期市场因素可以封装在图形过滤器中,自然会吸引股价数据的成对公式;这允许通过经济意义上的低频图拓扑处理高频定价数据。

 

通过使用MGTN作为深度Q强化学习代理的基础,我们可以对其进行训练,并将其与其他深度学习代理进行比较,以完成股票算法交易的任务。

Image

 

需要强调的是,上述模拟做出了很多假设(例如,无延迟、无交易成本、无市场影响等),因此对结果持保留态度。这个模拟的目的是展示在深度学习模型中结合经济原理如何产生更稳健的交易算法。

 

本期的分享就到这里,欢迎留言互动,谢谢阅读,希望能帮到你。