机器学习: AI 在量化投资是如何应用的?

大家好, 我是Lucy@FinTech社区。

今天这篇文章是关于:AI在量化投资中是如何应用的

欢迎大家添加微信fintech34,或扫描底部微信,加入FinTech社区,提认知,攒人脉,求职招聘!

 

本文授权总结自斯坦福创新论坛线上活动(https://www.bilibili.com/video/BV1rk4y1274T) Metabit Trading 的演讲。
 

首先我们来看这张图:

 

它和标准的机器学习任务是比较类似的。当我们有了raw data,然后要进行feature engineering,知道feature之后,进入到machine learning model产生一个prediction。从前半部分raw data到prediction这一步,总共有两个不太一样的地方。


 

第一个不同是:training的raw data可以是任何数据。

比如价格、交易量这种市场数据,或者说是来自财务报表、分析师研报的基本面数据,甚至是新闻社交媒体这种体现交易者情绪的非结构化数据。

这方面有大量的数据清洗工作要做,并且他们必须是自动化完成的。所以像互联网行业,你可以把很多这种标签来外包来完成,但是这块必须要自动清洗,并且清洗的效果越好的话,最终体现的的盈利越多


 

第二个不同的是:machine learning,model这一步的信噪比特别特别低。

你会发现所有你熟知的machine learning model针对的都是这样信噪比为1的情况。所以我们需要对模型底层算法进行一个特性的改进,来针对性地研究一个问题。


 

那下一步,我们有了prediction,该怎么把这个信号变成仓位呢?我们称它为portfolio construction 。这一步也非常重要,有两个原因。

第一个原因是每个股票之间是有correlation的。你可以想象说两个股票走势很像,它们的权重之和你不希望太大,或者两个股市的走势很独立很不像,你可能倾向它们是平均分配,俗称“鸡蛋不能放在一个篮子里”。

所以我们要分析correlation的结构,科学利用这个结构是可以降低风险的。


 

第二点很重要的原因是我们在做portfolioconstruction的时候,要考虑每次做决策股票权重和你上一次给出的权重差异不能太大。

因为差异越大就意味着你买卖进出的操作就越多。操作是有成本的,所以把交易成本的最小化考虑在其中,也是portfolio construction很重要的一项。这一块主要用到的数学工具是optimizationmulti-period decision making


 

因为数据量非常有限,不像做强化学习(reinforcement learning)有大量的simulation来产生数据。在这么小的数据量的情况下,你怎么能有一些知识结构的结构化模型能够把它学好?(需要深入学习)

最后有了仓位,就要考虑发出订单了。我们会用一些随机过程,优化的一些工具来模拟和市场的互动来下单。

说完了这一整个流程,我们来看看AI在不同频率上的不同侧重点。我这里分为了高中低三个频率:

对于高频来说,大家可能经常听到high frequency trading,抢的就是速度。持仓时间、决策时间就是微秒甚至纳秒到分钟级别的,交易快就非常非常重要。所以有一个好的交易系统,也就是 trading infrastructure特别重要!

因为速度快,所以需要的模型就非常简单,跟不上的话什么都白搭。它叫做高频交易, 这个特点就会让它更像是一个硬件设计公司,很硬核。

而且一般来说都是做自营交易,也就是用自己的钱交易。因为市场上太小了,可能就几个亿,也不需要募资。


 

中频领域,速度要求没那么高了,那么我们终于可以上大规模运算量的这种特别复杂的模型了。

此时算法就变成得特别重要。而且这么复杂的算法,它对于research infrastructure的需求就很大,并且数据量相比高频就小很多。

所以过拟合就成了一个很大的问题。它是算法的第一位重要的一个特性。所以它更像一个算法科技公司,算法是核心

并且中频策略一般也是自营,因为它兼具收益稳定和容量大的一个平衡。而我们公司最擅长的其实也是中频和高频,因为他们也是machine learning能利用的比较多的地方。


 

对于低频而言,因为它时间特别长,时间长了以后买卖操作就可以慢慢来,所以容量就变得非常非常大,容量大了对资金的需求就很大。因此,募资就是编程低频策略的重中之重了

但另一方面,持仓时间长,容量大,坏处就是样本点太少,所以需要非常严谨的统计分析总体来讲低频策略擅长的公司往往是资产管理公司,他有很强的金融属性。


 

从盈利的角度来给大家一个直观的感觉:

高频策略,基本上大概率是每天都在赚钱的。

中频策略,大概一周或者一个月也可能是赚钱的。

低频策略,一年一年来看,是以年为单位赚钱的。


 

最后,关于AI 在量化投资是如何应用,大家有其他问题想了解的话,可以添加微信:fintech34,加入FinTech 社区的机器学习小组一起讨论交流。