李荣兴
德邦基金量化投资部总经理、董事总经理
德邦基金基金经理
8月中旬,德邦基金基金经理李荣兴应开源证券金融工程团队魏建榕博士邀请,参加《开源金工•量化一席谈》会议,就AI与全局性量化投资等话题发表专业见解,干货满满。小邦精选部分内容以飨读者,供喜欢量化投资的朋友快速get投资精华观点~
问
您是如何理解全局性在量化投资的应用?
对于量化投资而言,发展过程中会遇到一些问题。首先,回归等传统算法没有办法聚合海量因子,最多包括几十个因子。其次,在多因子框架下,单因子有统计上的需求。市场上有很多信息在回归这些简单的算法层面上,没有办法解决全局性问题。因此,我们需要提高算法聚合信息的能力,像树模型、深度学习、强化学习等算法的使用使得我们聚合信息的能力大幅提升,收益也得到提升。在此基础上人工智能方法,AlphaGo等实践的成功也大大推动了算法层面的发展,而且在过去几年里面取得了比较大的成功。
问
AI是如何融合到量化投资?目前AI和公募主流的传统量化多因子体系,适应面分别体现在哪儿?
在我看来,多因子也是一种机器学习模型,或者说机器学习模型本身也属于多因子方法论。多因子模型最底层是数据,在数据的基础上产生因子并通过统计检验,单因子不存在全局性,多因子方法论有一定的信息聚合能力,在因子的基础上,回归等算法聚合信息的能力比较有限,原来的因子不足以反映市场信息,因此我们拓展因子的概念,原来模型所包含的信息现在仍然可以包含,原来没有办法包含的信息也可以纳入。
在这个层面上,AI是对传统多因子的拓展,第一个是在因子层面的拓展,第二个是算法层面的拓展,像网络算法有各种各样的结构,我们提取信息的能力也大大拓展。AI和多因子本质上是一种东西,只不过AI在信息聚合能力上大幅的提升了,这是我对AI跟传统的多因子体系的理解。
问
您觉得基于AI的量化投资策略,其超额收益主要来自于哪儿?
分析超额时可以将超额归为实时性、全面性和全局性三个要素。随着数据行业的发展,数据实时性得到改善,量价因子的实时性也很好,基本面可以通过分析师预期、舆情数据得以反映;而全面性,经过行业的多年发展,我们的因子已经非常多了,足以全面表达市场状态;过去几年量化最大的变化体现在全局性分析能力的提升,如人工智能算法的应用。
AI算法的信息聚合能力远远超过了原来我们使用的简单算法,在有效聚合信息的基础上模型获得了全局分析市场的能力。相对于主动投资,量化用回测等方法加快验证速度,相比传统算法,机器学习算法加快了探索规律的速度,人工智能框架可以代替人工探索不同的变量组合,这也改变了量化研究的效率。快速获得全局分析能力,是人工智能策略超额收益最底层的来源。
问
AI在数据处理维度中发挥的作用是什么?
现在数据维度非常高,反映市场状态的能力越来越强,结构化的数据越来越多,所以在数据的材料层面已经很完备,在工具层面,现在AI很多算法在处理高维度方面能力强很多,我们需要处理数百甚至是数千个变量,这是我们引入AI最直接的原因,因为它可以处理高维数据,同时也提供了一些非线性的处理,可以对描述市场状况的能力有进一步增强。
问
您目前的策略模型完全是AI驱动么?主观这部分会加入到我们策略么?
我们将量化分为三个维度,第一个维度是选股,第二个是选行业,第三个是择时。在选股方面,我们完全是AI驱动,主观以因子的方式加入到策略中,在AI框架下,通过因子把主观投资中我们认可的、符合投资逻辑、但没有办法通过统计检验的信息加入模型,将主动投资认为有价值有意义的信息以特征的方式加入模型,通过组合优化形成股票组合,通过回测验证有效性;在行业和风格层面,譬如在对冲产品上,我们会做股指期货的风格轮动,我们有中短期的股指期货CTA策略。
但在长期层面,我个人认为量化相对主动优势不明显,因为量化长周期采样的数据样本很少,所以我们把主动投资的观点以子策略的方式加入到CTA里面,相当于把主观投资策略当成子策略直接使用,与Alpha选股独立;此外,择时主要和产品形式相关,落到应用的概率不高。我们目前选股完全量化,而且在量化模型得到的结论与我们主观想法不一致的时候,更愿意相信有数据验证的模型。在选股层面,我们认为我们的Alpha经过了足够多样本的检验,比直接拍脑袋要好。
问
不少人认为,AI中的很多模型,存在样本内过拟合,而样本外失效比较严重的问题。请问您是如何理解这种观点的?以及您认为的正确的AI使用办法,应该是怎么样?
这里主要有两个层面的事情,第一个层面是过拟合的处理上,目前AI有非常成熟的解决方案,在整个机器学习和人工智能行业的应用也已经非常广泛,因此我们有非常成熟且有效的方法对抗过拟合;第二个层面是样本外的有效性,无论是整个行业或者是我们团队,目前在人工智能领域的应用已经很多年了,经历过很长时间的实盘检验,因此在方法论上的有效性是毋庸置疑的。
具体到如何正确地使用AI开发策略。一般的流程是,数据方面,我们将其分成训练集、验证集和测试集,训练集和验证集均属于样本内,测试集是样本外,其中验证集一般用来选择一些超参。如果训练集训练的很好,但是验证集做的不好,可能是训练的过程出现问题。如果训练集和验证集都很好,但是测试集不好,这种策略我们也不会投入实盘使用。
若模型在三种数据集上都有很好的表现,但是实盘过程中仍然效果不佳,我们主要思考两个问题:第一,是否把Beta当成Alpha,第二,是否把周期当成了失效。首先,思考是否只是赚到了小样本分析的钱,而没有真正的赚大样本统计的钱。接着,如果用过去两年的数据训练模型,而这两年的数据具有很强的周期性,而样本外的数据可能完全不在一个周期内,这也会导致模型失效。我们目前正在实盘的模型,有的是用19年之前的数据训练的,我们认为越接近投资本质的模型,失效过程应该是越缓慢的。不可否认的是,随着市场的逐渐成熟,策略的衰减过程必然存在,因此,我们一般使用多策略的方式进行对抗,然后及时跟踪策略表现,逐渐的替换掉失效策略。
问
AI模型能否有效的处理Beta端的预测?
首先需要把Alpha和Beta严格分开。我们目前讨论的Beta既包含市场的Beta,也包含行业的Beta,市场Beta与产品形式关系比较大,比如对于指数增强产品,就不用考虑Beta,都是满仓。近两年行业Beta相关的情况出现的比较多,对投资影响很大。比如说抱团股的崩塌,行业动量的反转。
在思考Beta的时候,我们一般思考三个问题,第一,是否准备好承受Beta所带来的波动。Beta通常是二选一的,容错率不高。第二,Beta与Alpha是否冲突。比如我们做过行业模型,假设能比基准超额20个点,但是如果融入Alpha模型的话,把Alpha模型让10个点行业暴露给它,它可能最后只贡献了两个点。而这两个点也可能会带来一些其它问题,这种情况下,使用这种行业Beta性价比就不高。第三,Beta可靠性有多少。数据量方面,与日频Alpha策略相比,在做日频的行业Beta相关模型时,数据量会下降100倍,如果做的是月频的,数据量会再降几十倍,这种情况下做出来的很多模型还是需要谨慎的。
问
近年来极端市场环境很多,比如新冠、俄乌冲突等黑天鹅事件等,在您的AI量化模型中有相应的调整和应对吗?
近几年每年都会出现一两次极端行情,比如抱团瓦解、行业反转、俄乌战争等。这些极端事件对我们的影响主要取决于我们愿意放出多少Beta换取收益,如果我们把所有风险(系统性风险,行业风险等)都控制住,曲线就会变得平滑,但是超额收益就会少很多。量化投资在控制风险层面具备非常成熟的方法论,能使我们对这种行情冲击不敏感。即使有波动,可能也就是一两个点的超额收益回撤,是可控状态。因此,我认为最重要的是如何做好风险控制,平衡收益和波动。
2022-09-02 14: 11
2022-09-02 12: 23
2022-09-02 12: 22
2022-08-17 22: 18
2022-08-05 22: 18
2022-09-01 22: 18