量化一席谈|德邦基金李荣兴:AI与全局性量化投资

李荣兴 2022-09-02 14:11

李荣兴


德邦基金量化投资部总经理、董事总经理

德邦基金基金经理


8月中旬,德邦基金基金经理李荣兴应开源证券金融工程团队魏建榕博士邀请,参加《开源金工•量化一席谈》会议,就AI与全局性量化投资等话题发表专业见解,干货满满。小邦精选部分内容以飨读者,供喜欢量化投资的朋友快速get投资精华观点~


您是如何理解全局性在量化投资的应用?


对于量化投资而言,发展过程中会遇到一些问题。首先,回归等传统算法没有办法聚合海量因子,最多包括几十个因子。其次,在多因子框架下,单因子有统计上的需求。市场上有很多信息在回归这些简单的算法层面上,没有办法解决全局性问题。因此,我们需要提高算法聚合信息的能力,像树模型、深度学习、强化学习等算法的使用使得我们聚合信息的能力大幅提升,收益也得到提升。在此基础上人工智能方法,AlphaGo等实践的成功也大大推动了算法层面的发展而且在过去几年里面取得了比较大的成功。


AI是如何融合到量化投资?目前AI和公募主流的传统量化多因子体系,适应面分别体现在哪儿?


在我看来,多因子也是一种机器学习模型,或者说机器学习模型本身也属于多因子方法论。多因子模型最底层是数据,在数据的基础上产生因子并通过统计检验,单因子不存在全局性,多因子方法论有一定的信息聚合能力,在因子的基础上,回归等算法聚合信息的能力比较有限,原来的因子不足以反映市场信息,因此我们拓展因子的概念,原来模型所包含的信息现在仍然可以包含,原来没有办法包含的信息也可以纳入。


在这个层面上,AI是对传统多因子的拓展,第一个是在因子层面的拓展,第二个是算法层面的拓展,像网络算法有各种各样的结构,我们提取信息的能力也大大拓展。AI和多因子本质上是一种东西,只不过AI在信息聚合能力上大幅的提升了,这是我对AI跟传统的多因子体系的理解。


您觉得基于AI的量化投资策略,其超额收益主要来自于哪儿?


分析超额时可以将超额归为实时性、全面性和全局性三个要素。随着数据行业的发展,数据实时性得到改善,量价因子的实时性也很好,基本面可以通过分析师预期、舆情数据得以反映;而全面性,经过行业的多年发展,我们的因子已经非常多了,足以全面表达市场状态;过去几年量化最大的变化体现在全局性分析能力的提升,如人工智能算法的应用。


AI算法的信息聚合能力远远超过了原来我们使用的简单算法,在有效聚合信息的基础上模型获得了全局分析市场的能力。相对于主动投资,量化用回测等方法加快验证速度,相比传统算法,机器学习算法加快了探索规律的速度,人工智能框架可以代替人工探索不同的变量组合,这也改变了量化研究的效率。快速获得全局分析能力,是人工智能策略超额收益最底层的来源。


AI在数据处理维度中发挥的作用是什么? 


现在数据维度非常高,反映市场状态的能力越来越强,结构化的数据越来越多,所以在数据的材料层面已经很完备,在工具层面,现在AI很多算法在处理高维度方面能力强很多,我们需要处理数百甚至是数千个变量,这是我们引入AI最直接的原因,因为它可以处理高维数据,同时也提供了一些非线性的处理,可以对描述市场状况的能力有进一步增强。


您目前的策略模型完全是AI驱动么?主观这部分会加入到我们策略么?


我们将量化分为三个维度,第一个维度是选股,第二个是选行业,第三个是择时。在选股方面,我们完全是AI驱动,主观以因子的方式加入到策略中,在AI框架下,通过因子把主观投资中我们认可的、符合投资逻辑、但没有办法通过统计检验的信息加入模型,将主动投资认为有价值有意义的信息以特征的方式加入模型,通过组合优化形成股票组合,通过回测验证有效性;在行业和风格层面,譬如在对冲产品上,我们会做股指期货的风格轮动,我们有中短期的股指期货CTA策略。


但在长期层面,我个人认为量化相对主动优势不明显,因为量化长周期采样的数据样本很少,所以我们把主动投资的观点以子策略的方式加入到CTA里面,相当于把主观投资策略当成子策略直接使用,与Alpha选股独立;此外,择时主要和产品形式相关,落到应用的概率不高。我们目前选股完全量化,而且在量化模型得到的结论与我们主观想法不一致的时候,更愿意相信有数据验证的模型。在选股层面,我们认为我们的Alpha经过了足够多样本的检验,比直接拍脑袋要好。


不少人认为,AI中的很多模型,存在样本内过拟合,而样本外失效比较严重的问题。请问您是如何理解这种观点的?以及您认为的正确的AI使用办法,应该是怎么样?


这里主要有两个层面的事情,第一个层面是过拟合的处理上,目前AI有非常成熟的解决方案,在整个机器学习和人工智能行业的应用也已经非常广泛,因此我们有非常成熟且有效的方法对抗过拟合;第二个层面是样本外的有效性,无论是整个行业或者是我们团队,目前在人工智能领域的应用已经很多年了,经历过很长时间的实盘检验,因此在方法论上的有效性是毋庸置疑的。


具体到如何正确地使用AI开发策略。一般的流程是,数据方面,我们将其分成训练集、验证集和测试集,训练集和验证集均属于样本内,测试集是样本外,其中验证集一般用来选择一些超参。如果训练集训练的很好,但是验证集做的不好,可能是训练的过程出现问题。如果训练集和验证集都很好,但是测试集不好,这种策略我们也不会投入实盘使用。


若模型在三种数据集上都有很好的表现,但是实盘过程中仍然效果不佳,我们主要思考两个问题:第一,是否把Beta当成Alpha,第二,是否把周期当成了失效。首先,思考是否只是赚到了小样本分析的钱,而没有真正的赚大样本统计的钱。接着,如果用过去两年的数据训练模型,而这两年的数据具有很强的周期性,而样本外的数据可能完全不在一个周期内,这也会导致模型失效。我们目前正在实盘的模型,有的是用19年之前的数据训练的,我们认为越接近投资本质的模型,失效过程应该是越缓慢的。不可否认的是,随着市场的逐渐成熟,策略的衰减过程必然存在,因此,我们一般使用多策略的方式进行对抗,然后及时跟踪策略表现,逐渐的替换掉失效策略。


AI模型能否有效的处理Beta端的预测?


首先需要把Alpha和Beta严格分开。我们目前讨论的Beta既包含市场的Beta,也包含行业的Beta,市场Beta与产品形式关系比较大,比如对于指数增强产品,就不用考虑Beta,都是满仓。近两年行业Beta相关的情况出现的比较多,对投资影响很大。比如说抱团股的崩塌,行业动量的反转。


在思考Beta的时候,我们一般思考三个问题,第一,是否准备好承受Beta所带来的波动。Beta通常是二选一的,容错率不高。第二,Beta与Alpha是否冲突。比如我们做过行业模型,假设能比基准超额20个点,但是如果融入Alpha模型的话,把Alpha模型让10个点行业暴露给它,它可能最后只贡献了两个点。而这两个点也可能会带来一些其它问题,这种情况下,使用这种行业Beta性价比就不高。第三,Beta可靠性有多少。数据量方面,与日频Alpha策略相比,在做日频的行业Beta相关模型时,数据量会下降100倍,如果做的是月频的,数据量会再降几十倍,这种情况下做出来的很多模型还是需要谨慎的。


近年来极端市场环境很多,比如新冠、俄乌冲突等黑天鹅事件等,在您的AI量化模型中有相应的调整和应对吗?


近几年每年都会出现一两次极端行情,比如抱团瓦解、行业反转、俄乌战争等。这些极端事件对我们的影响主要取决于我们愿意放出多少Beta换取收益,如果我们把所有风险(系统性风险,行业风险等)都控制住,曲线就会变得平滑,但是超额收益就会少很多。量化投资在控制风险层面具备非常成熟的方法论,能使我们对这种行情冲击不敏感。即使有波动,可能也就是一两个点的超额收益回撤,是可控状态。因此,我认为最重要的是如何做好风险控制,平衡收益和波动。



风险提示:基金有风险,投资需谨慎。基金管理人承诺以诚实信用、勤勉尽责的原则管理和运用基金资产,但不保证基金一定盈利,也不保证最低收益。我国基金运作时间较短,不能反映股市发展的所有阶段。基金的过往业绩及其净值高低并不预示其未来业绩表现,基金管理人管理的其他基金的业绩并不构成对基金业绩表现的保证。基金管理人提醒您基金投资的“买者自负”原则,在做出投资决策后,基金运营状况与基金净值变化引致的投资风险,由您自行负担。基金管理人、基金托管人、基金销售机构及相关机构不对基金投资收益做出任何承诺或保证。您在做出投资决策之前,请仔细阅读基金合同、基金招募说明书和基金产品资料概要等产品法律文件和风险揭示书,充分认识基金的风险收益特征和产品特性,认真考虑基金存在的各项风险因素,并根据自身的投资目的、投资期限、投资经验、资产状况等因素充分考虑自身的风险承受能力,在了解产品情况及销售适当性意见的基础上,理性判断并谨慎做出投资决策。


相关推荐