明汯投教| 何为因子?通常如何分类?
一、因子的定义
投资者可能经常听到这样的描述:“挖掘因子”,“对因子库的持续丰富和迭代”…… 那“因子”究竟是什么?如何界定“因子”以及分类?
在量化选股中,因子是指“对个股收益差异有解释作用的特征”,能够解释投资组合的收益或帮助进行资产定价。因子的有效性主要看预测能力。一个因子被验证为有效,是在某历史时间段内的数据所呈现出来的规律,并不意味着该规律在未来的市场中可以持续有效。
二、因子的分类
因子的种类很多,不同类别的因子能从不同的维度对个股收益差异进行解释。在量化选股模型中,一般可分为“风险因子”与“阿尔法因子”:前者更强调风险来源,解释能力还是很强,但已经缺乏预测能力;后者更强调回报来源,更注重是否能预测未来个股相对收益。
风险因子早期也属于阿尔法因子,只不过很早就被学术界挖掘并公开发表论文,尤其在美股,其收益风险比快速下降——但这些因子还是能够解释很多收益,只是预测能力几乎消失,所以被称为“风险因子”。常见的风险因子包括市值、市盈率、市净率、流动性、残差波动率等。
“阿尔法因子”一般指能较为稳定贡献超额收益的这类因子,其构建相对较为复杂,或数据来源比较独特。一般来说每家机构的阿尔法因子都有所不同,呈现低相关性。
以美股为代表的海外市场和A股市场在运行机制、发展阶段、投资者结构、融资成本及约束等方面都存在较大差异,因而在如何处理阿尔法因子和风险因子方面有所不同。比如海外量化产品以“市场中性+杠杆”为主,考虑到风险因子通常会带来较大波动但不能同时带来显著收益,所以资管机构在建模过程中会尽量减少风险因子的暴露;国内量化产品中则是各类量化多头产品线规模占比最高,对多头产品来说,放开风险因子约束并未显著增加净值波动,严控风险因子反而会对阿尔法因子的发挥有一定制约。
阿尔法因子按数据来源可分为价量因子、基本面因子、事件驱动因子、另类数据因子等。
价量因子
价量因子又可按照预测周期分为短周期价量因子和中长周期价量因子,短周期多指高频和日内因子,中长周期一般持仓周期在1-20天左右。目前,中周期价量因子在A股的配置占比较高。
基本面因子&事件驱动因子
根据引发股价反应的时间跨度差异,又可以分为偏短周期的“事件驱动因子”与偏长周期的“基本面因子”——前者包括财报发布、盈利预增、预计扭亏、突发事件等,后者一般包括估值、成长性、盈利质量等。
目前基本面因子占比也在逐步提高。但对量化私募来说,进一步大幅提升基本面因子配置比例仍有待时机。目前国内量化私募总体管理规模在整体市场的占比仍较小,价量为主的策略还能贡献较好的收益风险比;私募商业模式收费整体高于公募,要求私募管理人提供更好的收益风险比产品以获得投资者的青睐。
另类数据
另类数据因子在海外发展较为成熟,但在国内目前仍属蓝海。头部量化私募除了与多家数据第三方保持联动外,自己也在收集并持续探索以获得更多突破。
三、“因子同质化”现象并不存在
量化投资的盈利来源非常多样化。如上所述,既有微观结构数据驱动的高频因子(国内属于非主流)、交易数据驱动的价量因子、基本面数据驱动的基本面因子,又有事件驱动因子,以及另类数据因子。由于各家量化机构在方法论、模型、团队架构等方面均存在差异,投资组合优化及最终实盘交易行为都非常多样化。
从A股主流量化机构的超额数据分析可知,去掉交易量、波动率、离散度等影响量化超额的共同因子后,各家机构的超额相关性并不高,更不存在所谓的“因子同质化”——海外市场的数据也支持这一结论。主要原因是各家Alpha的交集部分大多用来克服印花税、佣金和冲击成本,而体现业绩的往往是各家比较独特的Alpha因子。此外,从逻辑上说,如果各家机构交易趋同,一定会导致过度交易的股票偏离合理价格,反而给市场上其他参与者提供反向交易的机会,从而导致“交易趋同”不成立。
当然,量化私募管理人仍需持续开发和丰富底层因子,提升策略进化效率和加深对市场的理解,在投资组合层面持续优化模型,挖掘培养优秀人才。目前,各家量化管理人围绕加速融合量化基本面、重视另类数据的应用、基于阿尔法策略微观结构做进一步解构、全周期多策略多品种等方向深入探索,取得了不错的进展和效果。(CIS)