FOF研讨会圆桌论坛:工具化投资时代下 FOF投资策略探讨
主持人:请教一下在座的各位,目前各位所在的公司AI是如何应用于公共FOF产品当中的?
何剑波:AI我们有广义和狭义的理解。一方面我用计算机或者用电脑代替人脑的过程,哪怕是代替一部分的功能,它是不是人工智能?我觉得也是算的。另外更多的人讲AI讲的是机器学习、深度学习技术,像阿尔法狗采用的神经网络技术。从广义的角度来说,我们做的事情基本都是量化的事情,用电脑算法来代替人的过程,当然还是由人来提取的思想。
我重点讲一下机器学习,机器学习用到金融领域,我们这边也做了一些实践,当然我们没有放在基金领域,基金领域还是在模型的框架下去做的,我们运用在股票领域,用了一些深度学习的神经网络,选择技术指标,通过机器的自动学习产生相关的策略,再去验证。目前发现效果其实是不理想的,至少目前我们在这方面还没有突破,我们也对行业内相关的研究人员做了广泛的沟通,他们也基本没有取得突破,但是我个人认为这是一个比较重要的方向,将来一旦有所突破,有可能是革命性的变化。所以,我这边还一直保持一个团队在做这方面的研究,也许半年以后或者一年以后我们在这方面会有所突破。目前的情况,特别是股票市场,我们用AI技术去分析,看起来很复杂、很高大上,但是做出来的结果还不如我们用技术指标做出来的结果好。
王欣:我们是在业内第一家成立了人工智能投资部的公司,同时也是业内第一家成立了博士后工作站,人工智能和机器学习是我们博士后工作站里一个最重要的研究主题。人工智能在FOF投资应用上,我想说的是我们究竟用人工智能在投资领域里能做什么,有哪一类的问题是必须要用AI和机器学习这样的技术来解决的。我本人是做量化研究的,我们在做量化研究的时候用的最多的模型是线性违规,然后再去算不同领域的相关系数,这是我们最常规的手段,但是这种手段还是有一定局限性的,用线性的模型同时能够处理到的因子数量是非常有限的。
打一个最简单的比喻,价格、成交量、涨幅三个因子去预测某一个我想知道的变量,如果只有三个因子,你会发现你用普通的线性模型就能做的差不多了,但是我把因子的数量扩大到50个、100个,明确的告诉你这已经不是一个线性的关系,可能是一个非常复杂的非线性的局面,我们现在用的常规的技术手段实际上是不足以解决的。这个时候你就会发现机器学习为你提供了一个途径,尤其是现在比较流行的深度神经网络这一类技术,它能够为我们解决在高维的非线性空间里寻找规律的问题,为我们提供了技术途径。但是它只是一个工具,但比我们以前所用的常规工具要复杂得多,能够把这种工具应用得好对我们的技术能力积累还是有要求的,并不是把线性的模型,在Excel做一个线性的回归,换一个工具就可以直接把深度学习的工具用好。在应用层面上还是有一定名堂的,目前我们自己也在研究,包括用深度学习做大量资产配置方面的预测研究。未来这必然是一个方向。
大家都比较关心阿尔法狗下围棋这件事情,其实投资跟下围棋还是两码事,下围棋是一个封闭的问题,是在一个有限的空间里,而且是逻辑都非常的清楚,目前棋盘上所有的状态都是一目了然的状态下,机器主要还是依靠它的算力战胜人类的。投资是一个开放性的问题,这个问题没有边界,里面有多少因子,有什么样的变量在起作用,并不清楚,在这样一个领域里,我们只能说尝试的用机器学习解决我们过去处理不了的复杂问题,但是是不是机器学习有朝一日能够替代人类去做决策,我觉得还是有非常长的路要走,但是这条路我们是必须要走的。就像刚才有一位嘉宾说的,大老远看到有一列火车开过来,你想赶上千万不要站在那儿不动,否则它就会瞬间从你身边经过,所以我们现在研究必须要做起来。
郑源:我是读计算机一直读到博士的,之前不是做金融出身的。关于人工智能在计算机的学术界经过过很多次浪潮,最近人工智能又开始复苏。深度学习这件事情大概在6、7年前在学术界已经成为了研究热点,现在学术界的研究热点已经过去了,现在为什么这么火,主要有两个原因,一是智能投顾,二是像阿尔法狗这样的产品开始出来了。实际上我们把人工智能分为两块,传统的机器学习在量化研究中已经被广泛的使用了,传统的机器学习,包括传统的模式识别,这样一些传统的机器学习工具的量化模型已经用的很多了,而且有不错的效果。但是传统的机器学习有一个问题,当数据量用的比较多的时候可能会出现系统稳健性的崩溃,当你对这个系统使用了大量的已有的历史数据,如果把握的不好,本身这个系统反而会出现不太稳定的情况。最近大家看到的像深度学习这样的系统有一些新的改进,比如反馈神经网络,把它应用到机器学习中间去,形成了最热的深度学习,但是大家不要忘了深度学习有一个很重要的前提,即需要大数据。面对数据量不是10万级别的,也不是百万级别的,最好用到千万级别,甚至亿级别的数据。
刚刚何总提出来一个很有意思的挑战,其实中国市场上可追溯的数据量没有那么大,并没有达到大数据级别。现在我们跟很多同行交流,他们现在做两件事,第一件事把跟股票、跟交易品种有关的所有的数据都拿出来用。你不是要千万级别的吗?我就做分钟级的,分钟级不够我就做秒级别的。如果还不够,干脆我提取数据中的相关特征,通过机器产生一些数据。数据量不够,我人造,保证这些人造的数据在统计上符合已有数据的特征。这就有点像有条件上,没有条件创造条件也要上,但确实面临一个问题,跟美国不一样,美国的历史很长,积累了很多数据。
围棋的问题和投资的问题是两个完全不一样的问题,不是开放和封闭的问题,实际上我们现在看到的东西达到的高度是人经过训练都能做得好的事情,但是机器能比我们做的更好,或者能比我们做的更熟练。到目前为止我们通过什么样的体系培养什么样的人成为投资高手,这是非常个性化的问题,而且在人的本质上也没有解决这个问题。从哲学的角度来讲,现在毕竟还叫人工智能,说白了它还是一种仿人类的或者跟人类类似的一种体系,它有没有可能做到人根本做不到,甚至人基本上很难做到的事情,我觉得这是存疑的。所以对于深度学习这一块,包括人工智能,我觉得还是有待时间的发展。传统的机器学习已经很成熟了对于深度学习、对于大数据时代,第一,我们有没有这么多的数据;第二,人工智能界能不能突破人类的边界,说白了还是有一个争论的。
哈图:计算机能帮我们做到的是更快更准更好,但其实本身这件事情是非常复杂的。举个例子,摩尔定律已经有效了50多年了,但很快它的有效的情况从现在开始到未来的5年、10年很快就会衰减。因为我们做的芯片操作的原子是几十个,往下的极限就表示在现有架构情况下计算能力的提高是有极限的。
科学家模拟智能有两个途径,一种是图灵的方式,编辑一种算法,输入输出,输出跟输出之间观察到有智能的情况出现。还有一种方法,用神经网络的方式,我们其实用的计算机它里面的速度是用光速来计的,但神经网络的脉冲每秒就是几百。就像蚂蚁怎么找回家,每个蚂蚁走的时候会在路上留下信息束,人类是当你每做一个学习,做一个正向反馈的时候你的神经网络会加强。所以为什么我们的坏习惯那么难改,因为是神经根深蒂固强化的结果。我们大脑又是非常复杂的密集的神经网络学习的机器,
科学家模拟神经网络计算的时候,用相当于一个楼的电力供给的计算设备模拟一个蟑螂的大脑脉冲信号,再到蟑螂的行为,他们现在只能模拟到老鼠大脑的脉冲。模拟的神经网络复杂的程度扩展到人脑的神经元级别,大概需要一座核电站级别的发电力,才能实现人脑的切片每个神经元定位之后达到人脑的工作模拟。从西医的角度来讲,先用核磁共振监测每一个神经元活动的神经脉冲变化,可能最小的单位是能定位多几千个神经元,可能未来有一天能定位到单个神经元,我们想象一下这需要多大的能量,其实我们人脑功率大概只有20瓦就能做到,我们视觉处理信息的带宽大概是PB级别的,我们所说的人工智能加上人工的智能其实就是算法的专家的模块。我们在顶层在我们策略的体系架构上更好更快速的处理,我们用了大量的人工智能的算法,包括通过极速的方式把市场的有效性提升,但这跟我们用人工智能去做一个策略的系统相比是远远不够的。模式识别是人类在自然中生存的核心的东西,但计算机跟计算机之间的沟通是不需要常识和模式识别的,当人类是在主体的智能领域占有绝对位置的时候,计算机才需要去模拟人类做一些模式识别跟常识的尝试。
我们想象一下,如果真有一个纯计算机的世界,硅原子的世界,可能就不需要常识了。所以人工智能在投资上的应用,我觉得更多的是一种在速度上或专家模块上的应用,跟智能其实并没有关系。我们看待市场也是这样的,市场的数据量在这种研究下还是处于非常小的级别,金融市场非常有幸,因为你能够得到的数据就是全部的数据,这是非常有幸的一点。因为我们做基本面研究的时候面对的是大量未知的东西,里面有需要博弈的东西,但是资本市场拿到的数据就是全部的数据。你观察到市场的有效和市场的不足,反应过度和反应不足,其实在程度和时间上都是存在问题的,我们的投资技术和方式的应用上能把这个过程极速的缩短,缩短的过程就是你获利的过程,也是市场对你的奖励。所以过程中我们用到的一些常识是通过对市场现状的观察去分析市场到底是什么样的,在发生什么事情,能够获得市场在信息传递过程中的反应过度和反应不足,我们能把它缩短。
再往大了说,做一个有语言认知能力的策略系统,这个要依赖于脑科学的研究成果,但目前看来还不太成熟。


















