什么是量化多因子模型
在了解因子模型之前,我们先来认识一下因子。
究竟专业人士口中的因子是什么?以我们日常生活中熟悉的事件来举例,比如我们形容一个人很优秀,那么知识丰富、长得好看、善良、诚实、情商高等等都是构成这个人优秀的指标,这些指标就是因子。
说回到投资,因子也就是我们投资过程中,挑选优秀股票的指标,广义区分为财务类因子和技术类因子,在不同的市场环境,发挥作用的因子各不相同。
多因子模型,即从众多因子中,选择相对有效的因子建立选股条件从而判断买入和卖出。
再举一个生活的例子,这就像是相亲过程中,人们判断这个人适不适合交往一样,往往会有几个标准,把这几个标准组合起来就是一个模型,当然不同的人对不同标准的重视程度不同,这个指标的权重也就不同,比如有的人看重共同的兴趣好爱,有人看重长相,有的人看重物质基础一样,正因为这样,所以每个人择偶的模型也会不同。
运用到我们的量化投资中是一个道理,我们要预测这一周哪些股票会比另外的股票涨得多,要怎么预测呢?
既可以通过公司的财务指标,比如净利润、利润增速、负债、周转率等进行分析;也可以通过股票的行情走势,形成技术指标,比如均线、布林轨等进行分析;还可以整理、汇总市面上的分析师、股吧等等对这只股票的舆论等进行分析。不同的量化私募管理人,会根据自己的投资风格组合出不同的模型,这就是多因子模型。
那么如此多度量股票状况的因子,如何把它们有效的整合到一起呢?
这就需要对各因子分配权重,一般有两种方法,打分法和回归法。打分法需要自行确定每个因子的系数,这很具有主观性,而回归法则利用历史数据去拟合,得到拟合系数作为每个因子的权重。比如几个彼此相关性高的因子应该弱化其中每个单一因子的权重;对未来股价预测能力更高的因子,应该强化其权重等等。
多因子模型是量化投资策略中最普遍运用的模型。它通过分析各个因子与股票表现,收益率之间的关系,而建立了一套量化选股的体系,可以在对标指数的股票池中更全面更准确的选出优质股票,从而实现超额回报。
机器学习在量化投资中的意义
机器学习策略框架根本目标与传统的量化投资策略本质上没有什么不同——即发现已有数据与未来投资回报之间的密切关系,并加以利用,制定相关的策略。然而,寻找这些数据关系的方法(通常在机器学习模型中称为“特征”)的不同之处在于,它们往往完全由数据驱动,不需要分析师预先给出的理由或直觉。
我们拿一只猫来举例,假设要构建一个识别猫咪的程序,如果用计算机用传统的方法进行识别,那么就需要输入一连串的指令,比如猫长着毛茸茸的毛,顶着一对三角形的耳朵等等,计算机会根据这些人为预先给出的理由或直觉指令去执行,但这个过程中可能会涉及到一些复杂、困难的概念,比如毛茸茸这个特征,计算机就难以理解,因此更好的方式是让机器自己学会学习。我们给计算机提供大量猫的照片,让计算机自己从中找到猫的特征,最终通过对不同特征的学习,来判断哪些特征组合起来是猫,这个就是机器学习。
机器学习技术的一个非常有趣的点是,它们能够处理大量非结构化数据,以及文本、音频、视频和图像。运用到我们的量化投资,机器学习的方法,就是金融计量方法的延伸,可以从线性模型到非线性模型,低维度到高维度,运算速度非常快。比如可以通过对成交量,波动率,价格,涨跌幅等等特征的学习,也可以通过对新闻文章、分析师笔记、分析师通话等这些文本情感特征进行学习,而通过对这些特征的学习,就可以生成对股票不同周期的预测,再把这些策略做优化组合,就形成了一套完整的策略。
举个例子,一个公司如果有卫星云图,能够看到停车场上的停车情况,就能判断这个月的车辆销售额是多少,用各种各样的奇怪的大数据能就够大概地在一个公司的年报或季报出来之前,得到公司相关的预测,只要在他之前就能预测出质量比较高的信号,那就可以战胜市场。
但事实上,从目前来看,机器学习的策略框架依然有许多不可被解释的部分,机器学习也不是什么一劳永逸的魔法,人要做的永远是最困难的那部分工作,真正优秀的量化机构或者量化策略就是要和数据日夜纠缠,发现问题,解决问题,通过人的不断的学习,让自己的计算机更聪明,跑得更快,才有机会在长跑中取得更好的成绩。
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站不拥有所有权,不承担相关法律责任。如发现有侵权/违规的内容, 联系QQ15101117,本站将立刻清除。