红移投资,胜率差,算法交易,统计套利,量化投资,做中国一流的量化对冲投资公司
当前位置: 主页 > 红移视点 >

模型因子下的股票量化投资

时间:2018-01-31 11:07

TAG 标签:

  投资是艺术的,也是科学的。很多时候我们无法预测未来,可能无从判断一家公司会不会长存百年,上市公司财报数据的作假,更会令重仓的基金遭遇滑铁卢,我们只能戏称为艺术的。但投资也是科学的,证券市场的运动,本质上也是某一类世界的运动,长期的运动,内在必然是符合一定的规律。正如历史的演变、尘埃的运动,内部是有规律的。
 
  而量化投资,无疑是把投资的逻辑以数据的方式展示出来,将主动投资的理念以及金融市场的一些行为,更理性地表达给大家。量化,不仅仅是程序化交易,或者套利,也不是天然与主动投资相对立,它代表着一种对于问题的思考、解决方式。
 
  在证券市场,影响每只股票的涨跌有很多因素,有系统因素、行业因素、基本面因素、技术面因素,而每一个因素背后都是有不同逻辑的。量化投资,跟其他投资方式一样,我们也需要去把握背后的逻辑。理解每一个背后的逻辑,才能知道自己能把握什么,而哪些又是所不能把握的。在这些所有的因素当中,我们本身需要去合理地、有层次地划分这些因素。
 
  证券市场的涨跌,影响着每只股票的涨跌。一家企业,个体层面,我们要看他它是否符合历史的浪潮,所处的经济周期是否有利于它的发展。大股东有股价诉求,机构投资者会遍览三张报表,散户投资者会去看各类图形,而连接这三者的,则是股票价格。不管是谁,我们都想要一个合理的价格,都想低买高卖。对于价格,充斥着博弈,但正因为太多的人关注,价格却是一个很大的风险因子。例如高送转,就纯粹是一个博弈的过程,它造就了股价的波动,却带来不了长期稳健的超额收益。影响一只证券的所有因素,我们都要有所思,也要有先后,这个才能合理地一步步分解。下表即是最经典的Barra风险模型中因子的分类,也是上图中的特异风险的一种视角。当我们把股票分成很多因素的时候,我们就能清晰地知道,我们需要解决哪些问题,而不是单纯地去判断某只股票的涨跌。
  市场,我们总是强调估值以及盈利。一个合理的市场,就像沉淀百年以上的美国股市,影响市场层面的也是这两个问题。我们的领导也一直在努力让我们的市场变得更规范,而不是变成一个赌场,一个圈钱的地方,要让投资者享受到国家经济发展带来的收益。估值和盈利,这是两个不同问题,它更多地需要从宏观出发。美国经济数据,对于美股涨跌的解释度可以达到很高,这也是技术分析在美股失效的原因之一。做量化投资的,在同样分析宏观经济的基础上,比起其他投资者可能更注重数据,强调自己去构建指标。对于纯理科出身的人来说,我们可以以更贴近市场的角度来学习,同样常用的基础数据,我们可以构建出有效的指标,不仅能去解释前面这两个问题,也能解释债券市场的走势,在大类资产配置上做一个比较良好的宏观指导。下图展示了某两个常用数据的复合指标对于债券的领先性。也许每个宏观分析师都疑惑的问题,每一次违反之前的历史规律,恰是领先于市场的投资良机。
  行业层面,每个人的知识结构、资源禀赋都不一样,对于做量化的,暂时无法把握,但我们不排斥对各个行业研究和宏观债券的学习。初时会显生涩,但量变引起质量,当我们不再奉为金科玉律,不再心动时,也许已经发生变化了。
  比如消费股,无论是A股,还是美股,消费行业都是可以穿越市场周期,长期都是跑赢其他行业的。但其他因素,则是量化投资所能把握的,寻找到股票投资的alpha因子。
 
  投资需要信仰,巴菲特、格雷厄姆的信仰是价值投资,而量化投资的信仰表面是alpha,背后支撑的逻辑同样是符合股价长期投资理念的价值投资以及人们的金融行为、心理缺陷。主动投资者每天看财报,演算财务数据,我们也每天看财报,可以去粗略了解几乎每只股票的基本面,我们也善于从资产负债表、利润表、现金流量表构建自己的指标,我们可以公平地对待每家企业,不带任何偏见。我们也可以从数据本身,去更快地发现一家企业的变化,做投资。虽然我们不会重仓,但我们不会错过牛股京东方等,我们也敢一直把海康威视(002415,股吧)、万华化学(600309,股吧)等股票在2017年的组合里一直配置其中。我们也可以看着股票随着基本面的变化,感受着它们的起起落落。
  每个做量化投资的都可以给出一个很好的组合回测,但有些可能是跟随着别人,有些或者是利用机器学习,输入一堆数据,而不是去想背后的逻辑。构建组合最通用的做法是多因子,在国内,景顺长城、华泰柏瑞等一批基金,则以海外巴克莱银行的barra模型为基础。这些模型背后都有很扎实的数理基础,而采用统计学模型最基本的一个条件是,独立正态分布。但A股数据,正如美股市场一样,存在于市场的是大量的小市值公司,这带有很强的右偏性。
 
  再者在刚开始的十几年里,A股是一个高市盈率的市场,高市盈率导致投资价值变低,于是大家更愿意相信炒作,听消息。这使得A股的反转效应显得特别明显,以此构建的股票收益会很高。
  A股还有一个显著特点,散户占比高,散户更喜欢看图炒股,而股价其实由散户和机构投资者的博弈达到均衡的一个结果,以散户为主的市场,必然使得以特异度、成交量等这种鲜明的博弈特征的因子,收益也很高。股票的数据是客观存在的,但它又带有很明显的倾向性,如何去寻找alpha因子,这需要改变我们已有的通用算法。正交化处理,在高等代数里,逻辑很严密,但大家好像认为这样一正交化,就能完全去除自变量的影响一样,结果可能发现构建的组合仍然受着自变量的影响。
 
  投资本身是跟经济学紧密联系在一起的,从经济学原理出发,我们能找到最坚实的基础,这足以去夯实我们的投资理念。我们相信每一时刻整体市场的有效性,却又坚持每一时刻的无效性,等待着下一时刻整体市场内部的有效运动,如此周而复始。高等数学的精妙算法,又能让我们在噪音频出的A股数据中,寻找到坚实的数据支撑。
 
  学习数学也一样,过了多年以后,也许我们会忘记如何去计算积分,但我们不会忘记支撑数学大厦的基础、核心支柱。我们在探索真理,而数学不断地让我们接近真理。盲目地使用机器学习算法,虽然可以让我们在已有的世界里看起来美好,却有可能迷失在未来的世界里。
 
  我们把股票的收益分成两部分,一部分是alpha,一部分是beta。事实上,对于股票的影响,beta远远大于alpha,所以人们总是喜欢忽视alpha,分析beta,因为beta在某个阶段可以创造非常高的收益。获得alpha的前提是,我们需要合理地去定义风险因子和alpha因子的区别,像市值、动量和反转,这种都极具beta特征,它虽然能让我们在2013-2015年收益颇丰,但也能使我们的组合在2017年亏损巨大。
  解决这个以后,其实也可以说阿尔法模型、风险模型、交易成本模型这三个所需的模型当中,风险模型是最弱化的,我们要研究的,是比别人更好的阿尔法模型和交易系统。Barra模型提供了一种看待股票收益的角度,但是也限制了看问题的角度,如同协整条件限制了做配对交易的角度。我们总讲究创新,我们也要变化角度去看待事物,然后,我们可以构建更好的、在未来一直有效的模型。
 
  可以确切地讲,在现有的构建组合的过程中,每一步都有更好的方法处理。很多人去评判因子的好坏,总喜欢用高数值因子和低数值因子的股票组合相比较,这大概是国内外教授最喜欢用的一种方法,简单粗暴,又易于发学术文章,但这里面,到底边际贡献有多少,还是噪音多,就不得而知了。每只股票都有很多影响因素,更何况只是一个单纯的股票组合,以前做理科实验时,我们总强调实验组和对照组,而股票组合研究也应如此。可是我们总是去研究比较包含多种风格因素的组合,比如沪深300和中证1000,这两个指数在行业分布、市值大小、估值高低、成长性,多个方面都是不一样的,而我们却把它们作为大小盘的评判标准。世界是丰富多彩的,不仅仅只有黑与白。价值和成长也从来不是对立的,它俩是刻画一个股票的、从基本面出发的两个角度。
 
  一家高增长的公司当然是有价值的。只不过很多时候,低估值的股票往往是大市值的,而高增长的股票往往是小市值的,市值大小是处于对立面的,大多数投资者也就把价值和成长对立起来了。今年很多量化基金可能获取的是负的超额收益,这其实是因为这些基金本身配置了很多beta,而多种风格在今年都发生了切换。如同CTA组合里,当策略相关性变得高时,组合的波动率必然增大。有人说国家队操纵市场,但它影响的只是局部,整体市场,或者是长期的有规律的运动,从来不是某个人所能操纵的。
 
  即使我们自认为能找到很好的alpha以后,由于之前所说的A股市场特征,在因子构建、因子选择、因子加权,在使用barra模型的过程中,我们既需要大胆,又需要小心处理,我们要对模型改变算法,合理地改造,才能构建出我们想要的组合。很多人在构建组合的时候,目的是去构建一个基本面组合,但业绩归因,其实发现组合并不是纯粹的基本面组合,那组合的收益走势,当然非预期所想。
 
  像景顺长城、华泰柏瑞的量化基金,所做即是所想,归因发现,他们都纯粹是一个基本面组合,几乎不带有任何技术类因子,所依赖的因子也就几个因子,两家基金最大的区别可能是股票行业分类的不同(比如非银金融)。长信量化先锋和申万中小盘都是2016年的量化牛基,但是他们的构建有相同点,也有不同点。长信量化先锋的基准应该是中证1000,而且由于技术面因子在A股历史的有效性,股票组合也不断地向技术面因子偏移。申万中小盘的基准是中证500,但是会暴露小市值,技术类因子很少暴露,重于基本面。
 
  构建组合,因为需控制相关风险,必然是用到组合优化模型,组合优化以最大化风险和交易成本调整后的收益为目标下:
 
  我们所要求的股票权重,表示每只股票的预期收益率,前面提到的barra模型,就是一种计算预期收益率的方法,这个也是我认为模型中最重要的部分,当然每家都是不一样的。是协方差矩阵,是风险厌恶系数,TC表示换仓时的交易成本。表示行业矩阵,X表示我们所要控制的各个风险因子,比如反转因子。
  在这里,我们以沪深300为对标指数,回测区间为2012年到2017年7月,股票池为全市场剔除ST、最近上市的股票,双边交易成本为千3,个股权重上限为max(1.5%,+1%),行业允许有0.1%的偏离,市值暴露敞口控制在0.1内,按月换仓,优化模型用matlab。我们的目标是构建一个以基本面为主的组合,所以我们不仅控制要行业、市值,也要控制Beta、Momentum等风险因子,充分暴露Earings、Growth、Value这些基本面因子。
 
  很多时候,我们相信因果循环,我们相信均值回复,所以在经济触底的时候,我们相信会有企稳反弹,也会有经济的复苏。而被低估的股票,未来也一定会价值回归。从基本面出发,构建盈利性高、成长性高、估值低的组合,将在未来收益一直丰厚。下图就展示了这个组合在剔除了市场、行业、市值、风格等因素的情形下的超额收益走势,它的年化超额收益达到16%。沪深300,这只是整体股票市场的一个局部世界,量化可以去超越每个有一定稳态的、有规律的局部股票组合,比如上证50、行业指数。
 
  对于各种风格切换,如大小市值的切换,与权益投资者聊天,能发现他们比做量化的把握更好,当一些基金仍死守小市值时,他们早已切换到核心资产。当我们把问题切割以后,我们也可以去研究宏观。正如债市有领先指标,风格切换也有领先指标。而风格切换,某种程度上,都是一个较长期的结果。
  举个例子,我们设计的市值强弱,可能与申万的大小盘指数不太一样,因为我们是剥离掉其他beta和alpha,纯粹研究市值这个beta的结果。多年的投资从业者应该会有直觉,2013年到2015年,对冲基金比2009到2011年要好做。
 
  而我们的其中一个模型则表明,大小盘风格切换早已注定,而未来何时切换,仍未可知。所以在这个时刻,去赌小市值的反弹,结果未必是好的,虽然它已经比大盘走弱了很长时间,可能在未来某个时候会回归,但这并不是一个很好的理由,它其实并没有很强的数据支撑。可能还不如赌量价因子的回归,当我们去买贵州茅台时,可能我们并不仅仅只出于价值投资。
 
  此外,相对于主动投资者,我们懂得何时去固守价值投资,何时去放弃部分价值投资,也许一个做主动投资的,很难让他去改变自己的投资理念。或者在基本面投资弱势时,他很难采取其他有效的措施。而明年的市场,将可能会证明这一点。
 
  当我们构建还算可以又异于市场的alpha模型,能把各类beta问题一一解决时,我们可以以整体的视角更好地看待证券市场。再去看每只股票的涨跌时,我们会淡然处之,也无需听消息而心动。对于银行、券商的FOF基金配置,只要所选的基金风格不发生变化,我们可以去模糊地预测基金的超额收益走势,以配置适应未来市场的基金,或者可能我们自己也能构建各种类型的股票组合。
 
  2018年,对于股市风格而言,由于今年的价值投资演绎到极致,估值低的股票获得了非常好的超额收益,但模型显示,在明年一季度前后,这个方面的风格有可能会有所切换。今年经历“alpha之殇”的量化基金,只要在市值上不太暴露,有可能会获得比基本面模型更好的收益。而对于小市值,展望明年,虽然对于大小盘风格,目前还没迹象表明小市值在一段时间内会回归,但也可能在明年某个时候发生变化。而随着今年股指期货贴水的逐步修复,明年的量化对冲基金将会迎来春天。(文 | 王华海 东航金融)
 
------分隔线----------------------------