由必赢官网姜富伟教授和必赢官网博士生马甜、湖南大学金融与统计学院唐国豪副教授合作撰写的论文《深度学习与中国股票市场因子投资—基于生成式对抗网络方法》被《经济学(季刊)》正式接收。
随着互联网云计算等技术的发展,深度学习神经网络模型已广泛应用在各行各业。而作为无监督深度学习的代表,生成式对抗网络模型(GAN)已成功应用在图片和视频生成等领域。国内金融领域尚无使用GAN模型进行研究的文献,本文首次将GAN应用于我国股票市场预测与投资,并强调了深度学习预测背后的经济理论思考和探索。相比国外成熟市场,中国股票市场散户参与度较高,市场波动性更大,GAN模型特有的判别器系统带来更为动态的模型适应性,在面对新一期的样本数据时,不仅通过生成器中的记忆单元保留了时序数据的趋势项,还通过判别器进一步过滤噪声。实证结果发现,相较经典线性模型,GAN深度学习模型在股票收益预测精度和因子投资绩效上均有非常显著提高。股票收益时间序列预测方面,GAN深度学习样本外预测R2最高达到0.89%,显著好于线性模型,模型预测精度提升效果在5%水平内显著。股票横截面因子投资策略方面,使用预测值排序法构建投资组合,发现基于GAN深度学习模型构建的多空对冲因子投资组合的月平均收益率和夏普比率分别为1.13%和0.71,显著好于线性模型,且其FF3和FF5模型超额收益在5%水平内显著。
本文还深入探究深度学习预测背后的经济理论机制。投资组合构成分析,发现科技类股票相比传统行业贡献更高收益。因子重要度分析,发现最重要的特征因子有三类:价格及交易量趋势类指标、流动性类指标、基本面类指标,其中前10大特征因子的贡献度占到了所有148个因子的40%左右。错误定价理论分析,发现深度学习模型在低金融摩擦、低波动性以及高流动性类股票更为有效。宏观经济状况分析,围绕宏观经济活跃度、经济政策与金融市场不确定性、投资者情绪等多个角度展开论证,发现深度学习模型可以有效捕捉我国宏观经济或金融市场中潜在的风险因素。微观企业状况分析,发现深度学习模型能有效预测企业在中短期(未来一年内)的盈利、收入和现金流等基本面状况信息。
本文在深度学习模型构建和因子大数据分析方面的特色创新如下:
第一、更有效的特征提取和对非线性信息的利用。传统线性回归模型忽视了金融大数据内在的潜在信息因子、稀疏性和非线性等数据性质。本文在构建股票特征大数据的基础上,使用了GAN模型对中国股票市场进行非线性信息特征的提取和分析。实证结果相比线性模型有了显著的提升,表明了我国股票市场中上市公司数据的非线性特征包含有重要的预测信息。
第二、对于时序数据的有效处理。本文在构建GAN模型时,使用了更适合时序数据处理的长短期记忆网络模型(LSTM),在对时序数据的处理中有着天然的优势。金融数据长期存在自相关特性,资产定价领域中动量效应更是作为经典的异象因子被广泛使用,LSTM通过记忆单元保留有效信息,并通过遗忘单元过滤掉“噪声”信息,针对不同的资产类型匹配不同的记忆长度。
第三、更“智能”的预测模型。不同于传统神经网络模型优化过程中单纯的使用梯度下降的方式,生成式对抗网络引入了“博弈”的过程,生成模块得到预测数据后,判别器将其与真实数据进行比对分类,评估并否定其预测结果,而最终的优化结果即要求生成器生成的数据骗过判别器达到以假乱真的程度。经济学中完全竞争市场具有最优效率,而通过引入判别器这一“竞争”者,生成式对抗模型在结构上优于单一的预测模型。