第6章 分歧·模型里的矛盾 (第1/2页)
爱吃肉鸡蛋羹的公羊缈提示您:看后求收藏(春雷小说clqcjtz.com),接着再看更方便。
连续一周,建模小组的进度像上了发条的钟,齿轮咬合得严丝合缝。林悦的ARIMA模型在反复调参后日趋完善,AIC值从最初的482降到了379,残差序列的白噪声检验p值稳定在0.8以上;苏然则带着王宇他们完成了数据清洗,从3000多条原始数据里筛出2876条有效样本,连新闻舆情的情感倾向都让了量化处理,用1表示正面、-1表示负面,精确到小数点后四位。
两人每天早上七点半准时在图书馆碰面,讨论时几乎不用多说废话。林悦刚说出“残差方差有点大”,苏然就会递过他标注好的“异方差检验结果”;苏然皱眉提到“宏观数据滞后性”,林悦早已调出提前让好的“领先指标相关性矩阵”。王宇私下跟赵阳感慨:“他俩这默契,说没穿一条裤子我都不信。”
直到周五下午三点,这台精密的“钟”突然卡壳了。
“我觉得应该加入LSTM神经网络。”苏然的手指重重敲在屏幕上,指腹在“2019年6月误差率15.3%”的红色标注上反复摩挲。他面前的笔记本电脑里,并排躺着两张图表:左边是林悦的ARIMA预测曲线,在平稳期贴合度很高,却在股灾那段陡峭的下跌中明显滞后;右边是他用简易LSTM跑的模拟结果,虽然波动更大,却精准咬住了那几个关键转折点。
林悦的心跳猛地一沉,指尖下意识地攥紧了鼠标,塑料外壳的冰凉透过皮肤渗进来。“但LSTM需要大量数据训练,”她的声音比平时低了些,带着不易察觉的紧绷,“我们只有五年的日度数据,总共1248个样本,用来训练深度学习模型太容易过拟合。”她点开模型评估表,指着“过拟合风险指数”那一栏,“你看,这个指数已经超过0.7了,竞赛评委最忌讳这个。”
“保守就是平庸!”苏然的声音陡然拔高,尾音带着点压抑的烦躁。后排正在整理文献的赵阳手一抖,钢笔在纸上划出道长长的墨痕;王宇刚塞进嘴里的薯片差点喷出来,赶紧低下头假装专心致志地敲代码。
苏然站起身,连帽衫的帽子滑到背后,露出额角微微跳动的青筋。“竞赛比的是创新!你看看去年的特等奖作品,哪个不是用了深度学习模型?”他抓起桌上的《量化投资前沿》,翻到折角的页面,“人家用的是Transformer架构,连文本数据都能嵌入模型,我们还守着十年前的ARIMA,怎么可能拿奖?”
“稳妥有错吗?”林悦也站了起来,椅子腿在地上划出刺耳的摩擦声。她的眼眶瞬间红了,却死死咬着唇不让眼泪掉下来,“我花了整整三天调参,把滞后阶数从(5,1,3)试到(3,1,1),才把平均误差率压到8%以下,你一句话就要全盘推翻?”她的声音抖得像风中的树叶,指尖因为用力而蜷缩,指甲深深掐进掌心——那里前几天刚被自已掐出红痕,现在又添了新的印记,疼得她指尖发麻。