- ·上一篇文章:大咖驾到| 2018中国上市房企百强峰会专家对话
- ·下一篇文章:百年老店”正在变年轻,蒂芙尼业绩修复路漫漫而修远兮
“大数据”在宏观经济预测分析中的应用
原标题:“大数据”在宏观经济预测分析中的应用“大数据”在宏观经济预测分析中的应用作 者:张 涛,中国社会科学院数量经济技术经济研究所研究员刘宽斌,中国社会科学院数量经济技术经济研究所刊期:《财经智库》2018年第3期。内容提要:本文梳理了当前“大数据”在宏观经济预测分析中的应用现状,在明确“大数据”特点的基础上,总结了“大数据”相较于传统统计数据在宏观经济预测分析过程中的优势,也指出了当前“大数据”在理论及应用上的不足和缺陷,包括数据来源局限、维度灾难、非结构化数据问题、噪声问题以及研究范式的转变。关 键 词:大数据;宏观经济;预测一、引言随着宏观经济理论的发展,宏观经济预测成为实证分析的另一个重要方面,经济模型分析应用的一个重要方面,传统宏观经济预测方法的核心思想是通过特定的模型与方法技术发现统计数据的内在规律,并利用这种规律预测未来。(一)传统宏观经济预测方法综合现有的宏观经济预测分析方法和应用现状,宏观预测模型主要可分为两种类型:基于理论驱动的结构模型和基于数据驱动的时序模型。基于理论驱动的结构模型主要是以宏观经济理论为基础,构建数理分析模型,然后“统计化”,形成经济计量模型,利用统计数据进行参数估计,并以此分析宏观经济变量之间的数量关系以及对关注变量进行预测,包括可计算一般均衡模型(CGE)、随机动态一般均衡模型(DSGE)、布鲁金斯模型(BrookingsModel)、沃顿模型(Wharton Model)、莫蒂利亚尼建立的中级的美国经济模型(MPS Model)、极限边界分析模型(BEA)、劳伦斯 . 梅耶合伙模型(LHM&AModel)等。这类模型计算过程复杂,能分析和预测领域众多,具有很好的经济解释性。以数据资源公司模型(DRI Model)为例,该模型基于凯恩斯主义,新古典经济学以及货币学派等的思想观点,结合经济增长模型,对宏观主要变量进行关系分析和预测。 DRI模型集成了718个方程,其中有379个随机方程以及339个非随机方程,涉及974个内生变量和286个外生变量,庞大的模型描述了经济社会收入、就业、供给、产业、工资、生产率、劳动、失业等各个方面。基于数据驱动的时序模型主要是指不依赖任何经济理论,纯粹依靠数据的内在规律进行建模。包括扩散指数法、移动平均法、指数平滑法、灰色预测法、向量自回归模型(VAR Model),结构向量自回归模型(SVAR)、贝叶斯向量自回归模型(BVAR)、全球向量自回归模型(Global VAR)、向量误差修正模型(VECM)、结构向量误差修正模型(SVECMX)、自回归移动平均模型(ARIMA)、自回归条件异方差模型(GARCH)等。这类模型不强调内在的经济理论逻辑,更多关注变量本身的变化特征和在时间维度上的延续性,并利用这种数据内在的变化模式预测未来。以 ARIMA 模型为例,根据需要预测的指标数据,基于一系列分布假设,例如需要假设模型随机干扰项满足白噪声性质,基于这些假设研究分析指标当期值与自身滞后期以及随机扰动项之间的关系,根据历史数据总结出最后的关系方程式,并以此方程来分析预测宏观经济指标。例如:孙少岩等(2014)利用 ARIMA 模型对吉林省失地人口进行分析,得到规律方程,并利用规律方程对未来失地人口量进行了预测。传统的宏观经济预测模型,经过长期的发展、更新和改进,建模方法相对完备,无论是理论驱动建模还是数据驱动建模在宏观经济预测领域发挥着重要作用。但无论是基于经济理论的模型还是基于数据驱动的模型都严重依赖于经济系统规律的延续性。现有的宏观经济预测模型应用有效性基本的逻辑是通过历史数据发现经济运行的基本规律,通过历史数据中发现的规律来预测未来经济情况。(二)传统宏观经济预测方法应用缺陷经济运行规律在短时间内发生变化的可能性较小,但随着时间间隔的增加,偏离原有的经济运行规律的可能性和程度会越来越大。因此,传统宏观经济预测模型方法的有效性在很大程度上依赖于使用的数据是否足够“好”。但传统宏观预测分析过程中使用的统计数据存在较为严重的问题,这也是导致宏观经济模型预测分析存在较大“偏误”的重要原因,也是传统宏观经济预测分析过程中存在的根本性问题。传统的统计数据主要存在五个方面的缺陷。1. 滞后性宏观统计数据需要在经济运行发生后,通过相关部门统计汇总,这个过程需要较长时间,一般统计的数据指标都是滞后一年或者滞后一个季度的数据。2. 统计误差统计数据需要人为地去搜集并汇总。这个过程人为参与程度较深,并且时间较长,过程较为复杂,很难确保整个过程的准确无误,这样汇总性的数据一般存在较大的统计误差,使用这样存在统计误差的数据做预测,会进一步增大预测误差。3. 数据获取成本高传统数据收集过程较为复杂,需要耗费大量的人力和物力投入,数据获取的成本相对较高。4. 样本量较少由于统计样本和获取数据成本是成反比的,随着统计样本量的增加,统计成本也会急速增加。因此,一般会在统计样本和统计成本之间做一个平衡。例如,居民消费者价格指数(CPI)的统计,采用的是抽样调查方法抽选确定调查网点,按照“定人、定点、定时”的原则,直接派人到调查网点采集原始价格,一共涵盖了8.3万多家价格数据,但相对于全国整体的市场数量,这个样本量不到整体的 1%。5. 颗粒度不够现有的宏观统计指标相对来讲,都是整体性的宏观指标,例如,CPI指标,涵盖了食品烟酒、衣着、居住、生活用品及服务、交通和通信、教育文化和娱乐、医疗保健、其他用品和服务等 8 大类、 262 个基本分类的商品与服务价格,但是,这样整体性的指标很难为分类行业的经济决策做具体性的指导。例如,需要知道童装价格的指数,就无从知晓。正是由于传统的统计数据存在上述根本性问题,导致了宏观经济预测分析过程中,难以做出实时和有效的预测。这也是当前传统宏观经济分析和预测存在的瓶颈性问题。除了统计数据本身的缺陷,还有来自方法论上的争论:一是卢卡斯批判。传统的计量模型方法均是基于历史数据来分析和预测未来,但这种模型方法没有充分考虑到人们预期的作用,人类经济行为不仅仅从历史经验中学习,而且也会估计当前的现状对将来的影响,进而影响到采取的行为和策略,这种行为的改变会使得经济模型的参数发生变化,而这种变化是难以衡量的。二是伊丽莎白
“大数据”在宏观经济预测分析中的应用