经济学研究岂能不懂大数据

当经济学家范里安教授的最新计量经济学论文里充满着谷歌文件系统、谷歌分布式数据存储系统、编程模型MapReduce等技术名词时,实证经济学研究也正受大数据和互联网影响,实证主义者也要补补课了。

既然大数据能够窥到全体样本的全貌,那就没有必要再从抽样样本的数据中做统计推断和假设检验了,因为大数据看到的就是全部真实的情况。

沿着这样的思路想下去,统计学和计量经济学领域中有众多着力解决小样本、缺失样本和有偏样本的技术,这些技术的重要性在大数据的时代下降了,处理大数据和移动互联网下的实时数据的技术和能力将在未来更加吃香。

再进一步想下去,此前很多靠小样本检验得到的实证经济学结论,都可能被大数据重新再检验一遍,是对是错,还不一定。

无论怎样,如果不懂大数据的话,未来的经济学研究将会受到很大的局限。大数据下的结论,显然要比一个受限的小实验或者一小部分样本得到的结论更加令人信服。

宏观经济学里有一篇很有名也很有趣的论文,是经济学家萨拉–伊–马丁教授的研究成果,题目就叫“我只是跑了两百万次回归”,内容也很简单,萨拉–伊–马丁用各种解释变量跑了两百万次回归,试图找到影响经济增长的关键因素。后续关于这“几百万次的回归”类型的研究还有多篇文章和多回合的争论,算是构成了学术界的一道亮丽风景线。这背后的逻辑,可能就是样本的问题。经济增长是个极其复杂的问题,单靠几个变量、几个方程(几百万可能都不够)和有限的样本数量,要得出一个贴近真实的结论,难度极大。但大数据或许就能帮上大忙。几百万的回归恐怕都不及大数据的计算结果来得更加真实和令人信服。人类社会经济增长这一现象实时而全貌地呈现在每个人的面前,这并不遥远。也许这个系列的研究很快就会出现封山之作,题目就叫“我只是用了大数据”。

总而言之,经济学理论也好,实证也罢,移动互联网大潮下新技术对其的侵蚀不可避免。这并不是坏事。经济学的目标就是认识一个更加真实的世界。我们相信在全方位、各领域的移动互联网化的时代里,拥抱互联网的经济学家们会帮助我们纠正此前的误解,认识一个更加贴近现实的世界。

[14] 若从研究角度看,大数据和云计算等手段将增强我们发现客观规律的能力,并推动理论向更深层次发展。