计量经济学服务中心旗下品牌网站

 找回密码
 立即注册

计量经济学模型对数据的依赖性

2017-2-22 16:01| 发布者: admin| 查看: 258| 评论: 0|原作者: 李子奈|来自: 经济学动态

摘要: 伴随着计量经济学模型方法的广泛应用,错误也屡屡发生,重要原因之一是没有正确理解模型对数据的依赖性。本文从计量经济学模型类型选择、总体回归模型设定、模型估计和模型应用等方面分析了数据的作用,指出了容易出 ...

【内容提要】

伴随着计量经济学模型方法的广泛应用,错误也屡屡发生,重要原因之一是没有正确理解模型对数据的依赖性。本文从计量经济学模型类型选择、总体回归模型设定、模型估计和模型应用等方面分析了数据的作用,指出了容易出现的错误和产生错误的原因。


【关 键 词】计量经济学模型/模型类型选择/总体回归模型设定/数据依赖性


一、引言

在我国,计量经济学模型在经济理论研究和经济问题分析中已经被广泛采用,成为一种主流的实证研究方法。在一些社会问题的研究中,采用计量经济学模型方法也已经成为一种趋势。同时,模型对数据的依赖性愈发突出,数据的数量和质成为计量经济学应用研究的一个重要制约因素。


计量经济学的创始人弗里希(R. Frisch)为计量经济学下了如下定义:经验表明,统计学、经济理论和数学这三者对于真正了解现代经济生活的数量关系来说,都是必要的,但本身并非是充分条件。三者结合起来,就是力量,这种结合便构成了计量经济学。”1984年诺贝尔经济学奖授予著名的统计学家斯通(Richard Stone)是因为他在发展国民核算体系方面做出了基础性贡献,并因此极大地改善了经验经济分析(即计量经济分析)的基础2000年获得诺贝尔经济学奖的赫克曼(J. Heckman)和麦克法登(D. McFaddan)的贡献是发展了微观计量经济学模型的理论方法,在瑞典皇家科学院发布的新闻公报中着重指出,他们已经解决了对微观数据进行统计分析中出现的基本问题。创立动态计量经济学的亨德里(David Hendry)认为,计量经济分析的过程就是发现客观的数据生成过程的过程。这些足以说明,计量经济学与统计学密不可分,统计学的发展催生了计量经济学,计量经济学的发展带动了统计学。具体表现于计量经济学模型和数据之间的紧密联系。

在计量经济学模型的应用研究中,经常有人提出类似于鸡生蛋还是蛋生鸡的问题,即究竟是根据数据设定模型,还是根据模型选择数据?不同的是,鸡与蛋的关系问题是没有答案的,而模型与数据的关系问题是有答案的。计量经济学应用研究中模型与数据之间的关系可以用图1表示。图中表示计量经济学应用模型的类型依赖于表征研究对象状态的数据类型,不同类型的数据,必须选择不同类型的模型。在模型类型确定之后,依据对研究对象的系统动力学关系的分析,设定总体模型。在这个过程中,必须对在经济理论指导下所分析的系统动力学关系进行统计必要性检验,如图中所示。当总体模型被正确设定后,接下来的任务是进行模型参数的估计,毫无疑问,模型估计必须得到样本数据的支持,模型估计结果依赖于样本数据的质量,即为图中所示。模型经过估计和检验后进入应用,根据应用目的的不同,需要不同的数据支持,例如用于预测,必须首先给出预测期的外生变量的数据,这就是图中所表示的步骤。

计量经济学模型对数据的依赖性的一个人所共知的例子是关于我国广义技术进步对经济增长的贡献的测算。国内外许多学者进行了经验研究,结果差异极大,技术进步对GDP增长的贡献率,最低的估计为0,最高估计达到40%。甚至所建立的模型都是C-D型总量生产函数模型,选择的投入要素都是资本和劳动,甚至选择的样本区间也是相同的,数据都来自于中国统计年鉴,仍然会得到不同的结论。为什么?关键是不同的研究者对资本投入的数据或者未进行任何处理,或者进行了不同方式的处理,以消除价格因素的影响。请注意,在统计中,固定资产原值(或者净值)数据是以资产形成年的价格计量的资产简单相加得到的。


最近几年,我们对农户借贷需求进行了较为广泛的调查,采集了青海、新疆、甘肃、河北、黑龙江、吉林、山西、湖南、湖北、河南、安徽、江西、陕西、山东、辽宁、内蒙古等16省区的72个县、440多个村庄的5100家农户的数据。其中,在一年中发生借贷行为的农户占55.3(包括向亲友借贷),为2820户,其余2280户没有发生借贷。对于这一宝贵的数据资源,当然要充分利用。于是,为了对农户借贷行为进行因素分析,不同的研究者建立了不同的计量经济学模型。有人利用2820户发生借贷的农户的借贷额为被解释变量,建立经典的回归模型;有人认为应该将没有发生借贷的农户信息加以利用,其借贷额为0,于是利用5100农户为样本,建立经典的回归模型;有人认为不应该将没有发生借贷的农户的借贷额统统视为0,而应该视为小于等于0(≤0),于是利用5100农户为样本,建立了归并(censoring)数据模型(Tobit模型)。有人认为不应该将没有发生借贷的农户的借贷额统统视为小于等于0,因为其中一部分农户有借贷需求,只是因为各种原因(例如提出借贷被拒绝,担心借不到而不敢提出借贷要求等)而没有发生实际借贷。所以,应该按照Heckman两步法建立模型,即首先利用全部样本信息建立借贷是否发生的二元选择模型,然后再利用2820户发生借贷的农户为样本,建立借贷额的因素分析回归模型。显然,最后一种模型是正确的,其他都是不正确的。那么,为什么会发生这些现象?

上述例子从不同的角度反映了计量经济学模型与数据之间的关系前者反映了计量经济学模型估计结果对数据质量的依赖性;后者反映了计量经济学模型类型对数据类型的依赖性。正如李子奈(2007)指出的,在我国计量经济学应用研究广泛开展的今天,问题和错误也普遍存在。重要的原因之一是对计量经济学模型方法论基础缺乏正确的理解,其中包括计量经济学模型的数据基础问题。

下面将着重就当前计量经济学应用研究中有关模型与数据之间关系的几个迫切、重要的问题进行讨论。最后对数据陷阱问题进行简单的讨论。

二、模型类型设定对数据的依赖性

在经济、社会问题研究中,当研究对象确定之后,表征该经济、社会活动结果的数据自然地被确定了。例如,研究我国经济增长的影响因素以及各个因素对增长的贡献,那么表征经济增长结果的GDP时间序列自然地成为模型研究的对象;研究学生在本科4年内不及格的课程门数与什么因素有关,那么表征不及格门数的计数数据012自然地成为模型研究的对象;研究农户的借贷方式由哪些因素决定,那么表征农户向各种正规金融和非正规金融机构借贷的选择结果的离散选择数据012自然地成为模型研究的对象;等等。计量经济学应用研究的第一步,就是根据表征所要研究的经济、社会活动结果的数据类型确定应该建立什么类型的计量经济学模型,在这一步骤中,数据的类型决定了计量经济学模型的类型。李子奈(2008)指出,一个成功的计量经济学应用研究,最重要的是设定正确的总体回归模型;并且提出了总体模型设定的若干原则,包括惟一性、一般性、现实性、统计检验必要性和经济系统动力学关系导向原则但是这些是在模型类型确定之后的任务,确定模型类型仍然是首要的任务。


用于宏观和微观计量经济分析的数据分为三类截面数据(Cross-sectional Data)时间序列数据(Time-series Data)面板数据(Panel Data,也译为平行数据、综列数据)

对于截面数据,只有当数据是在截面总体中由随机抽样得到的样本观测值,并且变量具有连续的随机分布时,才能够将模型类型设定为经典的计量经济学模型。经典计量经济学模型的数学基础是建立在随机抽样的截面数据之上的。但是,在实际的经验实证研究中,面对的截面数据经常是非随机抽样得到的,或者是离散的,如果仍然采用经典计量经济学的模型设定,错误就不可避免了。事实上,20世纪70年代以来,针对这些类型数据的模型已经得到发展并建立了坚实的数学基础。

例如在前述的农户借贷的实例中,如果只利用2820户发生借贷的农户为样本,建立经典的回归模型,被称为截断数据”(Truncation Data)。这类数据在实际经济分析中十分常见,特别在微观经济社会问题研究中大量存在。人们抽取的样本经常是掐头或者去尾的。对于这类数据,因为抽取每个样本的概率发生了变化,如果仍然采用经典计量经济学模型,其估计结果就产生了选择性偏误,应该建立截断数据模型,在这方面J. J. Heckman(19741979)做出了基础性贡献。③④

例如,如果我们分析学生的学习成绩与相关影响因素之间的关系,学习成绩的最高分为100,最低分为0。处于0100之间的得分,是学习成绩的真实反映;而表现为100分和0分的学生,实际学习成绩是不同的,所以应该将100分看为大于等于100分的归并,将0分看为小于等于0分的归并。这类数据被称为归并数据”(Censored Data)。它们在经济分析中也是常见的,例如受到供给限制条件下的商品需求量、尚处于失业状态下的失业时间。类似地,因为抽取处于归并点的每个样本的概率发生了变化,如果仍然采用经典计量经济学模型,其估计结果也会产生选择性偏误,应该建立归并数据模型,在这方面,J. J. Heckman(19741979)同样做出了基础性贡献。


鲜花

握手

雷人

路过

鸡蛋
关闭

站长推荐上一条 /2 下一条

Archiver|手机版|小黑屋|婉宁学术 ( 陕ICP备17001967号-1 )

GMT+8, 2017-10-24 19:03 , Processed in 0.040554 second(s), 15 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

返回顶部