9. 空间计量经济学理论研究若干问题时间: 2017-07-18信息来源:中国区域经济学会文献 作者:陈 斐 责编:万山
专著连载九
中国区域经济学会文献
区域发展创新论
主 编:罗布江村 陈达云 陈栋生
副主编:肖金成 郑长德
空间计量经济学理论研究若干问题
陈 斐
(南昌大学)
空间计量经济学是计量经济学的一个分支,研究的是如何在横截面数据(Cross-sectional Data)和面板数据(Panel Data)的回归模型中处理空间相互作用(空间自相关)和空间结构(空间不均匀性)[1]。它与地学统计和空间统计学相似。从某种程度上而言,空间计量经济学与空间统计学之间的不同和计量经济学与统计学之间的不同一样。由于对其理论上的关心以及将计量经济模型应用到新兴大型编码数据库中的要求,近年来这个领域获得了快速发展。
1 空间计量经济学发展概述
最近,不仅在应用计量经济学中,而且在理论计量经济学中对位置和空间相互作用给予了更多的关注。在一些专门化的领域中出现了一些明确结合了空间因素的模型以及相应的空间计量经济学应用,如区域科学、城市和房地产经济学、经济地理[2-5];而且在更多的经济学传统领域的各种经验调查研究中,也越来越多地采用空间计量经济学方法,如需求分析研究、国际经济学、劳动经济学、公共经济学和地方财政、农业和环境经济学[6]。此外,在一些涉及计量经济学方法的文献中,对如何处理与结合数据的“地理”属性的模型相适合的备择模型、估计量和检验统计进行了越来越多的讨论[7-10]。
在应用计量经济学和理论计量经济学的主流中,最近对存在的空间相互作用的确定、估计和检验的关注可以归结于两个主要因素:一是在理论经济学的框架内对那些考虑原子论式的因素(Atomistic Agent)的决策模型的兴趣不断增加。这些新的理论框架以社会规范、邻近影响和其它同等组影响的形式确定并研究这些因子之间的“直接”相互作用以及单个因子的相互作用是如何导致集体特性和聚集模式的。如社会相互作用理论模型[11]、贸易结构发展模型[12,13]、邻近溢出效应[14,15]等。这些框架也形成包括因子之间重要相互作用的经验模型的一些基础。阿瑟[16]、克鲁格曼[17-20]等重新对与经济地理学有关的马歇尔外部性、聚集经济及其它溢出效应的空间特征进行了评论。
第二个主要的因素在于,标准的计量经济技术通常不能用于存在空间自相关的情形中。但是在地理数据集中普遍存在空间自相关,除了需要处理空间模型的方法之外,还需要能够从实践、适用的角度来处理空间数据的技术。模型的性质、GIS技术的迅速普及以及地学编码的社会经济数据集的有效性都对这些处理地理数据的特殊专业化方法产生了需要[6]。在应用经济学和政策分析中,GIS与空间数据分析和模拟技术的结合已很普遍,特别是在房地产和住宅经济学[21][22]、环境和资源经济学[23][24]、发展经济学[25]等领域中。
就历史观点而言,由于在区域计量经济模型中处理次级地区数据的需要,早在20世纪70年代欧洲就展开了空间计量经济学研究,并将它作为一个确定的领域。Paelinck 和 Klaassen[26]定义了这个领域,包括:空间相互依赖在空间模型中的任务;空间关系不对称性;位于其他空间的解释因素的重要性;过去的和将来的相互作用之间的区别;明确的空间模拟。Anselin[1]将空间计量经济学定义为:处理由区域科学模型统计分析中的空间所引起的特殊性的技术总称。换句话说,空间计量经济学研究的是明确考虑空间影响(空间自相关和空间不均匀性)的方法。目前,空间计量经济学研究包括以下四个感兴趣的领域:计量经济模型中空间影响的确定;合并了空间影响的模型的估计;空间影响存在的说明检验和诊断;空间预测。
2 空间回归分析基础
2.1 空间影响
在空间回归分析中,空间影响与空间相关有关,即与空间自相关或空间不均匀性有关。为了获得模型参数的可识别性,必须同时考虑空间自相关或空间不均匀性[6]。根据矩条件,可以正式表达空间自相关,即属性值相似性与位置相似性的一致程度。
(1)式中: 、 分别指单个观测位置, 、 表示相应位置上某一随机变量的值。根据观测位置的空间结构、空间相互作用或空间排列,当非零位置对 、 的特殊布局具有一个解释时,从空间角度看这个协方差将变得有意义[6]。
空间不均匀性以非常量误差方差(不同空间离中趋势)或模型系数(空间状况)的形式表示结构不稳定性。借助标准的计量经济工具,可以处理这种结构不稳定性。然而,对于在回归分析中为何必须明确考虑空间不均匀性,主要出于以下三个原因:一是从某种意义上而言不均匀性背后的结构是空间的,在决定不均匀性的形式时,观测点的位置是极其重要的;其次,由于结构是空间的,不均匀性通常与空间自相关一起出现,这时标准的计量经济技术不再适用[27];第三,在一个单一横截面上,空间自相关和空间不均匀性在观测上可能是相同的[28]。
2.2 空间权重和空间滞后
在具有n个观测点的横截面环境中,不能直接从数据中估计协方差矩阵(式1),甚至渐进性也不再有效(协方差的数量随n2而增加,而样本大小仅随n的增加而增加)。相反,当能够获得横截面环境上的重复观测时,有可能使用其它维,并且获得一致的非参数的横截面协方差矩阵估计[8][29]。总的来说,必须为协方差赋予一个结构。针对这个问题存在三种主要的方法[6]:一是基于一个空间随机过程的说明;二是基于协方差结构的直接参数表达;三是不指定协方差,而是在一个非参数框架中处理协方差。
与时间序列分析一样,空间随机过程分为两种类型:空间自回归(SAR)过程和空间移动平均(SMA)过程。尽管横截面环境和时间序列的前后关系之间存在重要的差别,但更重要的是,与一个沿时间轴变化的明确概念相反,在横截面环境中不存在相应的概念,特别是当所有观测在空间上是不规则分布时。因此需要引入一个空间滞后算子。可以将空间滞后解释为邻近观测单元上某一随机变量的加权平均,或作为一个空间平滑滤波器。基于每个单元的邻近集的定义[30,31],基于观测的地理排列或邻近性,可以获得空间滞后算子。正式地,将变量 在 单元的空间滞后表示为:
或(2)式中:W表示空间权重矩阵(n?n), 表示随机变量的观测值(n?1)。对每个单元 而言,与 的邻近集范围内的单元{ }相对应的矩阵wij元素非零。为了便于解释,采用行标准化的空间权重矩阵W,即对每个 而言, 。由于渐进性要求获得一致的渐进正态估计量,必须限制由W结构容许的相关的范围。
必须注意到,对于模型而言,权重矩阵W的元素是非随机的、外生的。基于一个距离衰减函数[2]、社会网络结构[33]、经济距离[34]、k个最邻近[9]、经验流量矩阵[35]等也可以确定空间权重,尽管这些选择可能间接表明空间权重的确定是相当任意的。
2.3 空间自相关的形式表达
2.3.1 空间随机过程模型
表示空间自相关的最通用的方法是指定一个空间随机过程,即获得某一给定位置的某一随机变量与其它位置上同一变量之间的函数关系。如给定空间权重矩阵W(n?n),随机变量 (n?1),随机误差 (n?1),可将一个同步空间自回归过程 (SSAR)定义为:或 (3)可将一个空间移动平均过程(SMA)定义为:
或(4)式中: 是n?n的单位阵, 是分量为1的n?1向量, 是随机变量 的均值,随机误差项 (均值为零)的方差为 , 、 分别为自回归和移动平均参数。
对于(3)中的SAR结构而言, ,协方差为:(5)这是一个完全矩阵,意味着任何位置上的振动通过一个空间乘数效应影响所有其它位置。
对于(4)中的SMA过程而言, ,协方差为:(6)这导致一个位置和它的一阶(通过W)和二阶邻近位置(通过 )之间存在局部相互作用,但不产生一个空间乘数。
与时间上的主要不同相比较,AR和MA过程在空间上的不同在于:即使存在误差项 ,上述协方差矩阵的对角线元素也不是常数;而且不同离中趋势依赖于嵌入在空间权重矩阵W中的邻近结构,因此 中的过程不是恒协方差的[6]。只有在极少数情形下,才能获得恒协方差。如规则格网结构上每个非边缘观测都具有相同的权重结构。在实际应用中,这种情形是非常有限的。
此外,可以考虑采用空间误差分量模型表示空间自相关,必须注意的是此模型也可能导致不同离中趋势方差[36,37]。
2.3.2 直接表示法
正式说明空间自相关的第二种通用方法是以简单的方式将方差协方差矩阵的元素表示为少量参数和一个或多个外部变量的一个“直接的”函数。典型地,这涉及一些距离度量的反函数。如:(7)式中: 、 是回归干扰项, 是误差方差, 是彼此分隔的观测 、 之间的距离, 是一个距离衰减函数( 且 ), 是 的一个开子集 上的一个p?1参数向量。这种模式与地学统计中使用的方差图模型密切相关,尽管对固定性和均匀性有更严格的假定[38]。对每个观测运用式(7),得到误差协方差矩阵,其形式为:
(8)式中:矩阵 必须是正定的空间相关矩阵( 且 )。
与空间过程模型相反,直接表示模型没有引起不同离中趋势。在空间计量经济学中,这类模型主要用于城市住宅市场分析[39-41]。尽管这种说明有些直观,但在某种意义上它将空间集聚的概念表示为彼此分开的两个观测之间距离的函数,当然也存在各种估计和参数确定问题。
2.3.3 其他方法
最近,在一些研究中,采用非参数方法来估计空间协方差矩阵的元素,即对距离衰减而言,不需要一个明确的空间过程或函数形式。在面板数据(Panel Data)情形中,通常应用这种方法。如根据每组位置对的残差的样本协方差来估计空间协方差[42]。
此外还可以采用其它一些方法,如自相关一致协方差矩阵。这种方法对固定性和均匀性的假设更为严格,根据样本空间协方差的序列加权平均值等估计空间协方差[8][43]。
2.4 空间随机过程中的渐进性
与时间序列分析一样,根据随机过程的渐进性可以为空间序列导出估计量和检验的特征。然而,这些特征不仅仅是时间序列的二维结果的扩展。为此提出了许多复杂的因子,但到目前为止仍然缺乏空间相关情形的一些正式结果。
空间渐进性的第一个显著特征是为了限制空间相关的程度和空间序列的不均匀性,需要一些通用的矩条件(正则条件),以便获得一致的大数定律和中心极限定理来证实一致性和渐进正态性。从本质上讲,这些通用的矩条件与不均匀的时间相关过程类似,特定的空间条件表示为对空间矩阵与空间系数的参数空间的限制[9][44][45]。实际上,大多数基于样本邻近性的空间权重满足这些条件。
空间渐进性的第二个显著特点是可以以两种不同的方式逼近极限,即递增域渐进和填实渐进[38]。前者由一个样本结构组成,使得可以在边缘(边界点)不断地加入新的观测,这与时间序列分析中的基本渐进类似。当空间范围是有界的,适合采用填实渐进方式,在已有的观测之间加入新的观测,产生一个不断致密的空间。在大多数空间计量经济学的应用中,默认的结构是一个递增域。
3 横截面数据空间线性回归模型
横截面数据空间线性回归模型构成了空间计量经济学中组织各种模拟方法的框架。通过对通用模型参数的不同限制,可以导出特定的模型,从而以不同的方式合并空间相关。在下面的论述中,将局限于横截面数据空间线性回归模型形式的解释,至于模型的空间参数估计、空间影响的说明检验和诊断、空间预测等将另文论述。
3.1 标准线性回归模型与纯空间自回归模型
采用矩阵符号表示法,标准线性回归模型可以表示为:(9)式中:Y是n?1的列向量,表示因变量的观测值, 是一个n?k的解释变量的观测矩阵, 是k?1的回归系数向量, 是n?1的随机误差向量,理论上满足:(10)需要根据 和 的观测来估计 。Gauss-Markov定理认为,如果满足条件: 、 、 的秩为 、 是非随机的, 的OLS估计 是最优线性无偏估计(BLUE)。
回归模型的一个特例是,解释变量是由一个空间滞后组成,即一阶纯空间自回归模型。通过空间滞后(空间自回归项)来分析空间影响对回归系数的估计和检验产生的影响。一阶纯空间自回归模型表示为:(11)式中: 是常数项(以保证误差项 的均值为0), 是随机误差向量, 是空间自回归系数。如果 是观测值与均值的偏差向量,式(11)中通常不包括 。与经典回归模型或时间序列自回归模型不同的是,误差项 与解释变量 相关,因此OLS不再合适[1]。
3.2 横截面数据空间线性模型通用形式
Anselin给出了空间计量经济分析中适用于横截面数据的空间线性模型通用形式[1]。通过对通用模型的参数的不同限制,可以导出特定的模型。横截面数据的空间线性模型通用形式可表示为:(12)且满足: ,误差协方差矩阵 的对角线元素为:
(13)式中: 是与外生(解释)变量 相关的参数向量 , 是空间滞后 的系数, 是干扰项 的空间自回归结构 的系数, 、 分别与因变量的空间自回归过程和干扰项 的空间自回归过程相关,可以是行标准化的矩阵,也可以是二元矩阵或其他非标准化矩阵。
由于误差项 呈正态分布且具有误差协方差矩阵 ,其对角线元素考虑到不同离中趋势为P+1个外生变量 的函数(包括一个常数项)。P个参数 与非常数项相关,且有:(经典的同离中趋势的情形)。式(12)考虑了具有不同空间结构的空间过程,这个模型有 个未知参数[46],其矩阵形式为:(14)当将式(14)中参数向量的不同子向量设为0时,可以产生几个常见的空间模型结构。在各种文献中,讨论了四种传统的空间自回归模型,分别与下列情形相对应[1][32] [46] [47]:
(1)若 , (P+2个约束),产生经典线性回归模型(式9);
(2)若 , (P+1个约束),产生混合的回归—空间自回归模型:(15)
(3)若 , (P+1个约束),产生具有空间自回归干扰项的线性回归模型:(16)
(4)若 (P个约束),产生具有空间自回归干扰项的混合的回归—空间自回归模型:(17)
3.3 横截面数据空间线性模型的特例
式(15)相当于一个空间滞后模型,适合估计是否存在空间相互作用以及空间相互作用的强度,以反映可能存在的实质性的空间影响。式(16)相当于一个空间误差模型,回归干扰项的空间相关相当于多余(干扰)相关。
3.3.1 空间滞后模型
空间滞后模型中包括解释变量 和空间滞后项 。形式上可以表示为:(18)式中: 是空间自回归系数, 是误差项向量。空间相关形式上表示为附加回归量 , 可以估计模型中空间相关的程度,同时调整其它解释变量的影响。在对空间相关进行调整后,可以估计其它解释变量的显著性。形式上,式(18)可以表示为:(19)因此可将式(19)称为一个空间过滤因变量 对原有解释变量的回归[1]。与时间序列模型对应部分所保持的不同,空间滞后项 与干扰项 相关,甚至 是零均值误差也如此,使得作为模型估计的OLS的最优性不再有效。当侧重于理解过程的均值时,可以以非线性的形式表示模型,这可以从式(19)的简化型中看出:(20)式(20)中的逆可以扩展为一个无穷级数,包括所有位置上的说明变量和误差项(空间乘数)。因此必须将空间滞后项视为一个内生变量,而且适当的估计方法必须解释这种内生性[6]。
3.3.2 空间误差模型
空间误差模型是误差项具有相关性的回归的特例,其中协方差矩阵的非对角线元素表示空间相关的结构。可以以不同的方式来指定空间结构,并产生误差方差协方差矩阵,其中 是一个参数向量。
残差之间的空间自相关可能意味着:自变量和因变量之间的存在非线性关系;回归模型中遗漏了一个或多个回归自变量;回归模型应该具有一个自回归结构[48]。当误差项遵循一个空间自回归过程,即每个位置上的随机误差为所有其它位置上的随机误差的函数,那么可以以误差项 的一个空间自回归过程的形式,将空间自相关引入到这个模型中,即:(21)式中: 表示自回归参数, 为空间权重矩阵的第 行中的元素,假定 是标准正态分布的。
形式上,SAR误差模型可以表示为:(22)这个模型结合了一个标准回归模型和一个误差项 中的空间自回归模型,同时假设误差项 满足条件 、 ,即方差固定且误差项是不相关的。由于误差项 的均值为0,因此不管 的数值如何,因变量Y 的均值不受空间误差相关的影响。
3.3.3 讨论当存在实质性的空间影响时,如果模型中遗漏了空间滞后项,回归系数β的估计将是有偏的,这是与遗漏变量相关的标准回归问题的一个特例。当存在空间误差相关但忽略了这种相关时,尽管OLS保持无偏,但如果模型估计是侧重基于估计量的显著性检验和拟合度检验的统计推断时,OLS估计将是不可靠的。由于使用了空间数据,当要校正空间自相关的潜在偏差影响时,适合采用空间误差模型,而不管所关心的模型是否是空间的[6]。
实践中使用的大多数空间回归模型是基于一个单一的空间权重矩阵。然而从理论上讲,更高阶的模型也是可能的,如高阶SAR模型[49][50]、空间自回归、SARMA模型[51]以及既包括一个SAR误差过程又包括一个空间滞后因变量的模型[52]。但是在应用中必须非常小心,以保证高阶模型中的权重W是唯一的、正交的,而且所有的系数是可以确定的[53]。
空间影响的存在对回归系数的估计和检验产生显著的影响,而且由于空间相关的双向或多方向性质,因此标准计量经济技术不再适用,不能将具有滞后因变量的模型或系列残差相关的模型的OLS估计特性直接移植到空间情形。通常需要采用最大似然估计[54],使用合适的非线性优化程序来估计空间滞后模型和空间误差模型的回归系数或空间参数[6][55],从而将空间相关正式地合并到观测值的联合概率密度中;同时,可根据估计的渐进方差矩阵导出Wald检验或渐进的t—检验等来分析拟合模型的合理性[6],诊断空间相关更可能是源于实质性的相关,还是误差自相关。
参考文献(略),需要者请与作者联系(南昌大学经济系)。