文章

引力模型与社会科学研究

第1章 引力模型的来源和定义

1.1 贸易引力模型的来源

引力模型(Gravity Model)是一种用来分析和预测空间相互作用形式的数学方程,是应用广泛的空间相互作用模型。引力模型的思想来源于牛顿的万有引力定律,即:

两个质点之间存在着沿着它们连心线方向的相互吸引力。这个引力的大小与它们的质量成正比,与它们的距离成反比,而与它们的化学组成和介质种类无关。

美国经济学家Walter Isard(1919-2010)在他的论文 Location Theory and Trade Theory: Short-Run Analysis(1954)中,最早将万有引力定律的数学模型引入经济学领域,提出了最初的引力模型。他将研究对象从物体间的引力问题转向了两个地区之间涉及距离参数和质量参数与研究假设相关性的问题。引力模型后来被更多的经济学家和其他社会科学研究者应用到其他领域的研究中,并在某些研究方向上取得显著成效。其中就包括国际贸易相关的研究。经济学家Jan Tinbergen(1962)和Poyhonen P.(1963)则进一步将引力模型运用到国际贸易领域,开创了国际贸易研究的新途径。

[Source: K. Mitch Hodge, Unsplash]

1.2 引力模型的定义

由引力模型构建的最初的贸易引力模型如下:

F为双边贸易流量,G为固定参数,M为被测量的经济体的经济规模(一般以GDP为衡量标准),D为被测量的两个经济体之间的直线距离。

引力模型形式简洁,研究者只需对参数和相关分量作出契合所研究的问题的调整,或在基础形式上根据问题的变量多样性和复杂性进行拓展,即可应用于不同领域的研究中。其中,随机前沿引力模型是一个较为重要的模型变体,受到广泛关注和应用。

1.3 随机前沿模型

1977年,D Aigner、CAK Lovell、P Schmidt三位研究者共同发布了Formulation and estimation of stochastic frontier production function models(1977),开创性地提出了随机前沿模型(Stochastic Frontier Model),利用极大似然法来估计经济市场中厂商的生产效率。随机前沿模型的基本公式如下:

公式一和公式二构成了随机前沿分析模型,该模型用于评估厂商的生产效率。在该模型中,公式一中的y表示厂商的产出,X表示厂商的投入,包括劳动力、资本等生产要素。β是待估计参数,反映了投入和产出之间的关系。则为厂商的生产函数。ε是回归方程的随机扰动项;而又是复合扰动项,在公示二中由两部分组成:v和u。v为左右对称的随机扰动项,u为不小于零的非对称的随机扰动项。则构成了熟知的线性回归模型。

公式一中等号后的部分被称为厂商的“生产前沿面”。生产前沿面描述给定投入下厂商能够实现的最大产出水平,即理想产出。理想产出是指在给定投入下厂商能够实现的最大产出水平。显然,该生产前沿面的模型中包含v这一随机项,故称“随机前沿”。厂商的实际产出为 y,实际产出与理想产出的差距为 u ,则厂商相应的效率为y/(xβ+v) 。

u在经济含义上反映了厂商能够控制的内部因素,如管理水平、技术水平、经济水平等。u越大,说明厂商的无效率越高,生产效率越低。当u=0时,厂商达到最高效率,即实际产出等于理想产出。此时效率值达到最高水平,取值为1。v则反映了厂商不能控制的外部因素,如市场波动、天气变化、设备故障等。这些均影响厂商的生产前沿面。v中还包括了厂商产出量 y的测量误差。

[Source: Markus Spiske, Unsplash]

第2章 引力模型的作用和影响

2.1 引力模型的作用

贸易引力模型通常被用于衡量经济体之间贸易流量的大小与两者经济规模之间的关联性。同时,该模型也被经济学家用来分析双边贸易流动的决定因素,如共同边界、共同语言、共同法律制度、共同货币、共同殖民遗产。它也用于检验北美自贸协定(NAFTA)和世贸组织(WTO)等贸易协定和贸易组织对便利国际贸易的有效性,甚至还被用于评估国际关系对双边贸易的影响。

因此除了贸易领域外,引力模型还应用于其他双边流量数据(也称为“二元”数据),如移民、交通、汇款和外国直接投资,并扩展出其他社会科学研究领域的变体,如出行分布模型、人口迁移引力模型、两步移动搜索法、雷利零售引力法则。

2.2 引力模型的影响

引力模型的表述和表现形式固然简单,可能缺乏严谨的理论支撑,面对复杂的理论模型而言甚至可以形容为“简陋”,但依然有相当的应用价值。引力模型已经在国际贸易研究中获得了相当的成功,被广泛应用于测算贸易潜力、鉴别贸易集团的效果、分析贸易模式以及估计贸易壁垒的边界成本等领域,并较好地解释了在经济社会中观察到的一些现象,提供了许多具有研究价值的分析结论。随着应用和研究引力模型的学者逐渐增加,引力模型的理论根基亦逐步完善,产生了更多变体,模型本身存在的特定问题也得到改善。

[Source: Ian Taylor, Unsplash]

第3章 引力模型在社会科学研究中的运用

3.1 引力模型和中国政治经济学研究

贸易引力模型是应用广泛的引力模型。在改革开放后,国际贸易研究领域中有《引力模型在国际贸易理论中的发展和应用—兼论欧共体与其他国家 (地 区 ) 的贸易》(张杰、古斯达·克里斯坦森,1996)、《从贸易引力模型看中国双边贸易安排》(刘青峰、姜书竹,2002)、《中国的贸易流量与出口潜力:引力模型的研究》(盛斌、廖明中,2004)等一批研究论文较早地使用引力模型对国际贸易问题进行理论和实证分析。

在《引力模型在国际贸易理论中的发展和应用——兼论欧共体与其他国家(地区)的贸易》(1996)中,研究者①阐述了引力模型从诞生到引入国际贸易研究的模型演变过程,并对原有模型进行动态化转变,使得新的引力模型能够表示动态值;②运用利尼曼引力模型进行分析,发现贸易量与人均收入存在显著关系,当人们生活水平提高后, 对进口品需求也会相应增加;③哈维律列勋和皮瑞杰特在一项研究报告中利用引力模型来计算东欧在施行经济改革之后国际贸易的发展潜量,根据他们的模型分析发现,两国双边贸易量因距离远而减少;具有共同边界的两国贸易增加;双边贸易量几乎与GDP同步增长,但却与区域大小成反比;④引力模型还可以用模型扩展法实现多变量计算。

在《从贸易引力模型看中国双边贸易安排》(2002)中,研究者根据贸易引力模型的基本形式,结合中国与外部经济体的经济规模、人口、空间距离、双边贸易的制度安排等相关因素,构建出基于目标问题和多变量的新的引力模型。研究者指出,引力模型“运用灵活、计算简单”,而且“能解释传统的要素禀赋贸易理论不能解释的实际贸易现象”。根据数据分析结果,研究者发现,在国际贸易中,反映经济体体量的GDP是影响双边贸易流量的重要因素;空间距离仍然对贸易产生负面影响,其中包括了运输成本、信息交流成本和文化沟通成本;经济体之间的贸易制度安排则将对双边贸易流量产生巨大影响。

在《中国的贸易流量与出口潜力:引力模型的研究》(2004)中,我们可以发现,应用引力模型还需要考虑如何选择恰当的数据作为模型变量:

  1. 经济规模:GDP或PPP——GDP因带有汇率因素影响,适合分析短期的贸易流量,PPP则更适用于估计长期的贸易流量;

  2. 人口变量:人口总量或人均GDP——人均GDP内涵丰富,可以侧面反映经济发展程度、代表性需求水平和要素禀赋比例等额外内容;

  3. 间隔距离:绝对距离或相对距离——传统上一般采用两国政治或经济中心之间的球面距离或者两国主要港口之间的航海距离来衡量“绝对距离”,而也有学者主张采用“相对距离”,即两个贸易伙伴之间的距离与它们与其他贸易伙伴的距离的比值。

可见,在特定情形下,变量的选择会对数据的分析结果产生不同的影响,故研究者们需要随机应变,根据问题灵活地选取数据变量,同时需要检验其他变量对数据分析的影响是否显著,佐证自身选择的合理性。

[Source: Alex Duffy, Unsplash]

在《数字经济发展、国际贸易效率与贸易不确定性》(2020)中,研究者使用了随机前沿引力模型研究数字经济和贸易潜力增长与贸易效率增长之间的关联性。经过稳健性检验,考虑了不同情况,如:

  1. 不同分类型变量

  2. 替代指标回归

  3. 内生性问题:遗漏重要变量或存在反向因果关系

检验后的分析结果发现数字经济发展水平对贸易无效率项的影响均显著为负,对贸易不确定性的影响均显著为正,说明进口国数字经济的发展能够显著促进提高经济体的贸易效率,但同时会增加贸易不确定性。数字经济的发展能够提高获取市场信息、寻找贸易伙伴、建立贸易关系的能力以及降低履行交付义务的成本,进而降低了由进口国信息壁垒及市场制度约束造成的“人为阻力”,有效降低高收入国家与中低收入国家间贸易效率的差异。可见全球数字经济发展有利于提供更为公平的贸易环境,为中低收入国家提高自身的市场吸引力提供了新机遇。数字经济时代下的贸易壁垒将进一步削弱。

在《网络与贸易:一个扩展引力模型研究框架》(2019)中,研究者以网络科学的视角切入,尝试对企业自发生成和自主构建网络的存在及其影响进行分析。对于企业而言,外部环境基本无法改变,属外生变量,而其根据外部环境建立的内部网络却是可变的,对企业行为具有重要影响。本文尝试突破传统国际贸易理论中“冰山理论”对于企业出口所面临的摩擦因素的模糊性和综合性,将企业自生贸易网络从常用的双边距离变量中剥离出来,进行单独分析。这实际上提醒了我们,某些传统理论中依然存在着抽象而模糊的设定,需要进一步修改和完善。

传统的贸易引力模型往往考量双边贸易的实际地理距离,或经济中心至经济中心,或首都至首都,或货运港至货运港等直接贸易网络,而较少地讨论企业自生贸易网络系统中的运用信息跳板的虚拟地理距离对企业克服贸易壁垒的作用和影响。这一贸易网络是由企业自身出口经验结合外部网络构成的。从这一思想出发,文章扩展了传统引力模型,从“国家”主体下沉至“企业”主体,以构建企业自生贸易网络指标以及相应的虚拟地理距离等指标体系,进一步测度企业贸易网络对出口关系的扩展边界扩张、存活概率、集约边界扩张等企业出口行为的变动影响。结果发现,企业自生贸易网络强度对促进企业出口规模和效率的提升具有显著影响,且一定程度上可以弥补出口目的地的市场制度不理想的缺陷;出口差异性更大的产品,贸易网络的影响越大。个人认为,本文很好地弥补了传统贸易引力模型针对市场微观主体行为解释力较弱的缺憾,进一步提高了引力模型的适用性,并对数字经济下的数字贸易研究具有相当的启发意义。

在《跨境电商平台克服了哪些贸易成本?——来自“敦煌网”数据的经验证据》(2020)中,研究者借鉴使用了引力模型的传统框架,并根据前人研究加入了多边贸易阻力项以测度双边贸易的相对贸易成本。为测度跨境电商究竟克服了哪些贸易成本,研究者在引力模型的回归等式中明确了刻画固定成本和可变成本的变量,还加入互联网环境变量( 固定网络用户数、移动网络用户数、ICT 政策环境)以刻画各国互联网的发展水平。在新建立的引力模型中,研究者以GDP规模和共同语言作为固定贸易成本,以地理距离、关税水平和汇率水平来刻画可变贸易成本,用互联网覆盖率等因素来刻画双边互联网环境的影响变量等。在考虑到双边贸易存在异质性问题,研究者采用了PPML模型进行参数估计,以充分利用国家间存在的零贸易量的数据信息。本文亦是在传统引力模型上拓展新模型的有益尝试。尤其在考虑跨境电商等非传统的货物和服务贸易的情况,通过在模型中添加相关变量来分析难以量化的、“看不见摸不着”的跨境电商对双边贸易的影响;考虑同一变量对不同主体(出口国和进口国)的影响差异,这些都值得学习。

[Source: Agence Olloweb, Unslpash]

3.2 引力模型和外国社会科学研究

欧美发达国家最早提出引力模型并应用于政治经济学研究。

A Theoretical Foundation for Gravity Equation(1979)中,研究者Anderson J E则指出,尽管引力模型在诸多领域得到广泛应用,但一直以来都缺少可信、严密的理论基础,文章则为适用于商品贸易的引力方程提供了更加完善的理论阐释,给出了线性支出模型以及估计技术等因素所造成偏差下的替代方案,还将运输费用、关税纳入模型,综合给出更加完整的引力模型。研究者也在文章中阐述了收入变动对货物贸易的短期和长期影响、贸易平衡和资产积累之间的关系等其他因素。

Estimating Trade Flows: Trading Partners and Trading Volumes(2008)中,研究者以往的研究有失偏颇,多偏向研究正贸易流量的情况,而忽视了不互相贸易的经济体之间的零贸易流量情况,存在统计、测量和预测上的误差,因此他们开发了新的引力模型,用于预测经济体之间的正贸易流量和零贸易流量。研究还发现,相互贸易的经济体之的贸易量在很大程度上受到双边从事对外贸易的公司比例的影响,而且一比例随着国家特征的不同而有系统地变化。

Competitive advantage in the renewable energy industry: Evidence from a gravity model(2019)中,研究者使用传统引力模型作为研究一国可再生能源产业政策对其可再生能源产品出口绩效影响的分析框架。可再生能源产品主要是太阳能光伏和风力发电机。研究者使用了面板数据而非横截面数据作为数据基础。使用面板数据具有分析效率上的优势,在处理和估计任何一对国家的双边贸易的固定贸易成本亦富有成效。与其他研究类似,研究者在引力模型中添加了更多变量,如目的国需求、原产国可再生能源政策有效性等。

分析发现,需求拉动政策等积极的产业政策对于可再生能源产业的发展具有正向影响,能够推动出口绩效增长和提升产业竞争优势。有趣的是,进入二十一世纪的中国在太阳能光伏行业具有明显的出口绩效,而分析发现,这些出口绩效是由于企业家的追逐对外出口贸易机遇的结果,而非产业政策或国家治理的结果。风电装机量更高的国家,将会有更显著的出口额。光伏发电量更高的国家也有同样情况。但由于底层技术差异,政策驱动下的太阳能光伏的竞争优势将在若干年后消退,而风电行业则显得能够保持稳定水平。个人认为,这似乎是因为风电行业仍然是资本和技术密集型产业,市场门槛较高;而光伏行业则技术成本相对较低,更加注重工艺创新,能够通过规模效应迅速降低生产成本,赢得市场优势。这也使得光伏行业的竞争更加充分,暂时性的竞争优势更易消退。对于需要发展绿色经济,实现高质量增长的中国,我们更加需要支持发展技术密集型的可再生能源技术,支持国内企业技术创新,实现产业升级,在全球竞争中跃迁至价值链高端。

[Source: American Public Power Association, Unsplash]

Do rising rents lead to longer commutes? A gravity model of commuting flows in Ireland(2021)中,研究者使用引力模型探究就业中心和住宅区之间的租金差异对平均通勤时间的变动影响。他们将住所至工作地点两地的通勤流、交通距离、地租分别类比为双边贸易的贸易流、国家间地理距离,并加入了租金价格、行程时间等其他变量。这很有趣,将微观数据作为宏观数据的替代变量,但分析模型整体依然可用。研究者使用了横截面数据作为数据源。

在考虑变量的影响因素时,研究者既提到了地理距离选择(欧几里得法或实际道路长度)对通勤的需求影响,也提及收入水平差距对通勤的需求差异,颇有意思:一人拥有较高的豪华公寓的份额,而另一人以低技能体力劳动为工作内容,则两人对于通勤的可能性较低。个人认为,前者通常意味着收入水平较高的中高收入群体,购置资产(房地产、汽车)的消费能力较强,通过在市中心等发达区域购置房产,能够从物理意义上缩短与工作地点的距离;而中低收入群体则更多地在住所周遭寻求工作机会,或者说他们通常也无法跨越高收入岗位的就职门槛,导致无需过多通勤和通勤的地理距离缩短。

研究者面对众多的影响因素,使用了Post-Double-Selection Lasso,即Double-Selection Lasso(DS)的一种延伸方法。其中的“Lasso”不是英文中的“套索”,而是统计学中一种变量选择方法:The Least Absolute Shrinkage and Selection Operator。Lasso是“稀疏性假设”的产物:现实世界中,一个现象可能由数以万计的原因所导致,哪个(哪些)原因才是重要的?而如何快速地从数以万计的影响因素(自变量)中筛选出对研究对象(因变量)产生主要影响的因素?如果我们拥有的有限的样本数据,想要用有限的数据去估计过多的影响因素,很可能会出现数据不足的情况,故筛选变量以提高估计效果显得十分必要。虽然与统计中的方差结果较大、无偏分布的最小二乘法相比,Lasso方法所得到的是偏差较大、方差较小的有偏分布的结果,但提高了均方误差的有效性,可以更快筛选出主要影响因子。Double-Selection Lasso则是进行两次Lasso回归筛选以确定合适的影响因子(控制变量)。而Post-Double-Selection Lasso则在Double-Selection Lasso基础上发展而来的、根植于机器学习的数据驱动型的变量控制选择方法。

研究者最后得出结论:劳动者始终要在住房价格和通勤成本的相对价格中做出取舍,要么忍受高房价而享受低通勤成本,要么在距离工作地点较远的住所承受更高的通勤成本。而就业集中区的房价上涨将会助推该区域的单程通勤时间。 就业中心的高房价带来的出行成本和花费时间的上涨也会伴随诸如空气污染、居民身心健康受损、公共交通承压等社会问题。这对地方政府的城市规划和房地产政策有一定的警示意义。

[Source: Aleksandr Popov, Unsplash]

结论与启示

引力模型和随机前沿模型是社会科学研究中广泛使用的两种分析方法。引力模型被用于研究社会网络中的联系和互动,而随机前沿模型则被用于研究影响社会现象的因素。这两种模型都具有在社会科学研究中提供有价值的洞察和启示的潜力。

引力模型可以用于研究社会网络中的联系和互动。通过引力模型,研究人员可以分析社会网络中的成员之间的互动和联系,并探究这些互动和联系的特性。这些特性可以包括成员之间的距离、互动频率、交流方式等等。引力模型可以帮助研究人员理解社会网络的结构和运作方式,并且可以用于预测社会网络中的行为和互动。

随机前沿模型则可以用于研究影响社会现象的因素。通过随机前沿模型,研究人员可以分析社会现象的各种因素,并确定它们之间的关系和影响力。这些因素可以包括个人特征、社会背景、政治经济环境等等。随机前沿模型可以帮助研究人员理解社会现象的根本原因,并且可以用于预测社会现象的未来发展趋势。

自引力模型问世以来,便与自然科学,尤其是数学紧密相连。其源于描述自然界物理法则的万有引力定律,却被巧妙地应用于解释人类社会的经济现象。这表明自然科学与社会科学并非绝对的对立,而是相辅相成的。

数学作为人类社会的基础科学之一,既是抽象和具体的语言工具与逻辑工具,也是实现定义、区别、分析、预测的应用工具。正是数学作为支柱,与其他学科共同构建起了政治经济学的大厦。从古典政治经济学代表作《国富论》到马克思主义政治经济学的《资本论》,数学的影子始终贯穿其中。它以独特的简洁形式和高效表意能力,承载着人类文明发展的重任。

在政治经济学中的数学分析的研究,需要大胆假设,小心求证。这意味着我们不仅要提出假设,还要检验假设;不只是提出模型,也要构建模型;不仅要收集数据,还要检验数据。随着经济社会的发展,我们还需不断更新假设、模型和数据,以确保理论分析的长远可靠性。

引力模型和随机前沿模型在社会科学研究中的应用启示我们,跨学科的结合为我们提供了更为广阔的视角和更为丰富的方法论资源。我们应充分挖掘自然科学与社会科学的共性,争取在理论研究和实践应用方面取得更为深入的成果。因此,学好政治经济学,不仅要懂政治经济学的抽象理论,更要掌握好数学这门基础学科,方可辩证统一地剖析和解决社会问题,给出未来发展对策,指导经济社会发展。

总之,引力模型和随机前沿模型的跨领域应用使我们认识到,自然科学与社会科学的融合将为人类社会的认知和发展提供更为强大的动力。

[Source: Enric Moreu, Unsplash]

参考文献

  1. Aigner D , Lovell C , Schmidt P . Formulation and estimation of stochastic frontier production function models[J]. Journal of Econometrics, 1977, 6(1):21-37.

  2. 张杰,古斯达·克里斯坦森.引力模型在国际贸易理论中的发展和应用——兼论欧共体与其他国家(地区)的贸易[J].国际贸易问题,1996(01):29-36+41.

  3. 刘青峰,姜书竹.从贸易引力模型看中国双边贸易安排[J].浙江社会科学,2002(06):16-19.DOI:10.14167/j.zjss.2002.06.004.

  4. 盛斌,廖明中.中国的贸易流量与出口潜力:引力模型的研究[J].世界经济,2004(02):3-12.

  5. 范鑫.数字经济发展、国际贸易效率与贸易不确定性[J].财贸经济,2020,41(08):145-160.DOI:10.19795/j.cnki.cn11-1166/f.2020.08.010.

  6. 吴群锋,杨汝岱.网络与贸易:一个扩展引力模型研究框架[J].经济研究,2019,54(02):84-101.

  7. 鞠雪楠,赵宣凯,孙宝文.跨境电商平台克服了哪些贸易成本?——来自“敦煌网”数据的经验证据[J].经济研究,2020,55(02):181-196.

  8. Anderson J E. A Theoretical Foundation for Gravity Equation[J]. American Economic Review, 1979, 69(1):106-116.

  9. Elhanan H, Marc M, Yona R. Estimating Trade Flows: Trading Partners and Trading Volumes[J]. Quarterly Journal of Economics, 2008, 123(2):441-487.

  10. Kuik O, Branger F, Quirion P. Competitive advantage in the renewable energy industry: Evidence from a gravity model[J]. Renewable Energy, 2019, 131(FEB.):472-481.

  11. Ahrens A, Lyons S. Do rising rents lead to longer commutes? A gravity model of commuting flows in Ireland[J]. Urban Studies, 2021, 58.

License:  CC BY 4.0