计量经济学研究经济问题。它使用数学方法。它使用统计方法。数据很重要。现实世界有很多数字。这些数字是数据。价格是数据。工资是数据。销量是数据。经济学家收集数据。他们想理解经济规律。
经济关系常常是模糊的。例如,教育影响收入。多读书的人通常赚钱更多。但这不是绝对的。有人读书少也赚钱多。有人读书多赚钱少。其他因素也在起作用。个人能力有差异。家庭背景不同。运气成分存在。计量经济学帮助我们处理这种模糊性。它试图分离出单个因素的影响。它想回答“其他条件不变”下的问题。如果两个人的其他条件完全相同,多读一年书会增加多少收入?这是一个典型问题。
模型是核心工具。模型是现实世界的简化。它抓住主要关系。忽略次要细节。一个简单模型描述收入和教育的关系。收入等于一个基数加上教育年限乘以一个系数再加上其他因素。基数代表没有教育时的基础收入。系数代表每多一年教育带来的收入增加。其他因素代表所有未被模型明确包含的影响。这个模型是一个方程。方程是数学表达。它简洁明了。
我们无法直接观察系数。系数是未知的。我们需要估计它。估计需要数据。我们调查一群人。记录他们的教育年限和收入。数据点很多。每个点代表一个人。我们在图上画点。横坐标是教育年限。纵坐标是收入。点分散在图上。它们不在一条直线上。计量经济学找一条最合适的线。这条线概括了教育对收入的平均影响。这条线叫做回归线。
“最合适”有严格定义。通常使用普通最小二乘法。它计算点到线的垂直距离。这些距离叫残差。残差代表模型未能解释的部分。最小二乘法让所有残差的平方和最小。平方能避免正负抵消。它强调大的偏差。这个方法能得到系数估计值。这个估计值有良好性质。它在许多情况下是最优的。
估计值只是近似。它基于样本数据。样本是从总体中抽取的一部分。我们通常无法调查所有人。抽样带来误差。样本不同,估计值就不同。我们需要评估估计的可靠性。假设检验派上用场。我们提出一个原假设。比如,教育的系数为零。这意味着教育不影响收入。然后我们检验数据是否支持这个假设。我们计算一个统计量。这个统计量衡量估计值偏离零的程度。如果偏离很大,我们拒绝原假设。我们认为教育的影响是存在的。这个判断可能犯错。我们可能拒绝了正确的原假设。这叫第一类错误。我们可能接受了错误的原假设。这叫第二类错误。计量经济学控制这些错误概率。
数据质量很关键。垃圾进,垃圾出。数据有问题,结论就不可信。数据问题多种多样。测量误差常见。人们可能误报收入。教育年限可能记录不准。这会导致估计偏差。系数估计不再准确。它系统性地偏离真实值。
遗漏变量是严重问题。模型不可能包含一切。有些重要因素被忽略了。例如,个人能力常被遗漏。能力强的人可能选择更多教育。能力强的人也赚更多钱。如果我们只看教育和收入,我们会高估教育的作用。我们把能力的贡献也算给了教育。这导致估计系数向上偏误。计量经济学发展工具处理遗漏变量。工具变量法是一种重要方法。它寻找一个变量。这个变量与教育相关。这个变量与能力无关。这个变量只通过教育影响收入。例如,义务教育法改革是一个候选。它改变了人们的受教育年限。但它与个人能力无关。它可能直接影响收入。工具变量法利用这种“自然实验”来得到更干净的估计。
因果关系识别是根本难点。相关不等于因果。教育和收入高度相关。但因果方向可能复杂。是教育提高了收入吗?还是高收入家庭让孩子接受更多教育?或者有第三个因素同时导致两者?计量经济学家努力寻找因果证据。随机对照试验是黄金标准。随机分配教育干预。比较处理组和对照组的结果。这能有效确立因果关系。但在经济学中,大规模社会实验往往困难。经济学家利用准实验。他们寻找现实世界中类似随机的事件。例如,研究参军经历对收入的影响。越南战争时期有抽签征兵。抽签号码随机决定谁被征召。这类似于随机分配。比较不同号码人的后期收入,可以估计参军的影响。
时间序列数据分析另一个维度。我们观察一个变量随时间的变化。例如,国家的年度GDP。我们想预测未来经济。我们想理解经济周期。自回归模型常用。它用变量的过去值预测当前值。趋势和季节性是常见特征。计量经济学要分离它们。平稳性是一个重要概念。数据的统计性质不随时间改变。非平稳数据会导致伪回归。两个没有关系的趋势变量可能显示出虚假的相关性。差分是常用处理方法。用当期值减去前期值。这可以消除趋势,得到平稳序列。
面板数据结合横截面和时间序列。我们跟踪多个个体跨越多年。例如,每年调查同一批公司。面板数据有优势。它可以控制个体异质性。每个个体有自己未观察到的固定特征。这些特征可能影响结果变量。面板数据模型可以消除这些固定效应。这减轻了遗漏变量偏误。它让我们对因果关系的推断更有信心。
计量经济学软件普及了分析。Stata、R、Python都很流行。它们执行复杂计算。它们生成图表和结果。但软件只是工具。理解原理更重要。错误设定模型会得到错误结论。错误解释结果会误导决策。
计量经济学应用于各个领域。劳动经济学研究教育回报、性别工资差距。金融经济学研究资产定价、风险模型。发展经济学评估政策效果,比如扶贫项目是否有效。环境经济学估计污染的经济成本。健康经济学分析医疗保险的影响。
计量经济学也有局限性。它严重依赖假设。许多假设在现实中难以完全满足。模型的简化会丢失细节。外推预测有风险。过去的关系未来可能改变。黑色天鹅事件无法预测。计量经济学的结论是概率性的。它提供证据,不是绝对真理。它需要结合经济理论和现实洞察。
实证研究有固定流程。先提出一个具体问题。问题要有经济意义。然后查阅现有文献。看看别人做了什么。找到研究的空白。接着构建理论框架。思考变量间的逻辑关系。然后选择计量模型。模型要适合问题和数据。接着收集和处理数据。数据清洗耗时很长。然后进行估计。运行回归。得到数字结果。然后解释这些数字。系数符号对吗?系数大小合理吗?统计显著吗?经济显著吗?最后讨论稳健性。换一个模型设定结果还成立吗?用不同的数据子集试试。考虑可能的异质性。不同群体效果不同吗?
计量经济学是不断发展的学科。新方法不断出现。断点回归设计利用政策门槛。比如,奖学金分数线上下的人可视为随机分组。双重差分法比较处理组和对照组在政策前后的变化。这些方法提高了因果推断的能力。大数据时代带来新机遇。海量数据提供更细的观察。也带来新挑战。变量太多,模型太复杂。
学习计量经济学需要耐心。它结合经济学、数学和统计学。它要求清晰的逻辑思维。它要求对数据的谨慎态度。它最终服务于我们对真实经济世界的理解。我们通过数据看到模式。我们通过模型梳理关系。我们通过推断接近真相。这个过程不完美。但它是系统性的。它是科学的探索方式。它帮助我们在复杂的经济现象中做出更有依据的判断。