收入水平对家庭消费的影响一直受到人们关注。我们想知道收入增加后消费会如何变化。这种关系可以通过数据分析来研究。计量经济学提供了具体的研究方法。我们尝试建立一个简单的模型。这个模型只考虑收入和消费两个变量。家庭消费是我们要解释的变量。收入是我们的解释变量。其他因素也会影响消费。我们暂时不考虑这些因素。
数据来自某地区的家庭调查。我们收集了五百个家庭的月度数据。数据包括家庭消费支出和家庭可支配收入。数据是2022年的记录。所有数据都以元为单位。我们首先观察数据的分布情况。消费支出的平均值是四千五百元。收入的平均值是六千元。消费的最低值是两千元。最高值是八千元。收入的最低值是三千元。最高值是一万两千元。数据显示收入和消费都呈现增长趋势。收入高的家庭消费往往更高。这种关系可以从散点图中看出。散点图显示两个变量有正向关系。
我们建立线性回归模型。模型形式为消费等于常数加收入乘系数再加随机误差。常数项代表收入为零时的消费。系数代表收入增加一元时消费的增加额。随机误差代表其他所有因素的影响。我们使用普通最小二乘法估计参数。这种方法让预测误差的平方和最小。计算过程由统计软件完成。软件给出了估计结果。常数项估计值是八百元。收入系数估计值是零点六。模型拟合度是零点七五。拟合度表示收入可以解释消费变化的百分之七十五。其余百分之二十五由其他因素解释。
模型结果需要检验。我们先看系数是否显著。软件计算了系数的标准误。标准误是零点零五。我们进行t检验。原假设是系数等于零。备择假设是系数不等于零。计算得到的t值是十二。十二大于临界值一点九六。我们拒绝原假设。收入系数显著不为零。收入对消费有显著影响。常数项的t值是四。四也大于一点九六。常数项也是显著的。模型整体显著性也需要检验。我们进行F检验。原假设是所有系数都为零。F统计量是一百四十四。一百四十四大于临界值。模型整体是显著的。
我们检查模型是否满足基本假设。第一个假设是随机误差的均值为零。残差图显示残差随机分布。残差和拟合值没有明显关系。这个假设可能成立。第二个假设是随机误差同方差。我们画残差与收入的散点图。散点图显示残差波动范围基本稳定。没有出现喇叭形或漏斗形。同方差假设可能成立。第三个假设是随机误差无自相关。我们的数据是截面数据。不同家庭之间相互独立。这个假设可能成立。第四个假设是解释变量与随机误差不相关。收入是调查数据。测量误差较小。这个假设可能成立。第五个假设是解释变量非随机。收入数据是给定的。这个假设可能成立。基本假设的检查没有发现严重问题。
模型可能存在不足。家庭消费还受其他因素影响。家庭人口数量很重要。人口多的家庭消费可能更高。家庭资产也会影响消费。有房产的家庭可能消费更稳定。家庭成员年龄结构也有影响。有老人的家庭医疗消费更多。这些因素都没有包括在模型里。遗漏变量会导致估计偏差。收入系数可能不准确。我们尝试加入家庭人口数。新模型有三个变量。收入系数估计值变成零点五五。常数项变成五百元。人口数系数是二百元。拟合度提高到零点八。加入新变量后收入系数变小了。原来的简单模型高估了收入的影响。
模型还可能存在测量误差。消费数据可能不完整。家庭可能遗漏某些支出。收入数据可能不准确。有些收入没有申报。测量误差会影响估计结果。我们无法完全消除这些误差。我们只能尽量使用可靠数据。数据来源是权威统计部门。调查过程经过严格设计。我们相信数据质量较好。另一个问题是模型形式。我们假设线性关系。实际关系可能不是直线。收入很低时消费可能接近收入。收入很高时消费增长可能变慢。我们尝试加入收入平方项。平方项系数非常小。统计上不显著。线性模型可能已经足够。我们暂时保留线性形式。
我们利用模型进行预测。一个家庭月收入是七千元。预测消费是多少。我们使用简单模型。预测值等于八百加零点六乘七千。计算结果是五千元。使用包含人口数的模型。假设该家庭有三口人。预测值等于五百加零点五五乘七千加二百乘三。计算结果是五千二百五十元。两个预测值有差异。第二个模型更详细。预测可能更可靠。预测总会有误差。我们给出预测区间。收入七千元三口之家。百分之九十五预测区间是四千九百元到五千六百元。区间范围较宽。预测有不确定性。
这项研究有实际意义。政府制定经济政策可以参考。提高居民收入能促进消费。消费增长能带动经济发展。企业也可以利用这个模型。企业预测消费品市场需求。市场需求和居民收入有关。收入增长意味着市场扩大。模型很简单。它只包含少数变量。实际经济系统更复杂。我们需要注意模型的局限性。模型结论不能直接套用。不同地区不同时间结论可能不同。模型需要结合实际调整。
研究过程可以改进。数据可以更丰富。我们可以收集多年数据。面板数据能提供更多信息。我们可以考虑更多变量。储蓄率利率物价水平都重要。我们可以尝试不同模型形式。非线性模型可能更好。工具变量方法可以解决内生性问题。收入可能和误差项相关。我们寻找收入的工具变量。地区平均收入可能是一个工具。工具变量估计需要谨慎。这些改进需要更多工作。我们留在未来研究。
计量经济学研究就是这样进行的。我们从一个问题开始。我们收集相关数据。我们建立数学模型。我们估计模型参数。我们检验统计假设。我们检查模型问题。我们解释模型结果。我们指出模型用处。我们说明模型缺点。我们提出改进方向。这个过程需要耐心。每一步都要仔细。研究结论才可靠。