酷斯法律师网,一个集结国内知名律师的法律咨询网,为各地法律提供免费律师在线咨询服务,不在担心找不到好的律师,为您解决法律问题。

计量经济学笔记整理—计量经济学数据

2024-04-12 14:10 分类:经济犯罪 阅读:
 

计量经济学数据 (一)

计量经济学数据

计量经济学是经济学的一个分支,它使用数学和统计方法来分析经济数据,并预测未来的经济趋势,因此,计量经济学的研究需要大量的数据支持。

计量经济学中常用的数据类型:

1、时间序列数据:时间序列数据是按时间顺序排列的一组数据,例如股票价格、通货膨胀率、国内生产总值(GDP)等。这些数据通常用于分析经济现象随时间变化的情况,例如预测股票价格、通货膨胀率或GDP的增长趋势。

2、横截面数据:横截面数据是在同一时间点收集的一组数据,例如不同国家或不同地区的GDP、人口、就业率等。这些数据通常用于比较不同国家或地区之间的经济状况,或者研究经济现象在不同国家或地区的分布情况。

3、面板数据:面板数据是同时包含时间和个体信息的数据,例如不同国家或不同地区的历史GDP、人口、就业率等。这些数据通常用于分析经济现象在时间和个体两个维度上的变化情况,例如研究不同国家或地区的经济增长趋势和差异。

4、微观数据:微观数据是关于个体经济单位的数据,例如家庭收入、支出、劳动力参与等。这些数据通常用于研究个体经济单位的行为和决策,例如分析家庭消费和投资行为、劳动力市场供需等。

计量经济学数据的定义:

计量经济学数据是用于计量经济学研究的各种经济数据,包括宏观经济数据和微观经济数据。这些数据是通过统计学方法和数学模型对经济现象进行定量分析的重要基础。在收集、整理、分析和应用这些数据时,需要确保其准确性、可靠性和有效性,以便得出正确的结论和预测。

宏观经济数据通常包括国内生产总值、通货膨胀率、失业率等,用于反映整个国家或地区的经济状况。微观经济数据则包括企业销售额、劳动力成本、市场份额等,用于揭示个体经济单位的行为和表现。

通过运用计量经济学方法和模型,可以对这些数据进行深入剖析,揭示经济变量之间的关系,预测未来的经济走势,为政策制定和决策提供科学依据。

因此,计量经济学数据在经济研究、政策分析、商业决策等领域具有广泛的应用价值。同时,为了保证数据的准确性和可靠性,需要采用科学的方法进行采集、处理和分析,避免出现偏差和误导。

高级计量经济学 14:二值选择模型(基础) (二)

为了个人课题的进展,我会按照进度选择自己需要优先学习的内容😂不按照正常顺序的话不好意思啦!

此文内容为《高级计量经济学及STATA应用》的笔记,陈强老师著,高等教育出版社出版。

我只将个人会用到的知识作了笔记,并对教材较难理解的部分做了进一步阐述。为了更易于理解,我还对教材上的一些部分( 包括证明和正文 )做了修改。

目录

如果解释变量是离散的(比如,虚拟变量),这并不影响回归。但有时候被解释变量是离散的,而非连续的,这就让人很头疼了。

这类模型被称为 离散选择模型 (discrete choice model)或 定性反应模型 (qualitative response model)。另外,有时被解释变量只能取非负整数,比如企业在某个时间内所获得的专利数,这类数据被称为 计数数据 (count data),其被解释变量也是离散的。

考虑到离散被解释变量的特点, 通常不宜使用OLS进行回归

假设个体只有两种选择,比如 和 。是否考研,取决于毕业生毕业后的预期收入、个人兴趣等等,假设这些解释变量都被集成在向量 中。于是,最简单的模型为 线性概率模型 (Linear Probability Model,LPM):

对 的一致估计要求 (没有内生性)。然而,这里有几个问题:

尽管 LPM 有上面所提到的各种缺点,但它的优点是计算方便,而且容易分析经济意义。于是,为了使 的预测值总是介于 之间,我们对 LPM 进行拓展:在给定 的情况下,考虑 的两点分布概率为:

于是,函数 就被称为 连接函数 (link function),因为它将解释变量 与被解释变量 链接起来。由于 的取值要么为 0 ,要么为 1 ,于是 一定服从 两点分布

连接函数的选择有一定的灵活性,通过选择合适的连接函数 可以保证 ,并将 理解为 “ 发生的概率”,因为:

特别地,如果 是标准的正态分布累计函数(cdf),则:

那么这个模型就被称为 Probit模型 。如果 是 逻辑分布 (logistic distribution)的 cdf ,即:

那么这个模型就被称为 Logit模型 。

由于逻辑分布函数有解析表达式,而正态分布则没有,所以计算 Logit 模型通常比计算 Probit 模型更为方便。显然,这是一个 非线性模型 ,可以用最大似然法估计(MLE)。以 Logit 模型为例,第 个观测数据的概率密度为:

可以不分段地写成:

去对数,有:

假设样本中的个体相互独立,那么整个样本的 LLF (对数似然函数)为:

可以用 数值方法 求解这个非线性最大化问题。

需要注意的是,在这个非线性模型中,估计量 并非边际效应(marginal effects)。以 Probit 为例,可以计算:

在这里使用了微分的链式法则(chain rule),并假设了 为连续变量。由于 Probit 和 Logit 所使用的分布函数不同,所以其参数并不可以直接比较,而是需要 分别计算二者的边际效应,然后进行比较 。然而,对于非线性模型而言, 边际效应本身就不是常数 ,它随解释变量的变化而变化。常用的边际效应的概念有:

三种边际效应的计算结果可能会有差异。传统上,计算样本均值处的边际效应比较简单;然而,在非线性模型中,样本均值处的个体行为通常不能代表个体的平均行为(average behavior of individuals differes from behavior of the average individual)。 对于政策分析而言,平均边际效应比较有意义,也是 Stata 的默认方法

既然 并非边际效应,那他有什么经济意义呢?对于 Logit 模型,令 ,那么 ,由于 ,于是:

其中, 被称为 几率比 (odds ratio)或 相对风险 (relative risk)。如果几率比为2,意味着 的概率是 两倍。对第二个等式的右边求导,我们可以发现 的意义是:若 增加一个微小的量,那么 几率比的百分比 则会增加 。所以,可以把 视为 半弹性 ,即 增加一个单位引起 几率比的百分比 的变化。

还有另外一个生物统计领域特别喜欢使用的意义,考虑 从而 变成了 ,于是新几率比与原先几率比的比率可以写成:

所以, 表示 引起的 几率比的变化倍数

事实上,如果 比较小,两者方法是等价的( Taylor 展开)。然而,如果 必须变化一个单位(如性别、婚否),则应使用 。另外,Probit 模型无法对系数 进行类似的解释,这是 Probit 模型的劣势。

如何衡量一个非线性的模型的拟合优度呢?在不存在平方和分解公式的情况下, 是无法计算的,然而 Stata 依然汇报一个 准R2 (Pseudo ),由 McFadden (1974) 提出,其定义为:

其中, 为原模型的 LLF 最大值,而 为 以常数项为唯一解释变量 的 LLF 的最大值。由于 是离散的两点分布,似然函数 LF 的最大可能值为 1,于是 LLF 的最大可能值为 0,记为 。于是,必然有 ,于是 。

另外一类判断拟合优度的方法是计算 正确预测的百分比 ,实际上我认为目前机器学习领域的一系列常用的拟合优度如 MSE、MAPE 等都可以使用。

本节主要是复习 高级计量12 高级计量13 的内容

总的来说,要对 Probit 和 Logit 模型进行统计推断,需要作如下假设:

下面我们对两种检验:对

所有系数的联合检验

单个系数的独立检验

进行说明

(1) 所有系数的联合显著性

在使用 Stata 时,会汇报一个 LR 检验统计量,检验常数以外的所有其他系数的显著性(即所有系数的联合显著性)。在 高级计量13 ,我们已经推导出对 MLE 的系数的 LR 统计推断表达式:

上面的统计推断表达式仅依赖于 样本 i.i.d. 和 似然函数正确 这两个条件,前者是为了应用 大数定律 中心极限定理 ,后者是为了使用 信息矩阵等式

对于 Probit 和 Logit 模型,如果分布函数设定不正确,则为 准最大似然估计 (QMLE),那么我们要注意:

(2) 单个系数的显著性

在使用 Stata 时,也会汇报每个系数的 Std. err. 。如果要对单个系数的显著性进行推断,则需要使用 高级计量12 的 6.5.2 节中的推导:

a. 在抽取的样本为 i.i.d. 的假设下,我们用 大数定律 中心极限定理 可以推导出:

b. 在分布函数设定正确的假设下(于是可是使用 高级计量11 的 证明3 ),可以进一步推导出:

前面已经提到, 就算分布函数设定不正确 ,如果 成立,那么在 i.i.d. 的情况下,稳健标准误就等于 MLE 的普通标准误。所面的等式只要 成立就可以用了。

c. 如果 ,则 Probit 与 Logit 模型并不能得到对系数 的一致估计。此时统计推断并无意义。

欲从上面的式子单个系数进行检验,显然需要 未知的 真实参数 。于是我们可以根据 高级计量12 的 6.6 的方法去处理,这里就不再赘述了。

高级计量经济学 17:面板二值选择模型 (三)

此文内容为《高级计量经济学及STATA应用》的笔记,陈强老师著,高等教育出版社出版。

我只将个人会用到的知识作了笔记,并对教材较难理解的部分做了进一步阐述。为了更易于理解,我还对教材上的一些部分( 包括证明和正文 )做了修改。

目录

对于面板数据,如果被解释变量为虚拟变量,则称为 面板二值选择模型 (binary choice model for panel data)。对于二值选择行为,通常可以通过一个 潜变量 (latent variable)来概括该行为的净收益(收益减去成本)。如果净收益大于0,则选择做;否则选择不做。假设净收益为:

其中,净收益 为不可观测的潜变量, 为个体效应(individual effects),而解释变量 不含常数项。个体的选择规则为:

给定 , , ,则有:

其中, 为误差项 的累积分布函数(cdf),并假设 的密度函数关于原点对称。如果 则为 Probit 模型:

如果 服从逻辑分布,则为 Logit 模型:

面板二值选择模型主要估计方法包括:

在方程 中,如果 ,即没有个体效应,则为混合回归(pooled probit or pooled logit),可将此面板数据作为横截面数据处理(参考《高级计量16》),此时,只需要使用截面数据的相关 Stata 命令即可进行混合回归。然而,由于同一个体不同时期的扰动项可能存在自相关,故应使用以面板为聚类的聚类稳健标准误(cluster-robust standard error)。

更一般地,我们允许个体效应存在,即不同的个体拥有不同的 。如果 与所有解释变量 均不相关,则称为 随机效应模型 (Random Effect Model, RE, 见《高级计量16》);否则为 固定效应模型 (Fixed Effect Model, FE)。

首先考虑 RE 模型。对于线性面板的 RE 模型,一般使用广义最小二乘法(GLS)进行估计。但 非线性面板不便使用GLS ,故转而使用最大似然估计(MLE)。假设 ,记密度函数为 。以 Logit 模型为例,给定 ,则个体 的条件分布为(参考《高级计量14》):

然而,上式的 不可观测,为此,记 的联合密度为 ,并进行如下分解:

在 的联合密度重,将 积分去掉,即可得到 的边缘密度:

上面的积分没有解析解,可以通过数值求解的方法求解,这里就不再叙述了。

假设不同个体的观测值相互独立,则可以写出整个样本的似然函数。最大化此似然函数即得到 的 RE Logit 估计量 。如果将上述方程的逻辑分布 改为正态分 ,那么就是 RE Probit 估计量 。由于不同个体的观测值相互独立,故不同个体的扰动项也不相关,但由于 的存在,同一个体不同时期的扰动项之间仍存在相关:

如果 ,那么自相关系数为:

如果 越大,就表示复合扰动项 中个体效应 的部分比较大,不能忽视个体效应;极端地,如果 ,就表示复合扰动项中 ,个体效应接近没有,故应该使用混合回归模型。

在面板二值选择模型中,如果个体效应 与解释变量 相关,那么就是 FE 模型,

其中, 可以是 或者 。此时,如果使用 RE 模型或混合回归则得不到一致估计。

在线性面板模型中,可以通过组内变换或差分变换解决伴生参数问题,但对于固定效应的面板 Probit 模型,目前尚无法解决此类伴生参数问题。

对于固定效应的面板 Logit 模型,可以通过寻找 的 充分统计量 (sufficient statistic),然后在给定此充分统计量的条件下进行 条件最大似然估计 (conditional MLE)。

对于 Logit 模型,Chamberlain(1980)提出使用

作为 的充分统计量,并计算在给定 情况下的条件似然函数(根据充分统计量的性质,此似然函数不再依赖于 ),然后进行条件似然最大估计。然而,对于 Probit 模型,却找不到 的充分统计量。

以最简单的两期模型为例进行说明,即 。此时,对于个体 ,只有以下三种可能: 。下面分别考虑着三种情形:

,此时必然 ,从而 ,其对数似然函数为 ,故对整个样本的似然函数没有贡献。

直观来看,由于此条件似然函数的取值为常数,故此观测值不包含任何可以用于估计 的信息,因此,在进行条件似然估计时,是否包含这些观测值并不影响估计结果。

事实上,等于损失了这些样本的观测值。

,此时必然 ,从而 ,同理,这些观测值并不包含任何有助于估计 的信息,应该忽略

此时,或者 或者 ,分别计算其条件概率为:

假设给定 和 的条件下, 和 相互独立,则:

将表达式 和 代入 中,可得:

注意到, 在分子分母都有 项,于是被消除了。同理,将 和 代入 可得:

如果定义虚拟变量:如果 则 否则 ,那么就可以把 和 写在一起,并将个体 的条件对数似然函数写为:

其中 为示性函数,表示仅考虑 的观测值。上式对 加总,即可得到整个样本条件对数似然函数。

从 我们发现:

更一般地,对于 ,可以计算给定 或 的条件似然函数。固定效应模型的缺点是,将损失所有 或 的观测值,导致样本容量减少;并且由于 消去了,也无法估计个体效应 ,也无法预测 发生的概率或解释变量对 的边际效应。解决的方法是假设

2020-03-04 基本无害的计量经济学阅读笔记 (四)

学习计量经济学的历史应该是一部血泪史。

最开始的时候是本科大三上的时候,学习最基本的内容,学习Eviews,老师好像只讲到异方差。那时候上课还算认真,有段时间因为去日本访学,还在图书馆里看录的视频,看不懂就反复看。成绩应该还不错。有意思的是,老师讲到一个例子,好像是通货膨胀是否促进了经济增长,老师跑了个回归,说是正向促进作用。我觉得很奇怪的,这不一定是通货膨胀促进经济增长啊,还可能是经济增长导致通货膨胀啊。问了老师问题,老师糊弄我一下,就不了了之了。没想到的是,这个问题居然其实是计量经济学里最重要的问题。可想而知,老师已经脱离学术圈很久了。

大四的时候自学伍德里奇的计量经济学导论,学到一半就放弃了,Stata倒是学得很溜。那段时间也学习了很多杂的计量经济学知识,双重差分什么都是那个时候学的。所以那个时候觉得自己很厉害,我记得好像还买了陈强老师的书。

到了研究生阶段,上了中级和高级计量经济学,但老师以讲授理论知识为主,应用那部分自己也会了,其实对我的提升是非常有限的,基本没啥长进。也有选修专门的应用计量,貌似学到了一些东西,但自己写论文的过程中应用不多。

所以总觉得自己的大脑里没有形成体系,比如稳健的标准误,聚类是啥其实搞不明白。理论学得比较杂,应用也没有成体系,于是想着利用因为疫情呆在家的这段时间,看看这本书《基本无害的计量经济学》,英文名是Mostly Harmless Econometrics: An Empiricist's Companion。看看自己能不能坚持下去吧。

一项研究的四个常见问题:

书中收录的这首俳句很有意思:

T-stat looks too good.

Use robust standard errors-

significance gone.

医院能够使人变得健康吗?如果比较去过医院的人和没去医院的人的健康问题,可以得到结论,没去过医院的人更加健康。所以去医院会变得不健康吗?当然也是有可能的,因为去医院可能会面临更高的传染病风险。

因为去医院的人一般是身体比较差的人,所面的说法肯定是存在问题的。也就是样本选择偏差。我们要考虑的是,本来要去医院的人,如果后来没去医院的话,他的身体会怎么样。

随机分配可以消除选择性偏误。

如果是随机分配的,其实加入控制变量是没有必要的,但是,一般来说,这种做法可以为我们带来对因果关系更加精确的估计。标准误可能会减小,估计更加显著。

Angrist曾经问Alen Meltzer,他是否对把时间花费在寻求回归结果上感到满意,因为那之后只不过是很多双面加宽绿色条的论文而已。他大笑,然后说这是他最愿意做的。现在Angrist们也和大学和研究院的老师和指导老师一样,整日地追寻着回归结果。

在没有随机分配可以利用时,我们未必能对回归结果赋予一个因果解释。

即便无法解决因果性的难题,我们也很显然地知道在侠义地统计意义上,教育水平能够预测收入。我们使用条件期望函数(conditional expectation function, CDF)来概括和总结这种预测能力。

条件期望函数的分解性质:

任意一个随机变量Y都可以分解成由X解释的部分和正交于X的部分。

我们将经验研究看作在无需精确计算变量之间关系的同时捕捉到变量间统计关系实质的一种努力。

一般而言,异方差实际不会带来太大的影响。在运用分组数据进行的回归中,如果分组样本的大小不同

饱和回归模型指的是具有离散解释变量的模型,对解释变量的所以可能取值,该模型都存在相应的参数与之想对应。

包括虚拟变量和二者乘积的回归中,虚拟变量的系数就叫做主效应(main effect),两个虚拟变量乘积叫做交互项。

如果对于给定的总体,条件期望函数刻画了平均潜在结果之间的不同,那么就说这个条件期望函数具有因果性。

越来越觉得这像是一本哲学书。

Robert Frost's celebrated The Road Not Taken: the traveller-narrator sees himself looking back on an moment of choice. He believes that the decision to follow the roads less traveled "has made all the difference", though he also recognizes that counterfactual outcomes are unknowable.

条件独立假设指的是给定观察到的特点X,选择性偏误消失。

Omitted variable bias公式描述是当回归包含不同的控制变量时,回归结果之间存在的关系。这个公式的出发点是:可以对存在控制变量的回归方程赋予一个因果解释,但无法对不含有控制变量的回归方程赋予一个因果解释。因此,在不含控制变量的较短回归方程中得到的系数就被认为是biased。

短回归参数等于长回归参数加上一个数,这个数等于遗漏变量效应乘以遗漏变量对被包含变量的回归系数。

遗漏变量公式和解构回归公式都告诉我们当遗漏变量和纳入回归方程的变量不相关时,长回归和短回归得到的系数时一样的。

教育年限和工资收入的回归中,如果假如一些能力的变量,教育年限的系数机制减小了。

要说明条件独立假设时成立的,等于要说明控制了所有可观察的因素之后,服役和未服役的人之间是可比的。

我们已经指出,对协变量的控制可以提高回归估计值获得因果解释的可能性,但并不是控制变量越多越好。有些控制变量是不合格的控制变量,将其加入回归固然可以改变回归系数,但实际上缺不该将其加入。

不合格的控制变量是那些可以作为实验结果的变量。不合格的控制变量本身可市作为被解释变量。合格的控制变量是指当我们选定回归元之后,它的取值已经固定给出的那些变量。

在一个经验研究中的例子中,我们可以看到将职业的虚拟变量加入回归后,确实降低了教育水平的系数。但我们很难解释是何种原因导致了这种下降。教育水平的系数变小可能仅仅是选择偏误的一种表现。因此我们最好还是用不由教育水平决定的那些变量作为控制变量。

当使用代理变量做控制变量时,也会出现不合格的控制变量问题,也就是说纳入回归方程的变量可能部分地控制遗漏变量,但是它本身被我们感兴趣地变量影响。

用代理变量作为控制变量得到的估计系数比没有控制的情况下更接近真实值。

当我们开始思考使用何种变量作为控制变量时,对不合格控制变量和代理性控制变量都适用一个挑选准则:考虑控制变量被决定地时间。一般来说,在我们感兴趣地变量产生之前就被决定的变量都是好的控制变量。如果时间不确定的话,因果关系的准确考量需要我们做出哪个变量先被决定的假设,或者说没有任何一个控制变量是由我们感兴趣的变量所影响的。

如果条件期望函数具有因果性,那么回归结果可以逼近条件期望函数这一事实使得回归系数也具有了某种意义上的因果性。不过这种说法不够精确。

回归是一种匹配估计量,并且由其提供的计算匹配估计量的方法具有良好的性质。

事实上,匹配法对由每个协变量的特定值所决定的个体计算处理组和控制组之间的平均差异,然后用加权平均的方式将这些平均因果效应汇总到一个总的因果效应中。

回归于匹配都是用了控制协变量的研究策略。可以将回归看在一种特殊的匹配估计量,因此从经验研究的角度看,两者的区别并不太重要。

使用匹配法对被处理者的处理效应进行估计时,对于由协变量的不同取值足和所决定的不同组别的个体而言,匹配法将最大权重赋予最可能被处理的那组的个抽屉的处理效应。相比之下,回归估计将最大权重赋予条件方差最大的那组个体的处理效应。

对回归与匹配的进一步讨论:有序处理和连续处理

倾向评分定理指的是:给定多元协变量构成的向量,如果潜在结果与处理状态独立,那么给定协变量向量的某个值函数,潜在结果与处理状态仍然相互独立,这里协变量向量的值函数被称为倾向得分。

类似于回归中的遗漏变量公式,倾向评分定理指出我们只要将影响处理概率的协变量控制好就好。但实际上,这个定理还能让我们走得更远,我们位以需要控制的协变量就是处理概率本身。

生活中的难题,我们要相信自己可以解决,看完本文,相信你对 有了一定的了解,也知道它应该怎么处理。如果你还想了解计量经济学笔记整理的其他信息,可以点击酷斯法其他栏目。

单位犯罪判刑

塞拉利昂经济落后粮食短缺的原因!塞拉利昂是世界最贫穷的国家之一,工业基础薄弱

相关推荐

返回顶部