统计分析技术
结构方程模型

结构方程模型(Structural Equation Modeling,SEM)

作者:数海时代  发布时间:2012-11-9 1:35:02  点击数:76275

   结构方程模型(Structural Equation Modeling,简称SEM)是一种建立、估计和检验因果关系模型的多元统计分析技术。它包含了回归分析(Multiple Regression)、因子分析(Factor Analysis)、路径分析(Path Analysis)和多元方差分析(Multivariate Analysis of Variance)等一系列多元统计分析方法,是一种非常通用的、线性的、借助于理论进行假设检验的统计建模技术。这一模型和方法由K.Joreskog与其合作者在70年代提出并逐步改进和完善,20世纪80年代以来迅速发展,弥补了传统统计方法的不足,成为多元数据分析的重要工具,和社会科学研究中的一个非常好的方法。

结构方程模型概述
   SEM习惯上也叫做因果关系模型、协方差结构模型、证实性因子分析模型,或者直接称为LISRLE模型,这主要是因为LISREL是用来分析结构方程式模型的早期的最流行软件。
   结构方程模型假定在一组潜在变量中存在因果关系,这些潜在变量可以分别用一组可观测的变量表示。假设的模型通常包括某个基本线性回归模型和很多观测变量,而这个基本的线性回归模型应该是一组潜在变量的结构关系模型。这一组潜在变量分别是那些观测变量中的某几个的线性组合。在结构方程模型中,我们把那些能够直接度量的量叫做观测变量(observed variable)或指示变量(indicator variable),而那些不能够直接测量但可以用观测变量线性表示的变量,称之为潜在变量(latent variable),结构方程模型就是在我们能够度量的量的基础上,得出我们不能够度量的量之间的关系。一般采用路径图(path diagram)的形式表示结构方程模型,这是最简单、最直观的描述模型的方法,研究人员可以借助路径图直直观地变将量之间的关系以图形的方式表现出来。



图:结构方程模型的路径图


   图中给出了一个典型的结构方程模型中各变量的关系,可以看出,结构方程模型就是一个由许多观测变量、潜在变量、残差和误差项相互作用的复杂体系。所假设的潜在变量之间的关系模型,是一种根据理论建立的临时的基本模型,我们称之为结构模型(Structural Model);而那些在统计显著的观测变量之间的线性关系模型,称之为度量模型(Measurement Model)。
   一般结构方程式模型由三个矩阵方程式表示:


   第一个方程是结构模型部分,规定了所研究的模型中假设的潜在外生变量和潜在内生变量之间的因果关系,Β表示潜在内生变量对潜在内生变量的效应的系数矩阵,Γ表示潜在外生变量对潜在内生变量的效应的系数矩阵,ζ表示残差项构成的向量。
   后两个方程是度量模型部分,分别规定了潜在外生变量ξ和显在外生变量X之间的关系,以及潜在内生变量η和显在内生变量Y之间的关系,λx和λy分别表示对潜在变量ξ和η的回归系数或因子负荷矩阵,δ和ε分别表示了观测变量X和Y的测量误差。
   因此,结构方程式模型的建立涉及到八个基本的参数矩阵: λx、λy、Β、Γ、Φ、Ψ、θε、θδ。其中,Φ是潜在外生变量ξ的方差协方差矩阵,Ψ是结构模型残差项ζ的方差协方差矩阵,θε、θδ分别是观测变量Y和X误差项的方差协方差矩阵。研究者根据研究目的提出相关的原假设,画出路径图,应用LISREL或者AMOS软件进行模型的估计和检验。
   结构模型实际上是某种意义上的回归模型,要做的工作是验证这个模型是否合适,也就变成了估计潜在变量之间相应的回归系数(路径系数)的值,而度量模型便是估计这些回归系数的依据。
   在技术上,通过验证观测变量之间的协方差,可以估计出这个基本线性回归模型的系数值,从而在统计上检验所假设的模型对所研究的过程是否合适,也就是检验观测变量的协方差矩阵与模型拟合后的引申协方差矩阵的拟和程度,如果证实所假设的模型合适,就可以得出结论:我们所假设的潜在变量之间的关系是合理的。

结构方程模型的参数估计
   结构方程模型的估计过程与传统的统计方法截然不同,它是从样本的方差协方差矩阵S出发,将固定参数和自由参数代入结构方程,推导出一个再生的(引申的)方差协方差矩阵Σ,使矩阵Σ的每一个元素都尽可能地接近样本中观测变量的方差协方差矩阵S中的相应元素。如果设定模型正确的话,Σ将非常近似于S。因此,估计过程就是采用特殊的拟合函数使Σ与S之间的差异最小
   不软件提供的估计方法略有不同,AMOS提供了4种估计参数的迭代法:最大似然估计(ML)、不加权的最小二乘法(ULS)、广义最小二乘法(GLS)、渐进自由无干扰的加权最小二乘法(ADF)。

结构方程模型的评价
   结构方程模型的目标就是再生的一个观测变量的引申方差协方差矩阵Σ,使之与样本方差协方差矩阵S尽可能地接近,同时评价模型对数据的拟合程度。如果引申的方差协方差矩阵Σ与样本方差协方差矩阵S之间的差别非常小,也就是残差矩阵各个元素接近于0,就可以认为模型拟合了数据。
   关于模型的总体拟合程度有许多测量指标和标准,对模型的评价,涉及到模型对数据的总的拟合程度,AMOS软件提供了多种判定拟合优度的量。
  1、卡方统计量(X2)
   我们希望得到的不是显著的卡方值,大的值对应于差的拟合,小的值对应于好的拟合。
   2、拟合优度指数(GFI)
   指数在0和1之间,较大的数对应于较好的拟合,一般大于0.9时,则认为模型拟合观测数据。
   3、修正的拟合优度指数(AGFI)
   指数在0和1之间,较大的数对应于较好的拟合,一般大于0.9时,则认为模型拟合观测数据。
   4、平方平均残差的平方根(RMR)
   RMR度量了拟合残差的一种平均值,说明样本方差和协方差在假定模型正确的情况下的估计值与理论值的差异,RMR越小,说明拟合较好,如果RMR等于0,表明模型完美拟合。
   5、本特勒-波内特规范拟合指数(NFI)
   指数在0和1之间,较大的数对应于较好的拟合,一般大于0.9时,则认为模型拟合观测数据。
   6、近似误差的平方根 (RMSEA)
   习惯上,RMSEA取值小于0.05,表明相对于自由度模型拟合了数据。
   7、信息标准指数(information criteria index )
   信息标准指数测量是为了作不同模型的比较,信息标准指数测量的值越小,说明含独立估计参数越少的模型拟合越好,也是说简约模型(parsimonious model)越好。


结构方程模型的优点

  (一)同时处理多个因变量
  结构方程分析可同时考虑并处理多个因变量。在回归分析或路径分析中,就算统计结果的图表中展示多个因变量,其实在计算回归系数或路径系数时,仍是对每个因变量逐一计算。所以图表看似对多个因变量同时考虑,但在计算对某一个因变量的影响或关系时,都忽略了其他因变量的存在及其影响。
  (二)容许自变量和因变量含测量误差
  态度、行为等变量,往往含有误差,也不能简单地用单一指标测量。结构方程分析容许自变量和因变量均含测量误差。变量也可用多个指标测量。用传统方法计算的潜变量间相关系数,与用结构议程分析计算的潜变量间相关系数,可能相差很大。
  (三)同时估计因子结构和因子关系
  假设要了解潜变量之间的相关,每个潜变量者用我个指标或题目测量,一个常用的做法是对每个潜变量先用因子分析计算潜变量(即因子)与题目的关系(即因子负荷),进而得到因子得分,作为潜变量的观测值,然后再计算因子得分,作为潜变量之间的相关系数。这是两个独立的步骤。在结构方程中,这两步同时进行,即因子与题目之间的关系和因子与因子之间的关系同时考虑。
  (四)容许更大弹性的测量模型
  传统上,我们只容许每一题目(指标)从属于单一因子,但结构方程分析容许更加复杂的模型。例如,我们用英语书写的数学试题,去测量学生的数学能力,则测验得分(指标)既从属于数学因子,也从属于英语因子(因为得分也反映英语能力)。传统因子分析难以处理一个指标从属多个因子或者考虑高阶因子等有比较复杂的从属关系的模型。
  (五)估计整个模型的拟合程度
  在传统路径分析中,我们只估计每一路径(变量间关系)的强弱。在结构方程分析中,除了上述参数的估计外,我们还可以计算不同模型对同一个样本数据的整体拟合程度,从而判断哪一个模型更接近数据所呈现的关系。


 
分享到: