記得在做我的博士論文課題時, 為想了解某一特殊人群的不良行為背後原因, 使用了結構線性模型(Structural Equation Model, SEM).
其實在現實的世界中, 很多的事實是不能透過如問卷、數據測量等形式去量度的,
好似有: 認知、態度等; 雖然現在仍有很多人用KAP(Knowledge Attitudes and Practice k-a-p survey)問卷對研究對象進行調查, 但往往只能得到較淺表的分析結果, 且結果的擬合效果常都不是太好呵!~ 究其原因, 問卷的題目都是“顯性變項”, 我們常為了對方易於理解和方便作常, 也因方便測量, 所以題目都應設計得顯淺易明和可被測量的。但是現實中, 有很多是不能直接被測量的, 只能經由“顯性變項”的理解後才能有所認識和體會; 如對某問題的認知, 只能透過對該問題的知識測驗, 才能大約有所了解, 對於這些“不能直接被測量的”認識和體會, 若化身成變項, 就是“潛在變項”。
在統計/數學上又是如何理解呢!? 據我所知,潛在變項是在顯性變項的數據模型中, 與“預期”的數據模型作對比分析(驗證性分析,Confirmatory Factor Analysis, CFA), 兩模型的差距(即誤差項)中, 盡量由潛在變項來解釋; 為了這樣的解釋, 有時預期模型及潛在變項需要作多次的修改, 以便達到較好的配適度(good of fitness).
在我的博士論文內, 為了作這個SEM, 使用了SPSS的AMOS軟件. AMOS有其優點, 就是可直接與SPSS連接, 這樣在建立和設定模型的變項就很方便, 而且它也是用“拼圖”的形式在砌這個預期模型, 所以較容易上手吧! 但是據知它的數據類型有限制呢~ 最近雖然畢業了, 但學習了一款近年在處理該問題時, 新興的軟件---Mplus. 它對數據類型限制上較寬鬆, 雖然要寫程式, 但不太困難吧…
它的程式語句中, 要項只有10句:
TITLE: a title for the analysis (not part of
the syntax)
DATA: (required)
information about the data set
VARIABLE: (required)
information about the variables in the data set
DEFINE: transform existing variables and
create new variables
ANALYSIS: technical details of the analysis
MODEL: describe the model to be estimated
OUTPUT: request additional output
SAVEDATA: save the analysis data, auxiliary
data, and results
PLOT: request graphical displays of observed
data and results
MONTECARLO: details of a simulation study
例如在這個模型中, 程序示範如下:
TITLE: Wheaton et al. Example 1: Full SEM
DATA: FILE IS " d: \精神错乱.dat";
VARIABLE:
NAMES ARE X1 X2 Y1 Y2 Y3 Y4;
USEVARIABLES ARE X1-X2 Y1-Y4;
ANALYSIS: TYPE = general;
MODEL:
F1 BY X1 X2;
F2 BY Y1 Y2;
F3 BY Y3 Y4;
F2 ON F1;
F3 ON F1 F2;
OUTPUT: standardized sampstat modindices (4)
;
如果您有SEM的知識, 又或使用AMOS的經驗, 其結果的解釋就不太困難了
參考資料:
1. http://whqlibdoc.who.int/publications/2008/9789241596176_eng.pdf
2. The Mplus
modelling framework
3. Mplus 6.0软件的介绍与应用