定义、概念、类别等等
BC1 编号1
*适用于调查研究*
因子分析是一种统计方法,用于识别观测变量之间的潜在关系,将多个观测变量归纳为较少数量的因子。简单来说,因子分析用来找出多个问题或数据之间隐藏的联系,把它们归纳成少数几个“共同点”(因子)。这些因子可以帮助我们更简单地理解数据背后的结构或特征。
概念
因子分析常用于对不能直接观测的变量(也称隐变量), 如智力、音乐能力、爱国主义、消费者态度等等, 进行推断。
隐变量(latent variable)是指不能直接观测到的变量,但是可以从一组可观测变量的相关关系中导出。
隐变量是我们看不到的,但它会影响我们能观察到的数据。因为这些变量(问题或数据点)都受同一个因子的影响,所以它们之间会表现出很强的相关性。
例:学生成绩(可观测变量)和学习能力(隐变量)
假设有一组学生的考试成绩,包括数学、物理和化学三门科目。这些成绩之间往往会有较高的相关性(例如,受学习能力影响,数学好的人物理成绩也可能较好)。
类别
探索性因子分析(Exploratory FA)
在没有预先假设的情况下探索数据的因子结构。
目的:降维 (将原始数据中许多变量的复杂关系,归纳为少数几个核心因子,从而简化数据的结构 )
验证性因子分析(Confirmatory FA)
目的:CFA不是从数据中探索因子,而是验证一个基于理论或假设的模型是否与实际数据吻合。
“参数限制”:研究者可以对模型中的参数设定一些限制(如固定因子负载量、关联关系等),以便更具体地测试假设。
探索性分析例子
验证性分析例子
BC2 编号1
核心思想
因子分析(Factor Analysis) 是一种统计方法
识别出影响观测变量的公共因子,实现降维(减少变量数量)
将多个相关变量归纳为少数几个因子(简化数据),共同解释原始数据的方差(数据之间的隐藏关系),简化数据结构
因子分析需要较大的样本量,一般建议至少有100个样本,或者每个问卷题目对应10个样本。
概念
变量:问卷中的题目(如“我喜欢阅读课外书”)。
因子:变量背后共有的潜在特性(如“阅读兴趣”或“家庭支持”)。
因子载荷(Factor Loading):
表示某个变量对某个因子的贡献程度。
值范围为 -1 到 1
接近 1 或 -1:变量强烈反映该因子。
接近 0:变量与该因子无关。
公因子与特异因子:
公因子:所有变量共享的潜在特质(通过因子分析提取)。
特异因子:变量的独特部分,不能被因子解释。
例:变量“我喜欢阅读故事书”可能是因为“故事书类型”,可能与其整体对阅读的兴趣相关。
类别
探索性因子分析 (Exploratory Factor Analysis)
帮助理解变量之间的关联,归类变量
不依赖先验假设,不需要事先假定变量属于哪些因子
可假设因子间相互独立,也可允许因子间相关
例:问卷题目--
Q1: 我喜欢阅读故事书。
Q2: 我每天都会阅读课外书。
Q3: 家长会陪我一起阅读。
Q4: 家里有很多书可以看。
通过分析解读为:
因子1:阅读兴趣(Q1 和 Q2)
因子2:家庭支持(Q3 和 Q4)
验证性因子分析 (Confirmatory Factor Analysis)
检验数据是否符合一个预先假定的因子结构模型
基于理论或先验知识,验证数据是否符合预设模型
包含显变量(问卷题目)和潜变量(因子),每个显变量通过因子载荷反映潜变量,同时包含误差项
例:验证“阅读兴趣”和“家庭支持”模型(先有假设,再制定相对应的题目,验证假设)
因子1(阅读兴趣):由 Q1 和 Q2 反映。
因子2(家庭支持):由 Q3 和 Q4 反映。
概念、操作、范例等等
BC1 编号4
概念:KMO检验是Kaiser, Meyer和Olkin 提出的抽样适合性检验( Measure of Sampling Adequacy)。该检验是对原始变量之间的简相关系数和偏相关系数的相对大小进行检验。
KMO 检验(Kaiser-Meyer-Olkin Test)是因子分析(Factor Analysis)中的一个关键指标,用于评估数据适合进行因子分析的程度。
它主要检查变量之间的相关性和共享方差是否足够高。
作用
验证因子分析的可行性:KMO 检验值越高,说明数据更适合因子分析。
减少多余变量:如果 KMO 值较低,说明某些变量可能与其他变量相关性低,需要剔除或修改问卷设计。
操作步骤(假设你有一份问卷,希望用因子分析验证它的结构。)
数据准备:收集问卷数据,确保数据完整无误。
计算 KMO 值:使用统计软件(如 SPSS、Python 或 R)对问卷数据进行 KMO 检验。
解释 KMO 值:
如果 KMO 值高于 0.70,可以继续因子分析。
如果较低,则需检查变量设计(例如,删除不相关变量,合并部分变量)。
范例
场景:假设有 10 道问卷题,目的是测量学生的学习动机,使用 KMO 检验判断是否适合因子分析。
SPSS 操作步骤:
将问卷数据导入 SPSS。
点击 Analyze > Dimension Reduction > Factor。
在对话框中选择所有问卷变量,点击 Descriptive > KMO and Bartlett's Test,运行分析。
输出解释:
假如 KMO = 0.84,则说明问卷数据适合因子分析。
如果 KMO < 0.70,需重新审视问卷设计(可能需要删除某些题目)。
*注意事项
样本量要求:因子分析一般要求样本量是变量数量的 5~10 倍,样本不足可能导致 KMO 值偏低。
变量选择:剔除相关性低的变量(如相关系数小于 0.3),可提升 KMO 值。
通过 KMO 检验,可以确保问卷设计和数据分析的科学性,为研究结果的效度和信度打下坚实基础。
KMO值(度量标准表)
BC2 编号4
含义:KMO 检验(Kaiser-Meyer-Olkin 检验)是一种判断数据是否适合做因子分析的方法。简单来说,它会告诉你问卷中各个问题之间的关联程度够不够高,如果关联性不够强,做因子分析的结果就不可靠。
KMO 值:
KMO 的值介于 0 到 1 之间,数值越大,表示问题之间的关系越密切,越适合做因子分析。
0.8 ~ 1.0:非常适合
0.7 ~ 0.8:适合
0.6 ~ 0.7:勉强可以
< 0.6:不适合,需要重新设计问卷或修改问题
例如: 如果一份问卷的 KMO 值是 0.85,说明问题之间的关联性很高,可以放心地做因子分析;但如果 KMO 值只有 0.5,那就要考虑问题之间可能关联不大,不适合用因子分析来找出背后的主题。
KMO 检验的作用:
判断数据适用性:帮你决定这份问卷的数据适不适合做因子分析。
提高分析准确性:如果 KMO 值低,做出来的因子结果可能没什么意义。
计算 KMO 值的步骤(使用SPSS):
步骤一:准备数据
输入数据:打开 SPSS,并输入问卷数据,每一列代表一个问题,每一行代表一个受访者的答案。
检查数据:确保数据完整且没有缺失值,否则会影响 KMO 检验结果。
步骤二:打开因子分析功能
点击菜单栏上的 Analyze(分析) → Dimension Reduction(降维) → Factor(因子)。
在弹出的窗口中:
Variables(变量):把所有要分析的问题都拖到右边的框里。
确保每个问题都是数值类型(比如 1 到 5 的打分),否则 SPSS 无法计算。
步骤三:设置 KMO 检验
点击右边的 Descriptives(描述) 按钮。
在弹出的窗口中,勾选 KMO and Bartlett's test of sphericity(KMO 和 Bartlett 球形检验),然后点击 Continue(继续)。
返回主界面后,点击 OK(确定) 开始计算。
步骤四:查看 KMO 检验结果
SPSS 会生成一个输出报告,找到 KMO and Bartlett's Test(KMO 和 Bartlett 检验) 的表格,里面会有:
KMO Measure of Sampling Adequacy(KMO 取样适切性):显示 KMO 值。
Bartlett's Test of Sphericity(Bartlett 球形检验):显示卡方值和显著性水平(p 值)。
如何解读:
KMO 值:根据之前的标准判断问卷是否适合做因子分析。
- 例如:KMO = 0.85,表示非常适合;KMO = 0.5,表示不适合。
Bartlett's Test:看 Sig.(显著性) 的 p 值,如果 p < 0.05,表示问题之间有显著相关,可以继续做因子分析。
概念、操作、范例等等
BC2 编号16
Bartlett 检验是一种统计检验方法,用于检验多个样本的方差是否相等(即检验方差齐性,Homogeneity of Variance)。该检验通常用于分析方差齐性假设是否成立,这是许多统计分析(如方差分析 ANOVA)的重要前提条件。
假设
零假设(H0H_0H0):所有组的方差相等(方差齐性)。
备择假设(H1H_1H1):至少有一个组的方差不同(方差不齐性)。
Bartlett 检验对数据的正态性较敏感,因此在使用该检验前,建议先检验数据是否符合正态分布(如使用 Shapiro-Wilk 或 Kolmogorov-Smirnov 检验)。
计算公式
Bartlett 统计量 BBB 计算如下:
统计量 BBB 服从近似的 卡方分布(χ2\chi^2χ2 分布),自由度为 k−1k - 1k−1。若 BBB 对应的 p 值小于显著性水平(如 0.05),则拒绝零假设,说明方差不齐。
操作步骤
收集数据:准备多个样本数据,通常有多个组别,每组至少包含 2 个样本。
检验正态性:使用 Shapiro-Wilk 或 Kolmogorov-Smirnov 检验数据是否符合正态分布。
计算方差:计算每组的样本方差 Si2S_i^2Si2 和合并方差 S2S^2S2。
计算 Bartlett 统计量 BBB 并查找对应的 p 值。(可以用计算机软件,如 SPSS、Excel、Python来做,或者用 Bartlett 检验的统计公式计算。 )
判断结果:
若 p 值 > 0.05,则接受 H0H_0H0,说明各组方差相等。
若 p 值 ≤ 0.05,则拒绝 H0H_0H0,说明方差不齐。
范例题目
不同教学方法对考试成绩的影响
一所学校尝试 3 种不同的教学方法(传统课堂、线上教学、混合式教学),并在期末考试后随机抽取 30 名学生,记录他们的考试成绩。研究者想知道不同教学方法的考试成绩方差是否一致。
考试成绩的标准差如下(假设数据服从正态分布):
传统课堂:标准差 6
线上教学:标准差 5
混合式教学:标准差 8
使用 Bartlett 检验进行分析,并说明方差是否齐性。
经过计算,得到以下结果:
Bartlett 检验统计量 = 4.89
p 值 = 0.086
结果解释:
p = 0.086 (大于 0.05) → 方差相等 ✅
说明这 3 组数据的方差没有显著差异,我们可以放心使用 方差分析(ANOVA) 来比较不同教学方法的平均成绩。