3.2 研究的效度和信度考量

效度

效度的重要性

效度与信度的关系

信度

效度

定义、概念、类别等等

BC1 编号9

效度（Validity）

定义
效度是衡量研究工具或方法是否能够准确测量其声称要测量的目标的标准。它反映研究的真实性和准确性，因此也被称为真确性。

核心含义

效度的本质是“不离题”，即研究和测量内容必须与研究目标高度相关。
一篇高效度的研究论文应保持逻辑清晰，所有内容紧密围绕研究主题、研究目的展开。

重要性
效度强调测量结果是否准确反映了研究目标或核心概念。如果测量内容与研究目标无关或存在偏差，即使信度高，也无法得出有效的研究结论。

例：

- 在教育研究中，如果一项测评旨在测试学生的阅读能力，却包含过多与计算能力相关的问题，就会导致效度低。

主要概念

与研究目标的相关性：测量内容是否与研究目标高度相关。
无偏性：测量结果是否能够真实反映研究对象或现象。

例：问卷效度
在调查问卷中，效度指的是问卷内容是否能够真实反映所调查的目标或内容。如果问卷的设计偏离目标，即使问卷的结果一致（信度高），也无法说明其结果是有效的（效度低）。

效度通常与信度相关，但它们是不同的概念。信度高并不意味着效度高。例如，一个测试可能结果一致（信度高），但测量的并非研究的目标变量（效度低）。

测量效度的方法 (以下例子为：调查研究）

J.W.弗伦奇和W.B.米歇贝根据测验目标把效度分为：
1.内容效度（Content Validity）

定义：指测验内容是否全面且恰当地反映了测量的目标或研究的范围。它关注的是测验题目与研究内容之间的相关性和覆盖程度。

核心问题：
测验是否全面涵盖被测量的知识领域或行为特征？
验证方法：

专家判断：邀请相关领域专家检查测验题目的覆盖面和符合性。

- 逻辑分析：对测验内容进行系统性分析，确保题目与测量目标紧密相关。
例：一份用于测试学生数学能力的测验应包括代数、几何、概率等领域的问题，而不能仅仅局限于代数。

2.构想效度（Construct Validity）

定义：指测验分数能够说明心理学理论上的某种结构或特质的程度，从心理学的理论观点对测验的结果加以解释和探讨。

核心问题：

测验是否准确反映心理学理论上的构念？

验证方法：

从某一构想的理论出发，导出各项关于心理功能或行为的基本假设，据以设计和编制测验，然后由过求因，以相关实验和因素分析等方法，审查测验结果是否符合心理学上的理论观点。

例：一项用于测量学生学习动机的问卷应能够区分内在动机与外在动机，并准确反映这两种构念。

3.效标关联效度（效度标准：效标）（Criterion-related Validity）

定义：指测验结果与效标之间的相关程度。效标是指测量目标的外部参考标准，通常是客观且可靠的指标。

核心问题：
测验结果是否能够准确预测或反映某个客观标准（效标）的表现？
分类：
- 同时效度（Concurrent Validity）：测验结果对当前表现的预测能力。
  - 例：招聘考试的分数和应聘者目前的工作表现是否一致。
- 预测效度（Predictive Validity）：测验结果对未来表现的预测能力。
  - 例：高考成绩是否能预测学生在大学的学术成绩。
验证方法：
- 收集测验分数和实际标准（效标）的数据，使用统计方法分析相关性。
适用于：
- 教育：考试成绩是否能反映学生学习水平或预测未来发展。
- 工作：能力测评能否筛选出未来表现优秀的员工。
- 职业：职业技能测试是否与岗位需求匹配。

类别

1.内在效度（Internal Validity） (所有研究都需要）

指研究中是否有足够的证据支持因果关系的存在，排除其他潜在的解释（外部因素）。
例：如果一个实验是研究新的教学方法对学生成绩的影响，但没有控制学生的原始能力水平，那成绩提升可能是因为学生本身优秀，而非教学方法的效果，内在效度就受到威胁。

2.外在效度（External Validity）(所有研究都需要，*除了行动研究）

指研究结果在不同环境或者样本中的泛化能力，也就是研究结果是否可以推广到更广泛的情境中。
例：如果一项教学研究只在少数顶尖学校进行，研究结果只在这些学校成立，但可能无法推广到普通学校或其他地区，外在效度就受到了限制。

内在效度&外在效度之间的联系

内在效度为优先，外在效度为目标
内在效度是研究设计的基本要求；是研究质量的根本保证；是外在效度的先决条件
研究需要保证内在效度，确保结果真实可靠为先，否则即使外在效度高，也没有实际意义。
在确保内在效度的基础上，再考虑如何让研究结果具有普遍意义，能推广到更广泛的群体或场景。

效度的重要性

确保结果的可信度：高效度的研究可以更好地支持科学推论和决策。
提高研究的应用性：如果效度低，研究结果的推广价值有限。
避免资源浪费：无效的测量可能导致误导性的结论，从而浪费时间和资源。

效度与信度的关系

效度是基础，信度是保障：只有信度高的测量工具才能为效度提供可靠的依据，但信度高不一定意味着效度高。
例：一把坏掉的尺子总是测量出“错误但一致的长度”，它的信度高，但效度低。

参考资料：

1.效度-MBA智库百科

2.名师工作室简报（47）讲座：学术论文中调查问卷的信度和效度检验及实例

信度

定义、概念、类别等等

BC2 编号9

*调查研究需要

信度（Reliability）效度（Validity）两者间的关系

效度是对测量的准确性的估计；信度是对测量的一致性的估计。
信度是效度的必要条件，但没有效度的测量，即使信度再高测量也算无效。

关系：信度高效度不一定高；信度低效度一定低；效度高信度高（有效的测量）

信度的定义

指测量的可靠性或一致性。

信度的概念

在相同的条件下，对客观事物重复测量，结果的一致性说明数据的可靠性。
结果一致性程度越高，该测量工具的信度越高。

信度的类别

稳定信度

是长期的信度。
在不同的时间做测量，可以得到同样的结果。
以重测方法来检视指标的稳定信度。

代表性信度

横跨各个群组的信度。
不同群体（年龄、性别），可得到相同的结果。

同等信度

利用多重指标测量同一构念。
常用折半法来做此信度分析。

检视信度的方式

重测信度

使用同一份问卷，对同一群受测者，在不同时间，前后测试两次。
若相关系数高，表示此测验信度高。
注意：两次测验时间要适当。相隔太短，受测者记忆犹新，通常分数会提高；相隔太长，心智成长影响，稳定系数会降低。

复本信度

复本：内容、难度相当的两份测验。
对同一受测者，第一次用A测验，第二次用B测验。
两次测验可同时实施，也可相隔一段时间。
不受记忆的影响。

分半信度

将同一量表中的测验题目折成两半（单数题，偶数题），要使两半的问题尽可能有一致性。
类似复本信度的方式，常用在不可重复进行调查的情况。
同一时间进行测验。
两半测验总分为分半信度系数。

Cronbach's a信度系数

用于评价问卷的内部一致性。（评价量表中各题项得分）
α系数取值在0到1之间，系数越高，信度越高，问卷的内部一致性越好。
低信度：a<0.3.5；中信度:0.35<a<0.70；高信度a>0.7。

评分者信度

用多位评判者，检视彼此间的意见是否一致。

参考资料：

Page updated

Report abuse