3.2.2 初步试验的设计

特征

调查问卷的初步试验（Pretest/Pilot Test）指的是在正式实施大规模调查之前，先对问卷进行小范围的试用，目的是检验问卷的设计是否合理，问题表述是否清晰明确，受访者是否能够正确理解问题，并识别潜在的问题或不足之处，从而对问卷进行必要的修订和优化。

初步试验是调查研究中不可忽略的重要环节，能有效提高正式调查的质量和可信度。

具体而言，调查问卷的初步试验具有以下几个关键特征：

规模小：
通常抽取较少数量的代表性受访者（如10至30人）进行测试。
目的明确：
旨在发现问卷中存在的问题，如题意模糊、措辞不当、逻辑混乱等。
修订依据：
根据初步试验获得的反馈和数据，调整问卷内容、措辞、结构或选项。
提高效度与信度：
通过初步试验确保问卷能够准确测量研究所关注的变量，并保证稳定性和一致性。

初步试验的结果可用于：

修改不清晰或歧义的题目；
调整问卷长度，确保受访者能集中精力完成；
检验调查实施的实际可行性；
提升正式调查的成功率和数据质量。

人数规定

调查问卷的初步试验人数通常没有严格统一的规定，但在实际研究中一般会根据总体人数的规模、问卷复杂程度、研究目标和可行性来确定试验人数。常用的参考原则如下：

小型总体（100人以下）：
建议抽取约5-10人进行初测。
中型总体（100-1000人左右）：
通常抽取约10-30人进行初测。
大型总体（1000人以上）：
一般建议抽取约30-50人进行初测，或根据资源情况适当增加。

实际操作中，有以下参考：

多数学术研究中普遍采用20-30人左右进行试测。
如果问卷较长或较复杂，可以适当增加试验人数，以更全面地发现问题。
若时间和资源有限，则至少确保10-20人参与试测，以获得有意义的反馈。

初步试验的关键并非严格的统计要求，而是要能够有效地检测出问卷存在的问题。因此，应根据具体研究条件灵活调整人数，而不是机械地遵循某个固定比例。

Cronbach’s α

Bujang et al. (2024)：针对问卷信度测试的样本量

检验问卷信度（如克朗巴赫 α、Kappa、一致性等）时，建议最低：
- Cronbach’s α：至少 24 人（建议PISMP学员至少实施这项）
- ICC（组内相关）：至少 22 人
- Kappa 检验：至少 15 人

Sample size determination for conducting a pilot study to assess reliability of a questionnaire

Mohamad Adam Bujang 1, Evi Diana Omar 2, Diana Hui Ping Foo 1, Yoon Khee Hon 3

Affiliations Expand

PMID: 38449496
PMCID: PMC10912549
DOI: 10.5395/rde.2024.49.e3

Abstract

This article is a narrative review that discusses the recommended sample size requirements to design a pilot study to assess the reliability of a questionnaire. A list of various sample size tables that are based on the kappa agreement test, intra-class correlation test and Cronbach's alpha test has been compiled together. For all calculations, type I error (alpha) was set at a maximum value of 0.05, and power was set at a minimum value of 80.0%. For the kappa agreement test, intra-class correlation test, and Cronbach's alpha test, the recommended minimum sample size requirement based on the ideal effect sizes shall be at least 15, 22, and 24 subjects respectively. By making allowances for a non-response rate of 20.0%, a minimum sample size of 30 respondents will be sufficient to assess the reliability of the questionnaire. The clear guideline of minimum sample size requirement for the pilot study to assess the reliability of a questionnaire is discussed and this will ease researchers in preparation for the pilot study. This study provides justification for a minimum requirement of a sample size of 30 respondents specifically to test the reliability of a questionnaire.

Keywords: Pilot study; Questionnaire; Reliability; Sample size.

Pilot Testing using SPSS

Cronbach's Alpha for Pilot Testing

SIMPLE STEP HOW TO RUN PILOT TEST USING SPSS

SPSS PILOT STUDY (RELIABILITY ANALYSIS) - CASE STUDY

KMO检验

SPSS PILOT STUDY (RELIABILITY ANALYSIS) - CASE STUDY

初步试验（pilot test）时通常不强制进行KMO检验，但若你的研究计划包含因子分析（如探索性因子分析，EFA），则建议初测阶段也可考虑初步进行KMO检验，以评估问卷的结构合理性。

具体来说：

🔹 初步试验是否进行KMO检验的原则：

如果正式调查阶段你计划使用因子分析（特别是探索性因子分析EFA），初步试验时建议：
- 初步做一次KMO检验；
- 检验Bartlett球形检验；
- 以判断问卷的题项设计和结构是否初步符合进行因子分析的要求。
如果你的调查问卷不涉及因子分析（例如纯描述性分析或基本相关分析），初步试验阶段一般不必做KMO检验。

🔹 初步试验阶段进行KMO检验的好处：

及早发现问题（如相关性不佳）；
根据初步分析结果，对题项作出必要调整；
提高正式调查时的数据质量和分析有效性。

🔹 初步试验阶段的KMO参考值：

初测阶段KMO值**≥0.6** 已属满意；
若初测阶段KMO值低于0.6，建议：
- 调整或删除相关性差的题目；
- 改进问卷结构后再次测试。

因此，是否初步进行KMO检验，主要取决于你的正式研究计划是否涉及因子分析。

初步试验：定义、概念、操作等等

BC1 编号11

用于：调查研究（问卷）、个案研究（访谈题目）

定义

对研究方法或工具的初步检验，旨在验证研究的设计是否合理，并减少正式研究中的潜在问题和偏差。

概念

小规模：初步试验规模较小，通常以比正式研究更少的样本量进行测试。它并非用于验证假设，而是用于评估研究设计和操作的可行性。

验证数据收集工具：对问卷、测量工具或实验设备进行初步验证，确保它们可以准确收集数据。测试内容是否易于理解、适合目标群体，以及是否存在歧义或文化不符的问题。

发现问题：帮助发现正式研究中可能出现的各种问题，例如样本获取困难、实验程序复杂或测量工具不精确等。通过提前解决问题，可以节省时间和成本，提高正式研究的成功率。

帮助适应：初步试验能够模拟正式研究的主要流程，确保研究者和研究团队熟悉研究步骤，避免正式研究中操作失误。

操作

一、调查研究

背景：研究者希望了解中学生对健康饮食的看法及其实际饮食习惯，为此设计了一份问卷。
设计问卷

包括：

基本信息：年龄、性别、年级等。

饮食习惯：一周吃几次快餐？每天是否吃水果？

态度问题：是否认为健康饮食重要？选择健康食品的动力来源是什么？

问题采用多项选择、量表评分（如1-5分）和开放式问题相结合的方式。

选择样本：在某中学随机选取10名学生作为初步试验的对象，尽量覆盖不同年级和性别。
试发问卷

线上：通过Google Form发放问卷。
线下：打印纸质问卷，提供15分钟填写时间。

观察和反馈：观察学生填写问卷时是否有困惑。
收集反馈：学生是否觉得某些问题难以理解？问卷是否太长？
分析初步数据

检查数据：回答是否完整？是否存在回答倾向（如所有问题均打中间分）？
初步分析：如选择“健康饮食重要”的学生占80%，但实际饮食习惯较差，说明需要更细分问题来探索原因。

调整问卷

优化模糊问题：如“你是否认为健康饮食重要？”调整为“你每天愿意花多少时间准备健康饮食？”
缩短问卷长度：删除重复或意义不大的问题。

二、实验研究

确定研究目标和范围

研究目标：

评估延长课间运动时间对学生健康状况（如体力、专注力等）的影响。
观察教师、学生和家长对政策的接受程度和反馈。
测试政策实施过程中可能面临的挑战，如时间安排和资源需求。

试点范围：

选择3至5所小学，每校随机选取2个班级参与（约100-200名学生）。
地区分布包括城市学校和乡区学校，以便评估政策在不同环境下的效果。

2. 制定试验设计和方案

实验组与对照组：

实验组：实施延长课间运动时间的新政策。
对照组：保持现行课间时间（10分钟）。

干预内容：

实验组学校将课间时间延长至20分钟，同时要求学生在课间进行指定的身体活动（如跳绳、跑步、球类活动）。
配备基本运动器材（如跳绳、球类）。

3.数据收集工具与方法

健康与专注力测量：

健康指标：体能测试（如短跑成绩、体力耐力），以及BMI指数测量。
专注力测试：在数学或语文课后进行5分钟短测验，评估注意力与记忆力表现。

问卷调查与访谈：

学生问卷：记录他们对新政策的感受、运动习惯的改变。
教师问卷：了解课堂管理是否受到影响。
家长问卷：收集对延长课间时间的态度，以及家庭时间安排是否受影响。

课堂观察：

记录学生在课间活动中的参与度、互动表现以及回到课堂后的状态。

4.试点试验实施

培训与启动：

为参与学校的教师和管理员进行政策说明和实施培训，包括如何组织课间活动。
分发问卷或调查工具。

为期4周的试验：

第1周：建立基线数据（如健康测试、专注力测试）。
第2-4周：实施延长课间政策，观察学生的变化。

阶段性检查：

每周收集学生和教师的反馈，调整活动安排（如活动类型、器材补充）。

5.数据分析与问题总结

分析内容：

比较实验组与对照组在健康测试、专注力测试上的表现差异。
总结教师和家长的反馈，发现对政策支持或反对的主要原因。
统计课堂纪律或管理方面是否受到影响。

常见问题可能包括：

学校是否有足够的场地支持延长课间活动？
是否有学生不愿参加运动？如果有，需要如何激励？
延长课间时间是否影响其他学科教学？

6.根据试点数据和反馈，提出改进方案，如：

改善活动内容：根据学生喜好调整运动形式。
调整课表：避免延长课间对主要学科教学产生冲突。
优化政策宣传：帮助家长和学校理解延长课间时间的意义。

7.扩大试验或正式实施

如果试点取得积极效果，可逐步扩大到更多学校进行二次试验。
最终根据所有数据与分析结果，优化政策内容后，正式推广至全国。

BC2 编号11

初步试验（Pilot Study）是研究设计中的一个重要环节，主要用于测试研究方案的可行性、发现潜在问题，并优化正式研究的设计。

一、初步试验概念（调查研究-问卷调查；个案研究-访谈题目）

1.可行性测试

-检查研究是否顺利进行，包括资源、事件、人力、研究环境等方面

2.工具检测

-确保问卷、访谈、测验等研究工具的有效性和可靠性

3.数据收集与分析

-试验数据收集流程是否顺畅，数据是否足够清晰、可测量，分析方法是否合适

4.研究对象的反应

-观察研究参与者对研究内容、问题形式、实验操作等的理解和接受度。

5.规模缩减性

-样本量通常为正式研究的10-30%（论文内要注明“10%-30%”来源/出处，谁说的）

二、初步试验的操作

设计阶段

-明确研究目标，确定哪些方面需要测试（如问卷的理解度、实验变量的设置等）

-确定初步试验的样本规模，通常比正式研究小，但要具有代表性以及进行分层抽样（确保性别、成绩等维度分布均衡）

-选择合适的研究方法（实验法、访谈法、观察法等）

实施阶段

-进行小规模的数据收集，记录研究过程中遇到的困难

-观察研究对象的反应，并与他们交流，以获得反馈

-记录所有可能影响研究结果的外部因素，如环境干扰、设备问题等

分析阶段

-评估数据质量，分析是否存在数据缺失、测量误差、统计偏倚等问题

-识别研究设计中的问题，例如题目是否过长、研究变量是否有效等

-根据分析结果调整研究设计，如修改问卷问题、优化实验程序、增加或减少样本数量等

三、初步试验的重要性

提高研究的可靠性和有效性

通过试验可以发现问题并修正，减少正式研究中的误差。

节省时间和成本

提前发现研究设计中的问题，避免在正式研究中因错误而浪费资源。

优化数据收集方法

确保所选的数据收集工具和方法能够获得高质量的数据。

四、教育领域特殊考量

伦理规范

-知情同意书的双版本设计（教师/家长）

-数据匿名化处理流程

-应急终止预案（如学生明显不适）

Page updated

Report abuse

3.2.2 初步试验的设计

特征

人数规定

Cronbach’s α

KMO检验

初步试验： 定义、概念、操作等等

初步试验：定义、概念、操作等等