定义、目的、操作方法等等……
BC1 编号7:定义、例子和操作方法
抽样的定义(仅涉及调查研究)
指从目标总体(Population,或称为母群)中抽取一部分个体作为样本(Sample),通过观察样本的某一或某些属性,依据所获得的数据对总体的数量特征得出具有一定可靠性的估计判断,从而达到对总体的认识。
基本概念是要增加随机性 (randomness),尽量减低个人偏见 (bias) 或盲点导致的偏差。
抽样方法主要分两类:机率 (probabilistic) 和非机率 (non-probabilistic)
机率抽样法 (probabilistic sampling methods)
简易随机抽样 (simple random sampling):
从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此之间无一定的关联性和排斥性。
是其他各种抽样形式的基础。通常只在总体单位之间差异程度较小和数目较少时,才采用这种方法。
2. 系统抽样 (systematic sampling)
将总体各单位按一定标志或次序排列成为图形或一览表式(通常所说的排队),按相等的距离或间隔抽取样本单位。
特点:抽出的单位在总体中是均匀分布的,而且抽取的样本可少于纯随机抽样。
既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。
实际工作中应用较多,目前中国城乡居民收支等调查,都是采用这种方式。
假设我们想要了解某市今年高一学生的数学成绩情况,而该市今年有15000名高一学生参加了数学考试。为了研究这些学生的数学成绩,我们计划从中抽取一个容量为150的样本。
我们将这15000名学生的数学成绩按照某种顺序(例如按学生编号或考试顺序)进行排列。这是系统抽样的基础,确保每个个体在抽样过程中都有平等的机会被选中。
我们随机确定一个起始点,例如选择第5名学生作为起始样本。这是为了确保抽样的随机性,避免系统性偏差。
我们确定抽样的间隔。由于总体容量是15000,而样本容量是150,所以抽样间隔为15000除以150,即100。这意味着每隔100名学生,我们就抽取一个样本。
因此,从第5名学生开始,我们每隔100名学生抽取一个样本,直到抽取到第150名学生为止。这样,我们就得到了一个包含150个样本的样本集。通过这个样本集,我们可以对某市今年高一学生的数学成绩情况进行推断和分析。由于系统抽样具有代表性,这些样本的成绩能够较好地反映整个总体的情况。
3. 分层抽样 (stratified sampling)
将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。
特点:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。
该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。
例子:要研究某市居民的出行方式,总体即为该市的所有居民。不同年龄段、职业、收入水平的居民在出行方式上可能存在差异,可根据特征分层。比如,按照年龄段划分为儿童、青少年、成年人、老年人等层;或者按照职业划分为学生、上班族、退休人员等层;还可以按照收入水平划分为低收入、中等收入、高收入等层。
4.类聚抽样 (cluster sampling)
从总体中成群成组地抽取调查单位,而不是一个一个地抽取调查样本。
特点:调查单位比较集中,调查工作的组织和进行比较方便。但调查单位在总体中的分布不均匀,准确性要差些。
在群间差异性不大或者不适宜单个地抽选调查样本的情况下,可采用这种方式。
5. 多重类聚抽样 (multi-stage cluster sampling)
将调查分成两个或两个以上的阶段进行抽样。第一阶段先将总体按照一定的规范分成若干抽样单位,称之为一级抽样单位(或称初级抽样单位),再把抽中的一级抽样单位分成若干更小的二级抽样单位,从抽中的二级抽样单位再分三级抽样单位等等,这样就形成一个多阶段抽样过程。
特点:在对超大而又复杂总体调查的抽样中实施和管理更加方便,且不需要对每级抽样单位编制完全的抽样框。
6.双重抽样 (double sampling)
先抽取一个容量比较大的初始样本,用初始样本估计总体的某些参数或某些必要的信息作为分层的比例或再次抽样的标志,然后将抽出的初始大样本作为"总体",从中抽取容量合适的样本进行比较详细的调查。
特点:适合用于对总体信息了解比较少的调查。
非机率抽样法 (non-probabilistic sampling methods):
- 不是基于概率判断,而凭人们的主观判断或根据便利性原则来抽取样本。总体中每个个体被抽取的可能性难以用概率来计算,或者每一种样本组合被抽取的概率事先无法确定和计算。
便利抽样 (convenience sampling)
依据方便和经济的原则,抽选最容易接触或联络的单位作样本。
如就有关香港人消费意欲的调查访问街上途人,或就香港中学生对校规的看法访问 校内同学。
不费时,但所得之样本会有偏差,固不适宜把数据过份概括至更大的母群。
配额抽样 (quota sampling)
和分层抽样有点相似。探究员会根据她对母群属性的认识定下一些类分指标(如性别),然后按这些变值定下样本配额(如须访问多少男生和女生)。
不同的是,分层抽样属机率抽样的一种,本质上采用随机原则;配额抽样则依靠探究员有限的认知和主观的判断去确立配额,属非机率的抽样方法。
滚雪球抽样 (snowball sampling)
当母群中 的表列名单层并不明确的时候,我们须首先接触具有相关属性的人,然后通过他们的网络,滚雪球般一个介绍一个的接触更多样本,直至认为资料已足够为止。
例 如,我们无法确认那些年青人曾经服食精神科药物。然而,我们可先接触少数有此经验的年青人,然后通过她们介绍网络中的其他个案,帮助我们滚雪球般慢慢累积 所需的样本。
立意抽样/判断抽样 (purposeful sampling)
根据探究员对母群的认识和判断去抽选他认为最具代表性的样本。
抽样过程
BC1 编号8:概念、目的、操作方法和基本过程
1. 抽样的概念定义(适用于调查研究)
抽样是从目标总体中抽取一部分个体作为样本,通过观察样本的某些属性,依据所获得的数据对总体的数量特征进行估计和判断,从而达到对总体的认识。
2. 抽样的目的
抽样的主要目的是在资源有限的情况下,通过研究样本来推断总体的特征。具体而言,抽样的目的包括:
提高研究的可行性:由于对整个总体进行全面调查通常耗时耗力,抽样可以降低研究成本和时间。
增强研究的代表性:通过科学的抽样方法,确保样本能够代表总体,从而使研究结果更具普遍性。
确保数据的可推广性:通过对样本的分析,推断总体的特征,使研究结论具有更广泛的适用性。
抽样的方法主要分为概率抽样(Probability Sampling)和非概率抽样(Non-Probability Sampling)。
概率抽样是指在调查总体样本中的每个单位都具有同等可能性被抽中的机会。常见的概率抽样方法包括:
简单随机抽样(Simple Random Sampling):从总体中随机抽取样本,使每个可能的样本被抽中的概率相等。
系统抽样(Systematic Sampling):将总体中的所有单位按一定顺序排列,随机抽取一个单位作为初始单位,然后按规定的间隔抽取后续样本单位。
分层抽样(Stratified Sampling):将总体按某种特征分成不同的层,然后从每一层中随机抽取样本。
整群抽样(Cluster Sampling):将总体分成若干群组,随机抽取部分群组作为样本进行调查。
非概率抽样是指样本的选择不完全依赖于随机原则,常见的方法包括:
便利抽样(Convenience Sampling):选择最容易获得的个体作为样本。
判断抽样(Judgmental Sampling):根据研究者的判断选择具有代表性的个体作为样本。
配额抽样(Quota Sampling):根据某些特征将总体分组,然后按预定的配额从各组中选择样本。
滚雪球抽样(Snowball Sampling):通过被调查者介绍其他符合条件的调查对象,逐步扩大样本范围。
抽样过程主要包括以下几个阶段:
定义总体(母体):明确调查的全部对象及其范围。
确定抽样框:抽样框是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。
选择抽样方法:根据研究目的和总体特征,选择适当的抽样方法。
确定样本数量:根据研究要求和资源限制,确定抽样所需的样本数量。
实施抽样计划:按照选定的抽样方法和步骤,实际抽取样本。
数据收集与分析:对抽取的样本进行数据收集,并进行统计分析。
回顾抽样过程:评估抽样过程的有效性和可靠性,必要时进行调整。
简单随机抽样(Simple Random Sampling)
系统抽样(Systematic Sampling)
分层抽样(Stratified Sampling)
BC2 编号7
抽样框架图:
研究总体:研究的目标对象,群体或范围,比如“马来西亚华文小学学生”。
抽样框架:可获取的具体数据例如“华文小学学生在马来西亚不同州属的名单”。
抽样方法:根据研究的对象选择抽样的方法,例如分层抽样,随机抽样等。
样本筛选过程:说明研究时选择的研究对象,比如需要包括在内的研究对象(7-12岁的学生)和进入排除名单的研究对象(学前教育班的学生)。
最终样本:表达在研究的最后被采用的样本数量,例如最终抽取1500位学生作为本次研究的对象或参与者。
作用:
展示抽样的过程:透过图示直观地让研究者了解整个筛选样本的过程。
保证样本的代表性:保证研究样本的可信度。
帮助研究者保证数据的准确性从而提升研究的可靠性。
读者能了解样本的出处或来源,选择样本的过程。
BC2 编号8
抽样框架图:
研究总体
研究的目标群体,如“全国小学五年级学生”或“马来西亚华文小学教师”。
抽样框架
具体可获取的调查名单或数据库,例如“某州的所有华文小学教师名单”。
抽样方法
指定的抽样方式,如随机抽样、分层抽样等。
样本筛选过程
说明如何选择研究对象,例如:
包含标准:仅限于具有 5 年以上教学经验的教师。
排除标准:剔除正在休假的教师。
最终样本
说明最终纳入研究的样本数量及其代表性,例如“最终抽取 300 名教师参与调查”。
作用:
直观呈现抽样过程。
增强研究的可信度。
帮助读者快速掌握抽样方法。