第9组:
定义:直接反映现象规模或总量的原始数值,通常为计数或总和。(指直接计算得到的实际数值,用于表示总体或样本中某个类别的具体数量)
需要知道具体数量时,比如统计库存数量、计算总销售额。
例如,一个班级中有30名学生,其中男生18人,女生12人,18和12就是绝对数。
绝对数(Absolute Number)的使用条件
适用情况
适用于描述数据的总量或个体数量,不涉及比较或比例关系。
适用于统计某一群体中某个类别的实际数量,如:
某班级的男生人数(18人)
一年内销售的商品数量(200件)
某地区的出生人数(5000人)
使用条件
✅ 数据类型: 适用于计数数据(Count Data),如频数(Frequency)。适用于可以直接数出来的东西,比如班级里有多少男生、今天学校卖出了多少份午餐、操场上有多少辆自行车等。这些数据是具体的、可以数清楚的。
✅ 样本规模: 适用于数据量较小时,直接使用绝对数能清晰呈现信息。 如果数据量不是特别大,比如一个班级有 40 个学生,我们可以直接说:“班上有 18 个男生,22 个女生。” 这样讲很清楚。
✅ 数据独立性: 适用于单独考察某一类数据,而不涉及不同类别之间的比较。适用于单独统计某一个类别,比如“这个篮球队有 12 个人”或者“今天有 25 人迟到”。这里不需要和其他类别比较,比如不需要说“迟到的男生比女生多”或者“这个班的男生比例是多少”,只是单纯地统计一个数字。
局限性
⚠ 难以比较不同群体的数据:例如,两个班级的学生数量不同,仅比较“男生人数”可能会导致误解。
⚠ 不能直接衡量相对关系:如,一个企业招聘了 50 人,但不知道这是总申请人数的多少比例,无法得出结论。
定义:通过绝对数之间的对比生成的衍生指标,用于揭示比例、比率或变化关系。
相对数通常以比例(proportion)、百分比(percentage)或比率(ratio)的形式呈现,它反映了某一类别相对于整体的关系。
需要比较不同规模、不同单位的数据时。
相对数= ───比较数值(比数)/基础数值(基数)
📌 相对数就是用两个相关的数据进行比较,来说明它们之间的关系。
例子:
比率(Ratio):两个数的直接对比。
→ 男生和女生的比例是 2:1(比如班级有20个男生,10个女生)。
比例(Proportion):部分占整体的百分比。
→ 全班50人,女生占 40%(20人);男生占60%(30人)
百分比变化(Percentage):增长或下降的速度。
→ 考试成绩提升:去年你的语文考试考了80分,今年考了90分。
→ 相对数 = 90 ÷ 80 = 1.125(表示今年的成绩是去年的1.125倍,提升了12.5%)。
相对数(Relative Number)的使用条件
适用情况
适用于比较数据之间的相对关系,如:
比例(Proportion): 班级中男生占全班的 60%。
百分比(Percentage): 40% 的顾客选择了某品牌产品。
比率(Ratio): 每 1000 人中有 20 人使用某项服务。
使用条件
✅ 数据类型: 适用于分类数据(Categorical Data) 或连续数据的比例转换。适用于可以分成不同类别的数据,比如“男生和女生”“喜欢篮球、足球、羽毛球的人数”或者“不同颜色的汽车数量”。有时候,我们还可以把一些连续的数据转换成比例,比如“考试分数超过 80 分的人占全班的多少?”
✅ 比较需求: 适用于不同类别或群体之间的比较,如不同年份的增长率、男女生比例等。适用于比较不同的群体或时间变化,比如“今年和去年学校的学生人数增长了多少?”或者“班上男生和女生的人数比例是多少?” 这样可以帮助我们更好地看出变化或差异。
✅ 数据规模影响: 适用于大规模数据分析,能消除样本大小不同的影响。适用于数据量很大时,因为如果直接比较人数,可能会不太公平。例如,A 校有 3000 名学生,B 校有 500 名学生,A 校有 600 人参加某项活动,而 B 校有 200 人参加。虽然 A 校人数多,但如果用比例来看:A 校的参与率是 600/3000=20%,B 校是 200/500=40%,会发现 B 校的参与度更高。
局限性
⚠ 可能丢失实际数量信息:例如,某公司 2023 年销售增长率 50%,但如果基数很小(比如 10 件增长到 15 件),增长率虽高,但实际影响有限。
⚠ 需要基准参考:相对数通常需要对比基准,如“去年相比增长 20%”或“在 1000 人中有 30 人”。
第10组:
在一组数据中所有数的(sum of the terms)和除以这组数据的个数(number of the terms)所得的商(除)。
反映一组数据集中趋势的统计量。
使用平均数的条件:
1. 数据类型:必须是数值型数据
✅ 平均数适用于数值型(定量)数据,如考试分数、身高、体重、收入等。
❌ 不能用于类别数据(定性数据),如性别(男/女)、颜色(红/蓝/绿)、喜欢或不喜欢等。
2. 数据分布:适用于对称分布的数据
✅ 当数据呈对称分布(如正态分布)时,平均数是一个合适的代表值。
示例 1(适用): 如果大多数学生的考试分数在 75-85 之间,平均数可以很好地代表整体水平。
❌ 如果数据偏斜或包含极端值,平均数可能会失真。
示例 2(不适用): 如果有一个学生考了 100 分,而另一个考了 10 分,平均数可能无法准确反映数据的真实情况。
3. 测量尺度:至少是区间尺度或比率尺度
✅ 平均数适用于区间尺度(Interval Scale)和比率尺度(Ratio Scale)。
区间尺度:如温度(摄氏度、华氏度)。
比率尺度:如身高、体重、收入、考试分数。
❌ 平均数不适用于顺序数据(Ordinal Data)。
示例(不适用): 进行问卷调查时,选项为“非常满意(5)、满意(4)、一般(3)、不满意(2)、非常不满意(1)”,计算平均数可能没有实际意义。
4. 样本数量:样本量越大,平均数越稳定
✅ 当样本量较大时,平均数更可靠,能够减少随机误差的影响。
❌ 如果样本量太小(如 n < 10),少数几个值可能会极大地影响平均数,使其失真。
例子:学生课堂参与度调查(Mean)
SPSS操作步骤
输入数据
在 Variable View 设置变量:
变量名:Participation(课堂参与度
类型:Numeric
标签(Label):课堂参与评分
取值范围(Values):1-5
计算平均数
点击 Analyze(分析) → Descriptive Statistics(描述统计) → Descriptives(描述)
选择变量 Participation,点击 右箭头 (>) 选入分析
点击 Options(选项),勾选 Mean(均值)
点击 OK 运行分析
查看结果。
结论:
Mean(均值)= 4.00,表示该班级学生的平均课堂参与度为 4 分。
学生整体上参与课堂互动的积极性较高,教师可以继续维持或优化教学方法。
总体(population),又称为全体或者整体,是指由多个具有某种共同性质的事物的集合。
样本(sample),是指全体中随机抽取的个体。通过对样本的调查,可以大概的了解总体的情况。从总体抽样的时候,需要抽取一定数量的样本,如果样本太少,则不足以反映总体的情况。
表示数据点相对于均值(平均数)的分布情况。
标准差越大,表明数据的波动越大,分布越分散;标准差越小,表明数据的波动越小,分布越集中。
对于多组数据,在同质、同单位、均数相等或近似相等的情况下,可以比较多组数据的离散程度(三个条件缺一不可)
总体的标准差(population standard deviation)
总体数据计算得到的标准差,反映了总体数据的真实离散程度。
在实际应用中,往往很难获取整个总体的数据,因此总体标准差通常只在理论研究中使用。
σ表示总体标准差
X 表示总体中的每个数据值
μ 表示总体均值
N 表示总体容量
例子:教师工作满意度评分
SPSS操作步骤:
输入数据
进入 Variable View(变量视图)。
在第一列创建变量 Satisfaction_Score(满意度评分)。
切换到 Data View(数据视图),将 200 名教师的满意度评分输入数据表中。
计算总体标准差
点击 Analyze(分析)→ Descriptive Statistics(描述统计) → Descriptives(描述)。
在弹出的窗口中,选择变量 Satisfaction_Score,点击 箭头将其移动到 "Variable(s)"(变量)框内。
点击 Options(选项) 按钮,勾选 Standard Deviation(标准差),然后点击 Continue(继续)。
点击 OK(确定),SPSS 将生成统计结果。
查看结果。
结果说明:
均值(Mean)= 7.2,表示教师的平均满意度评分为 7.2 分,整体较为满意。
标准差(Population Standard Deviation)= 1.8,表示评分的分布情况:
标准差较小(<1.5):教师的评分比较一致,说明大多数教师对工作感到满意。
标准差较大(>2.0):教师的评分差异较大,说明部分教师满意度较高,而部分教师不满意,学校需要进一步调查问题。
当前标准差 1.8,说明教师的满意度评分有一定差异,可能存在工作体验不均的问题,需要关注低分教师的需求。
2. 样本的标准差(sample standard deviation)
对样本数据计算得到的标准差。
由于样本只是总体的一部分,因此样本标准差是对总体标准差的估计。
在计算样本标准差时,为了使估计更加准确,分母通常使用 n - 1 而不是 n。
s 表示样本标准差
X 表示样本中的每个数据值
ˉX 表示样本均值
n 表示样本容量
分母为 n - 1 是为了对样本标准差进行无偏估计 (用样本资料获得的标准差往往比总体标准差小)