第1组:
t 检验是一种统计方法,用来比较两个平均数,判断它们之间的差异是否显著,还是只是偶然的波动。
简单来说,T检验就像是一个判断“区别”是不是真的的工具,不再只靠“感觉”,而是用数学来得出结论!
举个例子 🎯
想知道吃营养早餐是否真的能提高数学成绩,于是:
组 1:吃营养早餐的学生,平均成绩是 85 分
组 2:不吃营养早餐的学生,平均成绩是 82 分
但这个 3 分的差距是真的有意义,还是只是运气问题?t 检验就能帮忙判断!
t值 = 差异大小 ÷ 波动程度
t值越大 → 差异越可能是真实的
t值越小 → 差异越可能是运气
如何得到t值?
收集数据:比如A班30人成绩,B班28人成绩。
按公式计算(软件帮你算):
输入两组的平均值、标准差、样本量 → 自动输出t值。
查表或软件直接给结果:
比如t=2.5,p=0.015 → 差异显著。
有了t值,我们会得到一个叫P值的东西(根据t值大小,得到一个概率叫p值)
p<0.05 → 差异显著(拒绝原假设)。
p≥0.05 → 差异不显著(暂时接受原假设)
例子:
假设你选取两组学生进行测试,第一组吃营养早餐,第二组不吃。测试结束后,你发现吃营养早餐的学生数学平均成绩是 85 分,而不吃早餐的学生平均成绩是 82 分。
设定原假设
原假设(正常情况):吃营养早餐不会影响数学成绩(两组平均成绩一样)。
计算 p 值
如果数学成绩和早餐无关,吃早餐组的平均分高出 3 分的概率是多少?(p 值计算)
如果 p 值很小(比如 < 5%),你会怀疑早餐真的有帮助(拒绝原假设)。
如果 p 值很大(比如 30%),你会觉得这只是巧合(接受原假设)。
T检验的类型
1. 独立样本T检验
独立样本T检验比较两组选项的差异,比如男性和女性。相对来讲,独立样本T检验在实验比较时使用频率更高,尤其是生物、医学相关领域。针对问卷研究。
仅用于分析两组数据,比如性别,高分组低分组,实验组对照组等。如超过两组比较则使用方差分析
用于分析定类数据(X)与定量数据(Y)之间的差异情况。如果X、Y均为定类数据,则使用卡方分析
2. 配对样本T检验
独立样本T检验和配对样本T检验功能上都是比较两个组别之间的差异,但有实质性区别。如果是比较不同性别,婚姻状况(已婚和未婚)样本对某变量的差异时,应该使用独立样本T检验。如果比较组别之间有配对关系时,只能使用配对样本T检验,配对关系是指类似实验组和对照组的这类关系。另外独立样本T检验两组样本个数可以不相等,而配对样本T检验的两组样本量需要完全相等。
3. 单样本T检验
比如问卷某题项选项表示为1分代表非常不满意,2分代表比较不满意,3分代表一般,4分代表比较满意,5分代表非常满意,当想分析样本对此题项的态度是否有明显的倾向,比如明显高于3分或者明显低于3分时,即可以使用单样本T检验。单样本T检验是比较某个题项的平均得分是否与某数字(例子是与3进行对比)有着明显的差异,如果呈现出显著性差异,即说明明显该题项平均打分明显不等于3分。此分析方法在问卷研究中较少使用,平均得分是否明显不为3分可以很直观的看出,而不需要单独进行检验分析。
什么时候用t检,什么时候用方差分析(ANOVA)?
方差和T检验的区别在于,对于T检验的自变量X来讲,只能为2个类别比如男和女。如果X为3个类别比如本科以下,本科,本科以上;此时只能使用方差分析。在方法选择上,问卷研究通常会使用方差分析,但某些专业,比如心理学、教育学或者师范类专业等涉及到实验研究时,更多会使用T检验进行分析,另外方差分析与T检验还有较多差异,在某些分析中只能使用其中一种。
T检验的前提条件🔥
独立T检验(也称T检验),要求因变量需要符合正态分布性,如果不满足,此时可考虑使用非参数检验,具体来讲应该是MannWhitney检验进行研究。
单样本T检验,其默认前提条件是数据需要符合正态分布性,如果不满足,此时可考虑使用单样本Wilcoxon检验进行研究。
配对样本T检验,其默认前提条件是差值数据需要符合正态分布性,如果不满足,此时可考虑使用配对Wilcoxon检验进行研究。
资料来源:
第2组:
ANOVA的关键点:
✅ 适用于比较三组或更多组数据的平均值。
✅ 可以判断是否有差异,但不能告诉你哪一组之间有差异(需要做事后检验Post Hoc Test,例:LSD 或 Tukey 检验)。
✅ 数据需要满足:
呈正态分布(大致是钟形曲线)
各组之间的方差(波动程度)相似【每组数据的“起伏”或“分散程度”大致相同】
解释:方差就像是“分数的稳定度”。如果有一组成绩很集中,另一组成绩差距很大,就像在比较一群学霸和一群水平参差不齐的学生,这样ANOVA的结果就会失真。
📊 方差分析的类型
1️⃣ 单因素方差分析(One-Way ANOVA)
👉 适用场景: 只有一个自变量(分类变量),但有多个组。
🔹 例子:
比较 三种不同的教学方法(A、B、C) 对学生语文成绩的影响。
比较 四个不同地区的学校 在某项测试中的平均成绩是否有差异。
2️⃣ 双因素方差分析(Two-Way ANOVA)
👉 适用场景: 研究两个自变量对因变量的影响,例如研究“教学方法” 和 “性别” 对语文成绩的影响。
🔹 例子:
教学方法(A、B、C) 和 性别(男、女) 是否对语文成绩有交互作用。
不同的教学策略 与 不同的学习时间 是否影响学生的成绩。
📊 方差分析(ANOVA)的进行方式【例子】
设定研究问题
我们想知道 不同的学习方式 是否会影响 小学生的语文成绩。
研究因素(自变量):学习方式(听老师讲解、朗读课文、做阅读理解练习)
结果(因变量):语文测试成绩
收集数据
让 30 名小学生 参加实验,把他们分成 3 组,每组 10 人。每组用不同的学习方式学习1周:
A 组:听老师讲解
B 组:朗读课文
C 组:做阅读理解练习
1 周后,所有人参加 同样的语文考试,记录每个人的分数。
计算平均值
计算 所有学生的总平均分(整体语文水平)。
计算 每一组的平均分(看看不同学习方式的差异)。
计算方差
组间方差(不同学习方式的影响):A、B、C 组的平均成绩是否不同?
组内方差(个人差异):即使是相同的学习方式,每个学生的成绩可能还是有高有低。
计算 F 值
如果 组间方差比组内方差大很多,说明学习方式的影响可能很大。
如果 F 值很大,说明不同学习方式的成绩差异明显。
如果 F 值很小,说明可能只是随机波动,学习方式影响不明显。
解释结果
如果 p < 0.05,比如发现 “朗读课文” 的成绩明显高于其他组,说明朗读课文更有效。
结论:【“朗读课文”教学方法对语文成绩有显著影响】
如果 p > 0.05,说明不同学习方式的成绩差不多,可能学习方法影响不大。
🎯双因素 ANOVA(进一步分析)
如果再加入 学习时间长短(长时间 vs. 短时间),我们可以看看:
学习方式 是否影响成绩?
学习时间 是否影响成绩?
两者有没有“交互作用”?比如:朗读课文在短时间内效果一般,但长期坚持效果更好。
这样,我们就可以找到最适合小学生的语文学习方式啦!
📌 ANOVA的结果怎么看?
F值 → 组间差异和组内差异的比值,F值越大,差异越明显。
P值 → 如果P值小于0.05,表示组间存在显著差异。
‼️ANOVA的注意事项
1.数据的正态性
方差分析要求数据符合正态分布,也就是说,数据应该像一个“钟形曲线”那样分布。
2.方差齐性
方差齐性是指各组的波动程度应该差不多。比如,用三种教学法的学生成绩,波动范围(最高分和最低分的差距)应该大致相同。
3. 样本独立性
样本独立性是指每组数据之间不应该互相影响。比如,你不能让同一个学生同时用三种教学方法,因为这会互相干扰。
4. 样本量
样本量是指每组的数据量要足够多。如果每组只有几个人,结果可能不可靠。通常建议每组至少有30个数据。
5. 控制其他变量
在实验中,你需要控制其他可能影响结果的因素。比如,如果你想比较教学方法对成绩的影响,就要确保所有学生的学习时间、教材内容等都相同。
6. 多重比较
如果方差分析发现显著差异,你还需要进一步分析具体是哪两组之间有差异。这叫做多重比较。
第3组:BC1 10, 11,15
什么是F检验?
F检验(F-test)是一种统计方法,用于比较两个或多个组的数据方差是否显著不同它主要用于:
a. 方差分析(ANOVA):判断多个组的均值是否存在显著差异。
为什么要用F检验?
假设你在研究“不同的教学方式对学生成绩的影响”,你测量了不同组学生的成绩,但光看平均值不够,F检验可以告诉你:
a. 这些成绩差异是显著的,还是只是偶然的?
b. 它帮助我们避免用随机波动得出错误结论,而是用数学方法判断是否真的存在显著影响。
F检验的基本思路
F检验的核心思想就是比较方差的大小,看看数据的波动是否符合假设。
计算方法:𝐹=较大方差/较小方差
然后将这个F值与临界值(F分布表中的值)对比:F值大 → 差异显著,说明组间真的有区别。
F 值接近 1 表示两组数据的波动相似,F 值远大于 1 表示两组数据的波动有显著差异。
是否希望 F 值大或小取决于研究目的,例如,研究教学方法是否让学生成绩稳定时,希望 F 值小;研究教学方法是否导致成绩差距扩大时,希望 F 值大。
F检验的常见应用
单因素方差分析(ANOVA):比较多个组的均值是否存在显著差异。
例子1:
假设你想研究三种教学方法(A、B、C)对学生成绩的影响。你随机将学生分成三组,分别用这三种方法教学,最后进行测试。
数据:A组平均成绩:80分、B组平均成绩:85分、C组平均成绩:90分
问题:这些差异是偶然的,还是教学方法真的有效?
用F检验:
计算组间方差(教学方法之间的差异)。
计算组内方差(每组学生内部的差异)。
如果F值显著,说明至少有一种教学方法的效果与其他方法不同。
例子2:
应用 F 检验
研究结论
如果 F 值显著偏大,我们可以推测:
A 教学法 可能让学生的成绩变得更不稳定(有的学生学得很好,有的学得不好)。
B 教学法 可能让学生的成绩更稳定(大家成绩相对接近)。
第4组: BC1-12, BC2-3,7
(英语:Pearson product-moment correlation coefficient,缩写:PPMCC,或PCCs[1][注 1],有时简称相关系数)
在统计学中,Pearson相关系数是一种描述性统计量,用于总结数据集。它衡量两组变量X和Y之间的线性相关的程度和方向的统计工具。它的取值范围在 -1 和 1 之间。
Pearson Correlation Coefficient, r :
r = 1 表示完全正相关(变量同步变化)。
r = -1 表示完全负相关(变量反向变化)。
r = 0 表示无相关性。
使用条件:
数据必须是数值型(如身高、温度),不能用于类别变量(如性别、颜色)
变量之间呈现直线:散点图看大致呈直线趋势(如果像曲线,可能测不准)。
没太多异常值:个别极端值(比如学习1小时考满分的人)会干扰结果。
注意事项:
相关≠因果:即使显著相关,也不能推断因果关系。比如雪糕销量和溺水人数正相关,但其实是夏天导致的,两者无直接因果关系。
非线性关系:Pearson仅检测线性关系,对曲线关系(如U型)可能失效。
样本量影响:小样本中强相关可能不显著,大样本中弱相关可能显著但无实际意义。比如只调查3个人,结果可能误差很大 (选择的考量因素)
实用例子:
分析考试成绩与学习时间的关系
研究气温与冰淇淋销量之间的联系
评估广告投入与销售额的相关性
例子:
研究学习时间与考试成绩的关系。如果 r = 0.85,表示学习时间和成绩之间有很强的正相关。
r = 1 (学习时间增加,成绩提升)
r = -1 (学习时间增加,成绩下降)
如果PEARSON相关系数接近1,说明学习时间增加,成绩也提高。
如果接近-1,说明学习时间增加,成绩反而下降。
如果接近0,说明学习时间对成绩没有明显影响。
散点图:直线
图表:一般性的参考规则。
第5组:BC2 2,6,15
一、什么是卡方检验?
卡方检验(Chi-Square Test)是一种用于分析分类数据的统计方法,主要用于分析分类数据(Categorical Data),帮助我们判断数据之间是否有关系,或者数据是否符合某种预期。
📌 核心思想:
实际数据 ≈ 理论预期 → 卡方值(χ²)小,说明二者偏差小。
实际数据 ≠ 理论预期 → 卡方值(χ²)大,说明二者偏差大。
实际值 = 期望值 → 卡方值 = 0,表明完全符合理论预期。
卡方值特别大 → 可能存在显著统计差异,需要进一步分析。
二、什么时候用 Chi-Square 检验?
独立性检验(Test of Independence)
问题:两个分类变量是否有关联?
例子:性别(男/女)和最喜欢的运动(篮球/足球/羽毛球)是否有关联?
适配度检验(Goodness-of-Fit Test)
问题:实际数据是否符合理论预期?
例子:投掷 100 次骰子,六个点数出现的次数是否均匀?
均一性检验(Test of Homogeneity)
问题:不同群体的分布是否相同?
例子:不同学校的学生是否同样喜欢某个明星?
三、Chi-Square 检验的特点
适用于分类数据(定性数据),如性别、职业、喜好等。
不要求数据服从正态分布,因此属于非参数统计方法。
要求样本量足够大,一般来说,期望频数(Expected Frequency)不应小于 5,否则可能需要合并类别或使用 Fisher 精确检验。
四、计算步骤
收集数据,整理成表格。
计算期望值 EEE,假设变量没有关系的情况下应该出现的数据。
计算 χ2\chi^2χ2 值,看实际数据和期望值的差异有多大。
查找 p 值,如果 p < 0.05,就说明变量之间可能有关系。
五、例子( 小学生阅读兴趣的卡方检验示例)
问题
某小学 200 名学生被调查最喜欢的阅读类型。根据过往经验,每种类型的书籍(故事书、科普书、漫画、历史书、杂志)应该大致一样受欢迎,各有 40 名 学生喜欢(期望值 = 200 ÷ 5 = 40)。
但实际调查结果如下:
故事书 📖 → 55 人
科普书 🔬 → 35 人
漫画 🎨 → 50 人
历史书 🏛 → 25 人
杂志 📰 → 35 人
问题:学生的阅读兴趣是否真的均匀分布?还是某些类型的书籍更受欢迎?
📌 计算卡方值
χ2=∑(实际值−期望值)2期望值χ² = \sum \frac{(实际值 - 期望值)^2}{期望值}χ2=∑期望值(实际值−期望值)2
计算各类别的卡方值:
故事书:(55−40)² ÷ 40 = 5.625
科普书:(35−40)² ÷ 40 = 0.625
漫画:(50−40)² ÷ 40 = 2.5
历史书:(25−40)² ÷ 40 = 5.625
杂志:(35−40)² ÷ 40 = 0.625
✨ 总卡方值 = 5.625 + 0.625 + 2.5 + 5.625 + 0.625 = 15
📌 查表判断(差距是否显著)
自由度 = 5 - 1 = 4(类别数 - 1)
显著性水平(0.05):查表得 临界值 9.49
比较卡方值:
15 > 9.49,说明实际数据和预期有显著差异,阅读兴趣可能 不是随机分布 的!
📌 结论
✅ 学生的阅读兴趣分布并不均匀!
某些书籍(故事书、漫画)更受欢迎,而历史书相对冷门。可能需要调整图书馆的书籍配置,增加热门书籍的数量,同时提升历史书的吸引力。📚✨
六、Chi-Square 检验的基本条件
数据是独立的(Independence)
观测值之间不能相互影响。例如,如果你调查的是班级里的同学,每个同学的回答必须是独立的,不能互相讨论后再作答。
数据是分类数据(Categorical Data)
Chi-Square 检验只能用于“类别数据”(如性别、喜欢的颜色、职业类型),不能用于连续数据(如身高、体重、考试分数)。
期望值 𝐸 不能太小
一般要求所有期望值 𝐸 大于 5,否则可能会影响检验结果的准确性。如果有很多小于 5 的期望值,建议合并类别或使用Fisher’s Exact Test(费舍尔精确检验)。
七、Chi-Square 检验的局限性
不能用于连续数据 → 如果数据是连续的(如年龄、身高),可以先转换成分类数据(如“年龄分组”),或者使用 t 检验、ANOVA 等方法。
对小样本不适用 → 当期望值很小(特别是 < 5)时,Chi-Square 可能不准确,建议改用 Fisher’s Exact Test(费舍尔精确检验)。
只能发现关联,不能证明因果关系 → Chi-Square 只能说明两个变量之间是否有关联,但不能说明“谁影响谁”。例如,如果性别和职业选择有关系,Chi-Square 不能告诉我们是性别影响了职业,还是职业的某些特征吸引了不同性别的人。
资料来源:
卡方检验| 统计学简介
第6组:BC2 8,12,16
Mann-Whitney U 检验是一种非参数统计方法,用来比较两组数据是否有显著差异,即判断两组数据是否来自相同的总体。它适用于数据不满足正态分布或存在异常的情况。
Mann-Whitney U 检验通过比较两个独立样本的秩次,评估它们是否来自同一分布。它假设两个样本分布形状相同,只是位置参数不同。检验统计量U的计算公式为:
计算出的U值需要与标准的U分布表进行比较,一确定是否拒绝零假设。较小的U值表明两个样本分布有显著差异。
U ≤ 临界值,拒绝零假设,认为差异显著。
U > 临界值,不能拒绝零假设,认为差异不显著。
关键假设:
两组之间比较的变量必须是连续的(能够在一定范围内取任何数字--例如年龄、体重、身高或心率)。这是因为该检验是基于对每组观察结果的排序。
数据被假设为非正态分布,或偏态分布。如果你的数据是正态分布,应该用非配对的t检验来比较两组。
虽然两组的数据不被假定为正态,但两组的数据被假定为形状相似。
数据应该是两个随机选择的独立样本,即两组之间没有关系。如果样本是成对的(例如,来自同一组参与者的两次测量),则应使用成对的样本t检验来代替。
有效的测试需要足够的样本量,通常每组有5个以上的观察值。
步骤
收集两个独立样本的数据。
合并两组数据,并按大小排序(等级/顺序)
给每个数据分配排名(如果有相同的数值,取平均排名)。
分别计算两个样本的秩次和。
计算 U 值(公式比较复杂,通常用软件计算)。
确定显著性水平:选择显著性水平,查找U分布表确定临界值,比较U值与临界值。
例子:
假设你想知道 两个班级(比如1班和2班) 的数学成绩有没有差异。
问题1:如果成绩分布很乱(比如有人考满分,有人超低分),直接用“平均分”比较可能不准。
问题2:数据不服从正态分布(比如成绩集中在高分或低分)。
这时候,Mann-Whitney U检验 就派上用场。它不比较平均分,而是比较“成绩的排名”。
假设两个班的成绩如下:
1班:85,78,92,88,76
2班:80,74,88,82,78
步骤1:合并两个样本并排序
74,76,78,78,80,82,85,88,88,92
步骤2:计算秩次和(每个班的“排名总和”)
1班的排名总和 = 3 + 5 + 6 + 9 + 10 = 33
2班的排名总和 = 1 + 2 + 4 + 7 + 8 = 12
步骤3:计算U值
使用公式计算U值:
步骤4:确定显著性水平
在显著性水平0.05下,查找U分布表得出临界值为8。由于U值12>8,我们不能拒绝零假设,既两种教学方法对学生成绩没有显著差异。如果U≤8,则拒绝零假设。
资料来源:
第7组:BC1 7, BC2 9,13
Kruskal-Wallis 检验也称为H检验,是一种非参数的假设检验方法。
什么时候用Kruskal-Wallis 检验?
数据之间是“独立”的
各组数据没有关系。
如:不同班级学生的考试成绩。
数据是“等级数据”
如:学生名次。
Kruskal-Wallis 检验是根据数据的秩(排名次序)来做计算,而不看具体数值。
有多组(通常3组或以上)(如:3班学生)
想知道它们之间有没有明显差异。
数据不满足正态分布的要求
若用ANOVA,数据要符合:
正态分布(Normal Distribution)
每组的方差差不多
用Kruskal-Wallis检验:
是非正态分布
方差差很多
对每个样本进行排序,得到一个从小到大的序列
给每个样本分配一个秩(我们不直接用原始数据,而是把所有数据按大小排序给的名次(秩次))(数值越大,秩次越高。)
计算每个样本的秩和(每组数据的秩次之和)
计算秩和平均值
计算秩和离差平方和
最终,我们通过计算秩和离差平方和来判断是否拒绝零假设。如果拒绝零假设,则说明至少有一组样本之间存在显著的差异。
Kruskal-Wallis Test的实现步骤
设计零假设和备择假设
零假设:所有组的总体分布相同
备择假设:至少有一组的总体分布不同
排序数据:将所有组的数据合并成一个整体,并按照数值大小从小到大进行排序。
例如,假设我们有三组数据:
A组: 85, 87, 90
B组: 79, 83, 88
C组: 75, 78, 81
排序后:75, 78, 79, 81, 83, 85, 87, 88, 90。
3. 分配秩次(Ranks):依照排序后的位置,为每个数据赋予一个“秩次”(排名)。如果有相同的值,取其平均排名。
例如:75(1), 78(2), 79(3), 81(4), 83(5), 85(6), 87(7), 88(8), 90(9)
4. 计算各组秩次和:统计每个组内所有数据的秩次之和(Rj)。
例如:
A组: 6 + 7 + 9 = 22
B组: 3 + 5 + 8 = 16
C组: 1 + 2 + 4 = 7
5. 计算每组的秩均值(平均排名),即:
例如:
A 组: 22/3=7.33
B 组: 16/3=5.33
C 组: 7/3=2.3
6. 计算检验统计量 𝐻:
Kruskal-Wallis 检验的统计量公式为:
N 是所有数据的总数 , n j 是每个组的数据数量 , R j 是各组的秩和
7. 判断是否拒绝零假设 𝐻0
Kruskal-Wallis 检验会计算一个统计量 𝐻,然后判断这个值是否足够大,大到能说明至少有一个组与其他组不同。
如果 P 值小于 0.05,说明组之间的差异很可能不是偶然的,拒绝零假设。
零假设:所有组的总体分布相同
备择假设:至少有一组的总体分布不同
如果拒绝零假设𝐻0:说明至少有一组数据的分布不同,即组间存在显著差异。
如果不拒绝零假设𝐻0:说明各组数据可能来自相同的分布,没有显著差异。
例子:
假设你想比较三种不同的学习方法对考试成绩的影响。从每种方法的学生中抽取一些成绩数据。
排序数据:不管数据属于哪一组,把所有人的成绩从低到高排序,并给它们编号(称为“秩次”)。
计算各组的秩均值(类似于平均排名):如果一个方法的排名明显更高或更低,可能意味着它和其他方法不同。
计算统计量并比较:Kruskal-Wallis 检验会计算一个统计量 𝐻,然后判断这个值是否足够大,大到能说明至少有一个组与其他组不同。
如果 P 值小于 0.05,说明组之间的差异很可能不是偶然的,而是由于学习方法不同。
第八组
😥 Spearman 相关系数是什么?
它是一种 衡量两个变量之间关系强弱的方法,特别适用于 数据不是线性关系 的情况。
目的:评估两个变量是否呈单调相关(即一个变量随另一个变量递增或递减的趋势)。
如果 一个变量增加,另一个变量也增加(即数据呈上升趋势),那么相关性是 正的。
如果 一个变量增加,另一个变量减少(即数据呈下降趋势),那么相关性是 负的。
如果 两个变量没有固定的趋势,那么它们可能没有相关性(接近 0)。
Spearman 相关系数的特别之处在于,它不看具体的数值,而是看数据的排名(秩次)。
Spearman 不关心具体分数,只关心谁高谁低!
例子(一):
假设全班5个人的数学成绩是:[50, 70, 60, 90, 80],排名后变成:[第5名, 第3名, 第4名, 第1名, 第2名]
例子(二):
假设全班同学按数学成绩从高到低排了名次,同时物理成绩也排了名次。
Spearman 的任务是:检查这两个排名名单是否一致。
如果数学第1的同学物理也是第1,数学第2物理也第2…… → 完全正相关(系数=1)。
如果数学第1的同学物理倒数第1,数学第2物理倒数第2…… → 完全负相关(系数=-1)
如果排名乱糟糟没规律 → 不相关(系数≈0)。
😥 什么时候用 Spearman?
如果数据本身的大小不重要,而只是关心排名的变化,就可以用 Spearman。例如:
✅ 适用情况:
比较 考试成绩 和 学习时长(如果学习时间长的人通常考得更好,就有正相关)。
研究 产品价格 和 客户满意度(价格越高,满意度可能越低,可能是负相关)。
评估 社交媒体关注人数 和 影响力(排名高的可能更有影响力)。
为什么要用“排名”而不是分数?
原因1:分数可能有极端值(比如某同学数学考了100分,但物理只考了10分),直接用分数计算会受干扰,但“排名”更稳定。
原因2:适合比较“顺序”问题,比如比赛名次、调查问卷的“满意程度等级”(好、中、差)。
怎么计算?简单版!
给两个科目的成绩各自排名(比如数学排1,2,3,物理排3,1,4)。
算每对排名的差距:
小明数学第1,物理第3 → 差距 = 1−3 = −2
小红数学第2,物理第1 → 差距 = 2−1 = 1
把这些差距平方(避免负数)再相加:
(−2)² + 1² + … = 4 + 1 + …
套公式:
结果会在 -1 到 1 之间,越接近1或-1,相关性越强!
用“班级排名”秒懂结果
ρ = 1:数学和物理排名完全一致!学霸每科都强,学渣每科都弱。
ρ = 0:两科排名完全没关联,数学好的人物理可能好也可能差。
ρ = -1:数学和物理排名完全相反!数学第1的人物理倒数第1。
和“皮尔逊相关系数”的区别
皮尔逊:关注分数之间的“直线关系”(比如分数高1分,另一科也固定高几分)。
斯皮尔曼:只关心排名趋势(不管分数具体差多少,只要排名一起升或降就行)。
😥 什么时候会出现 0 相关系数?
相关系数(无论是 Pearson 还是 Spearman)会在以下情况下接近 0:
✅ 情况 1:完全无关系
例子:鞋码 vs 语文成绩
解释:鞋码变大或变小,语文成绩不会受到影响,两个变量毫无关系,所以相关系数 = 0。
✅ 情况 2:数据完全随机
例子:随机分配的号码 vs 体重
解释:如果数据是 毫无规律的散点分布,那么计算出来的相关系数也会接近 0。
一句话总结:Spearman 就是帮你判断「两个东西的变化趋势是否一致」,不管数据长什么样子👇