サンプル数とサンプルサイズ n は意味が違う

井口豊(生物科学研究所,長野県岡谷市)
最終更新:2017年9月30日

統計学の用語には,日常用語に似た語もあるためか,頻繁に誤用される語がある。例えば,別ページに解説した「母数」などは,その最たるもので,朝日新聞の統計記事でも誤用されてる。
この母数と並んで頻繁に誤用される統計用語が,サンプル数である。

サンプルサイズ(sample size,標本サイズ,標本の大きさ)ことを誤ってサンプル数(the number of samples, 標本数)と呼ぶ人が非常に多い。。

例えば, 30 人と 40 人の身長の母平均の差を検定するのに,
サンプル数は 2
サンプルサイズは 30 と 40
である。

日常用語で群数と呼ばれるのがサンプル数(標本数)であり,したがって,この問題は,2群問題であり,2標本問題なのである。だから,「サンプル (標本)= 群」と覚えておけば,まず間違わないだろうが,実際には,大学教員でさえ誤用している例が見受けられる。その誤用の多くが,個々の測定値(観測値)をサンプル(標本)だと思っているのである。

例えば,関西大学の間淵領吾氏が奈良大学で行なった講義「調査結果を吟味する」は,その誤りの典型例である。

一方で,正しく注意を促す教員もいる。例えば,富山大学の唐渡広志氏の 統計学講義 第3回 母集団と標本 p.5 の解説のように,n を「標本数とはよばない!」と,!を付けてまで指摘している。あるいは,神戸大学の羽森茂之氏も, 「標本の大きさ(サンプルサイズ:sample size)と標本数」という解説で,両者を混同しないように注意を促している。大学の教員なら,たとえ統計学の専門家でなくても,正しい用語を学生に教えてほしいものである。

また,サンプルサイズ n を n 数と呼ぶこともあるが,用語の定義からすれば,「大きさ n」と呼ぶべきである。

外国でも,サンプルサイズとサンプル数を混同する人が,かなり多いらしく,大学教員が注意を促している。

この内容を理解すれば,サンプルサイズとサンプル数を混同しないと思う。

特にその p. 3 に,
Many students are confused about the number of samples versus the sample size.
と書かれているが,少なくとも日本では,学生どころか,大学教員でも混同する人がいるのである。ちょっと恥ずかしい。


その p. 1 に,
The number of samples and the sample size can potentially be confusing. Sample size is the number of items within a group. Number of samples is the number of groups.

日本の大学教員も,ここをきちんと教えてほしいものだ。