logo
生物科学研究所 井口研究室
Laboratory of Biology, Okaya, Nagano, Japan
Home

サンプル数とサンプルサイズ n は意味が違う

井口豊(生物科学研究所,長野県岡谷市)
最終更新:2024 年 2 月 14 日

この問題に関しては,黒木玄さんのコメントも非常に参考になる(X 2024年2月14日午前10:08 およびその後の補足)。

特に,以下のコメントである(X 2024年2月14日午前10:08)。

元々の専門用語の作り方が悪いので、読むときには文脈に合わせて寛容な態度で解釈し、書くときには悪しき伝統に頼らずに分かりやすく説明する努力をするべきだと思います。

以上の指摘を十分に念頭に置いた上で,以下の説明も読んでほしい。

統計学の用語には,日常用語に似た語もあるためか,頻繁に誤用される語がある。例えば,別ページに解説した「母数」などは,その最たるもので,朝日新聞の統計記事でも誤用されてる。

この母数と並んで頻繁に誤用される統計用語が,サンプル数である。

サンプルサイズ(sample size,標本サイズ,標本の大きさ)ことを誤ってサンプル数(the number of samples, 標本数)と呼ぶ人が非常に多い。

例えば, 30 人と 40 人の身長の母平均の差を検定するのに,サンプル数は 2 であり,サンプルサイズは 30 と 40 である。

日常用語で群数と呼ばれるのがサンプル数(標本数)であり,したがって,この問題は, 2 群問題であり, 2 標本問題なのである。だから,「サンプル (標本)= 群」と覚えておけば,まず間違わないだろうが,実際には,大学教員でさえ誤用している例が見受けられる。その誤用の多くが,個々の測定値(観測値)をサンプル(標本)だと思っているのである。

例えば,関西大学の間淵領吾氏が奈良大学で行なった講義「調査結果を吟味する」は,その誤りの典型例である。

一方で,正しく注意を促す教員もいる。例えば,富山大学の唐渡広志氏による 統計学講義 第3回 の中で, p.27 の解説のように,n を「標本数とかサンプル数とはよばない」と指摘している。あるいは,神戸大学の羽森茂之氏も, 「標本の大きさ(サンプルサイズ:sample size)と標本数」という解説で,両者を混同しないように注意を促している。大学の教員なら,たとえ統計学の専門家でなくても,正しい用語を学生に教えてほしいものである。

さらに,一時期,話題となった書籍「統計学が最強の学問である」(西内 啓,2013,ダイアモンド社)にも,サンプルサイズをサンプル数と誤記した例が頻繁に現れる(例えば,p.52)。

また,サンプルサイズ nn 数と呼ぶこともあるが,用語の定義からすれば,「大きさ n」と呼ぶべきである。

外国でも,サンプルサイズとサンプル数を混同する人が,かなり多いらしく,大学教員が注意を促している。

例えば, W. Robert Stephenson の解説 AP STATS がそれである。この内容を理解すれば,サンプルサイズとサンプル数を混同しないと思う。

その p. 3 の説明:

Many students are confused about the number of samples versus the sample size.

日本では,学生どころか,大学教員でも混同する人がいるのである。ちょっと恥ずかしい。

あるいは,Metin Çakanyıldırım の解説 Computing the Standard Deviation of Sample Means も参照して欲しい。

その p. 1 に書かれた説明:

The number of samples and the sample size can potentially be confusing. Sample size is the number of items within a group. Number of samples is the number of groups.

日本の大学教員も,ここをきちんと教えてほしいものだ。

Home