logo
生物科学研究所 井口研究室
Laboratory of Biology, Okaya, Nagano, Japan
Home

サンプル数とサンプルサイズ n は意味が違う

井口豊(生物科学研究所,長野県岡谷市)
最終更新:2018年11月4日

統計学の用語には,日常用語に似た語もあるためか,頻繁に誤用される語がある。例えば,別ページに解説した「母数」などは,その最たるもので,朝日新聞の統計記事でも誤用されてる。

この母数と並んで頻繁に誤用される統計用語が,サンプル数である。

サンプルサイズ(sample size,標本サイズ,標本の大きさ)ことを誤ってサンプル数(the number of samples, 標本数)と呼ぶ人が非常に多い。

例えば, 30 人と 40 人の身長の母平均の差を検定するのに,サンプル数は 2 であり,サンプルサイズは 30 と 40 である。

日常用語で群数と呼ばれるのがサンプル数(標本数)であり,したがって,この問題は, 2 群問題であり, 2 標本問題なのである。だから,「サンプル (標本)= 群」と覚えておけば,まず間違わないだろうが,実際には,大学教員でさえ誤用している例が見受けられる。その誤用の多くが,個々の測定値(観測値)をサンプル(標本)だと思っているのである。

例えば,関西大学の間淵領吾氏が奈良大学で行なった講義「調査結果を吟味する」は,その誤りの典型例である。

一方で,正しく注意を促す教員もいる。例えば,富山大学の唐渡広志氏による「統計学講義 第3回 母集団と標本」 p.5 の解説のように,n を「標本数とはよばない!」と,!を付けてまで指摘している。あるいは,神戸大学の羽森茂之氏も, 「標本の大きさ(サンプルサイズ:sample size)と標本数」という解説で,両者を混同しないように注意を促している。大学の教員なら,たとえ統計学の専門家でなくても,正しい用語を学生に教えてほしいものである。

さらに,一時期,話題となった書籍「統計学が最強の学問である」(西内 啓,2013,ダイアモンド社)にも,サンプルサイズをサンプル数と誤記した例が頻繁に現れる(例えば,p.52)。

また,サンプルサイズ n を n 数と呼ぶこともあるが,用語の定義からすれば,「大きさ n」と呼ぶべきである。

外国でも,サンプルサイズとサンプル数を混同する人が,かなり多いらしく,大学教員が注意を促している。

例えば,アイオワ州立大学W. Robert Stephenson の解説 AP STATS がそれである。この内容を理解すれば,サンプルサイズとサンプル数を混同しないと思う。

特にその p. 3 に,
Many students are confused about the number of samples versus the sample size.
と書かれているが,少なくとも日本では,学生どころか,大学教員でも混同する人がいるのである。ちょっと恥ずかしい。

あるいは,テキサス大学ダラス校Metin Çakanyıldırım の解説 Computing the Standard Deviation of Sample Means も参照して欲しい。

その p. 1 に書かれた説明:
The number of samples and the sample size can potentially be confusing. Sample size is the number of items within a group. Number of samples is the number of groups.

日本の大学教員も,ここをきちんと教えてほしいものだ。

Home