logo
生物科学研究所 井口研究室
Laboratory of Biology, Okaya, Nagano, Japan
Home

統計学の基準値の由来:5%有意水準,カイ二乗検定,相関係数の出典と引用

井口豊(生物科学研究所,長野県岡谷市)
最終更新:2023 年 10 月 21 日

1. はじめに

統計学において,しばしば用いる基準値というものがある。それにもかかわらず,その由来とか,出典元とかが不明のまま使われる基準値がある。それがあまりにも有名で広く使われているために,かえって原典が不明になってしまったケースと言って良い。ここでは,そのような基準値の原典は何か,という考察である。興味のある人は,実際にその原典までたどって読んでほしい。いくつかの文献には, PDF が読めるサイトをリンクした。なお, 四分位数の定義とその用語の歴史については,別のページの解説参照:
四分位数と四分位群:複数定義と用語の区別,その歴史

なお,本ページは,以下の論文に引用されています。

高野真史・倉持龍彦・久松学・細川正浩・蜂谷仁 (2020)
クライオバルーンアブレーションにおける V1 電極を用いた複合筋活動電位の検討
心電図 40(4): 217-227.

高橋昌也 (2018)
統計データの可視化の試み: 図形による表現とその描画プログラム
福岡工業大学研究論集 51(1): 41-53.

2. 有意水準 5%

統計学において最も頻繁に使われる基準値と言えば,仮説検定における有意水準 5%(α = 0.05)という数値だろう。仮説検定の結果,有意か否かを判定するのに,理論的には何%でも良いのだが,この5%という数値が,世界中で慣習として用いられてきた。慣習と単に言ってしまったが,その元となる歴史は,もちろんある。有意水準5%を最初に言い出したのは,かのフィッシャー(R. A. Fisher)らしい。次の論文を読むと,その起源が分かる。

Cowles M. and Davis C. (1982)
On the origins of the .05 level of statistical significance
American Psychologist 37: 553-558

これを読むと,Fisherが1925年に,彼の著書
Statistical methods for research workers. Oliver and Boyd, 1925.
において,p = 0.05を最初に使ったことになる。

この部分を読むには, York 大学の C. D. Green が作成した次のサイトを参照:
Classics in the History of Psychology

その中の
STATISTICAL METHODS FOR RESEARCH WORKERS
By Ronald A. Fisher (1925)

III. DISTRIBUTIONS
をクリックして,正規分布を解説した章
12. The Normal Distribution
そこを読んでいくと,次のように書かれている。

P =·.05, or 1 in 20, is 1.96 or nearly 2 ; it is convenient to take this point as a limit in judging

Cowles and Davis (1982) の最初の部分にも書かれているように,5% という基準自体は,特別な合理性があって決められたわけでなく,適当に(arbitrarily)決められたと言える。

なお, Fisher (1925) の論文では, P という文字で, 0.05 が示されているが,現在では,有意水準に対しては α が使われるのが普通である。この α は,仮説検定において,あらかじめ設定された棄却水準としての確率である。一方,帰無仮説が棄却される最小の有意水準を,有意確率といい, p で表すのが普通である。これは一般に p 値と呼ばれ,統計ソフトによって算出される確率でもある。

すなわち,
P≦αならば,帰無仮説は棄却される
P>αならば,帰無仮説は棄却されない
という結果になる。

3. カイ二乗検定(χ2検定)の適用基準

カイ二乗検定の適用基準として,期待値が 5 未満のセルが,全体の 20%以上になってはいけない,とされる。これに対しては, Cochran's rule という名称が存在する。以下の Cochran (1954) が示した基準値である。

Cochran W.G. (1954)
Some methods for strengthening the common x2 tests
Biometrics 10: 417-451.

しかしながら,日本の統計学の教科書には,このことが滅多に書かれていない。日本語でも,この原典を明記した上で「コクランの規則」のように書くべきだろう。ただし,似たような基準値は,この Cochran (1954) の論文以前から使われていたらしい。実際,この論文の中にも次のような記述がある。

many writers recommend that the mi be not less than 5 (p. 418)

この writers の名前が挙げられていないので,誰なのかは不明だが,とにかく期待値が 5 以下では駄目,というような推奨があったらしい。それにも関わらず, Cochran の規則という名称があるのは,この論文で,分割表のセル期待値がどのくらいあれば,どのような対応をとれば良いか,というアドバイスが書かれているからである。

具体的かつ詳細な内容は,本論文 p.420
2.1 Recommendations about minimum expectations
を読んでほしい。

例えば, 2×2 分割表ならば,全体の観察数(N)が 20 未満,または, 20 < N < 40 かつ最小期待値が 5 未満の時は,フィッシャー正確確率検定を使うことを勧めている。さらに N > 40 ならば,連続補正したカイ二乗検定を使うことを勧めている。

しかし,話は,そう単純ではない。この Cochran の規則は,くせ者である。こういう不合理な規則を押し付けるな,という詳しい解説を黒木玄さんがされている。非常に参考になる意見だ。自戒を込めて引用しよう。 X (旧ツイッター)黒木玄さん解説

なお,Fisher 正確確率検定か,カイ二乗検定かと考えることなく,最初から, Fisher 正確確率検定を採用するという考え方も当然ありうる。たいていの教科書や統計ソフトでは, 2 × 2 分割表に対して, Fisher 正確確率検定が適用されると書いてある。しかしながら,R を含めて最近の統計ソフトならば,任意の大きさの分割表に対して, Fisher 正確確率検定をできる。

ところで,この Fisher 正確確率検定(Fisher's exact test)の Fisher とは,冒頭述べた R. A. Fisher のことである。この検定に関しては,しばしば, Fisher (1922) として引用される次の論文がある。

Fisher R. A. (1922)
On the interpretation of X2 from contingency tables, and the calculation of p
Journal of the Royal Statistical Society 85: 87–94.

この論文を読んでみると分かるが, Fisher 自身が exact test と呼んでいるわけではない。この論文を, Fisher の正確確率検定の原典として引用する論文は,この論文での Fisher の功績をたたえて引用しているのである。

では,正確確率検定の本当の原典は何か?それに関しては,以下の論文が参考になる。

Hitchcock D. B. (2009)
Yates and Contingency Tables: 75 Years Later
Electronic Journal for History of Probability and Statistics 5(2): 1-14.

この中で,p.4から始まる
3 Development of Fisher’s exact test
を読み進めていくと,次の文献で, exact test という言葉が見られると分かる。

Fisher R. A. (1934)
Statistical Methods for Research Workers
Fifth Edition, Oliver and Boyd.

この論文は,最初の 5%有意水準で挙げた本と同じもので,前述のが初版,こちらは第 5 版なのである。

この第 5 版の序文 p.11
PREFACE TO FIFTH EDITION vi
に, giving the exact test と書かれている。

余談だが,その少し前を読むと,カイ二乗検定に対する,イエーツの連続性補正(Yates' correction for continuity)についても,この第 5 版で論じていると分かる。序文で書くくらいなので,いかに,これが強調したい内容なのかがわかる。

この本 Statistical Methods for Research Workers は, Fisher の最大の業績のひとつと言え, Wikipedia において,この本の項目でone of the 20th century's most influential books on statistical methods と紹介されているのも当然であろう。

4. 相関係数の強弱の基準

相関係数の強弱も,何気なく使う統計上の基準値である。よく使われるのは,絶対値として,以下のような基準である。

0 - 0.2 ほとんど相関なし
0.2 - 0.4 弱い相関あり
0.4 - 0.7 中程度の相関あり
0.7 - 1 強い相関あり

最後の部分は,特に,
0.9 - 1 非常に強い相関あり
とすることもある。

日本語の教科書やウェブサイトでは,これらの相関係数の基準を誰が言い出したのか,つまり,原典は何なのか,という解説は,まず見かけない。「目安として」とか,「分野によって異なる」とか,言い逃れみたいな説明だけになっている例も少なくない。

この相関係数の基準は,ギルフォード(J. P. Guilford)に端を発するらしい。これも非常に有名な心理学者で,彼の略歴や業績を,日本語サイト「ギルフォード博士の略歴」で読めるので参考にして欲しい。

このウェブページにも出てくる次の単行本
Fundamental Statistics in Psychology and Education
McGraw-Hill, New York.
これに相関係数の基準が述べられている。

複数年の版があり,1942年,1950年,1956年,1965年,1973年,1978年に出版年があるのだが,私の個人的印象では,1956年版,つまり,第 3 版が引用されることが多いようだ。実際,上述の基準は,Guilford's Rule of Thumb と呼ばれることが多く,このキイワードでググルと,多くの論文がこの Guilford (1956) を引用しているとわかる。例えば,次の論文もそうである。

Brown et al. (1996)
Leading without Authority: An Examination of the Impact of Transformational Leadership Cooperative Extension Work Groups and Teams
Journal of Extension, v34 n5.

Table2 の下の本文に,以下のように書かれている。

Guilford (1956) provides assistance in interpreting and comparing correlation coefficients. He describes correlation coefficients of less than .20 as being interpreted as "slight almost negligible relationships", correlations of .20 to.40 as "low correlation;" correlations of .40 to.70 as "moderate correlation;" .70 to.90 as "high correlation, marked relationship;" and correlation greater than .90 as "very high correlation, very dependable relationship.

References を見ると,Guilford (1956) を引用しているとわかる。

Guilford, J. P. (1956). Fundamental statistics in psychology and education. New York: McGraw Hill.

なお,相関係数を表す r は, Francis Galton (進化論で有名な Charles Darwin の従兄弟)が唱えた「先祖返り(reversion)」に由来するとされ,この reversion が,その後, regression (回帰)と言われる統計分析になった。これに関しては,以下の文献参照。

Gorroochurn, P. (2016)
On Galton's change from “reversion” to “regression”
The American Statistician 70(3): 227-231.

Rao, C. R. (1983)
多変量解析 その起源と発展に関する回想
応用統計学 12(2): 69-78 (柳井晴夫・竹内啓 訳).

Home