正規性検定をノンパラメトリック検定の選択基準にするな
井口豊(生物科学研究所,長野県岡谷市)
最終更新:2023 年 1 月 10 日
タイトルには,ノンパラメトリック検定の選択基準にするなと書いたが,もちろん,これをパラメトリック検定の選択基準にするなと書いても同じである。
t 検定を行なう前に,等分散かどうか検定し,等分散なら通常の t 検定,等分散でなければ Welch 検定と安易に使い分けてはいけないことは,別の統計解説ページに書いた。
この二段階検定問題は,等分散検定だけでなく,もっと広く注意されるべき事柄である。
代表的な問題は,正規性検定を行なってから,それを満足すればパラメトリック検定,それを満足しなければノンパラメトリック検定と使い分ける,というものである。
この使い分けが正しくないのは,事前の等分散検定と同じロジックであり,私自身は多重検定の問題と考えている。しかし,等分散検定に比べ,正規性検定の問題については,意外と知られていない。
日本語で,この問題を指摘している数少ない例が,三重大・奥村さんのブログ,2段階t検定の是非
であり,そのページの追記2段階t検定その後
を読むと良い。そこでは,正規性検定の結果で,パラメトリックとノンパラメトリック検定を使い分ける人が揶揄されている。
あるいは,弘前大・対馬さんの解説,多重決定問題とは
でも,正規性検定 ② が.多重検定であることが指摘されている。
英語の解説ならば,二段階検定とは異なる観点から,正規性検定の問題点を指摘した統計ソフト GraphPad Prism のページ, Advice: Don't automate the decision to use a nonparametric test 。
冒頭で,わざわざ訂正線を引いて解説するという手の込んだページになっている。
First perform a normality test. If the P value is low, demonstrating that the data do not follow a Gaussian distribution, choose a nonparametric test. Otherwise choose a conventional test.
要するに,正規性検定では, t 検定のようなパラメトリック検定が適用できないほどのズレがあるかどうかは判断できないというのである。
さらに,別のページには,小標本(サンプルサイズが小さい,n < 12 程度)では,正規性の検定が役立たず,パラメトリックでもノンパラメトリックでも,正しい検定結果が得られない,と書かれている(参照: Nonparametric tests with small and large samples)。
しかも,正規性検定は,文字通り,正規分布か否かの検定であり,パラメトリック検定か,ノンパラメトリック検定かを決める検定ではない。正規分布でなくても,何らかの確率分布が想定されれば,一般化線型モデル(GLM)を適用したほうが,適切な場合もある。
さらに,前述のウェブページ,等分散検定から t 検定,ウェルチ検定, U 検定への問題点,にも書いたように, U 検定など,ノンパラメトリック検定であっても,等分散を仮定するなど,何らかの仮定が必要となる場合もあり,仮定フリーな検定ではないのである。
結局,正規性検定を行なってから,それを満足すればパラメトリック検定,それを満足しなければノンパラメトリック検定と使い分ける,という安易な手順を踏んではならないのである。