logo
生物科学研究所 井口研究室
Laboratory of Biology, Okaya, Nagano, Japan
Home

正規性検定をノンパラメトリック検定の選択基準にするな

井口豊(生物科学研究所,長野県岡谷市)
最終更新:2018年11月11日

タイトルには,ノンパラメトリック検定の選択基準にするなと書いたが,もちろん,これをパラメトリック検定の選択基準にするなと書いても同じである。

t 検定を行なう前に,等分散かどうか検定し,等分散なら通常の t 検定,等分散でなければ Welch 検定と安易に使い分けてはいけないことは,別の統計解説ページに書いた:等分散検定から t検定,ウェルチ検定,U検定への問題点

この二段階検定問題は,等分散検定だけでなく,もっと広く注意されるべき事柄である。

代表的な問題は,正規性検定を行なってから,それを満足すればパラメトリック検定,それを満足しなければノンパラメトリック検定と使い分ける,というものである。

この使い分けが正しくないのは,事前の等分散検定と同じロジックであり,私自身は多重検定の問題と考えている。しかし,等分散検定に比べ,正規性検定の問題については,意外と語られていない。

日本語で,この問題を指摘している数少ない例が,三重大・奥村氏のブログ 2段階t検定の是非であり,そのページの追記2段階t検定その後を読むと良い。そこでは,正規性検定の結果で,パラメトリックとノンパラメトリック検定を使い分ける人が揶揄されている。

英語の解説ならば,二段階検定とは異なる観点から,正規性検定の問題点を指摘した統計ソフト GraphPad Prism のページ, Advice: Don't automate the decision to use a nonparametric test

冒頭で,わざわざ訂正線を引いて解説するという手の込んだページになっている。

First perform a normality test. If the P value is low, demonstrating that the data do not follow a Gaussian distribution, choose a nonparametric test. Otherwise choose a conventional test.

要するに,正規性検定では,t検定のようなパラメトリック検定が適用できないほどのズレがあるかどうかは判断できないというのである。

さらに,別のページには,小標本(サンプルサイズが小さい,n < 12 程度)では,正規性の検定が役立たず,パラメトリックでもノンパラメトリックでも,正しい検定結果が得られない,と書かれている(参照: Nonparametric tests with small and large samples)。

結局,正規性検定を行なってから,それを満足すればパラメトリック検定,それを満足しなければノンパラメトリック検定と使い分ける,という安易な手順を踏んではならないのである。

Home