Mann-Whitney U 検定の統計量: R による注意点
井口豊(生物科学研究所,長野県岡谷市)
最終更新: 2023 年 10 月 22 日
1. U 検定の統計量の計算
まず, Mann-Whitney U 検定(Wilcoxon 順位和検定)の統計量を, Wikipedia マン・ホイットニーのU検定
に挙げられたうさぎとかめのデータ例
で確認する。
日本でも良く知られたイソップ寓話のウサギとカメ
The Tortoise and the Hare
を題材にして,それぞれ 6 匹のウサギとカメが,以下の表 1 の順番でゴールしたとする。
U 検定では,それぞれの動物の順位の合計を計算して比較する。それゆえ,この検定は,順位和または順位平均の検定であり,中央値の検定ではない,ので注意が必要である。
カメとウサギの順位和をそれぞれ, R1 R2 とすると,次のように表される。便宜上,同着(同順位)が無いデータとなっている。
カメの順位和 R1 = 1 + 7 + 8 + 9 + 10 + 11 = 46
ウサギの順位和 R2 = 2 + 3 + 4 + 5 + 6 + 12 = 32
したがって,カメとウサギの検定統計量をそれぞれ, U1 U2 とすると,次のように表される。
Wikipedia に書かれているように,通常は,これらの統計量のうち,小さいほうの U1 の数値 11 を使って検定を進めるが,どちらを使うかは,あくまで便宜上のことである。実際,以下のような関係式が成り立つ。
この点は,統計ソフトで自動的に処理されるので, p 値を知るだけなら問題ないが,どちらの検定統計量なのか注意する必要がある。
2. R を用いた U 検定の統計量の計算
前述の順位データを R の wilcox.test 関数を使って計算すると,以下のようなスクリプトになる。日本語入力でも出来るが,なるべく英語入力のほうが良い。ちなみに,tortoise(カメ)で最も有名なものは Galápagos Giant Tortoise (ガラパゴスゾウガメ)だろう。
# 入力順位データ # カメ tortoise # ウサギ hare tortoise<- c(1, 7, 8, 9, 10, 11) hare<- c(2, 3, 4, 5, 6, 12) # U 検定 wilcox.test(tortoise, hare) ### 終了
結果は,以下の図 1 のようになった。
検定統計量は W として出力される。これは,前述の U1 U2 と比べると, W は大きいほうの U2 なのである。この点に注意する必要がある。