logo
生物科学研究所 井口研究室
Laboratory of Biology, Okaya, Nagano, Japan
Home

Mann-Whitney U 検定の統計量: R による注意点

井口豊(生物科学研究所,長野県岡谷市)
最終更新: 2023 年 10 月 22 日

1. U 検定の統計量の計算

まず, Mann-Whitney U 検定(Wilcoxon 順位和検定)の統計量を, Wikipedia マン・ホイットニーのU検定に挙げられたうさぎとかめのデータ例で確認する。

日本でも良く知られたイソップ寓話のウサギとカメ The Tortoise and the Hare を題材にして,それぞれ 6 匹のウサギとカメが,以下の表 1 の順番でゴールしたとする。

表 1.ウサギとカメの競争結果
順位123456789101112
動物カメウサギウサギウサギウサギウサギカメカメカメカメカメウサギ

U 検定では,それぞれの動物の順位の合計を計算して比較する。それゆえ,この検定は,順位和または順位平均の検定であり,中央値の検定ではない,ので注意が必要である。

カメとウサギの順位和をそれぞれ, R1 R2 とすると,次のように表される。便宜上,同着(同順位)が無いデータとなっている。

カメの順位和 R1 = 1 + 7 + 8 + 9 + 10 + 11 = 46

ウサギの順位和 R2 = 2 + 3 + 4 + 5 + 6 + 12 = 32

したがって,カメとウサギの検定統計量をそれぞれ, U1 U2 とすると,次のように表される。

カメの検定統計量 U1

ウサギの検定統計量 U2

Wikipedia に書かれているように,通常は,これらの統計量のうち,小さいほうの U1 の数値 11 を使って検定を進めるが,どちらを使うかは,あくまで便宜上のことである。実際,以下のような関係式が成り立つ。

U1 + U2 = n1*n2

この点は,統計ソフトで自動的に処理されるので, p 値を知るだけなら問題ないが,どちらの検定統計量なのか注意する必要がある。

2. R を用いた U 検定の統計量の計算

前述の順位データを R の wilcox.test 関数を使って計算すると,以下のようなスクリプトになる。日本語入力でも出来るが,なるべく英語入力のほうが良い。ちなみに,tortoise(カメ)で最も有名なものは Galápagos Giant Tortoise (ガラパゴスゾウガメ)だろう。  

# 入力順位データ
# カメ tortoise
# ウサギ hare

tortoise<- c(1, 7, 8, 9, 10, 11)
hare<- c(2, 3, 4, 5, 6, 12)

# U 検定
wilcox.test(tortoise, hare)

### 終了

結果は,以下の図 1 のようになった。

R の wilcox.test による U 検定

図 1. R の wilcox.test による U 検定の結果出力

検定統計量は W として出力される。これは,前述の U1 U2 と比べると, W は大きいほうの U2 なのである。この点に注意する必要がある。

関連ページ

Home