logo
生物科学研究所 井口研究室
Laboratory of Biology, Okaya, Nagano, Japan
Home

Kruskal-Wallis は平均順位検定であり,中央値検定ではない

井口豊(生物科学研究所,長野県岡谷市)
最終更新: 2022 年 10 月 29 日

1. はじめに

データ分布の位置(location)に関するノンパラメトリック検定となると,すぐに中央値の検定と思われるようで, Kruskal-Wallis (クラスカル・ウォリス)検定もその一つである。しかし実際には,この検定は平均順位(mean rank, 順位平均とも言う)の検定と言うべきであり,特に,標本サイズが大きい場合の近似計算では,平均順位を比較する分散分析(Rank ANOVA)そのものとも言える。

ここでは, R を使い,シミュレーションで Kruskal-Wallis 検定,中央値検定,順位データの分散分析の p 値を比較してみた。

なお,Kruskal-Wallis 検定を 2 群で計算すると, Mann-Whitney U 検定の結果となる(Kruskal-Wallis 検定を使えば U 検定は不要:漸近と正確検定)。したがって, U 検定もまた平均順位検定である。

パラメトリック検定である分散分析を 2 群で計算すると, t 検定の結果となる(対応ある t 検定は 1 群検定,分散分析は 2 群以上の検定)。この両者が母平均の検定であることと, Kruskal-Wallis 検定と Mann-Whitney U 検定が平均順位検定であることは,同様な関係にある。

2. Kruskal-Wallis 検定,中央値検定,順位分散分析

便宜上,同点(タイ)を避けるために,連続一様乱数を使い, 3 群(サンプル数 3),それぞれ大きさ 50 (サンプルサイズ 50)とした。

中央値検定には,パッケージ coin の median_test 関数(Brown-Mood median test)を使った。

以下が, R スクリプトである。


#############
library(coin)

k<- 1e+2 # 標本取り出し反復回数
n<- 50
grp<- factor(rep(1:3, each = n))

p<- replicate(k, {

    dat<- runif(3*n, 1, 5)

    c(
    kruskal.test(dat ~ grp)$p.value,
    pvalue(median_test(dat ~ grp)),
    oneway.test(rank(dat) ~ grp, var.equal = TRUE)$p.value
    )

})

par(oma = c(3, 3, 2, 2))

# Kruskal-Wallis 検定と中央値検定
plot(
  p[1, ], p[2, ],
  xlab = "Kruskal-Wallis test p-value",
  ylab = "Mood's median test p-value",
  cex.lab  = 1.2,
  cex.axis = 1.0
)

abline(0, 1, col = "red")

# Kruskal-Wallis 検定と順位分散分析
plot(
  p[1, ], p[3, ],
  xlab = "Kruskal-Wallis test p-value",
  ylab = "Rank ANOVA p-value",
  cex.lab  = 1.2,
  cex.axis = 1.0
)

abline(0, 1, col = "red")

################

結果は,次の図 1 のとおりである。

Kruskal-Wallis 検定統計量 H 近似と標本サイズ

図 1. p 値の比較: Kruskal-Wallis 検定に対して,中央値検定(上),順位分散分析(下)

Kruskal-Wallis 検定の p 値が,中央値検よりも,順位分散分析のそれに近いことが分かる。

論文の記載例

鈴木ほか(2006), p.182 表 2 には,中央値と四分位範囲が示されている。これ自体は,一般に見られることだが,これとは別に,次ページの表 3 には, Kruskal-wallis の検定結果とともに,各群の平均順位が示されている。本来,このように平均順位も記したほうが良いのである。

新型コロナ関連の研究で, Alhowaymel et al. (2022), p.6 Table 3 には, Mann-Whitney U 検定と Kruskal-Wallis 検定の結果とともに,平均,標準偏差,平均順位(Mean rank)が記されている。このように, U 検定も Kruskal-Wallis 検定も,平均順位を記したほうが良いのである。

関連サイト

参考文献

Alhowaymel, Abaoud, Alhuwaimel, Alenezi and Alsayed (2022) COVID-19 Patients'Satisfaction Levels with Nursing Care: A Cross-Sectional Study. SAGE Open Nursing 8.

印東太郎(1962)サーストンの心理尺度構成法. 日本音響学会誌 18(1): 16-22.

鈴木亨・園田茂・才藤栄一・村田元徳・清水康裕・三沢佳代(2006) 回復期リハビリテーション目的の入院脳卒中患者における転倒, 転落事故と ADL. リハビリテーション医学 43(3): 180-185.

Home