対応ある t 検定は 1 群検定,分散分析は 2 群以上の検定
井口豊(生物科学研究所,長野県岡谷市)
最終更新:2022 年 10 月 23 日
1. はじめに
検定と群数(標本数,サンプル数)の関係を,どうも理解していない人が多いようであり,代表的な例として,対応ある t 検定(paired t test)と分散分析(ANOVA)を取り上げる。
2. 対応ある t 検定とは何か?
対応ある t 検定は,対応するデータの差をとって 1 群(サンプル数 1)を作り,その 1 群(差データ)の平均が 0 であるかどうか検定するものである。ただし広義には,差がいくつであっても検定できる方法である。対応ある t 検定は 1 群だから,等分散かどうかという問題は生じない。筆算,いわゆる手計算でやれば,すぐ分かるのだが,Excel など統計ソフトに頼ると,教員が説明しない限りは,理解しないまま授業を終えてしまう。
例えば,次の表 1 のような対応あるデータ x1, x2 を考える。
x1 | x2 | d (= x2 - x1) |
---|---|---|
3 | 1 | 2 |
2 | 1 | 1 |
2 | 2 | 0 |
2 | 3 | -1 |
この差 d の平均
(2 + 1 + 0 -1)/4 = 0.5
が 0 となるかどうかを検定するのが,対応ある t 検定である。
表 1 データに対して, R で,対応ある t 検定と差 d の 1 群検定をやってみる。なお, Excel による 1 群 t 検定の方法は,別ページに解説した(母比率の検定:カイ二乗検定,二項検定,Z検定,1標本t検定,逆正弦変換検定)。
# 対応あるデータ x1, x2 の t 検定 x1<- c(3, 2, 2, 2) x2<- c(1, 1, 2, 3) t.test(x1, x2, paired = T) # 差データ d の t 検定 d<- x2 - x1 t.test(d)
どちらの結果も同じく,
t = -0.7746, df = 3, p-value = 0.495
である。
t 値の算出式を書くと,以下のようになる。
ここで, mean(d) は差データの平均, U2 は差データの不偏分散, n は差データの個数(上の例では, n = 4)である。
この点が理解できていない学生が(教員も?)多い。
当然ながら,正規分布の検定も,差データ d に対して行なう。これを誤って, x1, x2 それぞれを正規性検定する人がいるので注意が必要である。
さらに,対応あるデータでも,関連性が無ければ,当然だが,独立 2 群(対応なし)の t 検定となる。それは,別ページに解説した(対応のある t 検定から線形混合モデルへ)。この点も,理解せず,対応あれば何でも,対応ある t 検定だと思っている人も多い。
3. 分散分析は,2 群以上の検定
分散分析は,2 群以上の検定であり, 2 群の場合が, t 検定や,いわゆる Welch 検定(等分散かどうか問わない検定)である。授業では,歴史的に? t 検定を学ぶが,実用上は,不要と言える。このこともまた,あまり教えられていないようだ。
表 1 データを独立 2 群(サンプル数 2)のデータ x1, x2 として扱い, t 検定と分散分析で計算してみる。
### 等分散を仮定 x1<- c(3, 2, 2, 2) x2<- c(1, 1, 2, 3) # t 検定 t.test(x1, x2, var.equal=T) # 分散分析 group<- rep(1:2, c(length(x1), length(x2))) dat<- c(x1, x2) oneway.test(dat ~ group, var.equal=T) ### 等分散かどうか問題にしない # Welch t 検定 t.test(x1, x2, var.equal=F) # Welch 分散分析 oneway.test(dat ~ group, var.equal=F)
結果は省略するが,等分散の場合も,等分散であってもなくても良い場合も, t 検定と二群の分散分析は同じ結果になる。
分散分析の場合, F 値が,
F (1, t 検定自由度)
となり, t 値の 2 乗に等しくなり,自由度 n の t 分布に従う統計量 t の 2 乗は,自由度(1, n)の F 分布に従う,という統計学上の定理を実感できる。
4. 1 群分散分析
さらに,一般線形モデル(General Linear Model)として分散分析を考えると, 1 群(1 標本)分散分析が, 1 群 t 検定と同等になる。これは別ページで解説した。
5. Kruskal-Wallis 検定も 2 群以上の検定
ノンパラメトリック検定である Kruskal-Wallis 検定も 2 群以上の検定である。これも別ページで解説した。