不偏分散と不偏標準偏差におけるベッセル補正
井口豊(生物科学研究所,長野県岡谷市)
最終更新:2025 年 11 月 6 日
1. はじめに
不偏分散と不偏標準偏差の計算式を要約した。
2. 補正された分散としての不偏分散
統計学において,高校生が学ぶ分散(variance)は,各測定値 xi とその平均 x との差(偏差)を二乗して,その総和(偏差平方和)を標本サイズ(sample size)で割った値である。それを V2 で表すと以下のようになる。
これが,いわゆる n で割る分散,である。 Excel では,母集団の分散(母分散) VAR.P 関数として説明されている計算である。ここで P は母集団 population を表す。
ところが,標本として得られた測定値に,この母分散の式をそのまま適用して母分散の推定値とみなすと,その期待値に偏り(bias)が生じてしまう。この偏りを補正するために, n/(n−1) を乗じて,不偏分散(unbiased variance),いわゆる n−1 で割る分散を計算することになる。それを Uv と表すと以下のようになる。
この因子 n/(n−1) をベッセル補正因子 Bessel correction factor またはベッセルの補正因子 Bessel's correction factor と呼ぶ。この用語での日本語の説明は少ないが,英語版 Wikipedia の Bessel's correction には説明がある。
要するに,「n−1 で割る分散が不偏分散」,というよりも,「n で割る分散をベッセル補正したのが不偏分散」なのである。補正した分散として不偏分散を説明する例は,日本語解説には少ない。
3. 補正された標準偏差としての不偏標準偏差
高校生が学ぶ標準偏差(standard deviation)は,前述の n で割る分散 V2 の正の平方根である。それを S として表すと以下のような計算になる。
これもまた,母標準偏差の不偏推定量(不偏標準偏差)ではない。以下のサイトも参照。
後者のサイトにも書いたように,正規母集団から得られた標本の場合, n で割る標準偏差 S を補正する係数が,管理図(control chart)で使われる c4 であり,ガンマ関数を使って次のように表される。
この c4 とベッセル補正因子 n/(n−1) を使って, n で割る標準偏差 S を補正すると,不偏標準偏差が得られる。それを Us と表すと以下のようになる。
前述の参考サイト水増し係数と割引き係数
で述べたように,不偏標準偏差の係数計算には,係数表を使っていた。しかし,パソコンや統計ソフトが発達した現在では,それは不要である。 Excel でも計算式さえ入力すれば,不偏標準偏差を計算できる。