生物科学研究所 井口研究室
Laboratory of Biology, Okaya, Nagano, Japan
標準回帰係数と相関係数
井口豊(生物科学研究所,長野県岡谷市)
最終更新:2024 年 3 月 29 日
ここでは,単回帰式における標準回帰係数(直線の傾き)は,相関係数(Pearson 相関係数)と同値であることを示す。
まず,別のウェブページ回帰と相関の 3 章 最小二乗法の理論的計算
の式 (4) に書いたように,回帰直線は, x, y の重心,すなわち,平均点 (x̄, ȳ)を通るので,以下のように表現できる。。
これは共分散 σxy と標準偏差 σx, σy を使うと,以下のような簡潔な表現になる。
\begin{eqnarray} y-\bar{y}=\frac{\sigma_{xy}}{\sigma_{x}\sigma_{x}}(x-\bar{x}) \end{eqnarray}さらに,両辺を σy で割る。
\begin{eqnarray} \frac{y-\bar{y}}{\sigma_{y}}=\frac{\sigma_{xy}}{\sigma_{x}\sigma_{x}}\frac{x-\bar{x}}{\sigma_{y}} \end{eqnarray}右辺分母の標準偏差を並び替える。
\begin{eqnarray} \frac{y-\bar{y}}{\sigma_{y}}=\frac{\sigma_{xy}}{\sigma_{x}\sigma_{y}}\frac{x-\bar{x}}{\sigma_{x}} \end{eqnarray}
これは, x, y を標準化した回帰式を表す。さらに,その回帰係数は,前述のウェブページの 4 章 回帰係数と相関係数の違い
の式 (7) に書いたように,相関係数 r そのものである。標準化した x, y を X, Y とすると,以下のように簡潔に表せる。
したがって,単回帰式における標準回帰係数(直線の傾き)は,相関係数(Pearson 相関係数)そのものである。
統計ソフト R を用いて,乱数を代入して,標準回帰係数と相関係数を計算してみると実感できる。
n<- sample(5:100) x<- rnorm(n) y<- rnorm(n) # 標準回帰係数 lm(scale(y) ~ scale(x))$coef[2] # Pearson 相関係数 cor(x, y)