統計学入門⑩ 相関係数

統計学入門

 前回は散布図を使って相関関係について見ていきました。

 今回はより具体的に2つの量的データの相関関係を見るために相関係数を求める方法をまとめていきます。

相関係数は以下の式で求めることができます。

$相関係数= \cfrac{共分散}{量的データxの標準偏差\times量的データyの標準偏差}$

標準偏差ってなんだっけ?と思われた方は以下の記事をご覧いただければ嬉しいです。

いきなり出てきた共分散は以下の式で求めることができます。

$共分散= \cfrac{(量的データxの偏差\times量的データyの偏差)の総和}{データの個数}$

言葉で書くと分かりづらいので、実際に問題を解いてみます。

Exercise1-9

次の量的データ$ x $の標準偏差$ s_{x} $と$ y $の標準偏差$ s_{y} $と共分散$ s_{xy} $ を求めて、相関係数$ r $を求めてみましょう。(データ数が少ないですが・・・)

$x$4045606575
$y$5560657080

まず平均値は $x$の平均値 $\bar{x}=57$、$y$の平均値 $\bar{y}=66$ となります。

次に表を作っていきます。相関係数を求める時は下のような表を作るとミスを防止できるのと、後でミスがないか確認をする際に便利だと思います。

$x$4045606575
$y$5560657080
$x$の偏差
$x-\bar{x}$
-17-123818
$y$の偏差
$y-\bar{y}$
-11-6-1414
$x$の偏差の2乗
$(x-\bar{x})^2$
289144964324
$y$の偏差の2乗
$(y-\bar{y})^2$
12136116196
($x$の偏差)
$\times$
($y$の偏差)
$(x-\bar{x})$
$\times$
$(y-\bar{y})$
18772-332252

答えは少数点以下第3位で四捨五入しています。相関係数$r$は四捨五入した標準偏差と共分散を使っています。

$x$の標準偏差
$s_{x}=\sqrt{\cfrac{289+144+9+64+324}{5}}=12.88$

$y$の標準偏差
$s_{y}=\sqrt{\cfrac{121+36+1+16+196}{5}}=8.60$

共分散
$s_{xy}=\cfrac{187+72+(-3)+32+252}{5}=108$

相関係数
$r=\cfrac{共分散}{xの標準偏差\times yの標準偏差}=\cfrac{108}{12.88\times8.60}=0.98$

ここまでのまとめ

相関係数の求め方

$相関係数= \cfrac{共分散}{量的データxの標準偏差\times量的データyの標準偏差}$

相関係数の求め方

$共分散= \cfrac{(量的データxの偏差\times量的データyの偏差)の総和}{データの個数}$

ちなみにですが、私はこちらの参考書で勉強しています。

※Amazonのアソシエイトとして、当メディア(Nラボ備忘録)は適格販売により収入を得ています。

大したブログではないですが、読者になっていただければ嬉しいです。Twitterも始めているのでフォローよろしくお願いします。

コメント

タイトルとURLをコピーしました