(はじめに)
今まであまり計算では文字式を使わないようにしてきましたが、計算が複雑になってきたので使う場合が増えてくると思います。今更ではありますが、データの変数は$\ x\ $や$\ y\ $、平均値は$\ \bar{x}\ $, $\ \bar{y}\ $、標準偏差は$\ s_{x}\ $, $\ s_{y}\ $、分散は$\ {s_{x}}^2\ $, $\ {s_{y}}^2\ $、共分散は$\ s_{xy}\ $、相関係数は$\ r\ $を使っていきます。その他、新しく出てくるものは都度紹介します。
前回は相関係数の求め方をまとめました。
今回は変動係数$CV$について簡単に学びます。変数を$x$とするとき変動係数$CV$は以下の式で求めます。
$変動係数\ CV= \cfrac{標準偏差\ s}{平均値\ \bar{x}}$
標準偏差ってなんだっけ?と思われた方は以下の記事をご覧いただければ嬉しいです。
それでは変動係数について具体例を交えて考えていきます。
変動係数はデータの散らばりを見る際に使います。標準偏差もデータの散らばりを見る際に使いますが、2つのデータを比較する際には注意が必要です。一方で変動係数は2つのデータの散らばり具合を比較する際に使いやすいです。例えば、A社とB社それぞれが販売するマンゴスチン1個の重さの標準偏差と変動係数でデータの散らばりを考えてみます。
A社では平均値$\ $100$\ $g、標準偏差$\ $50$\ $gで、B社では平均値$\ $5000$\ $g、標準偏差$\ $500$\ $gとしましょう。これらを比較すると、B社の標準偏差が大きいので、B社の方がデータの散らばりが大きいように見えてしまうかもしれません。しかし、単純に考えると、平均値が$\ $100$\ $gに対して標準偏差が$\ $50$\ $gであるA社の方がデータの散らばりが大きいように思えます。つまり、このような極端に値が異なる2つのデータの散らばり具合を標準偏差で比較することは難しいということになります。
そこで変動係数を求めてみましょう。A社は0.5、B社は0.1となります。つまりA社の方が散らばり具合が大きいということになります。
以上の例の他にも、単位が異なる2つのデータ(例えば身長と体重)の散らばり具合を比較する際にも使うこともできます。
それでは、問題を解いていきます。
Exercise1-10
男子高校生30人の身長と体重に関するデータを集めたところ、身長の平均値は$\ $170$\ $cm、標準偏差は$\ $6$\ $cmで、体重の平均値は$\ $60$\ $kg、標準偏差は$\ $9$\ $kgでした。
このとき、身長と体重どちらのデータの散らばりが大きいでしょうか。
身長の変動係数$CV$は、
$変動係数\ CV=\cfrac{標準偏差\ s}{平均値\ \bar{x}}=\cfrac{6}{170}=0.035$
体重の変動係数$CV$は、
$変動係数\ CV=\cfrac{標準偏差\ s}{平均値\ \bar{x}}=\cfrac{9}{60}=0.15$
となります。2つの変動係数を比較すると体重の方が大きいです。したがって、データの散らばりも体重の方が大きいと判断できます。
ちなみにですが、私はこちらの参考書で勉強しています。
※Amazonのアソシエイトとして、当メディア(Nラボ備忘録)は適格販売により収入を得ています。
大したブログではないですが、読者になっていただければ嬉しいです。Twitterも始めているのでフォローよろしくお願いします。
コメント