(はじめに)
今まであまり計算では文字式を使わないようにしてきましたが、計算が複雑になってきたので使う場合が増えてくると思います。今更ではありますが、データの変数は$\ x\ $や$\ y\ $、平均値は$\ \bar{x}\ $, $\ \bar{y}\ $、標準偏差は$\ s_{x}\ $, $\ s_{y}\ $、分散は$\ {s_{x}}^2\ $, $\ {s_{y}}^2\ $、共分散は$\ s_{xy}\ $、相関係数は$\ r\ $を使っていきます。その他、新しく出てくるものは都度紹介します。
また当記事のテーマ、趣旨については以下の記事をご覧いただければと思います。
前回は変動係数$\ CV\ $の求め方を簡単に学びました。
今回は話を変えて、$\ $回帰分析$\ $について学び始めようと思います。と言ってもいつも通り初歩的なところだけですが。
回帰分析とは、(簡単に言えば)2つの変数$\ x\ $、$\ y\ $の間に何らかの関係があると考えたときに $\ x\ $から$\ y\ $を予測することです。このとき$\ x\ $を 説明変数 、$\ y\ $を 被説明変数(目的変数) といいます。$\ x\ $は「$\ y\ $を説明する変数」で、$\ y\ $は「$\ x\ $によって説明される変数」ということになります。
ここで言っている「何らかの関係」について、あるアイスクリーム店の「1ヶ月間の売り上げ」と「その月の最高気温」の関係を具体例にして考えていきます。
下の表は1〜12月まで最高気温と売り上げをまとめた表です。ただし、10月の売り上げに関してはデータを消去してしまいました(という設定にしておきます)。
月 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
最高気温 (℃) | 12 | 13 | 15 | 18 | 25 | 28 | 33 | 30 | 27 | 23 | 18 | 14 |
売り上げ (万円) | 30 | 32 | 35 | 40 | 50 | 60 | 75 | 65 | 55 | ? | 36 | 30 |
続いて横軸を月毎の最高気温$\ x\ $、縦軸を月毎の売り上げ$\ y\ $としてグラフを書いてみます。
このグラフから最高気温$\ x\ $と月毎の売り上げ$\ y\ $の関係は
$y = \alpha + \beta x$
$
y = \alpha + \beta x
$
で表せることができると考えられます。この直線のことを回帰直線といいます。
また$\ \alpha\ $と$\ \beta\ $を回帰係数といいます。
それでは、ここまでの復習として問題を解いていきます。
Exercise1-11
下の文章中の($\ $)に当てはまる言葉を考えてみましょう。
2つの変数$\ x\ $と$\ y\ $が何らかの関係を持つと考えたとき、$\ x\ $から$\ y\ $の値を予測することを(ア)という。
ここで$\ x\ $は(イ)、$\ y\ $は(ウ)と呼ばれる。
$\ x\ $と$\ y\ $の関係が直線の式$\ y=\alpha + \beta x\ $で表せるとき、この直線を(エ)という。
ここで、$\ \alpha\ $と$\ \beta\ $を(オ)という。
(ア)回帰分析
(イ)説明変数
(ウ)被説明変数(目的変数)
(エ)回帰直線
(オ)回帰係数
次回は、回帰係数$\ \alpha\ $と$\ \beta\ $の推定値$\ \hat{\alpha}\ $と$\ \hat{\beta}\ $の求め方を学んでいきます。
最近色々とやりたいことがあって更新が遅いので、いつになるかわかりませんが・・・。
ちなみにですが、私はこちらの参考書で勉強しています。
※Amazonのアソシエイトとして、当メディア(Nラボ備忘録)は適格販売により収入を得ています。
大したブログではないですが、読者になっていただければ嬉しいです。Twitterも始めているのでフォローよろしくお願いします。
コメント