統計学入門⑫ 回帰分析(1)

統計学入門

(はじめに)

今まであまり計算では文字式を使わないようにしてきましたが、計算が複雑になってきたので使う場合が増えてくると思います。今更ではありますが、データの変数は$\ x\ $や$\ y\ $、平均値は$\ \bar{x}\ $, $\ \bar{y}\ $、標準偏差は$\ s_{x}\ $, $\ s_{y}\ $、分散は$\ {s_{x}}^2\ $, $\ {s_{y}}^2\ $、共分散は$\ s_{xy}\ $、相関係数は$\ r\ $を使っていきます。その他、新しく出てくるものは都度紹介します。
また当記事のテーマ、趣旨については以下の記事をご覧いただければと思います。

前回は変動係数$\ CV\ $の求め方を簡単に学びました。

 今回は話を変えて、$\ $回帰分析$\ $について学び始めようと思います。と言ってもいつも通り初歩的なところだけですが。
 回帰分析とは、(簡単に言えば)2つの変数$\ x\ $、$\ y\ $の間に何らかの関係があると考えたときに $\ x\ $から$\ y\ $を予測することです。このとき$\ x\ $を 説明変数 、$\ y\ $を 被説明変数(目的変数) といいます。$\ x\ $は「$\ y\ $を説明する変数」で、$\ y\ $は「$\ x\ $によって説明される変数」ということになります。
 ここで言っている「何らかの関係」について、あるアイスクリーム店の「1ヶ月間の売り上げ」と「その月の最高気温」の関係を具体例にして考えていきます。

下の表は1〜12月まで最高気温と売り上げをまとめた表です。ただし、10月の売り上げに関してはデータを消去してしまいました(という設定にしておきます)。

123456789101112
最高気温 (℃)121315182528333027231814
売り上げ (万円)303235405060756555?3630

続いて横軸を月毎の最高気温$\ x\ $、縦軸を月毎の売り上げ$\ y\ $としてグラフを書いてみます。

このグラフから最高気温$\ x\ $と月毎の売り上げ$\ y\ $の関係は

$y = \alpha + \beta x$


$
y = \alpha + \beta x
$

で表せることができると考えられます。この直線のことを回帰直線といいます。
また$\ \alpha\ $と$\ \beta\ $を回帰係数といいます。

それでは、ここまでの復習として問題を解いていきます。

Exercise1-11

下の文章中の($\ $)に当てはまる言葉を考えてみましょう。

2つの変数$\ x\ $と$\ y\ $が何らかの関係を持つと考えたとき、$\ x\ $から$\ y\ $の値を予測することを(ア)という。

ここで$\ x\ $は(イ)、$\ y\ $は(ウ)と呼ばれる。

$\ x\ $と$\ y\ $の関係が直線の式$\ y=\alpha + \beta x\ $で表せるとき、この直線を(エ)という。

ここで、$\ \alpha\ $と$\ \beta\ $を(オ)という。

(ア)回帰分析

(イ)説明変数

(ウ)被説明変数(目的変数)

(エ)回帰直線

(オ)回帰係数

ここまでのまとめ

回帰分析
2つの変数$\ x\ $と$\ y\ $に何らかの関係があると考えたとき、$\ x\ $から$\ y\ $を予測すること。

説明変数
変数$\ x\ $のこと。何らかの原因である変数のこと。

被説明変数(目的変数)
変数$\ y\ $のこと。つまり予測したい値のこと。

次回は、回帰係数$\ \alpha\ $と$\ \beta\ $の推定値$\ \hat{\alpha}\ $と$\ \hat{\beta}\ $の求め方を学んでいきます。
最近色々とやりたいことがあって更新が遅いので、いつになるかわかりませんが・・・。

ちなみにですが、私はこちらの参考書で勉強しています。

※Amazonのアソシエイトとして、当メディア(Nラボ備忘録)は適格販売により収入を得ています。

大したブログではないですが、読者になっていただければ嬉しいです。Twitterも始めているのでフォローよろしくお願いします。



コメント

タイトルとURLをコピーしました