統計学入門④ 代表値( Ⅰ )

統計学入門

前回まで統計学で扱うデータの特徴を紹介していきました。

今回はデータを分析する上で、データの代表となる 代表値 について学んでいきます。代表値とはそのデータの集まりを代表するような特別な値のことを言います。

学習するにあたって、とある高校生7人の定期テスト(物理)の点数を使わせていただきましょう。

出席番号241014192537
点数10454545657070
とある高校生7人の定期テスト(物理)の点数

それでは7人の点数を使って、代表値を計算していきましょう。

平均値
平均値はよく耳にする言葉だと思います。求め方は以下になります。

① すべてのデータを足す:10 + 45+ 45 + 45 + 65 + 70 + 70 = 350
② 足した結果をデータの個数で割る:350 ÷ 7 = 40

中央値
中央値はどうでしょうか。中央値はその名の通り、”中央にある値”です。求め方は以下になります。

① データを小さい順に並べる:10, 45, 45, 45, 65, 70, 70
② 中央に来るデータが中央値:45
 ただし、今回のようなデータの数が奇数の場合は並べるだけわかりますが、データの数が偶数の場合は、真ん中2つのデータの平均値です。(詳しくはExercise1-3で)

最頻値
最頻値は漢字の意味が分かれば簡単ですね。”最も頻繁に出てくる値”で最頻値です。高校生7人の点数を見れば最頻値は45点とわかります。注意しなければいけないことは、45が3つあるから最頻値は”3″だと勘違いしないことです。
おそらく上記3つの代表値の中で一番簡単に求められると思います。

Exercise1-3
とある高校生6人の定期テスト(物理)の点数が、 30, 15, 50, 30, 85, 90だった場合の平均値、中央値、最頻値を求めてみましょう。

まず、小さい順に並べると、15, 30, 30, 50, 85, 90 となるので、

平均値・・・( 15 + 30 + 30 + 50 + 85 + 90 ) ÷ 6 = 50

中央値・・・( 30 + 50 ) ÷ 2 = 40

最頻値・・・30

いかがでしょうか。今回データの数が偶数なので、中央値の計算が若干面倒臭いかもしれません。

ここまでのまとめ

平均値・・・すべてのデータを足して、データの個数で割る

中央値・・・データを小さい順に並べて、中央に来るデータ(データ数が偶数の場合は、真ん中のデータ2つの平均値)

最頻値・・・最も頻繁に出てくるデータ

ちなみにですが、私はこちらの参考書で勉強しています。

※Amazonのアソシエイトとして、当メディア(Nラボ備忘録)は適格販売により収入を得ています。

コメント

タイトルとURLをコピーしました