統計学入門③ 量的データの特徴

統計学入門

 量的データは身長や個数などのデータと、統計学入門①で紹介しました。

 量的データは離散的なデータ連続的なデータに分けることができます。

離散的なデータ
 ”離散的=飛び飛び”の値を取るデータです。例えば、サイコロの目などがあります。つまり、隣り合う数字の間に値が存在しないデータのことです。確かにサイコロの4と5の目の間に4.4や4.6の目はありません。

連続的なデータ
 ”連続的=様々”な値を取ることができるデータです。例えば、身長などがあります。確かに165.0 cmと166.0 cmの間に165.5 cmや165.7 cmという身長の人がいても良いですよね。

 ここで、練習問題に挑戦してみましょう。

Exercise1-2 次のデータを離散的なデータと連続的なデータに分けてみましょう。

①:体重

②:年齢

③:気温

④:夕食の品数

⑤:サイコロの目

離散的なデータ・・・②、④、⑤

連続的なデータ・・・①、③

いかがでしょうか。離散的なデータである②年齢、④夕食の品数、⑤サイコロの目は、隣り合う数字の間に値が存在しません。(10.5歳や3.5品などという表現はたまに聞きますが・・・)

  一方で連続的なデータである①体重、③気温は、それぞれ50.5 kg、32.3℃など、様々な値で表現されます。

もっと深く

 もしかしたら上記の説明では納得いかない人もいるかもしれません。実は上記の説明では全てを正しくできているわけではありません。以下で、もう少し深く考えてみましょう。

①質的データと離散的なデータの違いは?

 質的データである出席番号と年齢を比較してみましょう。どちらもある程度決まった値を取ります。ただし、出席番号は単純な番号として使っているだけで大した意味はありません。 
 一方で年齢はどうでしょうか。年齢はその数字自体に意味があります。ここで言う意味があるとは、”計算に意味がある”ということです。例えば、「このクラスの出席番号の平均値は20である」という計算に意味はありませんが、「この大学における1年生の平均年齢は19歳である」という計算は意味を持ちます。これが質的データと離散的なデータの違いと解釈できます。

②”離散的=飛び飛び”なら、身長や体重も厳密には”飛び飛び”の値なのでは?

 その通りだと思います。身長も有効数字を小数点以下第一位までにしてしまえば、連続になっていないと言えます。そのため、取り得る値が多い場合を”連続”と言ってしまうのです。実際、完全に飛び飛びの値ってあまりないような気がしますね。

ここまでのまとめ

離散的なデータ・・・隣り合う数字に値が存在しないデータ

連続的なデータ・・・様々な値を取り得るデータ

ちなみにですが、私はこちらの参考書で勉強しています。

※Amazonのアソシエイトとして、当メディア(Nラボ備忘録)は適格販売により収入を得ています。

コメント

タイトルとURLをコピーしました