テストの点数を集めたものの、「このデータをどうまとめればいいのかわからない」と困っていないだろうか。
数字がずらっと並んでいるだけでは、全体の傾向がつかめない。「平均点あたりの人が多いのか」「ばらつきはどれくらいか」といった情報が、ぱっと見ではわからないのである。
実は、度数分布表という整理法を使えば、どんなに多いデータでもすっきりまとめられる。この記事では、度数分布表の作り方を、手順に沿ってひとつずつ確認していく。
そもそも度数分布表とは?
度数分布表とは、データをいくつかの区間に分けて、それぞれの区間に何個のデータがあるかを表にまとめたものである。
度数とは、「その区間に入るデータの個数」のことである。例えば「60点以上70点未満の人数が5人」なら、この区間の度数は5である。
階級とは、データを分けるための区間のことである。「60点以上70点未満」のような範囲が1つの階級にあたる。
具体例を見てみよう。クラス20人のテストの点数が以下のように与えられたとする。
45, 52, 58, 61, 63, 65, 67, 68, 70, 72,
74, 75, 78, 80, 82, 85, 88, 90, 93, 95
このままでは傾向がつかみにくいが、度数分布表にまとめると次のようになる。
| 階級(点) | 度数(人) |
|---|---|
| 40以上50未満 | 1 |
| 50以上60未満 | 2 |
| 60以上70未満 | 5 |
| 70以上80未満 | 5 |
| 80以上90未満 | 4 |
| 90以上100未満 | 3 |
| 合計 | 20 |
このように整理すると、「60〜80点あたりに多くの人が集中している」ことが一目でわかる。
度数分布表を図で理解する
度数分布表がどのようにデータを整理しているか、アニメーションで確認してみよう。
このグラフは柱状グラフ(ヒストグラム)と呼ばれ、度数分布表をそのまま視覚化したものである。棒の高さが度数を表している。
度数分布表の作り方
それでは、度数分布表を実際に作る手順を確認しよう。
データの範囲を確認する
まず、データの最小値と最大値を見つける。
例:最小値45点、最大値95点 → 範囲は45〜95点
階級の幅を決める
階級の幅とは、1つの区間の大きさのことである。
一般的には5、10、20などのキリのよい数を選ぶ。今回は10点刻みにする。
階級を決める
最小値を含む階級から、最大値を含む階級までを設定する。
例:40以上50未満、50以上60未満、…、90以上100未満
「以上」は、その数を含む。「未満」は、その数を含まない。例えば「60以上70未満」には、60点は含むが、70点は含まない。
度数を数える
各階級に入るデータの個数を数える。正の字を書いて数えると間違いにくい。
| 階級(点) | 正の字 | 度数 |
|---|---|---|
| 40以上50未満 | 一 | 1 |
| 50以上60未満 | 二 | 2 |
| 60以上70未満 | 正 | 5 |
| 70以上80未満 | 正 | 5 |
| 80以上90未満 | 四 | 4 |
| 90以上100未満 | 三 | 3 |
合計を確認する
度数の合計がデータの総数と一致するか確認する。
例:$1 + 2 + 5 + 5 + 4 + 3 = 20$(人数と一致 → OK)
階級値とは
度数分布表では、階級値という数値もよく使う。
階級値とは、各階級の中央の値のことである。階級の両端の値を足して2で割れば求められる。
例えば「60以上70未満」の階級値は次のように計算する。
すべての階級について階級値を求めると、次の表のようになる。
| 階級(点) | 階級値 | 度数(人) |
|---|---|---|
| 40以上50未満 | 45 | 1 |
| 50以上60未満 | 55 | 2 |
| 60以上70未満 | 65 | 5 |
| 70以上80未満 | 75 | 5 |
| 80以上90未満 | 85 | 4 |
| 90以上100未満 | 95 | 3 |
階級値は、度数分布表から平均値を計算するときに使う。
よくある間違いと対策
「以上」「未満」の境目を間違える
70点のデータを「60以上70未満」に入れてしまうミスが多い。
対策:「未満」はその数を含まないと覚える。70点は「70以上80未満」に入る。
度数の合計を確認しない
数え間違いがあると、合計がデータの総数と合わなくなる。
対策:必ず最後に合計を確認する。合わなければ、もう一度数え直す。
階級の幅を不揃いにしてしまう
「40〜50」「50〜65」「65〜80」のように幅がバラバラだと、正しく比較できない。
対策:階級の幅はすべて同じにする。
この単元のよくある質問
Q. 階級の幅は何点にすればいいですか?
A. 問題で指定がなければ、5点、10点、20点などのキリのよい数を選ぶ。データの範囲が広ければ幅を大きく、狭ければ幅を小さくすると見やすくなる。階級の数が5〜10個程度になるのが目安である。
Q. 「以上」と「以下」、「未満」の違いがわかりません。
A. 「以上」と「以下」は、その数を含む。「未満」と「超」は、その数を含まない。例えば「60以上70未満」なら、60は含み、70は含まない。つまり60, 61, 62, ..., 69が対象となる。
Q. 階級値は何に使うのですか?
A. 度数分布表から平均値を計算するときに使う。各階級のデータをすべて階級値で代表させて計算する。元のデータがわからなくても、おおよその平均値が求められる。
練習問題
155, 162, 158, 170, 165, 163, 168, 159, 172, 166
| 階級(点) | 度数 |
|---|---|
| 0以上20未満 | 2 |
| 20以上40未満 | 5 |
| 40以上60未満 | 8 |
| 60以上80未満 | 4 |
| 80以上100未満 | 1 |
まとめ
この記事では、度数分布表の作り方について学んだ。ポイントは以下の通りである。
- 度数分布表は、データを階級に分けて度数を数えたもの
- 「以上」は含み、「未満」は含まない
- 階級の幅はすべて同じにする
- 度数の合計がデータの総数と一致するか必ず確認する
- 階級値は、階級の両端の値を足して2で割る
Core-dorill— 基礎を、何度でも。

コメント