ヒストグラムの山の形、なんとなく眺めているだけになっていないだろうか。
「分布の形を説明しなさい」と言われても、どう言葉にすればいいかわからない。そんな悩みを抱えている人は多い。
実は、度数折れ線という道具を使えば、分布の形を「見える化」し、比較や説明がぐっと楽になる。この記事では、ヒストグラムから度数折れ線を作る方法と、分布の形を読み取るコツを順を追って解説する。
そもそも度数折れ線とは?
度数折れ線とは、ヒストグラムの各階級の度数を折れ線グラフで表したものである。
階級とは、データを区切った範囲のことである。例えば「0点以上10点未満」「10点以上20点未満」のように分けた各区間を階級と呼ぶ。
度数とは、その階級に入っているデータの個数のことである。
具体的には、ヒストグラムの各柱の上辺の中点を線で結んだものが度数折れ線である。
度数折れ線を使うと、次のようなメリットがある。
- 分布の形(山型、左右対称かどうかなど)が一目でわかる
- 複数のデータを重ねて比較しやすい
- 分布の傾向を言葉で説明しやすくなる
度数折れ線を図で理解する
ヒストグラムから度数折れ線がどのように作られるか、アニメーションで確認しよう。
アニメーションで見たように、度数折れ線は次の手順で作る。
- ヒストグラムの各柱の上辺の中点に印をつける
- その中点を順番に直線で結ぶ
- 両端は度数0の位置(x軸上)まで線を伸ばす
度数折れ線の作り方
具体的なデータを使って、度数折れ線を作る手順を確認しよう。
例題:次の度数分布表から度数折れ線をかけ。
| 階級(点) | 度数(人) | 階級値(点) |
|---|---|---|
| 0以上〜10未満 | 3 | 5 |
| 10以上〜20未満 | 7 | 15 |
| 20以上〜30未満 | 12 | 25 |
| 30以上〜40未満 | 8 | 35 |
| 40以上〜50未満 | 5 | 45 |
階級値とは、各階級の真ん中の値である。例えば「0以上〜10未満」の階級値は $(0 + 10) \div 2 = 5$ となる。
横軸に階級値、縦軸に度数をとる
横軸は階級の幅ごとに目盛りをつける。今回は0, 10, 20, 30, 40, 50である。
各階級値の位置に、度数の高さで点をとる
階級値5のところに度数3、階級値15のところに度数7、のように点を打つ。
点を直線で結ぶ
打った点を左から順に直線で結んでいく。
両端を軸まで伸ばす
最初の点の左と最後の点の右に、度数0の点(軸上)を追加して結ぶ。これにより、折れ線が閉じた形になる。
分布の形を読み取る
度数折れ線を見ると、分布の形がひと目でわかる。よく出てくる分布の形を覚えておこう。
左右対称型
山の頂点が中央にあり、左右がほぼ同じ形をしている。テストの点数などでよく見られる。平均値と中央値がほぼ一致する。
右に偏った型(右すそ型)
山が左寄りにあり、右側に長くすそが伸びている。高い値が少数いる分布。例えば、年収のデータなど。
左に偏った型(左すそ型)
山が右寄りにあり、左側に長くすそが伸びている。低い値が少数いる分布。
2つのデータを比較する
度数折れ線の最大の利点は、複数のデータを重ねて比較できることである。
この図から次のことが読み取れる。
- Aクラス(青)は40〜50点に山の頂点があり、中央付近に集まっている
- Bクラス(赤)は50〜60点に山の頂点があり、Aクラスより右寄りの分布である
- Bクラスの方が全体的に点数が高い傾向にある
このように、度数折れ線を重ねることで、2つのデータの違いを視覚的に比較できる。
よくある間違いと対策
柱の端で点をとってしまう
度数折れ線の点は、柱の上辺の「中点」にとる。端ではないので注意。階級値(階級の真ん中の値)の位置に点を打つと覚えよう。
両端を軸まで伸ばし忘れる
折れ線の両端は、データがない範囲まで伸ばして度数0の位置(x軸上)で終わらせる。これを忘れると、折れ線が途中で切れた形になる。
ヒストグラムと度数折れ線を混同する
ヒストグラムは「棒グラフ」、度数折れ線は「折れ線グラフ」である。度数折れ線はヒストグラムの情報を折れ線で表したものだが、見た目は全く異なる。
この単元のよくある質問
Q. 度数折れ線とヒストグラム、どちらを使えばよいですか?
A. 1つのデータの分布を見たいときはヒストグラム、複数のデータを比較したいときは度数折れ線が便利である。度数折れ線は線で表すため、重ねても見やすいという利点がある。
Q. 階級の幅が違うデータ同士は比較できますか?
A. 階級の幅が違うと、度数折れ線で比較しても正確な比較にならない。比較するときは、同じ階級の幅でデータを整理し直す必要がある。
Q. 度数折れ線の山が2つあるときはどう解釈しますか?
A. 山が2つある分布を「二峰性(にほうせい)の分布」と呼ぶ。これは、データが2つのグループに分かれている可能性を示している。例えば、男女混合のデータで身長を調べると、男子と女子で別々の山ができることがある。
練習問題
| 階級(cm) | 度数(人) |
|---|---|
| 140以上〜150未満 | 4 |
| 150以上〜160未満 | 9 |
| 160以上〜170未満 | 7 |
| 170以上〜180未満 | 3 |
まとめ
この記事では、度数折れ線について学んだ。ポイントは以下の通りである。
- 度数折れ線は、ヒストグラムの各柱の上辺の中点を結んだ折れ線グラフである
- 両端は度数0の位置(x軸上)まで線を伸ばす
- 分布の形には「左右対称型」「右に偏った型」「左に偏った型」がある
- 複数のデータを重ねて比較できるのが度数折れ線の大きな利点である
Core-dorill— 基礎を、何度でも。

コメント