「箱ひげ図は見たことがあるけれど、2つ並んだ図から何を読み取ればいいのかわからない」と感じたことはないだろうか。
テストでは「どちらのクラスの成績が良いか」「どちらのばらつきが大きいか」といった比較問題がよく出る。しかし、図を見ても何を比べればいいのか迷ってしまう人が多い。
実は、箱ひげ図の比較は「5つの数値」を順番に確認するだけである。この記事では、複数の箱ひげ図を並べて比較する方法を、図解とともに丁寧に解説する。
そもそも箱ひげ図とは?
箱ひげ図とは、データの分布を「箱」と「ひげ」で表した図である。1つの図に5つの重要な数値が含まれている。
箱ひげ図に含まれる5つの数値
- 最小値:データの中で最も小さい値
- 第1四分位数(Q1):データを小さい順に並べたとき、下から25%の位置にある値
- 中央値(Q2):データの真ん中の値(50%の位置)
- 第3四分位数(Q3):下から75%の位置にある値
- 最大値:データの中で最も大きい値
箱の左端がQ1、箱の中の線がQ2(中央値)、箱の右端がQ3を表す。ひげは最小値と最大値まで伸びている。
複数の箱ひげ図を比較するポイント
2つ以上の箱ひげ図を比較するとき、次の4つの視点で見るとよい。
中央値を比べる
箱の中にある線(中央値)の位置を比べる。中央値が高いほうが、データ全体として「高い傾向」にある。
四分位範囲(箱の幅)を比べる
箱の横幅は $\text{Q3} – \text{Q1}$ で計算される。この幅が広いほど「データのばらつきが大きい」と言える。
範囲(ひげ全体の長さ)を比べる
範囲は $\text{最大値} – \text{最小値}$ で計算される。範囲が広いほど「極端な値を含むばらつきが大きい」と言える。
箱の位置のずれを見る
中央値が箱の中央にない場合、データの分布が左右どちらかに偏っている。
四分位範囲(IQR)とは:$\text{IQR} = \text{Q3} – \text{Q1}$ で計算される。データの「真ん中50%」がどれだけ散らばっているかを示す。範囲より外れ値の影響を受けにくい指標である。
箱ひげ図の比較を図で理解する
ここでは、AクラスとBクラスのテスト結果を表した箱ひげ図を比較してみよう。
アニメーションでは、まず2つの箱ひげ図を表示し、その後中央値を比較している。
例題:2つのクラスを比較する
上の図から、AクラスとBクラスについて次のことを読み取ってみよう。
各クラスの5つの数値を読み取る
| Aクラス | Bクラス | |
|---|---|---|
| 最小値 | 35点 | 45点 |
| Q1 | 50点 | 60点 |
| 中央値 | 65点 | 70点 |
| Q3 | 75点 | 80点 |
| 最大値 | 95点 | 90点 |
中央値を比べる
Aクラスの中央値は65点、Bクラスは70点である。
→ Bクラスのほうが全体的に点数が高い傾向にある。
四分位範囲を計算して比べる
→ Aクラスのほうがばらつきが大きい(箱の幅が広い)。
範囲を計算して比べる
→ Aクラスは最高点が高いが最低点も低い。Aクラスのほうが極端な値を含む。
よくある間違いと対策
「箱が大きい=人数が多い」と勘違いする
箱の大きさは「ばらつき」を表しており、人数とは関係ない。箱ひげ図からはデータの個数はわからない。
「最大値が大きい=成績が良い」と判断する
最大値は1人だけの値かもしれない。全体の傾向を見るには中央値を比べるほうが適切である。
四分位範囲と範囲を混同する
- 四分位範囲(IQR)= Q3 − Q1(箱の幅)
- 範囲 = 最大値 − 最小値(ひげ全体)
どちらを問われているか、問題文をよく読むこと。
この単元のよくある質問
Q. 箱ひげ図から平均値はわかりますか?
A. 箱ひげ図からは平均値を読み取ることはできない。箱ひげ図に表されるのは、最小値・第1四分位数・中央値・第3四分位数・最大値の5つだけである。平均値を知りたい場合は、元のデータが必要になる。
Q. 中央値と第1四分位数の間には、データの何%が入っていますか?
A. 約25%のデータが入っている。箱ひげ図では、箱の中に全体の50%(真ん中半分)のデータが入っており、箱は中央値で二等分されている。つまり、Q1〜中央値に25%、中央値〜Q3に25%が含まれる。
Q. 2つの箱ひげ図で箱が重なっている場合、どちらが良いと言えますか?
A. 箱が大きく重なっている場合は「明確な差があるとは言えない」と判断するのが適切である。中央値の位置、四分位範囲、範囲など複数の観点から総合的に比較し、「〜の傾向がある」という表現を使うとよい。
練習問題
次の箱ひげ図は、XチームとYチームの試合での得点を表したものである。
まとめ
この記事では、複数の箱ひげ図を比較する方法を学んだ。ポイントは以下の通りである。
- 中央値を比べることで、どちらが全体的に高い(または低い)傾向かがわかる
- 四分位範囲(箱の幅)を比べることで、中央50%のデータのばらつきがわかる
- 範囲(ひげ全体)を比べることで、極端な値を含む全体のばらつきがわかる
- 箱ひげ図からは平均値やデータの個数は読み取れない
Core-dorill— 基礎を、何度でも。

コメント