MENU
図やアニメーションが崩れている場合はご連絡ください。

【資料の分析】箱ひげ図の読み取り|複数データの比較【中2数学】【必須】

「箱ひげ図は見たことがあるけれど、2つ並んだ図から何を読み取ればいいのかわからない」と感じたことはないだろうか。

テストでは「どちらのクラスの成績が良いか」「どちらのばらつきが大きいか」といった比較問題がよく出る。しかし、図を見ても何を比べればいいのか迷ってしまう人が多い。

実は、箱ひげ図の比較は「5つの数値」を順番に確認するだけである。この記事では、複数の箱ひげ図を並べて比較する方法を、図解とともに丁寧に解説する。

対象:中学2年 所要時間:約8分
目次

そもそも箱ひげ図とは?

はこひげ図とは、データの分布を「箱」と「ひげ」で表した図である。1つの図に5つの重要な数値が含まれている。

箱ひげ図に含まれる5つの数値

  • 最小値さいしょうち:データの中で最も小さい値
  • 第1四分位数だいいちしぶんいすう(Q1):データを小さい順に並べたとき、下から25%の位置にある値
  • 中央値ちゅうおうち(Q2):データの真ん中の値(50%の位置)
  • 第3四分位数だいさんしぶんいすう(Q3):下から75%の位置にある値
  • 最大値さいだいち:データの中で最も大きい値

箱の左端がQ1、箱の中の線がQ2(中央値)、箱の右端がQ3を表す。ひげは最小値と最大値まで伸びている。

複数の箱ひげ図を比較するポイント

2つ以上の箱ひげ図を比較するとき、次の4つの視点で見るとよい。

1

中央値を比べる

箱の中にある線(中央値)の位置を比べる。中央値が高いほうが、データ全体として「高い傾向」にある。

2

四分位範囲しぶんいはんい(箱の幅)を比べる

箱の横幅は $\text{Q3} – \text{Q1}$ で計算される。この幅が広いほど「データのばらつきが大きい」と言える。

3

範囲はんい(ひげ全体の長さ)を比べる

範囲は $\text{最大値} – \text{最小値}$ で計算される。範囲が広いほど「極端な値を含むばらつきが大きい」と言える。

4

箱の位置のずれを見る

中央値が箱の中央にない場合、データの分布が左右どちらかにかたよっている。

四分位範囲(IQR)とは:$\text{IQR} = \text{Q3} – \text{Q1}$ で計算される。データの「真ん中50%」がどれだけ散らばっているかを示す。範囲より外れ値はずれちの影響を受けにくい指標である。

箱ひげ図の比較を図で理解する

ここでは、AクラスとBクラスのテスト結果を表した箱ひげ図を比較してみよう。

アニメーションでは、まず2つの箱ひげ図を表示し、その後中央値を比較している。

例題:2つのクラスを比較する

上の図から、AクラスとBクラスについて次のことを読み取ってみよう。

1

各クラスの5つの数値を読み取る

AクラスBクラス
最小値35点45点
Q150点60点
中央値65点70点
Q375点80点
最大値95点90点
2

中央値を比べる

Aクラスの中央値は65点、Bクラスは70点である。

Bクラスのほうが全体的に点数が高い傾向にある。

3

四分位範囲を計算して比べる

$$\begin{aligned} \text{Aクラスの四分位範囲} &= 75 – 50 = 25 \text{(点)} \\[8pt] \text{Bクラスの四分位範囲} &= 80 – 60 = 20 \text{(点)} \end{aligned}$$

Aクラスのほうがばらつきが大きい(箱の幅が広い)。

4

範囲を計算して比べる

$$\begin{aligned} \text{Aクラスの範囲} &= 95 – 35 = 60 \text{(点)} \\[8pt] \text{Bクラスの範囲} &= 90 – 45 = 45 \text{(点)} \end{aligned}$$

→ Aクラスは最高点が高いが最低点も低い。Aクラスのほうが極端な値を含む

よくある間違いと対策

1

「箱が大きい=人数が多い」と勘違いする

箱の大きさは「ばらつき」を表しており、人数とは関係ない。箱ひげ図からはデータの個数はわからない。

2

「最大値が大きい=成績が良い」と判断する

最大値は1人だけの値かもしれない。全体の傾向を見るには中央値を比べるほうが適切である。

3

四分位範囲と範囲を混同する

  • 四分位範囲(IQR)= Q3 − Q1(箱の幅)
  • 範囲 = 最大値 − 最小値(ひげ全体)

どちらを問われているか、問題文をよく読むこと。

この単元のよくある質問

Q. 箱ひげ図から平均値はわかりますか?

A. 箱ひげ図からは平均値を読み取ることはできない。箱ひげ図に表されるのは、最小値・第1四分位数・中央値・第3四分位数・最大値の5つだけである。平均値を知りたい場合は、元のデータが必要になる。

Q. 中央値と第1四分位数の間には、データの何%が入っていますか?

A. 約25%のデータが入っている。箱ひげ図では、箱の中に全体の50%(真ん中半分)のデータが入っており、箱は中央値で二等分されている。つまり、Q1〜中央値に25%、中央値〜Q3に25%が含まれる。

Q. 2つの箱ひげ図で箱が重なっている場合、どちらが良いと言えますか?

A. 箱が大きく重なっている場合は「明確な差があるとは言えない」と判断するのが適切である。中央値の位置、四分位範囲、範囲など複数の観点から総合的に比較し、「〜の傾向がある」という表現を使うとよい。

練習問題

次の箱ひげ図は、XチームとYチームの試合での得点を表したものである。

問1. XチームとYチームの中央値をそれぞれ読み取り、どちらのチームのほうが得点が高い傾向にあるか答えよ。
問2. 両チームの四分位範囲を計算し、どちらのチームのほうがばらつきが大きいか答えよ。
問3. 両チームの範囲を計算し、極端な得点を含むばらつきはどちらが大きいか答えよ。

まとめ

この記事では、複数の箱ひげ図を比較する方法を学んだ。ポイントは以下の通りである。

  • 中央値を比べることで、どちらが全体的に高い(または低い)傾向かがわかる
  • 四分位範囲(箱の幅)を比べることで、中央50%のデータのばらつきがわかる
  • 範囲(ひげ全体)を比べることで、極端な値を含む全体のばらつきがわかる
  • 箱ひげ図からは平均値やデータの個数は読み取れない

Core-dorill— 基礎を、何度でも。

コメント

コメントする

目次