テストの点数を見て「自分は真ん中くらいかな?」と思ったことはないだろうか。しかし「真ん中」にもいろいろな意味がある。
平均点と自分の点数を比べても、データ全体の中で自分がどのあたりにいるのかはわかりにくい。「上位何%くらい?」「下から数えてどのあたり?」という疑問に答えるには、別の道具が必要である。
その道具が四分位数である。データを4つのグループに分ける境目の値を知れば、自分の位置がはっきりわかる。この記事では、四分位数の求め方を手順通りに解説する。
そもそも四分位数とは?
四分位数とは、データを小さい順に並べたとき、全体を4等分する位置にある値のことである。
四分位とは「4つに分ける」という意味である。データを25%ずつの4つのグループに分ける境目が四分位数である。
四分位数には3つの種類がある。
| 名前 | 記号 | 意味 |
|---|---|---|
| 第1四分位数 | $Q_1$ | 下から25%の位置にある値 |
| 第2四分位数 | $Q_2$ | 下から50%の位置にある値(中央値と同じ) |
| 第3四分位数 | $Q_3$ | 下から75%の位置にある値 |
例えば、クラス40人のテストで第3四分位数が80点なら、「80点以上の人は上位25%(10人)」ということがわかる。
四分位数を図で理解する
9人のデータを例に、四分位数がどの位置にあるかを見てみよう。
このように、四分位数はデータを4つのグループに分ける「境目」の値である。
四分位数の求め方【手順】
四分位数を求める手順は、データの個数が奇数か偶数かで少し異なる。まずは奇数個の場合から見ていこう。
データが奇数個の場合
9個のデータ「23, 35, 42, 48, 55, 61, 68, 74, 89」で四分位数を求める。
データを小さい順に並べる
すでに並んでいる:23, 35, 42, 48, 55, 61, 68, 74, 89
中央値(第2四分位数)を求める
9個のデータの真ん中は5番目である。
中央値より小さいグループで中央値を求める → 第1四分位数
中央値(55)より小さいデータ:23, 35, 42, 48(4個)
4個の中央値は、2番目と3番目の平均である。
中央値より大きいグループで中央値を求める → 第3四分位数
中央値(55)より大きいデータ:61, 68, 74, 89(4個)
4個の中央値は、2番目と3番目の平均である。
データが奇数個のとき、中央値($Q_2$)は前半・後半どちらのグループにも含めない。
データが偶数個の場合
8個のデータ「15, 28, 36, 45, 52, 63, 77, 84」で四分位数を求める。
データを小さい順に並べる
すでに並んでいる:15, 28, 36, 45, 52, 63, 77, 84
中央値(第2四分位数)を求める
8個のデータの中央値は、4番目と5番目の平均である。
前半グループで中央値を求める → 第1四分位数
前半(1〜4番目):15, 28, 36, 45
4個の中央値は、2番目と3番目の平均である。
後半グループで中央値を求める → 第3四分位数
後半(5〜8番目):52, 63, 77, 84
4個の中央値は、2番目と3番目の平均である。
データが偶数個のとき、前半と後半でデータをちょうど半分に分ける。
四分位数の求め方を図で確認する
奇数個と偶数個で、どのようにグループを分けるかを図で確認しよう。
ポイントは次の2つである。
- 奇数個:中央値を除いた前半・後半でそれぞれ中央値を求める
- 偶数個:ちょうど半分に分けた前半・後半でそれぞれ中央値を求める
よくある間違いと対策
四分位数を求めるときに、多くの人がつまずくポイントを3つ紹介する。
データを並べ替え忘れる
四分位数を求める前に、必ずデータを小さい順に並べる。並べ替えずに計算すると、まったく違う答えになる。
奇数個のとき、中央値を前半・後半に含めてしまう
9個のデータなら、中央値(5番目)は前半にも後半にも含めない。前半は1〜4番目、後半は6〜9番目である。
偶数個のとき、中央値を計算し忘れる
偶数個のデータでは、第2四分位数(中央値)も2つの値の平均で求める必要がある。
この単元のよくある質問
Q. 四分位数と中央値は何が違うのですか?
A. 中央値はデータの真ん中の値で、第2四分位数($Q_2$)と同じである。四分位数は中央値に加えて、下位25%の位置($Q_1$)と上位25%の位置($Q_3$)も表す。つまり、四分位数は中央値を含む3つの値のセットである。
Q. 四分位数が小数になることはありますか?
A. ある。2つの値の平均を求める場面では、小数になることが多い。例えば、35と42の平均は38.5である。小数になっても、そのまま答えとして使う。
Q. 四分位数は何に使うのですか?
A. データのばらつきを調べるのに使う。特に「四分位範囲」($Q_3 - Q_1$)は、データの中央50%がどれくらい広がっているかを示す。また、箱ひげ図を描くときにも四分位数を使う。
練習問題
12, 18, 25, 31, 37, 42, 56
5, 9, 14, 20, 28, 35, 41, 50, 62, 78
72, 45, 88, 53, 67, 91, 38, 60
まとめ
この記事では、四分位数の意味と求め方を学んだ。ポイントは以下の通りである。
- 四分位数はデータを4等分する3つの値($Q_1$, $Q_2$, $Q_3$)である
- 第2四分位数($Q_2$)は中央値と同じである
- 奇数個のデータでは、中央値を除いた前半・後半でそれぞれ中央値を求める
- 偶数個のデータでは、ちょうど半分に分けた前半・後半でそれぞれ中央値を求める
- データを小さい順に並べることを忘れない
Core-dorill— 基礎を、何度でも。

コメント