テレビの選挙速報で「出口調査の結果、当選確実」と出るのを見たことがあるだろうか。投票が終わる前に、なぜ結果がわかるのか。実は、全員に聞かなくても「一部を調べるだけで全体がわかる」という統計の技術が使われている。
「母集団って何?」「標本との違いがわからない」「無作為抽出ってどういう意味?」——こうした用語に戸惑う人は多い。
これらがわかりにくいのは、日常で使わない専門用語だからである。この記事では、身近な例を使いながら統計の基本用語を順番に解説していく。読み終わる頃には、「なぜ一部を調べるだけで全体がわかるのか」が理解できるようになる。
そもそも母集団と標本とは?
統計で最も大切な2つの用語を、まずはっきりさせよう。
母集団とは
母集団とは、「調べたい対象全体」のことである。
「母」という字は「もとになるもの」という意味で使われている。調査のもとになる集団、だから母集団である。
具体例を見てみよう。
→ 母集団は「日本の中学3年生全員」(約100万人)
→ 母集団は「その工場で作った電球すべて」
→ 母集団は「A市の有権者全員」
標本とは
標本とは、「母集団から選び出した一部分」のことである。
「標本」は英語で sample(サンプル)という。料理の味見をするとき、鍋の中身全部を飲まなくても、一口で味がわかる。その「一口」が標本である。
先ほどの例で標本を考えると、次のようになる。
標本:無作為に選んだ1000人
標本:ランダムに選んだ100個
標本:電話調査で回答した500人
なぜ標本を使うのか?
母集団全体を調べられれば一番正確だが、それができない場合がほとんどである。
| 調査対象 | 全数調査が難しい理由 |
|---|---|
| 中学3年生全員 | 100万人に調査するのは時間と費用がかかりすぎる |
| 電球の寿命 | 全部の電球を点灯させて寿命を測ると、売る電球がなくなる |
| 選挙の出口調査 | 投票した全員に聞く時間がない |
だから、一部(標本)を調べて、全体(母集団)を推測するのである。
母集団と標本の関係を図で理解する
アニメーションを再生すると、母集団の中から標本が選ばれる様子がわかる。青い点は母集団の個体、赤い点は標本として選ばれた個体である。
無作為抽出とは何か
標本を選ぶ方法で最も大切なのが、無作為抽出である。
無作為抽出の意味
「無作為」とは「作為がない」、つまり「意図的に選ばない」という意味である。
抽出は「取り出すこと」。無作為抽出は「ランダムに取り出すこと」と言い換えられる。
なぜ無作為でなければならないのか
偏った選び方をすると、正確な結果が得られない。
→ 背の高い人ばかりになり、平均が高くなりすぎる
→ テレビ好きな人ばかりになり、視聴率が高くなりすぎる
→ 誰が選ばれるかわからないので、偏りがない
無作為抽出の仕組みを図で理解する
アニメーションでは、12人の母集団からランダムに3人を選んでいる。どの番号が選ばれるかは事前にわからない。これが無作為抽出である。
重要用語のまとめ
| 用語 | 意味 | 例 |
|---|---|---|
| 母集団 | 調べたい対象全体 | 日本の中学3年生全員 |
| 標本 | 母集団から選んだ一部 | 無作為に選んだ1000人 |
| 無作為抽出 | 偏りなくランダムに選ぶこと | 乱数で番号を決める |
| 標本調査 | 標本を調べて母集団を推測すること | 視聴率調査、世論調査 |
| 全数調査 | 母集団全体を調べること | 国勢調査 |
よくある間違いと対策
→ 標本の数より、選び方の方が大切。偏った1万人より、無作為の100人の方が正確なことがある。
→ 「母」は「もと」。大きい方、全体が母集団。小さい方、一部が標本。
→ 「適当」ではなく「公平」に選ぶ。人間の「なんとなく」には偏りがあるので、くじ引きや乱数を使う。
この単元のよくある質問
Q. 標本の数(標本の大きさ)はどのくらいあればよいですか?
A. 目安として、母集団の特性を把握するには最低30〜50程度、より正確さを求めるなら数百以上が望ましい。テレビの視聴率調査では約900世帯、選挙の世論調査では1000〜2000人程度が使われることが多い。
Q. 国勢調査は全数調査なのに、なぜ行われるのですか?
A. 国勢調査は「日本に住む全員の正確なデータ」が必要な場面(選挙区の区割り、予算配分など)で使われる。費用と時間はかかるが、推測ではなく確実な数字が求められるため、5年に1度実施されている。
Q. インターネット調査は無作為抽出といえますか?
A. 多くの場合、無作為抽出とはいえない。なぜなら「インターネットを使う人」「その調査サイトを見る人」「回答する気がある人」という時点で、すでに偏りが生じているからである。無作為抽出には、母集団全員に等しく選ばれる可能性がある方法が必要である。
練習問題
「ある中学校の生徒800人の中から、無作為に50人を選んで読書量を調べた。」
ア. 街頭で声をかけやすそうな人に聞く
イ. 名簿の番号を乱数で選ぶ
ウ. 友達に頼んで協力してもらう
エ. くじ引きで当たった人に聞く
まとめ
この記事では、統計の基本用語について学んだ。ポイントは以下の通りである。
- 母集団は「調べたい対象全体」、標本は「選び出した一部」
- 全体を調べられないとき、標本を調べて母集団を推測する(標本調査)
- 無作為抽出は「どの個体も同じ確率で選ばれる方法」で、偏りのない調査に必須
- 標本の数より、選び方(無作為かどうか)の方が重要
これらの用語は、次に学ぶ「標本平均」や「母集団の推定」の土台となる。しっかり区別できるようにしておこう。
Core-dorill— 基礎を、何度でも。

コメント