MENU
図やアニメーションが崩れている場合はご連絡ください。

【資料の分析】母集団と標本|統計の基本用語【中3数学】【必須】

テレビの選挙速報で「出口調査の結果、当選確実」と出るのを見たことがあるだろうか。投票が終わる前に、なぜ結果がわかるのか。実は、全員に聞かなくても「一部を調べるだけで全体がわかる」という統計の技術が使われている。

母集団ぼしゅうだんって何?」「標本ひょうほんとの違いがわからない」「無作為抽出むさくいちゅうしゅつってどういう意味?」——こうした用語に戸惑う人は多い。

これらがわかりにくいのは、日常で使わない専門用語だからである。この記事では、身近な例を使いながら統計の基本用語を順番に解説していく。読み終わる頃には、「なぜ一部を調べるだけで全体がわかるのか」が理解できるようになる。

対象:中学3年 所要時間:約8分
目次

そもそも母集団と標本とは?

統計で最も大切な2つの用語を、まずはっきりさせよう。

母集団とは

母集団とは、「調べたい対象全体」のことである。

「母」という字は「もとになるもの」という意味で使われている。調査のもとになる集団、だから母集団である。

具体例を見てみよう。

例1
「日本の中学3年生全員の平均身長を調べたい」
→ 母集団は「日本の中学3年生全員」(約100万人)
例2
「ある工場で作った電球の寿命を調べたい」
→ 母集団は「その工場で作った電球すべて」
例3
「A市の有権者の支持政党を調べたい」
→ 母集団は「A市の有権者全員」

標本とは

標本とは、「母集団から選び出した一部分」のことである。

「標本」は英語で sample(サンプル)という。料理の味見をするとき、鍋の中身全部を飲まなくても、一口で味がわかる。その「一口」が標本である。

先ほどの例で標本を考えると、次のようになる。

例1
母集団:日本の中学3年生全員(約100万人)
標本:無作為に選んだ1000人
例2
母集団:工場で作った電球すべて
標本:ランダムに選んだ100個
例3
母集団:A市の有権者全員
標本:電話調査で回答した500人

なぜ標本を使うのか?

母集団全体を調べられれば一番正確だが、それができない場合がほとんどである。

調査対象 全数調査が難しい理由
中学3年生全員 100万人に調査するのは時間と費用がかかりすぎる
電球の寿命 全部の電球を点灯させて寿命を測ると、売る電球がなくなる
選挙の出口調査 投票した全員に聞く時間がない

だから、一部(標本)を調べて、全体(母集団)を推測すいそくするのである。

母集団と標本の関係を図で理解する

アニメーションを再生すると、母集団の中から標本が選ばれる様子がわかる。青い点は母集団の個体、赤い点は標本として選ばれた個体である。

無作為抽出とは何か

標本を選ぶ方法で最も大切なのが、無作為抽出である。

無作為抽出の意味

「無作為」とは「作為がない」、つまり「意図的に選ばない」という意味である。

抽出ちゅうしゅつは「取り出すこと」。無作為抽出は「ランダムに取り出すこと」と言い換えられる。

$$\text{無作為抽出} = \text{母集団のどの個体も、同じ確率で選ばれる方法}$$

なぜ無作為でなければならないのか

偏った選び方をすると、正確な結果が得られない。

悪い例1
中学生の平均身長を調べるのに、バスケ部員だけを選ぶ
→ 背の高い人ばかりになり、平均が高くなりすぎる
悪い例2
テレビの視聴率を調べるのに、自分から応募した人だけを調べる
→ テレビ好きな人ばかりになり、視聴率が高くなりすぎる
良い例
くじ引き、乱数表、コンピュータで番号をランダムに選ぶ
→ 誰が選ばれるかわからないので、かたよりがない

無作為抽出の仕組みを図で理解する

アニメーションでは、12人の母集団からランダムに3人を選んでいる。どの番号が選ばれるかは事前にわからない。これが無作為抽出である。

重要用語のまとめ

用語 意味
母集団 調べたい対象全体 日本の中学3年生全員
標本 母集団から選んだ一部 無作為に選んだ1000人
無作為抽出 偏りなくランダムに選ぶこと 乱数で番号を決める
標本調査ひょうほんちょうさ 標本を調べて母集団を推測すること 視聴率調査、世論調査
全数調査ぜんすうちょうさ 母集団全体を調べること 国勢調査

よくある間違いと対策

間違い1
「標本は多ければ多いほどよい」と思っている
→ 標本の数より、選び方の方が大切。偏った1万人より、無作為の100人の方が正確なことがある。
間違い2
「母集団」と「標本」を逆に覚えている
→ 「母」は「もと」。大きい方、全体が母集団。小さい方、一部が標本。
間違い3
「無作為」を「適当に選ぶ」と思っている
→ 「適当」ではなく「公平」に選ぶ。人間の「なんとなく」には偏りがあるので、くじ引きや乱数を使う。

この単元のよくある質問

Q. 標本の数(標本の大きさ)はどのくらいあればよいですか?

A. 目安として、母集団の特性を把握するには最低30〜50程度、より正確さを求めるなら数百以上が望ましい。テレビの視聴率調査では約900世帯、選挙の世論調査では1000〜2000人程度が使われることが多い。

Q. 国勢調査は全数調査なのに、なぜ行われるのですか?

A. 国勢調査は「日本に住む全員の正確なデータ」が必要な場面(選挙区の区割り、予算配分など)で使われる。費用と時間はかかるが、推測ではなく確実な数字が求められるため、5年に1度実施されている。

Q. インターネット調査は無作為抽出といえますか?

A. 多くの場合、無作為抽出とはいえない。なぜなら「インターネットを使う人」「その調査サイトを見る人」「回答する気がある人」という時点で、すでに偏りが生じているからである。無作為抽出には、母集団全員に等しく選ばれる可能性がある方法が必要である。

練習問題

問1. 次の調査について、母集団と標本をそれぞれ答えなさい。
「ある中学校の生徒800人の中から、無作為に50人を選んで読書量を調べた。」
問2. 次のうち、無作為抽出といえるものを選びなさい。
ア. 街頭で声をかけやすそうな人に聞く
イ. 名簿の番号を乱数で選ぶ
ウ. 友達に頼んで協力してもらう
エ. くじ引きで当たった人に聞く
問3. ある湖にいる魚の総数を推定したい。この場合、全数調査と標本調査のどちらが適切か。理由も答えなさい。

まとめ

この記事では、統計の基本用語について学んだ。ポイントは以下の通りである。

  • 母集団は「調べたい対象全体」、標本は「選び出した一部」
  • 全体を調べられないとき、標本を調べて母集団を推測する(標本調査)
  • 無作為抽出は「どの個体も同じ確率で選ばれる方法」で、偏りのない調査に必須
  • 標本の数より、選び方(無作為かどうか)の方が重要

これらの用語は、次に学ぶ「標本平均」や「母集団の推定」の土台となる。しっかり区別できるようにしておこう。

Core-dorill— 基礎を、何度でも。

コメント

コメントする

目次