「IT / ICT Glossary」シリーズでは、主に国家資格「ITパスポート(iパス)」に関連した用語を解説致します。
iパスの学習範囲は「企業と法務」など、システム以外の分野も含まれていますので、業種・職種に関わらず、社会生活を送る上で、とても参考になると考えています。
今回のキーワードは「標本抽出」です。
目次
大まかに説明すると
標本調査は、集団全体(母集団)から一部を抽出し、そのデータを基に母集団全体を推測する方法です。
全数調査は集団全体を対象にするため正確ですが、手間やコストがかかります。
標本調査はコスト削減が可能ですが、標本誤差が生じる可能性があります。
標本抽出には、無作為抽出や層別抽出、多段抽出などの方法があり、調査の目的に応じて使い分けます。
国勢調査は全数調査で、標本調査の基礎データとしても重要です。
標本調査について
標本調査とは、ある集団の中から一部の対象者を抽出し、部分集団から得た情報をもとに、ある集団全体の状態を推計する方法です。
調査の対象となる集団全体は母集団と呼ばれ、標本抽出によって抽出された部分集団は標本またはサンプルと呼ばれます。
標本調査の目的は、標本のデータを得るだけでなく、標本から母集団の状況をできるだけ正確に復元推計することです。
そのため、正確な推計結果を得るためにも、標本抽出を行う際には、母集団全体の特徴をよく表したものになるように設定しなくてはなりません。
全数調査と標本調査の違い
標本調査に対して、母集団全体の調査を行う方法を全数調査と呼びます。
日本で5年に一度、定期的に実施されている全国民の情報を調べる国勢調査は全数調査にあたります。
全数調査は、調べたい集団全体を調査するため、誤差なく正確な結果が得られる反面、膨大な手間と時間、コストがかかるのがデメリットです。
これに対して、標本調査は、母集団の一部を抽出して調べるので全数調査に比べると手間やコストを軽減できます。
そのため、一般的な調査は標準調査によって行われています。
もっとも、部分的な調査なので、全数調査に比べ、標本誤差が生じるおそれがあるのがデメリットです。
標本誤差がなるべく小さくなるよう、標本は偏りが生じないようにし、母集団を代表するように行わなくてはなりません。
主な抽出方法として以下があります。
単純無作為抽出
標本抽出の最もスタンダードな方法で、母集団から無作為に抽出します。
単純な方法なので抽出が容易である反面、母集団が大きいほど無作為抽出が難しくなります。
層別抽出
集団を一定の特性にもとづきいくつかの層に分けたうえで、各層から抽出単位や調査対象を抽出する方法です。
年代と性別などで分けたり、都道府県で分けたり、独身、既婚などで分けて、それぞれの層からさらに抽出を行います。
各層の特性に合わせて必要な標本サイズを設定できるので、調査対象が小さくても誤差を小さくすることが期待できます。
一方、特性ごとに分類するための事前情報が必要となり、標本抽出の手間が複雑になるのがデメリットです。
多段抽出
母集団を集落に分割し、さらに複数の段に分けて行う方法です。
たとえば、ある都道府県の中から調査する市区町村をいくつか決め、そこから世帯を抽出して世帯全体に調査を行うような方法です。
調査対象数を減らせるメリットがありますが、抽出の方法が複雑化するのがデメリットになります。
国勢調査
国勢調査は、日本で実施されている最も大規模な全数調査であり、全国結果をはじめ、都道府県別、市町村別、男女別・年齢別などの詳細な結果が公表されます。
手間や時間、コストをかけても、全数調査を実施するのは、標本調査の抽出をする際のベースとなる指標を提供するためにも欠かせません。
たとえば、集落に分割する際や段や層に分ける際に、どのような指標で分けるのか、全数調査の結果がベースになります。
アンケート調査
アンケート調査は標本調査の一つです。
たとえば、20代女性向けの化粧品開発にあたり、日本の20代女性が求めていることを知りたいという場合、母集団は日本全国の20代女性となりますが、アンケート調査を依頼するために抽出した集団が標本となります。
本キーワードの関連情報
今回のキーワードは、ITパスポート試験シラバスの、以下カテゴリに分類されています。
試験のご参考にもなれば幸いです。
カテゴリ:ストラテジ系 / 大分類1「企業と法務」 / 中分類1「企業活動」
2. 業務分析・データ利活用
目標「身近な業務を分析し、データの利活用によって問題を解決するための代表的な手法を理解し、活用する。業務を把握する際のビジュアル表現を理解し、活用する。」
説明「身近な業務を把握して分析する手法、代表的なビジュアル表現、データ利活用、OR(Operations Research)及びIE(Industrial Engineering)の手法を理解し、活用する。」
(3) データ利活用
・データを分析して利活用することによる、業務改善や問題解決
② データ分析における統計情報の活用
・データから言えること、データが何を意味するかを適切に把握することの重要性
・扱うデータに関する領域(業界,専門分野など)に特化した知識(ドメイン知識)の重要性
・データの発生現場を確認することの重要性
・文献や現象を読み解き、それらの関係を分析・考察して表現すること
参考・引用元資料
【ITパスポート試験】試験内容・出題範囲
https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html
ここまで読んで頂いて、誠にありがとうございます。今後ともどうぞよろしくお願い致します。