《 iパス用語解説》仮説検定とは何か。大まかな説明付き。IT / ICT Glossary「IT担当者からのファーストリポート」

「IT / ICT Glossary」シリーズでは、主に国家資格「ITパスポート(iパス)」に関連した用語を解説致します。

iパスの学習範囲は「企業と法務」など、システム以外の分野も含まれていますので、業種・職種に関わらず、社会生活を送る上で、とても参考になると考えています。

今回のキーワードは「仮説検定」です。

大まかに説明すると

仮説検定は、立てた仮説が正しいかどうかを統計的に検証する方法です。

まず帰無仮説と対立仮説を設定し、有意水準を決定します。有意水準とは、仮説が間違っていると判断する確率の基準で、一般的に0.05が使われます。

次に、データを基に仮説を検証し、結果に基づいて結論を導きます。

ただし、導かれた結論が必ずしも正しいとは限らず、調査方法や状況によって結果に誤差が生じる可能性もあります。

仮説検定とは

仮説検定とは、とある仮説を立てた場合に、その仮説が正しいのか、正しくないのかを統計学的に検証することで、推計統計学の手法の一つに分類されるのです。

検定の手順は、最初に仮説を立てから始まります。

次に、有意水準を設定したうえで、実際に起こった結果を確率的に検証します。

最後に、検証結果から結論を導くという流れです。

有意水準とは、帰無仮説が間違っていると判断する、つまり帰無仮説を棄却する基準となる確率を指します。

また、結論を導く際は背理法が用いられます。

背理法とは、最初に仮説を設定し、仮説が正しいとの前提のもとで考え、矛盾が起きた場合には仮説が間違っていると判断する方法です。

では、仮説検定の流れを見ていきましょう。

仮説の設定

たとえば、このクラスの小学生はみんなから揚げが好きであるという帰無仮説と、それとは相反する対立仮説として、このクラスの小学生はみんなから揚げは好きではないという仮説の両方を用意します。

有意水準の設定

有意水準とは、帰無仮説が間違っていると判断する基準となる確率のことです。

たとえば、有意水準を0.05とすれば、5%以下の確率で生じる現象は、とても稀な現象であることを意味します。

検証

帰無仮説が正しいと仮定したうえで、データが実現する確率を検定統計量にもとづいて検証していきます。

検証は、たとえばアンケート調査を行う方法や給食にから揚げが出た日に残さずすべて食べた人をカウントする方法などが挙げられます。

検定統計量は、平均や偏差を含む公式を用いて、統計学的に計算されるのが基本です。

結論

検証した結果を評価したうえで、設定した有意水準のルールを当てはめます。

設定した有意水準が5%の場合、5%未満になった時は滅多に起こらないことなので、仮説が間違っていると判断されることになります。

逆に、5%以上の確率で起こる場合には滅多にないことではない、許容できる範囲となり、仮説が間違っているとは言えないと判断されるという流れです。

導かれた結論は絶対に正しいわけではない

有意水準を下回れば滅多にないということになりますが、その水準の決め方も正しいかどうかはわかりません。

から揚げは好きか嫌いかの二者択一のアンケート調査は正しいように思えますが、そこまで好きではないけれど嫌いではないから好きという人もいる可能性があります。

給食で残したからといって、その時は体調が悪かった場合や給食のから揚げの味が好きではないのかもしれないですし、すべて食べたからといって好きではない可能性があり、お腹が空いていてほかにおかずがなかったからという理由かもしれません。

今回は単純な事例でしたが、より判断が難しい事例では、有意水準の設定の仕方をはじめ、結論が100%正しいわけではないことも頭に入れておくことが大切です。

本キーワードの関連情報

今回のキーワードは、ITパスポート試験シラバスの、以下カテゴリに分類されています。
試験のご参考にもなれば幸いです。

カテゴリ:ストラテジ系 / 大分類1「企業と法務」 / 中分類1「企業活動」

2. 業務分析・データ利活用

目標「身近な業務を分析し、データの利活用によって問題を解決するための代表的な手法を理解し、活用する。業務を把握する際のビジュアル表現を理解し、活用する。」

説明「身近な業務を把握して分析する手法、代表的なビジュアル表現、データ利活用、OR(Operations Research)及びIE(Industrial Engineering)の手法を理解し、活用する。」

(3) データ利活用

・データを分析して利活用することによる、業務改善や問題解決

② データ分析における統計情報の活用

・データから言えること、データが何を意味するかを適切に把握することの重要性
・扱うデータに関する領域(業界,専門分野など)に特化した知識(ドメイン知識)の重要性
・データの発生現場を確認することの重要性
・文献や現象を読み解き、それらの関係を分析・考察して表現すること

参考・引用元資料

【ITパスポート試験】試験内容・出題範囲
https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html


ここまで読んで頂いて、誠にありがとうございます。今後ともどうぞよろしくお願い致します。

SystemTeams
おすすめの記事