「IT / ICT Glossary」シリーズでは、主に国家資格「ITパスポート(iパス)」に関連した用語を解説致します。
iパスの学習範囲は「企業と法務」など、システム以外の分野も含まれていますので、業種・職種に関わらず、社会生活を送る上で、とても参考になると考えています。
今回のキーワードは「精度と偏り」です。
目次
大まかに説明すると
業務分析ではデータの精度を保つことが重要です。
データの鮮度や適切な加工が精度向上に役立ち、古いデータや不明確なデータを使うと精度が低下します。
また、データ分析における偏りには偶然誤差と系統誤差があり、偶然誤差はサンプルサイズや測定回数を増やすことで改善できますが、系統誤差は対象者の性質や測定方法に依存するため、サンプルを増やしても改善できません。
分析の信頼性を高めるためには、この偏りに注意することが必要です。
データ分析精度の重要性
業務分析は、1回行えばいいものではなく、顧客分析や財務分析、ECサイトの利用データ分析など、継続的に行っていく必要があります。
そのため、データ分析の精度を保ち続けることがとても大切です。
データ分析の精度を保つためには、データの鮮度とデータを利活用する際の適切な加工などが大きく影響します。
データの鮮度とはデータの新しさです。
データは生ものであり、生きもののような存在で、収集されるデータは日々変化するはずです。
そのため、古いデータを使い回すことや対象が不明確なデータを用いると精度が低くなります。
データの鮮度が高いほど、分析対象の現在の姿を的確に捉えることができるので、精度を高めるのに役立ちます。
データの精度を高めるには、新しいデータを用いるのにとどまらずデータの加工も重要です。
データの加工はデータ分析の前処理として必要な工程であり、条件に合わないデータを除去することやデータを集計するなど、データ分析をしやすい形にすることです。
データ分析における偏り
データ分析における偏りとは、データの分類を行う際に予測したい項目に含まれる値の出現頻度に大きな偏りが生じた状態を指します。
偏りには大きく2種類あります。
1つは偶然誤差、もう1つは系統誤差です。
偶然誤差とは
偶然誤差とは、データ収集時の偶然がもたらす値のばらつきのことを指します。
調査対象者の数が少ないなど、サンプルサイズが小さい場合をはじめ、測定回数が少ない場合に偶然誤差が生じやすくなります。
偶然誤差による偏りを防ぐには、調査対象者数や測定回数を増やすことで改善が可能です。
系統誤差とは
系統誤差とは、特定の収集対象者の性質や測定方法が影響して生じる誤差です。
偶然誤差とは異なり、調査対象者数や測定回数をいかに増やしても改善することはできません。
たとえば、男性と女性でデータの性質が違うとして、母集団の割合は男女のデータ数が同等であることを目標とした場合に、有効回答数の割合が男4対女6など、構成比が目標の割合と異なってしまうと、系統誤差が生じてしまいます。
系統誤差が生じると、全体のデータ傾向が本来捉えたいものから乖離してしまうので注意しなくてはなりません。
系統誤差とサンプルサイズ
偶然誤差は、サンプルサイズが大きくなれば小さくすることは可能ですが、系統誤差はサンプルサイズをいくら増やしても改善することはできません。
なぜなら、データの性質に差があるためです。
先の例のように男性と女性で性質が違う場合に、男性のデータをいくらたくさん集めたところで誤差の改善にはなりません。
本キーワードの関連情報
今回のキーワードは、ITパスポート試験シラバスの、以下カテゴリに分類されています。
試験のご参考にもなれば幸いです。
カテゴリ:ストラテジ系 / 大分類1「企業と法務」 / 中分類1「企業活動」
2. 業務分析・データ利活用
目標「身近な業務を分析し、データの利活用によって問題を解決するための代表的な手法を理解し、活用する。業務を把握する際のビジュアル表現を理解し、活用する。」
説明「身近な業務を把握して分析する手法、代表的なビジュアル表現、データ利活用、OR(Operations Research)及びIE(Industrial Engineering)の手法を理解し、活用する。」
(3) データ利活用
・データを分析して利活用することによる、業務改善や問題解決
② データ分析における統計情報の活用
・データから言えること、データが何を意味するかを適切に把握することの重要性
・扱うデータに関する領域(業界,専門分野など)に特化した知識(ドメイン知識)の重要性
・データの発生現場を確認することの重要性
・文献や現象を読み解き、それらの関係を分析・考察して表現すること
参考・引用元資料
【ITパスポート試験】試験内容・出題範囲
https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html
ここまで読んで頂いて、誠にありがとうございます。今後ともどうぞよろしくお願い致します。