「IT / ICT Glossary」シリーズでは、主に国家資格「ITパスポート(iパス)」に関連した用語を解説致します。
iパスの学習範囲は「企業と法務」など、システム以外の分野も含まれていますので、業種・職種に関わらず、社会生活を送る上で、とても参考になると考えています。
今回のキーワードは「データマイニング」です。
目次
大まかに説明すると
データマイニングとは、統計学や機械学習などの手法を使い、膨大なデータから有益な情報を発掘する技術です。
データを情報、知識へと変化させるDIKWモデルの中で、情報や知識を引き出す役割を担います。
主な手法として、データ同士の関係を分析するマーケット・バスケット分析、似たものを分類するクラスター分析、確率を予測するロジスティック回帰分析、優先順位を決めるABC分析などが挙げられます。
これらはマーケティングや業務効率化に広く活用されています。
データマイニングとは
データマイニングは、英語で「Data Mining」と表記します。
Miningは、採鉱や採掘などを意味する英語です。
その言葉の通り、データマイニングとは、情報を発掘することを指しています。
具体的には、統計学や機械学習、人工知能などの分析手法を活用して、膨大なデータの中から有益な情報を見出していきます。
以前は、データベースからの知識発見(Knowledge Discovery in Databases)とも呼ばれていました。
現在は、両者はほぼ同じ意味で使われるようになっています。
DIKWモデル
データマイニングによって得られる知識は、DIKWモデルと呼ばれています。
DIKWとは、データ(Data)、情報(Information)、知識(Knowledge)、知恵(Wisdom)の頭文字です。
データは収集されたすべての素材、情報はデータを整理したもの、知識は情報によって得られる知見、知恵は知識を使って判断する力のことを指します。
データ→情報→知識→知恵の順番で、有用性の高いものと判断されています。
なお、データマイニングの領域は、データを情報に変化して、知識を引き出すところまでです。
データマイニングの手法
データマイニングにはさまざま手法があります。
代表的な手法は以下の通りです。
マーケット・バスケット分析(アソシエーション分析)
マーケット・バスケット分析は、データ同士の関係性を分析する手法のことです。
アソシエーション分析とも呼ばれています。
コンビニエンスストアのPOSデータの分析でよく用いられている手法でもあります。
ECサイトのレコメンド機能もこの分析が活用されているのです。
クラスター分析
クラスター分析は、調査対象を似たもので分類するなどして分析する手法のことです。
階層クラスター分析や非階層クラスター分析などの種類があります。
ロジスティック回帰分析
ロジスティック回帰分析は、特定の事象が発生する確率を予測する手法のことです。
マーケティングでよく活用されています。
いくつかの要因から、2値の結果が発生する確率を予測することができます。
ABC分析
ABC分析とは、売上高やコストなどの評価軸を定めて、A、B、Cの3つのグループに分けて、優先度を決める手法のことです。
なお、ABCとは、Activity Based Costing(アクティビティ・ベースド・コスティング)を指しています。
本キーワードの関連情報
今回のキーワードは、ITパスポート試験シラバスの、以下カテゴリに分類されています。
試験のご参考にもなれば幸いです。
カテゴリ:ストラテジ系 / 大分類1「企業と法務」 / 中分類1「企業活動」
2. 業務分析・データ利活用
目標「身近な業務を分析し、データの利活用によって問題を解決するための代表的な手法を理解し、活用する。業務を把握する際のビジュアル表現を理解し、活用する。」
説明「身近な業務を把握して分析する手法、代表的なビジュアル表現、データ利活用、OR(Operations Research)及びIE(Industrial Engineering)の手法を理解し、活用する。」
(3) データ利活用
・データを分析して利活用することによる、業務改善や問題解決
③ データサイエンス,ビッグデータ分析
・データの特徴を読み解くことでの,起きている事象の背景や意味合い
・データサイエンスにおける帰納的推論の重要性,及び利点と欠点
参考・引用元資料
【ITパスポート試験】試験内容・出題範囲
https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html
ここまで読んで頂いて、誠にありがとうございます。今後ともどうぞよろしくお願い致します。