「IT / ICT Glossary」シリーズでは、主に国家資格「ITパスポート(iパス)」に関連した用語を解説致します。
iパスの学習範囲は「企業と法務」など、システム以外の分野も含まれていますので、業種・職種に関わらず、社会生活を送る上で、とても参考になると考えています。
今回のキーワードは「ビッグデータ」です。
目次
大まかに説明すると
ビッグデータとは、膨大で多様な形式のデータ群を指します。
数テラバイトからペタバイト規模のデータが含まれ、GPSの位置情報やSNSの投稿、監視カメラ映像などが具体例です。
データは「構造化データ」と「非構造化データ」に分類され、活用方法が異なります。
また、ビッグデータの特徴として、膨大な容量(Volume)、多様性(Variety)、高速処理(Velocity)の3つが挙げられ、価値(Value)や正確性(Veracity)を加えた5つのVとして説明される場合もあります。
ビッグデータとは
ビッグデータは、英語で「Big Data」と表記します。
その言葉の通り、巨大なデータ群のことです。
人間がその全体を把握することが難しいくらいに大規模で、多種多様なデータのことを指しています。
ビッグデータの容量の目安は、数テラバイト~数ペタバイトくらいです。
ビッグデータに含まれているデータは、画像データ、動画データ、音声データなどが挙げられます。
そのほかにも、さまざまな形式のデータがビックデータとして存在しており、日常生活の中で次々と生成されているのです。
具体例を挙げると、GPSで収集される位置情報、SNSに投稿されるコメント、監視カメラに録画されている映像データなどがビッグデータに該当します。
ビッグデータの分類について
ビッグデータは、構造化データと非構造化データとに分けることができます。
それぞれ活用方法が異なります。
構造化データ
構造化データとは、表計算ソフトのように行と列を持ち、二次元の表形式になっているデータです。
スキーマオンライトとも呼ばれています。
顧客データ、アンケート結果、アクセスログ、売上データなどが該当します。
非構造化データ
非構造化データとは、表形式への変換が困難なデータのことです。
スキーマオンリードとも呼ばれています。
テキスト、音声、画像、動画、IoTセンサーなど、さまざまなデータが該当します。
データが生成された状態のままで保存されているため、自由な形式で扱えるのがメリットです。
ただし、利用の手間がかかる、ツールの選択肢が少ないといったデメリットもあります。
ビッグデータの特徴と5つのV
ビッグデータには、明確な定義はありません。
ただし、ビッグデータと呼ぶためには、以下の3つの特徴が必要であるという考え方が存在しています。
膨大なデータ容量(Volume)
数テラバイトからペタバイト程度の膨大なデータ容量を持っていること。
多様性(Variety)
列や行などで表されるデータ以外に、位置情報、テキスト形式データ、音声データ、画像データ、動画データなどといった多種多様なデータが存在している。
処理速度(Velocity)
発生の頻度や速度が高く、リアルタイムでのスピーディな処理が必要になる。
これらのビッグデータの特徴は、3つのVとも呼ばれています。
さらにこの3つの特徴に、Value(価値)と Veracity(正確さ)などを加えて、5つのVとする考え方もあります。
本キーワードの関連情報
今回のキーワードは、ITパスポート試験シラバスの、以下カテゴリに分類されています。
試験のご参考にもなれば幸いです。
カテゴリ:ストラテジ系 / 大分類1「企業と法務」 / 中分類1「企業活動」
2. 業務分析・データ利活用
目標「身近な業務を分析し、データの利活用によって問題を解決するための代表的な手法を理解し、活用する。業務を把握する際のビジュアル表現を理解し、活用する。」
説明「身近な業務を把握して分析する手法、代表的なビジュアル表現、データ利活用、OR(Operations Research)及びIE(Industrial Engineering)の手法を理解し、活用する。」
(3) データ利活用
・データを分析して利活用することによる、業務改善や問題解決
③ データサイエンス,ビッグデータ分析
・データの特徴を読み解くことでの,起きている事象の背景や意味合い
・データサイエンスにおける帰納的推論の重要性,及び利点と欠点
参考・引用元資料
【ITパスポート試験】試験内容・出題範囲
https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html
ここまで読んで頂いて、誠にありがとうございます。今後ともどうぞよろしくお願い致します。