《 iパス用語解説》散布図とは何か。大まかな説明付き。IT / ICT Glossary「IT担当者からのファーストリポート」

「IT / ICT Glossary」シリーズでは、主に国家資格「ITパスポート(iパス)」に関連した用語を解説致します。

iパスの学習範囲は「企業と法務」など、システム以外の分野も含まれていますので、業種・職種に関わらず、社会生活を送る上で、とても参考になると考えています。

今回のキーワードは「散布図」です。

大まかに説明すると

散布図(さんぷず)は、2種類のデータの関係を調べるために用いられるグラフのことです。

散布図を使うことで、2つのデータの間における分布・相関関係を視覚的に確認することができます。

正の相関では要因が大きくなると特性も大きくなり、負の相関では逆に特性が小さくなります。

散布図の目的は、相関関係を視覚的に把握し、データの影響要因を特定することです。

画像出典:データを散布図または折れ線グラフで表示する - Microsoft サポート(https://support.microsoft.com/ja-jp/office/%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E6%95%A3%E5%B8%83%E5%9B%B3%E3%81%BE%E3%81%9F%E3%81%AF%E6%8A%98%E3%82%8C%E7%B7%9A%E3%82%B0%E3%83%A9%E3%83%95%E3%81%A7%E8%A1%A8%E7%A4%BA%E3%81%99%E3%82%8B-4570a80f-599a-4d6b-a155-104a9018b86e)

散布図とは

散布図とは、縦軸、横軸、点などを用いて、2種類のデータの関係性を示したグラフです。

散布図の特徴は、2種類のデータの相関関係を把握できることです。

相関関係とは、関連性や影響度合いなどを指します。

散布図から読み取れる相関関係は、正の相関、負の相関、無相関の3つです。

正の相関

正の相関は、2つの異なるデータの関連性において、要因が大きくなると、特性も大きくなる関係が見られるデータのことです。

たとえば、気温が高い時期には、冷たいものが食べたくなるため、アイスクリームの売れ行きが伸びやすくなります。

このような関係性は、正の相関があると言えます。

負の相関

負の相関は、2つの異なるデータの関連性において、要因が大きくなると、特性も小さくなる関係が見られるデータのことです。

たとえば、子どもがゲームに夢中になってしまうと、勉強時間が少なくなって成績が下がることがあります。

ゲームで遊ぶ時間と学校の成績は、負の相関があると言えます。

無相関

無相関は、2つの異なるデータの関連性において、要因が大きい場合であっても、小さい場合であっても、特性の傾向ないデータのことです。

たとえば、身長とテストの成績のように関係性が薄そうなケースは無相関と言えます。

散布図の仕組み

散布図には、縦軸と横軸があります。

それぞれの軸に対して別の量をとったうえで、収集したすべてのデータを該当する位置へ配置していきます。

データを配置する際には、縦軸と横軸の交わるところに点をプロットします。

散布図のプロットが右上がりに分布する場合には、正の相関であると言えるでしょう。

反対に、散布図のデプロットが右下がりに分布する場合は、負の相関だと捉えることができます。

正の相関と負の相関のどちらにも該当せず、プロットがさまざまな場所に点在する場合は、無相関であると言えます。

散布図を作成する目的

散布図を作成する目的は、2つの要素の相関関係があるかを把握して分析することです。

散布図を見ることで、データに影響を与えている要因の特定もしやすくなります。

プロットが右肩上がりのグラフは正の相関、右下がりのグラフは負の相関、点在するグラフは無相関といったように、視覚的に把握しやすくすることも、散布図を作成する目的の一つです。

本キーワードの関連情報

今回のキーワードは、ITパスポート試験シラバスの、以下カテゴリに分類されています。
試験のご参考にもなれば幸いです。

カテゴリ:ストラテジ系 / 大分類1「企業と法務」 / 中分類1「企業活動」

2. 業務分析・データ利活用

目標「身近な業務を分析し、データの利活用によって問題を解決するための代表的な手法を理解し、活用する。業務を把握する際のビジュアル表現を理解し、活用する。」

説明「身近な業務を把握して分析する手法、代表的なビジュアル表現、データ利活用、OR(Operations Research)及びIE(Industrial Engineering)の手法を理解し、活用する。」

(2) 業務分析と業務計画

・業務を分析するための代表的な手法、データの可視化手法。

②図表、グラフによるデータ可視化

・目的に応じた適切な可視化手法の選択による、他者へのデータの説明。
・不適切に作成されたグラフにだまされないこと、及びそのようなグラフを作成しないこ
と。
・データを分析して問題解決や効率化を図るためのツール(ソフトウェアパッケージ)
の活用。

参考・引用元資料

【ITパスポート試験】試験内容・出題範囲
https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html


ここまで読んで頂いて、誠にありがとうございます。今後ともどうぞよろしくお願い致します。

SystemTeams
おすすめの記事