「IT / ICT Glossary」シリーズでは、主に国家資格「ITパスポート(iパス)」に関連した用語を解説致します。
iパスの学習範囲は「企業と法務」など、システム以外の分野も含まれていますので、業種・職種に関わらず、社会生活を送る上で、とても参考になると考えています。
今回のキーワードは「散布図」です。
目次
大まかに説明すると
散布図(さんぷず)は、2種類のデータの関係を調べるために用いられるグラフのことです。
散布図を使うことで、2つのデータの間における分布・相関関係を視覚的に確認することができます。
正の相関では要因が大きくなると特性も大きくなり、負の相関では逆に特性が小さくなります。
散布図の目的は、相関関係を視覚的に把握し、データの影響要因を特定することです。
画像出典:データを散布図または折れ線グラフで表示する - Microsoft サポート(https://support.microsoft.com/ja-jp/office/%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E6%95%A3%E5%B8%83%E5%9B%B3%E3%81%BE%E3%81%9F%E3%81%AF%E6%8A%98%E3%82%8C%E7%B7%9A%E3%82%B0%E3%83%A9%E3%83%95%E3%81%A7%E8%A1%A8%E7%A4%BA%E3%81%99%E3%82%8B-4570a80f-599a-4d6b-a155-104a9018b86e)
散布図とは
散布図とは、縦軸、横軸、点などを用いて、2種類のデータの関係性を示したグラフです。
散布図の特徴は、2種類のデータの相関関係を把握できることです。
相関関係とは、関連性や影響度合いなどを指します。
散布図から読み取れる相関関係は、正の相関、負の相関、無相関の3つです。
正の相関
正の相関は、2つの異なるデータの関連性において、要因が大きくなると、特性も大きくなる関係が見られるデータのことです。
たとえば、気温が高い時期には、冷たいものが食べたくなるため、アイスクリームの売れ行きが伸びやすくなります。
このような関係性は、正の相関があると言えます。
負の相関
負の相関は、2つの異なるデータの関連性において、要因が大きくなると、特性も小さくなる関係が見られるデータのことです。
たとえば、子どもがゲームに夢中になってしまうと、勉強時間が少なくなって成績が下がることがあります。
ゲームで遊ぶ時間と学校の成績は、負の相関があると言えます。
無相関
無相関は、2つの異なるデータの関連性において、要因が大きい場合であっても、小さい場合であっても、特性の傾向ないデータのことです。
たとえば、身長とテストの成績のように関係性が薄そうなケースは無相関と言えます。
散布図の仕組み
散布図には、縦軸と横軸があります。
それぞれの軸に対して別の量をとったうえで、収集したすべてのデータを該当する位置へ配置していきます。
データを配置する際には、縦軸と横軸の交わるところに点をプロットします。
散布図のプロットが右上がりに分布する場合には、正の相関であると言えるでしょう。
反対に、散布図のデプロットが右下がりに分布する場合は、負の相関だと捉えることができます。
正の相関と負の相関のどちらにも該当せず、プロットがさまざまな場所に点在する場合は、無相関であると言えます。
散布図を作成する目的
散布図を作成する目的は、2つの要素の相関関係があるかを把握して分析することです。
散布図を見ることで、データに影響を与えている要因の特定もしやすくなります。
プロットが右肩上がりのグラフは正の相関、右下がりのグラフは負の相関、点在するグラフは無相関といったように、視覚的に把握しやすくすることも、散布図を作成する目的の一つです。
本キーワードの関連情報
今回のキーワードは、ITパスポート試験シラバスの、以下カテゴリに分類されています。
試験のご参考にもなれば幸いです。
カテゴリ:ストラテジ系 / 大分類1「企業と法務」 / 中分類1「企業活動」
2. 業務分析・データ利活用
目標「身近な業務を分析し、データの利活用によって問題を解決するための代表的な手法を理解し、活用する。業務を把握する際のビジュアル表現を理解し、活用する。」
説明「身近な業務を把握して分析する手法、代表的なビジュアル表現、データ利活用、OR(Operations Research)及びIE(Industrial Engineering)の手法を理解し、活用する。」
(2) 業務分析と業務計画
・業務を分析するための代表的な手法、データの可視化手法。
②図表、グラフによるデータ可視化
・目的に応じた適切な可視化手法の選択による、他者へのデータの説明。
・不適切に作成されたグラフにだまされないこと、及びそのようなグラフを作成しないこ
と。
・データを分析して問題解決や効率化を図るためのツール(ソフトウェアパッケージ)
の活用。
参考・引用元資料
【ITパスポート試験】試験内容・出題範囲
https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html
ここまで読んで頂いて、誠にありがとうございます。今後ともどうぞよろしくお願い致します。