「IT / ICT Glossary」シリーズでは、主に国家資格「ITパスポート(iパス)」に関連した用語を解説致します。
iパスの学習範囲は「企業と法務」など、システム以外の分野も含まれていますので、業種・職種に関わらず、社会生活を送る上で、とても参考になると考えています。
今回のキーワードは「相関係数行列」です。
目次
大まかに説明すると
相関係数は2つの変数間の関係を示す数値で、rで表し、-1から+1の範囲です。
相関行列は複数の変数間の相関係数を表にしたもので、変数間の関係性を分析できます。
これにより、データのパターンを見つけやすく、将来の予測にも役立ちます。
例えば、地域別の売上や利益率、スタッフ数を分析し、経営判断に活用できます。
ただし、多重共線性が発生する場合、標準誤差が大きくなるため注意が必要です。
相関係数とは
相関係数行列を考えるには相関係数と相関行列に分けて考えるとわかりやすいです。
まず、相関係数は、2つの確率変数の間の関係を表す数のことです。
例えば、身長と体重や、地域別のお店の売上と資格取得者数など、2つの測定値などで相関係数を計算することがあります。
2つの測定値(連続型変数または順序尺度)について、直線的な関連の強さを表す係数です。
記号rで表すのが一般的で、rは−1~+1の範囲の値になります。
rが1に近づくほど、正の相関の関係が強くなり、一方が大きくなれば、もう一方の数値も大きくなるといった正の相関関係が強くなる関係性です。
これに対して、rが−1に近づくほど負相関の関係が強くなり、一方が大きくなれば、もう一方の数値は小さくなるなど反対の動きをすることを、負の相関と呼びます。
散布図で表した場合、右上がりになる場合を正の相関がある、右下がりになる場合を負の相関があると言います。
画像出典:複数の変数の関係性を見る - 統計局(https://www.stat.go.jp/naruhodo/10_tokucho/hukusu.html)
なお、相関係数が0に近い場合は、2つの変数には特段の関係はないと見ることが可能です。
また、相関係数はExcelの関数機能を使って、セルに「=CORREL(X,Y)」と入れることによって計算することができます。
相関行列とは
相関行列は、異なる変数の相関係数を表にしたもので、2つ以上の変数がどの程度の強さであるか、どの方向に関連するのかを分析することができます。
データを的確に理解して分析し、それにもとづく意思決定を行いたい場合には、相関行列の読み方と使い方を理解しておかなければなりません。
変数は行と列で表示され、相関係数は表の各セルに示されます。
行列はすべての値の組が、互いにどう関連しているかを示しています。
膨大なデータであっても要約することができ、データのパターンを見つけて表示できるのが大きなメリットです。
相関係数は-1~+1の範囲で示され、+1は完全な正の相関があること、0は変数間に相関がないこと、-1は完全な負の相関であることを示しています。
相関行列からわかること
相関行列を用いることで、2つ以上の変数が互いにどう関連しているか、依存し合っているかを判断することが可能です。
表形式で表示できるので、一目で分析しやすく、パターンを見つけやすくなり、将来どうなるかを予測するのにも役立ちます。
そのため、たとえばチェーン店に関する地域別のお店の売上と利益率とスタッフ数、資格取得者数などの動きなどを分析し、経営者が設備投資の配分や仕入れ先、人員体制などを検討する際に活用することも可能です。
このように、相関行列は、異なる変数が互いにどのように関連しているかを把握するのに役立ち、2つ以上の変数が互いに高い相関を持つ状況を発見することができます。
この状態を多重共線性と呼びますが、標準誤差が大きすぎるという問題が出る場合がある点は注意が必要です。
本キーワードの関連情報
今回のキーワードは、ITパスポート試験シラバスの、以下カテゴリに分類されています。
試験のご参考にもなれば幸いです。
カテゴリ:ストラテジ系 / 大分類1「企業と法務」 / 中分類1「企業活動」
2. 業務分析・データ利活用
目標「身近な業務を分析し、データの利活用によって問題を解決するための代表的な手法を理解し、活用する。業務を把握する際のビジュアル表現を理解し、活用する。」
説明「身近な業務を把握して分析する手法、代表的なビジュアル表現、データ利活用、OR(Operations Research)及びIE(Industrial Engineering)の手法を理解し、活用する。」
(2) 業務分析と業務計画
・業務を分析するための代表的な手法、データの可視化手法。
②図表、グラフによるデータ可視化
・目的に応じた適切な可視化手法の選択による、他者へのデータの説明。
・不適切に作成されたグラフにだまされないこと、及びそのようなグラフを作成しないこ
と。
・データを分析して問題解決や効率化を図るためのツール(ソフトウェアパッケージ)
の活用。
参考・引用元資料
【ITパスポート試験】試験内容・出題範囲
https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html
ここまで読んで頂いて、誠にありがとうございます。今後ともどうぞよろしくお願い致します。