《 iパス用語解説》箱ひげ図とは何か。大まかな説明付き。IT / ICT Glossary「IT担当者からのファーストリポート」

「IT / ICT Glossary」シリーズでは、主に国家資格「ITパスポート(iパス)」に関連した用語を解説致します。

iパスの学習範囲は「企業と法務」など、システム以外の分野も含まれていますので、業種・職種に関わらず、社会生活を送る上で、とても参考になると考えています。

今回のキーワードは「箱ひげ図」です。

大まかに説明すると

箱ひげ図はデータのばらつきをグラフで示し、中央値や四分位数、最大値・最小値を見ることができます。

データの散らばりや外れ値が一目で分かり、データの偏りも把握しやすいです。

ヒストグラムと比べて複数のデータを比較するのに適しており、会社の売上など複数のデータを分析する際に有用です。

画像出典:箱ひげ図を作成する - Microsoft サポート(https://support.microsoft.com/ja-jp/office/%E7%AE%B1%E3%81%B2%E3%81%92%E5%9B%B3%E3%82%92%E4%BD%9C%E6%88%90%E3%81%99%E3%82%8B-62f4219f-db4b-4754-aca8-4743f6190f0d)

データのばらつき具合を視覚的に把握する際に役立つ箱ひげ図とは

箱ひげ図は、アメリカの数学者であるジョン・テューキーによって生み出されました。

テューキーは、仮設検定と呼ばれる統計手法が主体であった当時にデータそのものを見ることに重要性を感じ、この箱ひげ図という統計手法を生み出したと言われています。

この箱ひげ図は、近年中学校2年生で学ぶので、学生の方はご存知の方も多いのではないでしょうか。

箱ひげ図は、データのばらつき具合を箱と髭によって表したグラフであり、データがどの辺の値に集中しているかどうかを一目で把握することができるものです。

つまりデータの可視化に役立つグラフと言えるでしょう。

四角い箱の上下に髭のようなものが生えている形をしたグラフで示します。

箱ひげ図では、中央値、最小値と最大値、四分位範囲、四分位数、外れ値があり、これらを駆使してグラフを作成していきます。

まず値は髭の上側にある末端部分が最大値、反対に下側にある末端部分が最小値です。

四分位数とは、データを4等分した際の3つの区切りとなる値を指しており、小さいほうから第1四分位数、第2四分位数、第3四分位数と表しています。

箱における横線が50%目のデータの場合、第2四分位数である中央値を指し、箱の上底が75%目のデータの第3四分位数、箱の下底が25%目のデータの第1四分位数を指すことになるのです。

四分位数を求めるには、まずは50%目のデータの中央値を求めてから、データを2つに分け、最後に分けたデータのそれぞれの中央値を求めることで、第1四分位数と第3四分位数を求めます。

外れ値は、箱部分にも髭部分にも属さない箇所に点が表示されるもので、いわゆるノイズのようなデータにあたると言えるでしょう。

箱ひげ図を活用するメリット

箱ひげ図は、データを視覚的に確認することができるので、最大値や最小値のみならず四分位数などを一目で把握することができます。

また、データは4等分にして作成されているので、おおよその散らばり具合を確認できるというのも箱ひげ図を活用するメリットです。

区分の幅が狭くなるほどデータが密集しており、区分の幅が広くなるほど密度が小さくなるのでデータは密集していないことが一目で理解できるのです。

データの偏りがわかりやすいといった点でも使いやすい図だと言えるでしょう。

ヒストグラムでも、データのばらつき具合を可視化できるのですが、基本一つのデータのみになるので、複数のデータのばらつきを比較したい時には箱ひげ図が役立ちます。

そのため、たとえば会社全体の売上のばらつきを把握するために最適で、本社、各支社における売上のばらつきを並べて把握し、売上データ分析するにも役立ちます。

本キーワードの関連情報

今回のキーワードは、ITパスポート試験シラバスの、以下カテゴリに分類されています。
試験のご参考にもなれば幸いです。

カテゴリ:ストラテジ系 / 大分類1「企業と法務」 / 中分類1「企業活動」

2. 業務分析・データ利活用

目標「身近な業務を分析し、データの利活用によって問題を解決するための代表的な手法を理解し、活用する。業務を把握する際のビジュアル表現を理解し、活用する。」

説明「身近な業務を把握して分析する手法、代表的なビジュアル表現、データ利活用、OR(Operations Research)及びIE(Industrial Engineering)の手法を理解し、活用する。」

(2) 業務分析と業務計画

・業務を分析するための代表的な手法、データの可視化手法。

②図表、グラフによるデータ可視化

・目的に応じた適切な可視化手法の選択による、他者へのデータの説明。
・不適切に作成されたグラフにだまされないこと、及びそのようなグラフを作成しないこ
と。
・データを分析して問題解決や効率化を図るためのツール(ソフトウェアパッケージ)
の活用。

参考・引用元資料

【ITパスポート試験】試験内容・出題範囲
https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html


ここまで読んで頂いて、誠にありがとうございます。今後ともどうぞよろしくお願い致します。

SystemTeams
おすすめの記事