✔ 学習ポイント
順序統計量は、データを小さい順に並び替えてから計算する統計量で、中央値、最小値・最大値、四分位数などがあります。
また、四分位範囲(第3四分位数-第1四分位数)は、データの中央50%のばらつきを示す重要な指標です。
中央値、最小値・最大値、四分位数の値を視覚化した箱ひげ図を利用することで、データの中心的な傾向や散らばり具合を視覚的に把握することができます。
四分位数とは何か説明してください。
四分位数とは、データを小さい順に並べたときの25%ごとの区切りとなる値です。第1四分位数、第2四分位数、第3四分位数の3つがあり、第2四分位は中央値と同じです。
第1四分位数と第3四分位数の求め方について、データ個数が奇数・偶数の場合の違いを含めて説明してください。
奇数個の場合、中央値(第2四分位数)を除外し残りを二分し、その中央値を第1・第3四分位数とします。
偶数個の場合、中央値の境界で二分し、それぞれの中央値を第1・第3四分位数とします。四分位範囲とは何か説明してください。
四分位範囲とは、データを小さい順に並べたときの中央50%のデータがある範囲のことです。
四分位範囲は、「第3四分位数-第1四分位数」で求められます。四分位範囲が狭ければ、データの中央部分が密集していることがわかり、広ければ、中央部分が散らばっていることがわかります。
クリック/タップで表示(記事末尾にも設置)
順序統計量とは
順序統計量とは、「データを小さい順に並び替えてから、その情報を利用して計算する統計量(データの特徴を表す値)」のことを指します。
順序統計量には、「中央値」や「最小値・最大値」、「四分位数」などがあります。

中央値は代表値の一種であり、「データを大きさ順に並べたとき、ちょうど真ん中にくるデータの値」を指します。
最小値・最大値はその名の通り、「データ全体のなかで最も小さい値、または、大きい値」のことを指します。
四分位数は、「データを小さい順に並べたとき、25%ごとの区切りとなる値」のことです。中央値や最大値・最小値に比べて、日常的な概念ではないため、次項で詳しく見ていきましょう。
四分位数とは
四分位数とは、データを小さい順に並べたとき、25%ごとの区切りとなる値のことです。
四分位数において、4分割されたデータのうちの最初の区切り(下から25%)が第1四分位数であり、これ以降も25%毎に「第◯四分位数」と呼ばれます。
50%の区切りは第2四分位数と呼び、これは中央値と同じ値です。同じように、75%の区切りを第3四分位数と呼びます。ちなみに、100%の区切りである第4四分位は存在せず、最大値として取り扱います。

四分位数の求め方:データ個数が奇数の場合
中央値(第2四分位数)を求めたあと、中央値より前と後の2つのデータ群にわけます。この際、中央値はデータの群わけから除外します。
その後、それぞれのデータ群のなかの中央値を求めます。前半のデータ群の中央値が第1四分位数、後半のデータ群の中央値が第3四分位数となります。
- データ全体の中央値(第2四分位数)を求める
- 中央値を除いて、中央値より前と後のグループにわける
- 前後それぞれのグループで、さらに中央値を求める
- 前のグループの中央値を第1四分位数、後のグループの中央値を第3四分位数とする
四分位数の求め方:データ個数が偶数の場合
データ個数が偶数のときの中央値(第2四分位数)は、データの中央の2つの値の平均値となります。
例えば、データ個数が10個であれば、5番目と6番目の値の平均値が中央値として求められます。この際、前後のグループわけは、1から5番目のデータまでが前のグループ、6から10番目までのデータが後のグループになります。
つまり、データ個数が奇数の場合と異なり、中央値を除外した群わけを行う必要はありません。
- データ全体の中央値(第2四分位数)を求める
- 中央の2つの値を境に、前と後のグループにわける
- 前後それぞれのグループで、さらに中央値を求める
- 前のグループの中央値を第1四分位数、後のグループの中央値を第3四分位数とする
四分位数はなんの役に立つ?
さて、四分位数がわかると、データの散らばり具合がわかるようになります。
例えば、A組で行ったあるテストの得点データがあり、第1四分位数が60点、第2四分位数が75点、第3四分位数が90点だった場合、以下のことがわかります。
- A組生徒の25%は60点以下
- A組生徒の半数は75点以下
- A組生徒の75%は90点以下
- A組生徒の中央50%は60点〜90点の範囲に収まる(四分位範囲)
このように、四分位数がわかることで、データがどのように分布しているかわかります。特に、大半のデータがどこに位置しているかを示す四分位範囲は、データの傾向を読み取るうえで重要な情報です。
四分位範囲とは
四分位範囲とは、データを小さい順に並べたときの中央50%のデータがある範囲のことです。
四分位範囲は、「第3四分位数-第1四分位数」で求められます。四分位範囲が狭ければ、データの中央部分が密集していることがわかり、広ければ、中央部分が散らばっていることがわかります。
先ほどの例であれば、四分位範囲は「90-60=30」で、A組の中央50%のデータは30点の範囲内に収まっていることがわかります。
四分位範囲でデータの特徴を捉える
四分位範囲を算出することで、他のデータと意味のある比較ができます。
例えば、A組、B組、C組のテストの中央値が同じ75点だったとしても、四分位範囲を考えることでデータの実態が見えてきます。
B組のテストの四分位範囲が15点であれば、B組は大多数の生徒が近い点数を取っていると考えられます。また、C組のテストの四分位範囲が40点であれば、C組の生徒の点数はかなりばらつきがあると考えられます。

このように、データのばらつきがわかると、「B組の生徒は理解度が均一なので、効率よく集団授業を行っていく」「C組の生徒は理解度に大きく差があるため、個別指導に力を入れたほうがよい」「A組は理解度にやや差があるので、集団授業をベースとしつつも個別指導を必要に応じて取り入れる」など、具体的な考察ができるようになります。
箱ひげ図とは
箱ひげ図とは、5数要約から構成されるグラフで、データの中心的な傾向や散らばり具合を視覚的に把握することができます。
ちなみに5数要約とは、「中央値」「第1四分位数」「第3四分位数」「最小値」「最大値」の5つの統計量のことです。

箱
第1四分位数を箱の下辺、第3四分位数を箱の上辺とし、データの中央50%の範囲を示します。この箱の幅が四分位範囲で、データがどれだけ密集しているかを表します。
また、箱の中央にある線は、中央値を示しています。
ひげ
箱の両端から伸びる線で、箱の外にあるデータの範囲を表します。
また、外れ値を表現するかどうかによって、2種類のひげの書き方があります。
- 最大値をひげの上端、最小値をひげの下端とする。
- 四分位範囲の1.5倍以内の最大値をひげの上端、最小値をひげの下端とする。その範囲外の数値は外れ値として、個別に示す。
後者の四分位範囲の1.5倍以内について、例をあげて考えてみましょう。
第1四分位数が60、第3四分位数が90で四分位範囲が30であれば、ひげの長さは上下それぞれで最大「30×1.5=45」となります。つまり、「60-45=15」までにある最小値がひげの下端、「90+45=135」までにある最大値がひげの上端となります。
順序統計量や箱ひげ図で、代表値を適切に解釈する
順序統計量や箱ひげ図は、平均値や中央値といった代表値だけでは見えにくい、データの隠れた実態を明らかにする重要なツールです。
例えば、平均値は外れ値に影響されやすいため、集団の実態を誤って解釈してしまう可能性があります。しかし、順序統計量である四分位数や中央値、そしてそれを視覚化した箱ひげ図を用いることで、データの大部分がどこに集中しているか、そしてどれくらいのばらつきがあるかを正確に把握できます。
代表値は、統計を行う上で最も基本的な統計量ですが、それだけでデータ全体の傾向を解釈するのは誤りの原因となります。傾向を正しく解釈するために、代表値だけでなく、四分位数や箱ひげ図を適切に利用できるようになるのが望ましいでしょう。
問題
四分位数とは何か説明してください。
四分位数とは、データを小さい順に並べたときの25%ごとの区切りとなる値です。第1四分位数、第2四分位数、第3四分位数の3つがあり、第2四分位は中央値と同じです。
第1四分位数と第3四分位数の求め方について、データ個数が奇数・偶数の場合の違いを含めて説明してください。
奇数個の場合、中央値(第2四分位数)を除外し残りを二分し、その中央値を第1・第3四分位数とします。
偶数個の場合、中央値の境界で二分し、それぞれの中央値を第1・第3四分位数とします。四分位範囲とは何か説明してください。
四分位範囲とは、データを小さい順に並べたときの中央50%のデータがある範囲のことです。
四分位範囲は、「第3四分位数-第1四分位数」で求められます。四分位範囲が狭ければ、データの中央部分が密集していることがわかり、広ければ、中央部分が散らばっていることがわかります。
クリック/タップで解答表示
記事をお気に入りに追加






