最頻値

概要

最頻値(Mode)は、以下のように定義できる。

最頻値を求めるためには、まず度数分布を取る必要がある。

　最頻値は、先述の手順で度数分布を求めることによって、cnt[1]に対応する階級から求めることができる。
　式(4)に当てはめると、n = 1に対応する階級の下限点は 2.0 である。配列のそれぞれの値が階級値そのものを示す場合は、これが最頻値となる。

この階級の階級値（級間の中心点） cls_n は次の式で求めることができる。

cls_n[n] = cls_l[n] + cls_width / 2 (5)

よって、n = 1に対応する階級値は 2.5 であり、これを最頻値とする考え方がある。

　ところが、間隔尺度・比尺度の場合には、分布が左右対称でない限り式(5)が中心点を示すとは限らない。そこで、これを考慮した最頻値として、以下の定義を用いる。

Mo = cls_l[n] + cls_width * cnt[n+1] / (cnt[n-1] + cnt[n+1]) (6)

式(6)において、

であり、この式に当てはめた場合、最頻値は以下のように求めることができる。

Mo = 2.0 + 1.0 * 1 / (3 + 1) = 2.25

最頻値は、複数出現しないとは限らない。この場合、どちらを代表値として扱うかは、明確な取り決めがなく、ソフトウェアによって異なっているのが実情である。

2008/07/21: 作成