最頻値(Mode)は、以下のように定義できる。
最頻値を求めるためには、まず度数分布を取る必要がある。
最頻値は、先述の手順で度数分布を求めることによって、cnt[1]に対応する階級から求めることができる。
式(4)に当てはめると、n
= 1に対応する階級の下限点は 2.0
である。配列のそれぞれの値が階級値そのものを示す場合は、これが最頻値となる。
この階級の階級値(級間の中心点) cls_n は次の式で求めることができる。
cls_n[n] = cls_l[n] + cls_width / 2 (5)
よって、n = 1に対応する階級値は 2.5 であり、これを最頻値とする考え方がある。
ところが、間隔尺度・比尺度の場合には、分布が左右対称でない限り式(5)が中心点を示すとは限らない。そこで、これを考慮した最頻値として、以下の定義を用いる。
Mo = cls_l[n] + cls_width * cnt[n+1] / (cnt[n-1] + cnt[n+1]) (6)
式(6)において、
であり、この式に当てはめた場合、最頻値は以下のように求めることができる。
Mo = 2.0 + 1.0 * 1 / (3 + 1) = 2.25
最頻値は、複数出現しないとは限らない。この場合、どちらを代表値として扱うかは、明確な取り決めがなく、ソフトウェアによって異なっているのが実情である。
2008/07/21: 作成