コラム1 平均値と最頻値考察~「平均初婚年齢」と「初婚年齢の最頻値」の間には3歳から4歳の差~

本編 > コラム1 平均値と最頻値考察~「平均初婚年齢」と「初婚年齢の最頻値」の間には3歳から4歳の差~

コラム1

平均値と最頻値考察~「平均初婚年齢」と「初婚年齢の最頻値」の間には3歳から4歳の差~


統計学では、集団の中心的傾向を示す値は「代表値」と呼ばれ、「代表値」には、「平均値」「最頻値」「中央値」がある。「平均値(average)」は、データの合計をデータの個数で割ったもので、「算術平均」ともいう。「最頻値(mode)」は、その値が起こる頻度が最も高い値のことで、最頻値を求めるには、度数分布表1を作成し、度数の最も多い値が「最頻値」となる。「中央値(median)」は、データを値の小さいほうから順に並べたときにちょうど半分にデータを分ける値をいう。

3つの代表値の関係性を見てみると、データの分布が左右対称に近い山形(正規分布)になっていれば、「平均値」、「中央値」、「最頻値」は一致する(図1の左図)。一方、分布に偏りがある場合、「中央値」、「平均値」、「最頻値」はそれぞれ異なった値を取る(図1の右図)。

(図1)データの分布(例)別ウインドウで開きます
(図1)データの分布(例)

一般的には、「平均値」を基準に物事を考える人は少なくない。しかしながら、上記の図のとおり、「平均値」は、大きな値や小さな値(外れ値)に引っ張られるという特徴があるため、必ずしも実際の姿を正確に表しているわけではないことには留意が必要である。

例えば、「令和2(2020)年の女性の初婚年齢の「平均値」は29.4歳であった」と聞くと、30歳前後で結婚した人が多かったように感じるが、実際に令和2(2020)年の女性の婚姻件数の年齢別の状況を見ると、婚姻が最も多かった年齢(初婚年齢の「最頻値」)2は26歳であり、27歳以降は、年齢が上がるごとに婚姻件数が大きく減少している。男性についても同様の傾向が見られ、令和2(2020)年の初婚年齢の「平均値」は31.0歳、初婚年齢の「最頻値」は27歳であり、初婚年齢の「平均値」と、初婚年齢の「最頻値」の間に女性は約3歳、男性は約4歳の差があった。なお、初婚年齢の「平均値」と「最頻値」の間にかい離が生じた理由は、一部の中高齢者の結婚が「平均値」を大きく引き上げているためである。また、平均初婚年齢時点で、初婚の男女の7割近くが既に結婚している。

(図2)年齢別初婚件数(令和2(2020)年)別ウインドウで開きます
(図2)年齢別初婚件数(令和2(2020)年)

(図2)[CSV形式:2KB]CSVファイル

平均初婚年齢と同様に、「令和2(2020)年の平均寿命は女性87.71歳、男性81.56歳」という数字も、老後の生活設計を行う際のベンチマークとしてしばしば参照されている。しかし、令和2(2020)年に生命表上で死亡する人が最も多い年齢(死亡年齢の「最頻値」)は、女性93歳、男性88歳であり、「平均値」と「最頻値」の間には、女性で約5歳、男性で約6歳の差がある。社会保障制度の設計や、政策立案を行う際には、人々のライフイベントに関する分布を考慮して、適切な統計データを把握することが必要不可欠である。

(図3)年齢別死亡件数(令和2(2020)年)別ウインドウで開きます
(図3)年齢別死亡件数(令和2(2020)年)

(図3)[CSV形式:2KB]CSVファイル

1データがどのように散らばっているかを示す表であり、値自身や値の階級に対して、その範囲にいくつデータがあるかの頻度(度数)を表したものをいう。

2初婚のうち、婚姻件数が最も多かった年齢(厚生労働省「人口動態統計」)。