分析手法・データ出典・制作者について
本プロジェクトは、総務省統計局が提供する e-Stat API から国勢調査データを取得し、 複数の統計モデルを用いて日本の都道府県別人口を 2050 年まで予測するデータ分析ポートフォリオです。
都道府県別の人口ピラミッドと総人口推移をインタラクティブなビジュアライゼーションで表現し、 データアナリストとしての技術力(API データ取得・統計モデリング・Web 可視化)を示しています。
国勢調査5年ごとの「コーホート変化率」(同一年齢集団の5年間の変化)を過去3期間の平均から算出し、 2020年を起点に2050年まで投影します。出生は CWR(幼児女性比)、高齢者は 85+ の特別処理を行います。 国立社会保障・人口問題研究所(社人研)が採用する手法と同原理で、本プロジェクトの主要推計として使用しています。
Facebook(現 Meta)が開発した時系列予測ライブラリ。都道府県別の総人口トレンドを Prophet で予測し、 2020年の年齢構成比を使って年齢別人口に分配します。変化点を3ヶ所に限定(changepoint_prior_scale=0.05)し、 過学習を抑えています。
ARIMA(1,1,0) を用いた時系列予測。データ点数が少ない(7点)ため自由度の低いモデルを選択。 定数予測に落ちる場合は直近3期間のトレンド外挿にフォールバックします。 Prophet と同様に年齢構成比で分配します。
1990〜2010年で学習し、2015年・2020年の実績値と比較するバックテストを実施しました。
| 指標 | 値 | 説明 |
|---|---|---|
| MAPE(平均絶対誤差率)平均 | 約 2〜4% | 都道府県×年の平均誤差率 |
| RMSE | 約 3〜8 万人 | 二乗平均平方根誤差 |
| 社人研比(2050年) | ±5〜15% | 都道府県によりばらつきあり |
※ コーホート要因法は直近の変化率トレンドを外挿するため、急激な人口変動(震災後の転出など)には対応が困難です。
| データ | 提供元 | 期間 |
|---|---|---|
| 国勢調査 人口・年齢(5歳階級)・男女別 | 総務省統計局 / e-Stat API(統計表 0003410381) | 1990〜2020年(5年毎) |
| 将来推計人口(参考値) | 国立社会保障・人口問題研究所(社人研) 日本の将来推計人口(令和5年推計)出生中位・死亡中位 |
2025〜2050年 |
| 都道府県別将来推計(参考値) | 社人研「日本の地域別将来推計人口(令和5年推計)」 | 2050年 |
慶應義塾大学法学部卒業。広告代理店勤務を経て 2008年に株式会社ダイアローグ研究所を設立。Eコマース・マーケティング・業務アプリ開発のコンサルティングを行う傍ら、 データ分析スキルを体系的に習得し、データドリブンな意思決定支援を提供しています。