日本の人口動態予測 Population Forecast Japan 1990–2050

プロジェクトについて

分析手法・データ出典・制作者について

プロジェクト概要

本プロジェクトは、総務省統計局が提供する e-Stat API から国勢調査データを取得し、 複数の統計モデルを用いて日本の都道府県別人口を 2050 年まで予測するデータ分析ポートフォリオです。

都道府県別の人口ピラミッドと総人口推移をインタラクティブなビジュアライゼーションで表現し、 データアナリストとしての技術力(API データ取得・統計モデリング・Web 可視化)を示しています。

使用した予測モデル

コーホート要因法(主推計)

国勢調査5年ごとの「コーホート変化率」(同一年齢集団の5年間の変化)を過去3期間の平均から算出し、 2020年を起点に2050年まで投影します。出生は CWR(幼児女性比)、高齢者は 85+ の特別処理を行います。 国立社会保障・人口問題研究所(社人研)が採用する手法と同原理で、本プロジェクトの主要推計として使用しています。

Prophet(Meta 開発の時系列モデル)

Facebook(現 Meta)が開発した時系列予測ライブラリ。都道府県別の総人口トレンドを Prophet で予測し、 2020年の年齢構成比を使って年齢別人口に分配します。変化点を3ヶ所に限定(changepoint_prior_scale=0.05)し、 過学習を抑えています。

ARIMA(自己回帰和分移動平均モデル)

ARIMA(1,1,0) を用いた時系列予測。データ点数が少ない(7点)ため自由度の低いモデルを選択。 定数予測に落ちる場合は直近3期間のトレンド外挿にフォールバックします。 Prophet と同様に年齢構成比で分配します。

精度評価(バックテスト)

1990〜2010年で学習し、2015年・2020年の実績値と比較するバックテストを実施しました。

指標説明
MAPE(平均絶対誤差率)平均約 2〜4%都道府県×年の平均誤差率
RMSE約 3〜8 万人二乗平均平方根誤差
社人研比(2050年)±5〜15%都道府県によりばらつきあり

※ コーホート要因法は直近の変化率トレンドを外挿するため、急激な人口変動(震災後の転出など)には対応が困難です。

データ出典

データ提供元期間
国勢調査 人口・年齢(5歳階級)・男女別 総務省統計局 / e-Stat API(統計表 0003410381) 1990〜2020年(5年毎)
将来推計人口(参考値) 国立社会保障・人口問題研究所(社人研)
日本の将来推計人口(令和5年推計)出生中位・死亡中位
2025〜2050年
都道府県別将来推計(参考値) 社人研「日本の地域別将来推計人口(令和5年推計)」 2050年

使用技術

バックエンド(データ処理)
  • Python 3.11
  • pandas / numpy / pyarrow
  • statsmodels(ARIMA)
  • prophet(Meta)
  • geopandas(GeoJSON 処理)
  • tenacity(リトライ)
  • loguru(ロギング)
フロントエンド(可視化)
  • D3.js v7(コロプレスマップ・ピラミッド)
  • Chart.js v4(時系列グラフ)
  • バニラ HTML / CSS / JavaScript
  • GitHub Pages(ホスティング)

制作者

中江 哲夫(Tetsu Nakae)
株式会社ダイアローグ研究所 代表取締役 / データアナリスト

慶應義塾大学法学部卒業。広告代理店勤務を経て 2008年に株式会社ダイアローグ研究所を設立。Eコマース・マーケティング・業務アプリ開発のコンサルティングを行う傍ら、 データ分析スキルを体系的に習得し、データドリブンな意思決定支援を提供しています。

GitHub →
保有資格
  • Python エンジニア認定基礎
  • Python エンジニア認定データ分析
  • 基本情報技術者
  • Google Data Analytics Professional Certificate
  • データ分析マスター認定(ピーシーアシスト)