プロジェクト概要
本プロジェクトは、楽天ふるさと納税に掲載されている返礼品データと、総務省「ふるさと納税に関する現況調査」(令和4年度)を組み合わせて、 ふるさと納税市場の人気構造・価格戦略・自治体戦略を可視化した分析ダッシュボードです。
制作者の中江哲夫は、広告代理店でのブランドリサーチ・ディレクター経験と、 ダイアローグ研究所でのEコマース事業開発・マーケティングコンサルティングの実務経験を持ちます。 本作品は「事業視点を持ったデータアナリスト」としての差別化を示すポートフォリオ第2作です。
データソース
| データ | 出典 | 取得時期 | 件数 |
|---|---|---|---|
| 楽天ふるさと納税 返礼品データ | 楽天ウェブサービス(楽天市場商品検索API) | 2026年5月 | 32,244件 |
| ふるさと納税の現況調査 | 総務省「ふるさと納税に関する現況調査結果」令和4年度 | 令和4年度調査 | 1,741自治体 |
楽天API利用規約への準拠
本ダッシュボードは、楽天ウェブサービス利用規約を遵守して構築されています。 具体的には以下の点を厳守しています。
- 取得した個別商品データの再配布は行いません。ダッシュボードには集計値・統計値のみを表示しています
- 商品名・商品画像・ショップ情報の個別表示は行っていません
- APIのレート制限(1リクエスト/秒、30,000リクエスト/日)を遵守しています
- データ取得には SQLite キャッシュを使用し、不要な再取得を防止しています
本サイトに掲載しているデータは、楽天ウェブサービスを利用して収集・加工したものです。
分析手法
1. カテゴリ正規化
楽天APIの検索キーワード(「ふるさと納税 牛肉」等)と商品名・説明文から、
sudachipy(日本語形態素解析)と YAML マッピングルール(config/category_mapping.yml)を組み合わせて
14の主要カテゴリに正規化しました。
2. 価格帯セグメント
返礼品の寄付金額を7つの価格帯に分割し、各帯のボリューム・レビュー獲得力を比較。 「心理的価格ポイント」(1万円・3万円・5万円)への集中度も分析しています。
3. 自治体タイプ分類(K-means)
各自治体のショップを「商品数・価格中央値・レビュー数・食品比率・高額品比率・受入額」の6次元特徴量でベクトル化し、 K-means(k=5)でクラスタリングを実施。StandardScaler で標準化後にクラスタリングしています。
4. 楽天・総務省データの突合
楽天のショップ名(例: 「北海道別海町」)と総務省の「都道府県名+市区町村名」を 部分一致マッチングで突合。突合率は99.5%を達成しています。
制作者プロフィール
中江 哲夫(Tetsu Nakae)
株式会社ダイアローグ研究所 代表取締役
慶應義塾大学法学部政治学科卒。広告代理店でのブランドリサーチ・ディレクター経験を経て、 2008年株式会社ダイアローグ研究所を設立し、Eコマース事業開発・マーケティングコンサルティングに従事。
保有資格: Python エンジニア認定(基礎・データ分析)、Google Data Analytics プロフェッショナル認定、 データ分析マスター認定、基本情報技術者、通販エキスパート検定1級 他
使用技術
| カテゴリ | ライブラリ / ツール | 用途 |
|---|---|---|
| データ取得 | requests, tenacity | 楽天API呼び出し・リトライ |
| キャッシュ | SQLite | API レスポンスのキャッシュ |
| データ処理 | pandas, pyarrow | 前処理・集計・parquet出力 |
| 日本語NLP | sudachipy | 商品名トークナイズ・カテゴリ正規化 |
| 機械学習 | scikit-learn | K-means クラスタリング |
| 可視化 | Plotly.js | インタラクティブチャート |
| フロントエンド | Vanilla JS / CSS | ダッシュボード UI |
| ホスティング | GitHub Pages | 静的サイト公開 |
ソースコード: GitHub
免責事項
- 本ダッシュボードの分析結果はポートフォリオ目的のものであり、投資・事業判断の根拠としての利用は推奨しません
- 還元率の推定値はあくまで参考値です。実際の市場価格との差異が生じる場合があります
- 楽天APIのデータは取得時点のものであり、現在の掲載状況と異なる場合があります
- 総務省データは令和4年度(2022年度)の調査に基づきます