DATA POPCORN FEATURE
e-Stat APIを100回叩いてわかった、
日本の政府データが宝の持ち腐れな件
22万を超えるデータセットを擁するe-Stat。しかしそのAPIは複雑で、使いこなせる人はごくわずか。都市分析8本分のデータ収集で見えた課題と解決策。
📊 e-Stat API / 法人番号API / 不動産API
📅 2026.02
日本の政府統計ポータル「e-Stat」には、22万を超えるデータセットが登録されている(2026年2月時点)。295の政府統計調査から、全国1,741市区町村・17分野をカバーする国内最大級のオープンデータ基盤だ。
でも、そのデータを実際に使ったことがある人はどれくらいいるだろう?
STORY
この「都市分析シリーズ」では、Vol.1の札幌からVol.8の水戸まで、8つの都市をデータで読み解いてきた。人口、地価、産業、住宅、観光。各都市5つの指標を、すべてe-Stat APIから取得している。
8都市 x 5指標。それだけで40回以上のAPI呼び出し。比較データや時系列を含めると、優に100回を超える。その過程で嫌というほど思い知ったのが、日本の政府データは「ある」のに「使えない」という現実だった。
e-Stat APIのレスポンスは、人間が読むようにできていない。地域コード「04100」が仙台市だと知っていないと、データの意味がわからない。統計分類コード「001」が「総人口」を意味することも、ドキュメントを読み込まないと判別できない。APIの戻り値は深くネストしたJSONで、必要な数値にたどり着くまでに3~4階層を掘り下げる必要がある。
実際、この都市分析プロジェクトでは、8都市分のデータ取得と整形に延べ20時間以上を費やした。API仕様の理解、コード変換テーブルの作成、エラー処理。本来やりたかった「分析」にたどり着く前に、「データ整備」でプロジェクトの工数の大半が消えた。
データは公開されている。でも、アクセスが民主化されていない。これが、日本の政府データが「宝の持ち腐れ」になっている本質的な原因だ。
🍿 SNACK
e-Statのデータベースに登録されたデータセットは22万件超(295調査、2026年2月時点)。国勢調査から経済センサス、家計調査、住宅統計まで。日本政府が持つ公的データの大半が、このポータルに集約されている。だがAPIを通じてプログラムから利用している人はごく一部だ。
もし「札幌市の人口を教えて」の一言で、
出典付きデータが返ってきたら?
DATA 01 ── データの海
e-Stat が抱えるデータの規模
政府統計の総合窓口に登録されたデータ(2026年2月時点)
データセット数
約22万
295の政府統計調査からAPI経由で取得可能(2026年2月時点)
対応市区町村
1,741
全国の市区町村をカバー(特別区含む)
統計分野
17分野
人口・経済・労働・住宅・教育 他
📌 295の政府統計調査から22万を超えるデータセットが登録されている(2026年2月時点)
人口動態、経済センサス、家計調査、住宅統計、地価公示、賃金構造、労働力調査。日本の公的データは質・量ともに充実している。問題は「量」ではなく「アクセス方法」にある。
DATA 02 ── APIの壁
従来のe-Stat API呼び出し: 5つの壁
1つの統計データを取得するまでに必要なステップ
↓
↓
↓
4
パラメータ構築
cdCat・cdArea等を正確に指定
↓
⏱ この5ステップを、統計表ごとに毎回繰り返す
本プロジェクトでは8都市 x 複数指標で延べ20時間以上をデータ整備に費やした。
📌 最大のボトルネックは「ステップ3: コード解読」。e-Statは全データをコード番号で返すため、「00710=15歳以上人口」「001=総数」のような変換テーブルを自前で構築する必要がある。
これは「バグ」ではなく「仕様」だ。e-Stat APIは本来、統計の専門家や省庁内部向けに設計されている。一般のデータアナリスト、ジャーナリスト、学生、あるいはAIが使うことは想定されていなかった。結果として、国内最大級のオープンデータが、ごく一部の専門家だけのものになっている。
この問題を解決するために作ったのが
japan-data-mcp だ。
e-Stat・法人番号・不動産の3つの公的APIを1つに統合し、AIから自然言語でアクセスできるようにしたオープンソースのMCPサーバー。コード変換、パラメータ構築、レスポンス整形をすべて自動化。さらに、全レスポンスに出典・検証URL・取得日時を自動付与する。AIのハルシネーション(事実誤認)が問題になる時代に、「データの出どころ」を常に明示する設計だ。
DATA 03 ── Before / After
japan-data-mcp で何が変わるか
従来のAPI操作 vs MCP経由のデータ取得
📌 5ステップが1コマンドに。しかも3つのAPIを横断できる
コード変換は自動。「04100」ではなく「仙台市」と入力すれば良い。さらに、e-Stat(統計)・法人番号(企業)・不動産(取引価格)の3APIが統合されているため、「人口が増えている地域の不動産価格」のようなクロス分析も可能になる。自分でラッパーを書けば1つのAPIは叩ける。だが3つを統合し、コード変換し、出典まで付けてくれるツールは、現時点で国内向けの公開OSSとしては確認されていない。
「自分でPythonで叩けばいいのでは?」
確かに、1つのAPIなら自分でラッパーを書ける。だが japan-data-mcp が解決しているのは「APIを叩くこと」ではない。
1
コード変換の自動化 — 「13000」ではなく「東京都」と入力するだけ。1,741市区町村のコード変換テーブルを内蔵
2
出典の自動付与 — 検証URL・統計表ID・取得日時が全レスポンスに付く。コピペで論文の引用に使える
3
MCP準拠 — Pythonが書けなくてもいい。AIに日本語で話しかけるだけでデータを取得できる
4
統一フォーマット — 3つのAPIの出力がすべて同じMarkdown形式で返る。出力を揃える前処理が不要
Pythonが書ける人にとっても、書けない人にとっても、「データにアクセスする最短距離」であること。——これが設計思想だ。
KEY INSIGHT
データは公開された。
でもアクセスは民主化されていない。
── これが「宝の持ち腐れ」の正体だ。
そしてもう一つ。AIが生成する数値の信頼性が問われる今、「出典が付いたデータ」と「出典のないデータ」の価値は決定的に違う。
DEMO ── 実際に使ってみる
japan-data-mcp は、e-Stat・法人番号・不動産の3つの公的APIを統合したMCPサーバーだ。Claude、ChatGPT、Cursor など MCP 対応の AI クライアントから、自然言語で話しかけるだけでデータにアクセスできる。
1. 地域の人口データを取得
MCP Tool
AI
札幌市の人口データ
| 年度 | 総人口 | 男 | 女 |
|------|-----------|---------|---------|
| 2020 | 1,973,395 | 920,678 | 1,052,717 |
| 2015 | 1,952,356 | 910,614 | 1,041,742 |
| 2010 | 1,913,545 | 893,137 | 1,020,408 |
---
出典: e-Stat 国勢調査
検証: https://www.e-stat.go.jp/dbview?sid=...
取得日時: 2026-02-26 JST
2. 複数地域を比較
MCP Tool
AI
地域比較: 人口(2020年)
| 地域 | 総人口 | 増減率 |
|------|-----------|--------|
| 札幌市 | 1,973,395 | +1.1% |
| 福岡市 | 1,612,392 | +4.9% |
| 仙台市 | 1,096,704 | +1.3% |
---
出典: e-Stat 国勢調査
3. 不動産取引価格を調べる
MCP Tool
AI
札幌市の不動産取引 (2023年)
取引件数: 1,847件
| 指標 | 値 |
|------|-------------|
| 中央値 | 2,480万円 |
| 平均値 | 3,150万円 |
| 最高値 | 3億8,000万円 |
---
出典: 不動産情報ライブラリ
💡 全11ツール搭載。統計検索、地域プロファイル、法人検索、不動産取引まで。すべてのレスポンスに出典・検証URL・取得日時が自動付与される。
TRUST ── 動作の裏側
「本当に動くのか?」——当然の疑問だ。japan-data-mcp の内部処理と、信頼性を担保する仕組みを公開する。
📡
リアルタイム取得
キャッシュなし。毎回e-Stat / 法人番号 / 不動産APIにリアルタイムでリクエストを送信。データは常にAPI提供元の最新値。
🔗
出典自動付与
全レスポンスに「出典名・統計表ID・e-Stat直リンク・取得日時(JST)」を自動付与。リンクをクリックすれば元データを即座に検証可能。
⚠️
エラー明示
存在しない地域名や無効なパラメータには明確なエラーメッセージを返す。データが取得できない場合は、その理由を明示。
🔍
オープンソース
MIT License でソースコード全公開。処理ロジック、コード変換テーブル、API呼び出し方法をすべて確認可能。74のテストケースで品質を担保。
技術仕様
出力形式
Markdown テーブル形式。人間が読め、AIも構造的に解釈できるフォーマット
API呼び出し
リアルタイム。キャッシュなし。毎回APIに直接リクエスト
レート制限
e-Stat API の制限(上限あり)に準拠し逐次リクエスト。自動で制御
エラー処理
無効な地域名・パラメータ → 原因を明示したエラーメッセージを返却
データ鮮度
API提供元の最新値。e-Stat の更新タイミング(調査ごとに異なる)に依存
テスト
74ケース(pytest)。コード変換・API応答・フォーマットを網羅
依存関係
httpx / pydantic / mcp — pip install で自動解決
レスポンス末尾に自動付与される検証フッター
実際の出力
---
出典: e-Stat 政府統計の総合窓口
統計表: 国勢調査 人口等基本集計
統計表ID: 0003448773
検証URL: https://www.e-stat.go.jp/dbview?sid=0003448773
取得日時: 2026-02-26T14:30:00+09:00
注: 本データはe-Stat APIから取得した統計値です
📌 すべてのツール出力にこのフッターが付く。検証URLをクリックすれば、e-Stat上の元データに直接アクセスできる。
WHO ── 誰に向いているか
記事の裏取りに統計データが必要だが、e-Stat APIを叩く時間はない。自然言語で即座にデータを取得し、出典リンクまで自動付与。ファクトチェックのスピードが変わる。
他市町村との比較資料、議会答弁の数値根拠、政策立案のベースデータ。全国1,741市区町村に対応しているため、自分の自治体と類似都市をすぐに比較できる。
卒論やレポートで統計データが必要なとき、APIの仕様書と格闘する必要がなくなる。「東京都の産業構造を教えて」と聞くだけ。引用に必要な出典情報も自動で付く。
日本のローカルデータにアクセスするMCPツールとして組み込める。地域分析、不動産査定、企業調査など、日本市場向けAIエージェントの「目」になる。
CONTEXT
MCP(Model Context Protocol)は、AIアシスタントが外部ツールやデータソースに接続するためのオープンな標準プロトコルだ。特定のAIに依存しない設計で、対応する様々なクライアントから利用できる。
japan-data-mcp は、このMCPプロトコルに準拠したサーバーとして動作する。つまり、AIに「札幌市の人口は?」と聞くだけで、裏側でe-Stat APIが呼ばれ、コード変換が行われ、整形されたデータが出典付きで返ってくる。ユーザーはAPIの存在すら意識する必要がない。
対応クライアント: Claude Desktop、ChatGPT Desktop、Cursor、Windsurf など、MCP対応のAIクライアントであればどれでも利用可能。特定のAIサービスに縛られない。
対応する3つのAPI。e-Stat(政府統計)、法人番号Web-API(企業情報)、不動産情報ライブラリ(取引価格)。この3つだけで、人口・経済・企業・不動産という地域分析の基本的なデータソースをカバーできる。
完全無料・オープンソース(MIT License)。PyPI からワンコマンドでインストールでき、APIキーの取得も全て無料。セットアップは対話式のコマンド1つで完了する。
QUICKSTART ── 3分で始める
1
インストール
pip install japan-data-mcp
Python 3.11以上。uvx japan-data-mcp でも可。
2
セットアップ
japan-data-mcp setup
対話式でAPIキーを自動取得。3つのAPIキーすべて無料。
3
使う
「札幌市の人口を教えて」
Claude Desktop / ChatGPT / Cursor から自然言語で話しかけるだけ。出典・検証URL付きでデータが返る。
Terminal
$ pip install japan-data-mcp
Successfully installed japan-data-mcp-0.2.5
$ japan-data-mcp setup
? e-Stat API appId を入力: ********
✓ e-Stat API key saved
? 法人番号 API ID を入力: ********
✓ Corporate Number API key saved
✓ Setup complete!
→ Claude Desktop を起動して
「札幌市の人口を教えて」と聞いてみよう
🚀 japan-data-mcp
🔧 提供ツール: 統計8 + 法人2 + 不動産1 = 全11ツール
🤖 対応AI: Claude Desktop / ChatGPT / Cursor / Windsurf 他
📝 ライセンス: MIT License(完全無料・オープンソース)
🍿 今日のポップコーン
🎯雑学: e-Statには22万を超えるデータセットが登録されている(295調査、2026年2月時点)。国勢調査から家計調査まで、日本の公的データの大半がここに集約されている。
📊データ発見: 8都市分の統計データ整備に延べ20時間以上。分析ではなくデータ取得に時間が消えていた。
🔍構造理解: 「データがない」のではなく「アクセスできない」。3API統合 + 出典自動付与が、その壁を溶かす。
DATA POPCORN 特集 ── e-Stat APIを100回叩いてわかった、政府データが宝の持ち腐れな件
データ・ツール出典: e-Stat(CC BY 4.0) / 国税庁 法人番号Web-API / 国土交通省 不動産情報ライブラリ
japan-data-mcp: GitHub / PyPI / MIT License
本記事の統計数値は2026年2月時点のe-Stat公開データに基づきます。最新値は各出典元をご確認ください。
© 2026 DATA POPCORN. データ分析は統計値に基づくものであり、特定の判断を推奨するものではありません。