著者:吉住遼(@well_living_ry)・原泰史(@harayasushi)
本リポジトリは、書籍「Pythonではじめるオープンデータ分析 -経済統計の取得からデータハンドリング、可視化、分析まで-」のサポートサイトです。
本書のハッシュタグは #pythonopendatabook です。
本書は、オープンデータや統計データの活用方法について、できる限り包括的にまとめた本です。 オープンデータとはそもそも何で、どうすれば取得できるのか、何ができるのかを、プログラミング言語Pythonを用いて実践的に学べます。
本書は3部構成です。 第1部では、本書の第Ⅱ部以降のオープンデータや経済統計を扱う際に必要となる基本的なデータの取得、ハンドリング、可視化をPythonで行う方法を紹介します。 第2部では、人口、家計、企業、金融、経済などさまざまなオープンデータ・経済統計・公的統計を取得し、可視化、分析する方法を説明します。 第3部では、オープンデータを活用し、具体的な社会事象をデータに基づいて分析することを実践的に学びます。
- 目次
- 1章 序論
- 第1部 Pythonデータ分析の基礎
- 2章 データハンドリングとpandas
- 3章 統計の基礎
- 4章 データの可視化とPlotly
- 5章 オープンデータとデータ取得
- 第2部 オープンデータ分析の基礎
- 6章 オープンデータ・経済統計・公的統計
- 7章 人口データの取得・可視化・分析
- 8章 家計・生活・労働データの取得・可視化・分析
- 9章 金融・市場の取得・可視化・分析
- 10章 国際統計・長期経済統計の取得・可視化・分析
- 11章 法人・産業データの取得・可視化・分析
- 第3部 オープンデータ分析の実践
- 12章 gBizINFOの法人データを用いたスタートアップ企業の分析
- 13章 e-Statを用いたふるさと納税のパネルデータ分析
詳細な目次は出版社(講談社)のサイトにあります。
サンプルコードは章ごとにcodeディレクトリに格納しています。
| 見出し | nbviewer | Colab |
|---|---|---|
| 2 データハンドリングとpandas | ||
| 3 統計の基礎 | ||
| 4 データの可視化とPlotly | ||
| 5 オープンデータとデータ取得 | ||
| 6 オープンデータ・経済統計・公的統計 | ||
| 7 人口データの取得・可視化・分析 | ||
| 8 家計・生活・労働データの取得・可視化・分析 | ||
| 9 金融・市場の取得・可視化・分析 | ||
| 10 国際統計・長期経済統計の取得・可視化・分析 | ||
| 11 法人・産業データの取得・可視化・分析 | ||
| 12 gBizINFOの法人データを用いたスタートアップ企業の分析 | ||
| 13 e-Statを用いたふるさと納税のパネルデータ分析 |
本書初版のPythonのバージョンは2025年時点でsecurity版のうち最新の3.12としています。 その他のライブラリのバージョンはrequirements.txtに記載しています。
- 本書と本サポートサイトに記載されているサンプルプログラムやスクリプト、および実行結果を記した画像イメージなどは、特定の設定に基づいた環境にて再現される一例です。また、入出力情報の正確性、完全性などについて、何ら保証を行っていません。本書と本サポートサイトの内容に関して適用した結果生じたこと、また、適用できなかった結果について、著者および出版社は一切の責任を負えませんので、あらかじめご了承ください。
- 本書と本サポートサイトの内容は、著者個人が作成したものであり、所属組織が作成したものではありません。
- 本書と本サポートサイトに記載されているウェブサイトなどは、予告なく変更されていることがあります。
- 本書に掲載されたオープンデータの利用にあたってはそれぞれのデータ提供元の利用条件をご確認ください。委細については、「1.2 データの利用規約と著作権について」をご参照ください。
- 2025-10-19: サポートサイト公開
- 2025-10-22: 書籍発売
詳しい更新情報はリンク先を参照ください。
書籍の正誤表はリンク先を参照ください。
本書の誤記の連絡は、お手数ですが本リポジトリのIssuesに投稿をお願いいたします。
書籍の質問はIssuesで受け付けております。
FAQはリンク先にあります。
gBizINFOは2026年1月に次期システムに移行するため、2025年9月から現行システムのAPI利用申請の受付が中止されています。 次期gBizINFO に関する情報ページによると、2025年9月末時点で、2025年9月30日がページ最終更新日となっており、2025年9月にAPI利用申請の受付中止、2026年1月に次期システムのサービスが開始し、2026年9月にREST APIのv1が終了してv2への移行予定と記載されています。 また、情報ページにgBizINFOのデータ出典元からのデータ収集の凍結状況についても記載されています。
さらに、gBizINFO REST API (v2)の暫定版の仕様書が公開されています。
本サポートサイトにて、2026年1月以降に、次期システムの仕様に対応した修正コードを提供予定です。
本書のソースコードは MIT です。 Webサイトやイベントなどで使用する場合には、Webサイトや配布資料に著作権表示を記載してください。
本書の「1.2 データの利用規約と著作権について」の節で詳しく説明しています。
本書で利用したデータの出典は、リンク先に記載しています。
また、本書で用いていないデータを含め、各サービスのデータに関する利用規約のリンクをできるかぎりリンク先に整理しています。
リンク先に記載のないデータも含め、本書で取り上げるソースコードを用いて、あるいは参照することでデータを取得する過程では、データの利用方法・著作権について、必ずご自身で確認を行ってください。
| branch名 | 内容 |
|---|---|
| main | 書籍と同一のプログラムをベースとし、各サービスのサイトやAPIの更新に随時対応しています。 |
| original_book | 書籍(2025/10/22発売初版)と基本的に同一のプログラム。各サービスのサイトやAPIの更新によりコードが実行できなくなっている場合があります。 |
本書の事例集サイトとして、「Open Data Casebook - オープンデータ分析 事例集サイト」を用意しています。
オープンデータや公的統計を活用した分析・可視化の事例とサンプルコードを公開しています。
多くは書籍に掲載していない追加事例で、データ分析に関する知見の共有・学び合い・再利用を促進するためのオープンリポジトリです。
読者・利用者からの Pull Request(事例提供) や note / Zenn など外部記事のリンク紹介 も受け付けています。
