Skip to content

本リポジトリは、書籍「Pythonではじめるオープンデータ分析 -経済統計の取得からデータハンドリング、可視化、分析まで-」のサポートサイトです。

License

python-opendata-analysis/python-opendata-analysis-book

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

38 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Pythonではじめるオープンデータ分析

―経済統計の取得からデータハンドリング、可視化、分析まで―

著者:吉住遼@well_living_ry)・原泰史@harayasushi

本リポジトリは、書籍「Pythonではじめるオープンデータ分析 -経済統計の取得からデータハンドリング、可視化、分析まで-」のサポートサイトです。


書籍の表紙

本書のハッシュタグは #pythonopendatabook です。

本書の概要

本書は、オープンデータや統計データの活用方法について、できる限り包括的にまとめた本です。 オープンデータとはそもそも何で、どうすれば取得できるのか、何ができるのかを、プログラミング言語Pythonを用いて実践的に学べます。

本書は3部構成です。 第1部では、本書の第Ⅱ部以降のオープンデータや経済統計を扱う際に必要となる基本的なデータの取得、ハンドリング、可視化をPythonで行う方法を紹介します。 第2部では、人口、家計、企業、金融、経済などさまざまなオープンデータ・経済統計・公的統計を取得し、可視化、分析する方法を説明します。 第3部では、オープンデータを活用し、具体的な社会事象をデータに基づいて分析することを実践的に学びます。

  • 目次
    • 1章 序論
  • 第1部 Pythonデータ分析の基礎
    • 2章 データハンドリングとpandas
    • 3章 統計の基礎
    • 4章 データの可視化とPlotly
    • 5章 オープンデータとデータ取得
  • 第2部 オープンデータ分析の基礎
    • 6章 オープンデータ・経済統計・公的統計
    • 7章 人口データの取得・可視化・分析
    • 8章 家計・生活・労働データの取得・可視化・分析
    • 9章 金融・市場の取得・可視化・分析
    • 10章 国際統計・長期経済統計の取得・可視化・分析
    • 11章 法人・産業データの取得・可視化・分析
  • 第3部 オープンデータ分析の実践
    • 12章 gBizINFOの法人データを用いたスタートアップ企業の分析
    • 13章 e-Statを用いたふるさと納税のパネルデータ分析

詳細な目次は出版社(講談社)のサイトにあります。

サンプルコード

サンプルコードは章ごとにcodeディレクトリに格納しています。

見出し nbviewer Colab
2 データハンドリングとpandas Open In Colab
3 統計の基礎 Open In Colab
4 データの可視化とPlotly Open In Colab
5 オープンデータとデータ取得 Open In Colab
6 オープンデータ・経済統計・公的統計 Open In Colab
7 人口データの取得・可視化・分析 Open In Colab
8 家計・生活・労働データの取得・可視化・分析 Open In Colab
9 金融・市場の取得・可視化・分析 Open In Colab
10 国際統計・長期経済統計の取得・可視化・分析 Open In Colab
11 法人・産業データの取得・可視化・分析 Open In Colab
12 gBizINFOの法人データを用いたスタートアップ企業の分析 Open In Colab
13 e-Statを用いたふるさと納税のパネルデータ分析 Open In Colab

ライブラリのバージョン

本書初版のPythonのバージョンは2025年時点でsecurity版のうち最新の3.12としています。 その他のライブラリのバージョンはrequirements.txtに記載しています。

免責事項

  • 本書と本サポートサイトに記載されているサンプルプログラムやスクリプト、および実行結果を記した画像イメージなどは、特定の設定に基づいた環境にて再現される一例です。また、入出力情報の正確性、完全性などについて、何ら保証を行っていません。本書と本サポートサイトの内容に関して適用した結果生じたこと、また、適用できなかった結果について、著者および出版社は一切の責任を負えませんので、あらかじめご了承ください。
  • 本書と本サポートサイトの内容は、著者個人が作成したものであり、所属組織が作成したものではありません。
  • 本書と本サポートサイトに記載されているウェブサイトなどは、予告なく変更されていることがあります。
  • 本書に掲載されたオープンデータの利用にあたってはそれぞれのデータ提供元の利用条件をご確認ください。委細については、「1.2 データの利用規約と著作権について」をご参照ください。

更新情報

  • 2025-10-19: サポートサイト公開
  • 2025-10-22: 書籍発売

詳しい更新情報はリンク先を参照ください。

正誤表

書籍の正誤表はリンク先を参照ください。

本書の誤記の連絡は、お手数ですが本リポジトリのIssuesに投稿をお願いいたします。

FAQ

書籍の質問はIssuesで受け付けております。

FAQはリンク先にあります。

gBizINFO APIについて

gBizINFOは2026年1月に次期システムに移行するため、2025年9月から現行システムのAPI利用申請の受付が中止されています。 次期gBizINFO に関する情報ページによると、2025年9月末時点で、2025年9月30日がページ最終更新日となっており、2025年9月にAPI利用申請の受付中止、2026年1月に次期システムのサービスが開始し、2026年9月にREST APIのv1が終了してv2への移行予定と記載されています。 また、情報ページにgBizINFOのデータ出典元からのデータ収集の凍結状況についても記載されています。

さらに、gBizINFO REST API (v2)の暫定版の仕様書が公開されています。

本サポートサイトにて、2026年1月以降に、次期システムの仕様に対応した修正コードを提供予定です。

ソースコードのライセンス

本書のソースコードは MIT です。 Webサイトやイベントなどで使用する場合には、Webサイトや配布資料に著作権表示を記載してください。

データの利用規約と著作権

本書の「1.2 データの利用規約と著作権について」の節で詳しく説明しています。

本書で利用したデータの出典は、リンク先に記載しています。

また、本書で用いていないデータを含め、各サービスのデータに関する利用規約のリンクをできるかぎりリンク先に整理しています。

リンク先に記載のないデータも含め、本書で取り上げるソースコードを用いて、あるいは参照することでデータを取得する過程では、データの利用方法・著作権について、必ずご自身で確認を行ってください。

GitHubリポジトリ

branch名 内容
main 書籍と同一のプログラムをベースとし、各サービスのサイトやAPIの更新に随時対応しています。
original_book 書籍(2025/10/22発売初版)と基本的に同一のプログラム。各サービスのサイトやAPIの更新によりコードが実行できなくなっている場合があります。

オープンデータ分析 事例集サイト

本書の事例集サイトとして、「Open Data Casebook - オープンデータ分析 事例集サイト」を用意しています。 オープンデータや公的統計を活用した分析・可視化の事例とサンプルコードを公開しています。
多くは書籍に掲載していない追加事例で、データ分析に関する知見の共有・学び合い・再利用を促進するためのオープンリポジトリです。

読者・利用者からの Pull Request(事例提供)note / Zenn など外部記事のリンク紹介 も受け付けています。

About

本リポジトリは、書籍「Pythonではじめるオープンデータ分析 -経済統計の取得からデータハンドリング、可視化、分析まで-」のサポートサイトです。

Topics

Resources

License

Stars

Watchers

Forks