日本プロ野球の成績Jupyterとpandasとmatplotlibで前処理・分析・可視化するサンプル

参考文献

こちらの書籍のテクニックを元に作成しました.

PythonユーザのためのJupyter[実践]入門

何ができるのか

Scrapyのアプリケーションで集めた野球データ（打撃成績）の分析と可視化を行うサンプルです.
こちらを真似・Fork・コピることにより,以下の事ができるようになります.
- Jupyterの使い方を覚える
- pandasの使い方と前処理・かんたんな統計分析
- matplotlibで可視化
- 野球のデータセットの使い方

動作環境

作者(shinyorke)の動作環境より.

gitクライアント(何でもOK)
- ソースコードを取得するために使う
- 面倒くさい方は直接ダウンロードしてもらってもOK
Python 3系の最新Ver
- 3.6以上を推奨
- 試してはいませんが,3.3.x以上なら動くと思う
- 2.7.x系は未検証ですが多分動くと思います(がオススメしません&対応する気は無いです)
Anacondaのインストール
- PythonユーザのためのJupyter[実践]入門での推奨方法
- Anacondaへの抵抗がある方はpipで入れても構いません（どっちでもいい）

セットアップ

Anaconda前提での解説です.

1. リポジトリをclone or ダウンロードする

クローンの場合

$ git clone https://github.com/Shinichi-Nakagawa/jupyter-sample-baseball.git

ダウンロードの場合

$ wget https://github.com/Shinichi-Nakagawa/jupyter-sample-baseball/archive/master.zip
$ unzip master.zip

2. Anacondaをインストール

公式サイトからお使いのOS・プラットフォームに合うイメージをダウンロード
Anaconda3-4.3.1が推奨バージョンです
詳細はこの本に乗ってるので自信がないかたはご参考に→PythonユーザのためのJupyter[実践]入門

3. 環境を作る

condaコマンドまでのパスを通したら以下のコマンドを実施

$ conda create -n jupyter-sample-baseball python=3.6
$ source activate jupyter-sample-baseball
$ conda install -y jupyter pandas notebook matplotlib bokeh

なお,bokehは使っていないので外しても大丈夫です(最初は使う想定でした...).

これでセットアップは完了です.

【補足】Anacondaを使いたくない方は

ご自身でPython 3の環境を用意,pip installしてください

$ pip install -r requirements.txt

使い方

1. ディレクトリに移動

Scrapyのエンドポイントにcdします.

$ cd jupyter-sample-baseball

なお,ダウンロードで手に入れた人は最初のディレクトリ名が変わるので注意

$ cd jupyter-sample-baseball-master

2. DBをコピー

Scrapyのアプリケーションで集めた野球データをDirectory配下にコピります.

$ cp {Scrapyアプリのエンドポイント}/baseball/baseball/baseball.db .

3. Jupyterを起動

$ jupyter notebook

あとは好きなように遊んでみましょう！

データについて

構造

baseball/baseball/item.pyに乗っているカラムと解説が全てです.

カラムの名称は一般的に使われる野球英語の略称を用いています.

詳細は各Itemのコメントを参照ください.

Table Scheme

baseball/baseball/pipelines.pyにCreate Table文があります.

カラムの意味と解説はItemと全く同じです(id値とcreate_date/update_dateがあるぐらいの違い)

なお,indexは全く貼っていないので必要な方は随時書き換えてもらえると.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.gitignore		.gitignore
README.md		README.md
baseball-sample-npb2017.ipynb		baseball-sample-npb2017.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

日本プロ野球の成績Jupyterとpandasとmatplotlibで前処理・分析・可視化するサンプル

参考文献

何ができるのか

動作環境

セットアップ

1. リポジトリをclone or ダウンロードする

クローンの場合

ダウンロードの場合

2. Anacondaをインストール

3. 環境を作る

【補足】Anacondaを使いたくない方は

使い方

1. ディレクトリに移動

2. DBをコピー

3. Jupyterを起動

データについて

構造

Table Scheme

About

Releases

Packages

Languages

Shinichi-Nakagawa/jupyter-sample-baseball

Folders and files

Latest commit

History

Repository files navigation

日本プロ野球の成績Jupyterとpandasとmatplotlibで前処理・分析・可視化するサンプル

参考文献

何ができるのか

動作環境

セットアップ

1. リポジトリをclone or ダウンロードする

クローンの場合

ダウンロードの場合

2. Anacondaをインストール

3. 環境を作る

【補足】Anacondaを使いたくない方は

使い方

1. ディレクトリに移動

2. DBをコピー

3. Jupyterを起動

データについて

構造

Table Scheme

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages