Skip to content
No description, website, or topics provided.
Branch: master
Clone or download
Latest commit 3a692a4 Apr 11, 2018
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
data modify data,code Apr 11, 2018
preprocess modify data,code Apr 11, 2018
LICENSE add LICENSE Apr 9, 2018
README.md modify README.md Apr 11, 2018

README.md

awesomebook

『前処理大全』のサンプルコード

本橋智光 著、株式会社ホクソエム 監修 B5変/366ページ/本体価格3,000円+税 ISBN978-4-7741-9647-3 技術評論社、2018年発行

各言語の前処理実行方法

SQLの前処理実行

  1. AWS Redshiftの準備
  1. SQL Workbench/J を使用して、Redshiftに接続
  1. AWS S3の準備
  1. S3にデータをアップロード
  • dataフォルダ配下のcsvをs3上にアップロード
  1. DDLを実行
  • preprocess/load_data/ddl配下のDDLのSQLにAWSのKey情報を設定し、実行
  1. 各前処理の実行
  • preprocessフォルダ配下の前処理コードを実行

Rの前処理実行

  1. Rのインストール
  1. RStudioのインストール
  1. RStudioの起動
  • インストールしたRStudioを起動
  1. WorkinkDirectoryの設定
  • setwd('awesomebook_codeのパス')
  1. コードに必要なパッケージをインストール
  • install.packages('パッケージ名')
  1. 各前処理の実行
  • preprocessフォルダ配下の前処理コードを実行

Pythonの前処理実行

  1. Python3のインストール
  1. PyCharmのインストール
  1. PyCharmの起動
  • インストールしたPyCharmを起動
  1. ターミナルからpipコマンドを実行して、コードに必要なライブラリをインストール
  • pip3 install ライブラリ名
  1. 各前処理の実行
  • preprocessフォルダ配下の前処理コードを実行

目次

  • はじめに
  • Part1 入門前処理
  • 第1章 前処理とは
  • Part2 データ構造を対象とした前処理
  • 第2章 抽出
  • 第3章 集約
  • 第4章 結合
  • 第5章 分割
  • 第6章 生成
  • 第7章 展開
  • 第8章 数値型
  • 第9章 カテゴリ型
  • 第10章 日時型
  • 第11章 文字型
  • 第12章 位置情報型
  • Part4 実践前処理
  • 第13章 演習問題

サポートページ

http://gihyo.jp/book/2018/978-4-7741-9647-3

ライセンス

https://github.com/ghmagazine/awesomebook/blob/master/LICENSE

You can’t perform that action at this time.