Skip to content

uribo/190710-johokiko

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

データ分析における特徴量エンジニアリング~多種多様なデータを扱う際の原理と実践~

2019年7月10日 (水曜日) 開催 10:30~16:30

内容

1. 特徴量エンジニアリングについての各論

  1. 導入
  2. 数値の取り扱い
  3. カテゴリ変数の取り扱い

2. 多様なデータの特徴量エンジニアリング

  1. テキストデータの取り扱い
  2. 時間・日付データの取り扱い
  3. 地理空間データの取り扱い
  4. 画像データの取り扱い

3. 話題提供

参考

  • Data Visualization: A Practical Introduction

  • Alice Zheng and Amanda Casari (2018). Feature Engineering for Machine Learning (O'Reilly) (翻訳 株式会社ホクソエム訳 (2019). 機械学習のための特徴量エンジニアリング (オライリー))

  • 福島真太朗 (2015). データ分析プロセス (共立出版)

  • 本橋智光 (2018). 前処理大全 (技術評論社)

  • 古谷知之 (2011). Rによる空間データの統計分析 (朝倉書店)

  • 谷村晋 (2010). 地理空間データ分析 (共立出版)

  • 瀬谷創、堤盛人 (2014). 空間統計学: 自然科学から人文・社会科学まで (朝倉書店)

  • 星野崇宏 (2009). 調査観察データの統計科学: 因果推論・選択バイアス・データ融合 (岩波書店)

  • Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani (2013). An Introduction to Statistical Learning with Applications in R (Springer)

  • Trevor Hastie, Robert Tibshirani and Jerome Friedman (2009). The Elements of Statistical Learning (翻訳 杉山将ほか訳 (2014). 統計的学習の基礎. (共立出版))

  • Sarah Guido and Andreas Müller (2016). Introduction to Machine Learning with Python A Guide for Data Scientists (O'Reilly) (翻訳 中田秀基訳 (2017). Pythonではじめる機械学習 scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎 (オライリー))

  • Peter Bruce and Andrew Bruce (2017). Practical Statistics for Data Scientist - 50 Essential Concepts (O'Reilly) (翻訳 黒川利明訳(2018). データサイエンスのための統計学入門 - 予測、分類、統計モデリング、統計的機械学習とRプログラミング (オライリー))

  • 石田基広 (2017). Rによるテキストマイニング入門 第2版 (森北出版)

  • 有賀康顕、中山 心太、西林孝 (2018). 仕事ではじめる機械学習 (オライリー)

  • Max Kuhn and Kjell Johnson (2019).Feature Engineering and Selection: A Practical Approach for Predictive Models (CRC Press)

  • The caret Package... Rのcaretパッケージのガイドだが役立つ知識が豊富

  • Applied Predictive Modeling

  • Christoph Molnar (2019). Interpretable Machine Learning - A Guide for Making Black Box Models Explainable https://christophm.github.io/interpretable-ml-book/

  • Aurélien Géron (2017). Hands-On Machine Learning with Scikit-Learn and TensorFlow (O'Reilly) (翻訳 長尾高弘訳 (2018). scikit-learnとTensorFlowによる実践機械学習 (オライリー))

  • Data Science from Scratch

  • The Elements of Statistical Learning

  • Predictive Models: Visual Exploration, Explanation and Debugging

  • Brad Boehmke and Brandon Greenwell (----). Hands-on Machine Learning with R (CRC Press)

  • 久保拓弥 (2012). データ解析のための統計モデリング入門: 一般化線形モデル・階層ベイズモデル・MCMC (岩波書店)

  • 阿部貴行 (2016). 欠測データの統計解析 (朝倉書店)

  • 高橋将宜・渡辺美智子 (2017). 欠測データ処理-Rによる単一代入法と多重代入法- (共立出版)

  • Applied Missing Data Analysis

  • Flexible Imputation of Missing Data

  • Data Mining with R: Learning with case studies

  • Julia Silge and David Robinson (2017). Text Mining with R A Tidy Approach (O'Reilly) (翻訳 長尾高弘訳 (2018). Rによるテキストマイニング — tidytextを活用したデータ分析と可視化の基礎 (オライリー))

  • Benjamin Bengfort, Tony Ojeda, Rebecca Bilbro (2018). Applied Text Analysis with Python Enabling Language-Aware Data Products with Machine Learning (O'Reilly)

  • Robin Lovelace, Jakub Nowosad, Jannes Muenchow (2019). Geocomputation with R (CRC Press)

  • Recipes for Data Processing

Programming

Online course

TODO

  • 夜間人口
  • ビール支出に天気を追加
  • 関東
  • 東京駅からの距離
  • ダークテーマ
  • イラストの作成... モデリングのプロセス、データ分割
  • リンクの確認
  • ビールデータセット

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published