Skip to content

ニコニコデータセットをBigQueryにロードしやすいように加工する

Notifications You must be signed in to change notification settings

shibacow/niconico_dataset_add_smid

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

37 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ニコニコデータセットのBigQueryへのロード

目的

ニコニコ動画のデータセットが公開された。 分析するために、BigQUeryへデータをロードする。

認証

環境変数 GOOGLE_APPLICATION_CREDENTIALS gcloud auth application-default login したあとのconfig/gcloud/application_default_credentials.json を指定する。

使い方

  • 動画情報(Vide)のロードのREADME
  • コメント情報(comment)のロードのREADME
  • コメント情報(旧版)のロードのREADMD

データロス率

今回は全てのデータがロードされた。

元データ BQロード 喪失レコード数 喪失率
コメント 4,126,253,731 4,126,253,731 0 0%
動画情報 19,712,836 19,712,836 0 0.0%

About

ニコニコデータセットをBigQueryにロードしやすいように加工する

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published