Skip to content

SampleUser0001/Use_MeCab_for_ArchiveComment

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Use MeCab

形態素解析を使用して、YoutubeのNGコメントを検出する。
事前にGet_NG_Patternでパターンを作成しておく。

実行

  1. app/input/${動画ID}.jsonGetYoutubeArchiveCommentで取得したコメント.jsonファイルを取得する。
  2. app/input/ng_pattern配下にNGパターンの形態素解析結果を配置する。
  3. docker-compose.ymlVIDEO_IDを${動画ID}に修正。
  4. docker-compose upを実行。

実行結果

出力パス

./app/output/result_${動画ID}.json

出力パターン

{
  "authorExternalChannelId": "(隠蔽)",     # コメント投稿者のチャンネルID
  "user": "(隠蔽)",                        # コメント投稿者名
  "timestampUsec": "1618180355896087",      # コメント投稿時刻(UnixTime)
  "time": "2:00",                           # コメント投稿時間(配信開始時からの経過時間)
  "authorbadge": "",                        # コメント投稿者の属性(一般/メンバー(期間)/モデレータ等)
  "text": "(一応隠蔽)",                      # 投稿コメント
  "purchaseAmount": "¥200",                # スーパーチャットで投げられた金額
  "type": "SUPERCHAT",                      # コメント種類
  "video_id": "1h78n8hzpqg",                # 動画ID
  "Chat_No": "00552"                        # コメントID(動画内で何番目に投稿されたコメントかの番号)
  "ng_flg": true,                           # NGコメント判定されたか
  "ng_info": {                              # NGのときのみ出力
    "pattern": "./input/ng_pattern/pmTQqhpHAHs/00096.txt", # どのパターンでNGになったか
    "similarity": 1                                        # 検出されたパターンとの一致度
  }
},

参考

About

形態素解析エンジンのMeCabを使用する。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages