形態素解析を使用して、YoutubeのNGコメントを検出する。
事前にGet_NG_Patternでパターンを作成しておく。
app/input/${動画ID}.json
にGetYoutubeArchiveCommentで取得したコメント.jsonファイルを取得する。- GetYoutubeArchiveCommentはYoutubeの規約で、公開停止。
app/input/ng_pattern
配下にNGパターンの形態素解析結果を配置する。- Get_NG_Patternで作成したパターン
docker-compose.yml
のVIDEO_ID
を${動画ID}に修正。docker-compose up
を実行。
./app/output/result_${動画ID}.json
{
"authorExternalChannelId": "(隠蔽)", # コメント投稿者のチャンネルID
"user": "(隠蔽)", # コメント投稿者名
"timestampUsec": "1618180355896087", # コメント投稿時刻(UnixTime)
"time": "2:00", # コメント投稿時間(配信開始時からの経過時間)
"authorbadge": "", # コメント投稿者の属性(一般/メンバー(期間)/モデレータ等)
"text": "(一応隠蔽)", # 投稿コメント
"purchaseAmount": "¥200", # スーパーチャットで投げられた金額
"type": "SUPERCHAT", # コメント種類
"video_id": "1h78n8hzpqg", # 動画ID
"Chat_No": "00552" # コメントID(動画内で何番目に投稿されたコメントかの番号)
"ng_flg": true, # NGコメント判定されたか
"ng_info": { # NGのときのみ出力
"pattern": "./input/ng_pattern/pmTQqhpHAHs/00096.txt", # どのパターンでNGになったか
"similarity": 1 # 検出されたパターンとの一致度
}
},