本项目是对黑灰产情报的提取和监控。主要是对Telegram中的黑灰产群组进行文本数据监控和情报提取。
主要分两部分:
- Telegram群聊天数据的爬取、格式化存储
- 文本情报的分析
第一部分主要用到爬虫相关的知识,也可以去使用Telegram API;第二部分主要涉及到分词算法、黑词识别等。详细文档在docs文件夹中补充。
-
source —— 源码文件夹
-
docs —— 相关文档
-
minds —— 思维导图
-
references —— 存放供参考的论文、报告等
-
res —— 资源文件夹,存放一些项目需要借用的外部数据