Skip to content

Coldwave96/WebShell-AIHunter

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

WebShell AIHunter - 机器学习算法检测Webshell

Welcome to my personal blog(^◇^)


工具介绍

  • [⇥] 机器学习NB算法(朴素贝叶斯算法)

  • [⇥] 词袋加IF-TDF模型对数据进行预处理及特征提取

  • [⇥] 基于文本的WebShell检测

  • [⇥] 支持检测php,asp和jsp三种类型的Webshell

数据格式

⚠️⚠️ Data文件夹形式默认结构如下:

  • Data
    • check
    • normal
      • asp
      • jsp
      • php
    • WebShell
      • asp
      • jsp
      • php

💎 Tips:

1.训练时需自行填充Data文件夹下对应目录的文件

2.WebShell文件夹存放3种格式的WebShell文件,normal文件夹存放3种格式的正常文件,check文件夹下存放待检测的文件

3.待检测文件无需分类别存放

4.所有文件下可以有子文件,但是不支持压缩文件包。

5.训练和检测时只会打开对应格式的文件,错误格式文件会自动跳过

6.Release只会发布训练好的模型和检测脚本

使用方法

检测

  • 只需要下载Release的版本,将待检测文件放入Data/check文件夹下,执行python check.py命令即可

训练

  • 下载整个项目的源代码

  • 按照数据格式部分分别填充黑白样本文件

  • 依次执行python train_php.pypython train_asp.pypython train_jsp.py命令即可训练模型

下一步计划

  • 代码优化 + 算法更新 + 添加更多的Webshell静态检验(动态污点追踪暂时想不了==)

  • 更多类型检测 + 自主指定文件夹

  • 考虑建立黑样本模型,类似黑名单机制(理论上白样本模型应该更好可是不切实际)

  • 另外求更多更好的黑样本 🙏🙏