Skip to content

Graduation project in Cybersecurity department, 2022.12-2023.06.

Notifications You must be signed in to change notification settings

2020dfff/Anomalous_node_detection

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

网络通信异常节点识别与可靠性分析_实验环境搭建

费扬 SJTU_SEIEE_CSE

2023.06.06

[TOC]

一. 摘要

​ 随着信息化时代的到来,网络安全问题开始出现在全球大大小小的网络中。在大量的局域网中,不法分子利用网络结构的漏洞对网络内部的信息、设备甚至用户进行攻击,引发网络异常,以达到窃取信息,瘫痪网络等效果。因此,对异常节点的识别在网络的设计与优化中起到了重要作用。本文对此开展了研究,基于线下自采的大量数据设计了一套包含图论特征选取,数据信息处理,图网络生成,异常节点识别与场景分析在内的网络节点可靠性分析系统,并在公开数据集上进行了验证实验。

​ 本文首先参考了国内外的研究工作,针对当前网络异常节点识别的领域调查了研究现状。然后,根据大量数学先验知识进行理论支撑,选取了多个有效特征用于异常节点的识别。本课题主要基于图论中不同的特征算法,而不涉及图神经网络的分析,主要目的是为了实现有效便捷的异常节点分析。

​ 随后,设计实现了一套用于实际流量信息中异常节点检测的模型,实现了对流量数据的端口扫描,节点分析,高级图特征分析等工作。本文基于线下自采的企业数据集开展了检测,在预处理过程中进行去重等系列操作;利用第三方库提供的接口构建图网络,并使用一系列图论特征进行统计,根据得到的离群值来收集分析其中的异常通信用户的流量信息字段。

​ 而在网络公开数据集LANL上,本文利用数据集内红队事件文件作为基本事实,将58天的事件进行筛除、分割、去重、标签等预处理,按照小时划分快照。通过红队事件边集来定义异常节点集,选取含有异常节点的85个异常时段作为分析目标,对应生成图网络,并在每个时段的最大子图上开展特征提取。实验发现了其中大量的异常节点,且检测结果能够覆盖其中超过90%的异常事件,具有良好的可用性。

​ 总的来说,本文基于图论算法,实现了从线下自采数据集到网络公开数据集的应用。该方法能够快捷有效地进行异常节点检测与可靠性分析,定位到网络中的异常节点,效果良好,可用性佳,为解决多种网络通信安全问题提供了思路与方法。

关键词:网络安全,图论算法,异常节点检测,图网络生成,图特征分析


二. 整体系统架构

​ 本文工作内容主要由三部分组成:首先是异常节点检测图论算法的介绍,介绍算法并进行代码实现,建立离散数学的图论理论基础;其次是两大模块内容依次展开,对真实局域网内的流量信息展开分析与检测验证。

​ 本文的总体流程结构如下图所示。

image-20230606172958648

​ 第一阶段指代基于线下自采集数据集进行的网络通信异常节点识别与可靠性分析,其中借助端口扫描等信息实现了可能异常场景的分析;

​ 第二阶段则是指建立在网络公开数据集LANL上的工作,本课题采取了一些算法优化策略,并利用类似于基于线下数据集的模型,分三步实现了网络通信异常节点识别,并进行了效果验证。


三. 实验环境搭建

​ 本文在异常节点检测方面所做实验采用的实验环境如下表所示:

表格:异常节点检测与可靠性分析实验环境

编号 参数 环境/值
1 操作系统 Ubuntu 22.04 (WSL on Windows 11)
2 内核版本 5.15.90.1-microsoft-standard-WSL2
3 CPU 12th Gen Intel(R) Core i7-12700H
4 GPU NVIDIA GeForce RTX 3060
5 Python 3.7.16
6 Anaconda 4.13.0
7 NetworkX 2.6.3
8 Joblib 1.1.0

​ 本课题参考表3-3建立了本次实验的环境,使用Windows Subsystem for Linux,Ubuntu 22.04作为操作系统,独立建立Anaconda环境,适配大部分第三方Python库的版本。同时,所用的硬件型号可以支持本课题的运算量,能够在个人电脑上开展。


四. 总结与展望

​ 一个合理的局域网网络结构需要能够最大限度地提高网络吞吐量、减少数据丢失率,同时保证网络的可靠性。在局域网网络设计过程中,需要考虑网络中节点的分布以保证网络性能的最优化。在这些节点中,存在的异常节点包括了网络中的恶意攻击、硬件故障和软件错误等问题,这些异常节点的存在会对局域网网络的正常运行造成严重影响。通过异常节点的识别,可以及时发现和排除这些问题,从而保证网络的可靠性和稳定性。可靠性分析则是针对局域网网络的各项指标进行综合评估,以进一步提高网络的可靠性和稳定性。

​ 针对网络结构的研究一直未曾停止,图论算法在检测图网络中异常节点方面具有重要的应用价值。其中,基于中心性的算法(如介数中心性、接近中心性)可以用于发现网络中的关键节点,进一步识别和定位异常节点。这些算法在局域网网络的管理中具有重要的应用价值。

​ 本文参考了国内外研究学者在这一领域的工作,确定了以图论算法为数学支撑的一系列图特征检测方法,简洁实用的设计了在实际企业局域网内进行异常节点分析的系统,避开了图神经网络的复杂计算,是对众多图论基础算法研究的有效应用。

​ 在线下自采数据集中,利用NetworkX库的接口实现了多种图特征的计算,将三种特征表征粒度应用到算法中,实现了全面的异常检测。并辅以端口扫描检测,关键字段分析等策略推测其异常场景,涵盖了常见的硬件故障,通信故障,攻击事件等,实现了有效的可靠性分析。

​ 而在公开数据集LANL上,本文利用类似的方法检测并识别其中的异常节点,并基于红队事件的基本事实进行效果检验。通过本课题的异常节点识别方法发现了其中大量的异常节点,检测结果能够覆盖其中超过90%的异常事件,且具有良好的可用性。

​ 总体来说,本文实现了由线下自采数据集到公开数据集的异常节点检测与可靠性分析。针对网络异常节点检测,本文结合已有的图论算法,验证了本课题方法的可行性。整体检测效果良好,泛用性佳,与开题阶段的预期成果一致,为解决多种网络通信安全问题提供了思路与方法。

About

Graduation project in Cybersecurity department, 2022.12-2023.06.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages