Skip to content

C#实现的FPGrowth算法与可视化 / FP-Growth Algorithm and Visualization in C#

Notifications You must be signed in to change notification settings

lpaladin/csFPGrowth

Repository files navigation

C#程序设计 - 期末大作业:

频繁模式挖掘与可视化工具

周昊宇 / 1200012823

2013 / 12 / 17

提示:欲打开项目,请打开csFinalHomework文件夹下的csproj工程文件!
=====================================
概述:
本工具是基于FP-Growth算法的频繁模式挖掘工具,
同时提供了可视化工具便于直观查看频繁项之间的关系。


功能特性:

支持从文件或数据源(ODBC或SQL)读取数据集
支持以整数或字符串作为条目读取数据集
使用FP-Growth+Hashtable,算法效率较高
使用多线程进行后台处理并实时显示进度,提高用户体验
可以通过点击列标对结果进行排序
支持以可旋转的球状标签云显示指定数目的频繁项集和项之间的关联程度
支持自定义标签云显示颜色
支持实时显示标签云中项目的关联信息


编程过程中使用的特性:

多线程编程
泛型编程
GDI+
数据库访问
Property、Attribute
等等……


备注:

随程序提供了测试数据集
mushroom.dat(建议阈值5%~25%)
retail.dat(建议阈值0.1%以上)
T10I4D100K.dat(建议阈值0.1%~0.5%)
theidiot_请使用字符串模式打开.dat(建议阈值0.5%以上)

从数据源读取似乎有Bug,尚未解决……

About

C#实现的FPGrowth算法与可视化 / FP-Growth Algorithm and Visualization in C#

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages