Skip to content

📊 数据挖掘常用算法:关联分析Apriori算法,数据分类决策树算法,数据聚类K-means算法

Notifications You must be signed in to change notification settings

chgl16/data-mining-algorithm

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

数据挖掘算法

  1. 关联分析Apriori算法
  2. 数据分类决策树算法
  3. 数据聚类K-means算法

关联分析Apriori算法

以超市交易为数据集,所有商品的项集为
I = {bread, beer, cake, cream, milk, tea}
某条交易如
Ti = {bread, beer, milk}
简化为
Ti = {a, b, d}
data.txt数据集样本如下

a, d, e,f
a, d, e
c, e
e, f
...

使用经典的Apriori算法,依次扫描交易记录集,计算出 k-候选集Ck 然后去除支持度sup小的项集获得 k-频繁集Lk, 只计算到 3-频繁集

第k个候选集只会从k-1频繁集中的各项目组合连接,然后扫描记录集,以获取Ck中各项集的支持度。

输出结果

数据分类决策树算法

数据聚类K-means算法

About

📊 数据挖掘常用算法:关联分析Apriori算法,数据分类决策树算法,数据聚类K-means算法

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages