Skip to content

yichuancq/book-recommender-system

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 

Repository files navigation

book-recommendation-system

spring boot2 图书推荐系统

Apriori算法

Apriori算法使用一种称为逐层搜索的迭代方法,其中k项集用于探索(k+1)项集(如使用频繁1项集找到频繁2项集),其实现过程如下:

(1) 通过扫描数据库,累计每个项的计数,并收集满足最小支持度的项,找出频繁1项集的集合。该集合记作L1;

(2) 使用L1找出频繁2项集的集合L2,使用L2找出L3;

(3) 如此下去,直至不能再找到频繁k项集,每找出一个Lk需要一次完整的数据库扫描。

FP-growth算法

FP-growth(Frequent Pattern Tree, 频繁模式树),是将数据集存储在一个特定的称作FP树的结构之后发现频繁项集或频繁项对,即常在一块出现的元素项的集合FP树。

FP-growth算法比Apriori算法效率更高,在整个算法执行过程中,只需遍历数据集2次,就能够完成频繁模式发现,其发现频繁项集的基本过程如下:

(1) 构建FP树

(2) 从FP树中挖掘频繁项集

FP-growth的一般流程如下:

(1) 先扫描一遍数据集,得到频繁项为1的项目集,定义最小支持度(项目出现最少次数),删除那些小于最小支持度的项目,然后将原始数据集中的条目按项目集中降序进行排列。

(2) 第二次扫描,创建项头表(从上往下降序),以及FP树。

(3) 对于每个项目(可以按照从下往上的顺序)找到其条件模式基(CPB,conditional patten base),递归调用树结构,删除小于最小支持度的项。如果最终呈现单一路径的树结构,则直接列举所有组合;非单一路径的则继续调用树结构,直到形成单一路径即可。

About

spring boot2 图书推荐系统

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages