Skip to content

用Spark进行用户行为分析

Latest
Compare
Choose a tag to compare
@FocusOn1 FocusOn1 released this 04 Jul 09:14
2e62bdc

这是大数据应用的代码文件,注意:

  • 执行顺序:四个.ipynb文件执行顺序按照前面的序号1-4依次进行
  • 代码顺序说明:
    • 1.UserBehavior.csv.ipynb:大文件提前处理数据UserBehavior.csv
    • 2.csv.ipynb:大文件保存csv(防止数据丢失所以保存副本)
    • 3.UserBehavior.csv.DF.SQL.ipynb:大数据大文件UserBehavior.csv处理DF、SQL
    • 4.UserBehaviorDHSample500w.csv.rdd.ipynb:大数据UserBehaviorDHSample500w.csv操作rdd

当然,如果您的电脑内存足够,那么可以将这4个代码文件合并起来执行~