bigdata 大数据相关的一些笔记。 PS: 很多知识点看过却未总结出来,后续尽量补充。 Todo [HDFS小文件问题] [HBase off heap] [Spark Shuffle] [Hive数据倾斜] [Spark数据倾斜] RPC分析 计划 Hive CBO Spark 相关[:TODO 11月底完成] 机器学习 [:TODO 圣诞节前后开始重点学习] Passages: 压缩 集群调优