Skip to content

binlijin/bigdata

 
 

Repository files navigation

bigdata

目前 "AI + 云 + 大数据" 做为企业标配的趋势越来越明显,本 repo 也将专注这几块内容:

  • AI 方面将主要学习使用 机器学习 + TensorFlow,若之后精力允许,将继续学习深度学习;
  • 云方面将主要学习 Docker + Kubernetes;
  • 大数据方面主要学习 Hadoop + Spark/Flink/JStorm。

本 repo 主要记录工作中学习了解的知识与遇到的问题,权当笔记使用。希望将这些知识应用于工作,毕竟专业知识只有提高生产力或变现才有价值。

Todo

  • [HBase off heap]
  • [Spark Shuffle]
  • [Spark数据倾斜]
  • RPC分析

Doing

  • Kubernetes
  • Docker

计划

  • Hive/Spark CBO
  • Spark 相关[:TODO 11月底完成][: Delay]
  • 机器学习 [:TODO 圣诞节前后开始重点学习]

Passages:

About

hadoop,hbase,storm,spark,etc..

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Java 60.2%
  • Shell 39.8%