谷歌的 GFS,MapReduce 和 BigTable,雅虎的 Hadoop,Facebook 的 Cassandra 和 Hive,Twitter 的 Storm,LinkedIn 的 Kafka
这个就是罗列了大数据相关的技术,只是一句话的描述。主要看重的是下面的论文整理。 大数据技术汇总 Data Hub: A Generalized Metadata Search & Discovery Tool https://www.cnblogs.com/DataPipeline2018/p/11434893.html
非常好,值得细看 大规模数据处理的演化历程(2003-2018)
介绍了uber大数据基础平台的搭建历史,最终为了update的时效性,推出hudi,非常值得深究 Uber 大数据平台的演进(2014~2019) 别人家的元数据系统是怎么设计的
[]When to use Cassandra, MongoDB, HBase, Accumulo and MySQL(https://blog.ippon.tech/use-cassandra-mongodb-hbase-accumulo-mysql/)
Apache Kylin 原理介绍与新架构分享(Kylin On Parquet)
类TiDB、cockroachDB https://www.yugabyte.com/