Skip to content

Latest commit

 

History

History
43 lines (25 loc) · 1.81 KB

links.md

File metadata and controls

43 lines (25 loc) · 1.81 KB

谷歌的 GFS,MapReduce 和 BigTable,雅虎的 Hadoop,Facebook 的 Cassandra 和 Hive,Twitter 的 Storm,LinkedIn 的 Kafka

过往记忆大数据

dbaplus

infoq

hbase原理简述

这个就是罗列了大数据相关的技术,只是一句话的描述。主要看重的是下面的论文整理。 大数据技术汇总 Data Hub: A Generalized Metadata Search & Discovery Tool https://www.cnblogs.com/DataPipeline2018/p/11434893.html

非常好,值得细看 大规模数据处理的演化历程(2003-2018)

介绍了uber大数据基础平台的搭建历史,最终为了update的时效性,推出hudi,非常值得深究 Uber 大数据平台的演进(2014~2019) 别人家的元数据系统是怎么设计的

[]When to use Cassandra, MongoDB, HBase, Accumulo and MySQL(https://blog.ippon.tech/use-cassandra-mongodb-hbase-accumulo-mysql/)

test

Dapper,大规模分布式系统的跟踪系统

Apache Kylin 原理介绍与新架构分享(Kylin On Parquet)

读 Streaming Systems (一)

Streaming Systems (二)

How to beat the CAP theorem

类TiDB、cockroachDB https://www.yugabyte.com/

apache bookkeeper papers and presentations