Skip to content

Home zh CN

dmetasoul01 edited this page Jul 1, 2022 · 4 revisions

LakeSoul 是数元灵研发的构建于 Apache Spark 引擎之上的流批一体表存储框架,具备高可扩展的元数据管理、ACID 事务、高效灵活的 upsert 操作、Schema 演进和批流一体化处理。

LakeSoul 实现了在表上的行列级别 Upsert 功能,并能够高并发地更新同一个分区。LakeSoul 采用 LSM-Tree 的结构来组织对哈希分区表的更新,在云上对象存储上能够获得极高的写吞吐(30MB/s/core);同时 LakeSoul 通过高度优化的 Merge on Read 来实现优秀的读性能。LakeSoul 采用分布式 DB 来管理和扩展元数据。

具体特性请参考: 特性介绍