Skip to content

Latest commit

 

History

History
174 lines (89 loc) · 13.9 KB

db.md

File metadata and controls

174 lines (89 loc) · 13.9 KB

数据库系统(Database System)资料

书籍

介绍:经典书籍,数据库系统概念。数据库领域的殿堂级作品。夯实数据库理论基础,增强数据库技术内功的必备之选。内容涉及很广:表、SQL、关系模型、事务、数据库设计、分布式、存储、索引、查询处理与优化、并发、数据库分析(postgresql,SQL server)。书的难度系数对于刚刚入门的同学可能不太适合,但可以当作"词典”。配套书籍网站.

介绍:经典书籍,数据库系统基础教程。讲述关系数据模型、ER图、约束与触发器、SQL、视图。适合入门数据库系统的同学。

介绍:剖析数据系统内部架构,本文一共包括 8 章,分别是:第 1 章概述,第 2 章进程模型,第 3 章并行体系结构:进程和内存协调,第 4 章关系查询处理器,第 5 章存储管理,第 6 章事务:并发控制和恢复,第 7 章共享组件,第 8 章结束语。中文版由厦门大学数据库实验室翻译

介绍:数据库领域红宝书重出江湖。《Readings in Database Systems, 5th Edition》评注版 Peter Bailis, Joseph M. Hellerstein, Michael Stonebraker编著。十年之后,内容大变,传统数据库架构彻底重写,bigdata浪潮影响深远,数据库领域必看书籍。里面包含有数据挖掘、查询优化、数据库语言.

介绍:斯坦福大学本科教材,这本阐述了实现关系数据库系统各个层面的关键技术。主要分为三部分:存储管理器、查询处理器和事务管理器的实现技术。书中从存储,Index,SQL compiler,optimizer, log,事务等关键技术。不太适合数据库入门初学者,理论很多信息量大。英文版

课程

介绍:卡内基梅隆2018年春季高级数据库课程,对现代数据库管理系统内部的全面研究。它将涵盖高性能事务处理系统(OLTP)和大规模分析系统(OLAP)中的组件核心概念和基础知识。它的阅读列表课堂笔记课件都已经开放。并且提供了视频

介绍:麻省理工学院数据库系统的一门核心课程。由数据库Samuel Madden教授DB Lab推出的课程。前半部分比较基础的数据库的知识包含关系代数、数据模型、范式、查询优化、事务,后半段主要在讲分布式数据库,讲如何达到数据一致性,也是database比较火的研究方向。

介绍:使用并且实现一个数据库系统,这门课程是德国慕尼黑工业大学开设,包含两部分:实现和使用。内容有:事务管理、错误处理、多用户同步、数据的结构、请求处理、分布式数据库、OLTP/OLAP、XML、性能评估。

查询/优化器

介绍:本篇论文讲述如何架构一个查询编译器,SQL如何被执行、查询评估、如何处理并行执行、查询器的优化、以及最后的TPC测试。

介绍:分析型数据库和OLTP数据库需要不同的利弊权衡方式。这反映在索引数据结构的选择上。此文讨论了许多更适合分析型数据库的索引数据结构。

介绍:Google利用深度学习改善索引创建,提交查询效率

事务

介绍:这门课程是德国慕尼黑工业大学开设的关于数据库事务课程。内容有:计算模型、并发控制算法、多版本并发控制、并发控制在对象/查询结构/关系数据库的应用、事务恢复、page恢复算法、如何实现。主要是课件

介绍:事务隔离是数据库系统设计中根本的组成部分,本文主要从标准层面来讨论隔离级别的划分方式,先解释事务隔离分级的原因以及标准制定的目标;之后概述其发展历史;最后介绍Atul Adya给出的比较合理的隔离级别定义。参考序列化

介绍:Percolator是由Google公司开发的、为大数据集群进行增量处理更新的系统,主要用于google网页搜索索引服务。使用基于Percolator的增量处理系统代替原有的批处理索引系统后,Google在处理同样数据量的文档时,将文档的平均搜索延时降低了50%。笔记参考

介绍:通过事务批量和操作的重排序来提高乐观并发控制性能

  • [《Omid: Lock-free transactional support for distributed data stores》]

介绍:Omid一种无锁分布式事务,它是Yahoo公司研发的在大规模分布式存储之上提供事务功能的组件,每隔一段时间都会发布一篇论文。分别是《Taking Omid to the Clouds》《Omid, Reloaded: Scalable and Highly-Available Transaction Processing》。阅读时推荐和Google发表的Percolator论文一起阅读

介绍:经典书籍,讨论数据库的并发控制和恢复。序列化、两阶段锁、MVCC、分布式数据恢复、数据复制

介绍:对ANSI SQL 隔离级别的批评。ANSI SQL-92 提出了最经典的隔离级别定义,包括读未提交(Read Uncommitted)、读提交(Read Committed)、可重复读(Repeatable Read)和可序列化(Serializable)。本文显示,这些phenomena和ANSI SQL定义无法正确表征几个流行的隔离级别,包括对于不同隔离级别标准的锁实现。本文调查了phenomena说明中的歧义,并提出了更正式的说明;此外,介绍了更好地表征隔离类型的新phenomena。最后,定义了一个称为快照隔离的重要的多版本隔离类型。

介绍:这篇文章,指出了此前对隔离级别定义重度依赖数据库的实现,并且提出了与实现无关的隔离级别定义。

介绍:快照隔离首先是在《A Critique of ANSI SQL Isolation Levels 》中被提出。本文主要讲述PostgreSQL中基于 Snapshot Isolation 的可串行化实现。

关系模型

介绍:CMU 数据课程,讲述数据库关系模型

NewSQL

介绍:这本论文主要是讲述Spanner的之所以能成功的一些工程经验。如何为一个强大的分布式数据库内核添加SQL支持,如何处理并发问题。其中还列举出了两个案例:分布式中TOPK问题、JOIN随机读问题。

介绍:vldb2019年会议论文,如何构建可快速查询的KV存储系统.讲述了KV系统构建时的权衡.该篇是作者博士论文<Tell: An Elastic Database System for Mixed Workloads>的精简版

介绍:在线异步执行F1 DDL操纵.F1团队提出了一种安全的Schema变更算法。本文将先简单介绍KV存储引擎的提供的接口,然后分析异步的Schema变更导致的问题,最后再描述F1的Schema变更算法以及其限制点。参考阅读异步 schema 变更TiDB 的异步 schema 变更实现

介绍:Aurora是一个 OLTP 的关系型数据库。这篇论文描述Aurora架构和设计时的考量。高吞吐的数据处理瓶颈,已经从计算和存储,转移到了网络。Aurora的主要是为了解决多租户scale-out、共享存储、网络瓶颈。阅读笔记Amazon Aurora: 云原生关系数据库的设计

介绍:vldb2019年会议论文,本文重点讨论了Azure的自动索引推荐系统,讨论了整个过程的细节和反馈。相关笔记

介绍:本文详细讲述了腾讯分布式数据库TDSQL的实现细节和考量

介绍:AnalyticDB是阿里云构建的OLAP分布式计算数据库,是一种存储和计算分离的架构。在论文中,提到了和阿里基础设施服务盘古和伏羲的结合,并且在此基础上面做的一些工作。论文中有很多大胆的设计,例如所有列都有索引,减少用户的索引维护成本。读写分离,读节点定时拉,写节点主动下推。

介绍:这篇论文主要讲述PushdownDB 如何利用AWS S3做为存储组件。把DBMS的一些过滤、聚合、映射下发至S3并得到响应结果。其实利用S3用于底层存储AWS 在Aurora就有实现。

学者

介绍:卡内基梅隆的Daniel Abadi教授,HadoopDB的作者。他的博客 质量很高。譬如讨论事务隔离级别2阶段提交

存储

介绍:这篇论文介绍了阿里云面向大规模流量场景设计的自研存储引擎X-Engine,设计采用分层存储的全新理念,可以根据数据访问频度将数据合理归位,实现快存快取。POLARDB是基于x-engine

其他

介绍:Apache Spark作者Reynold Xin推荐的数据库阅读清单

介绍:PingCAP下面的数据库学习资料repository.

介绍:2019-2020年著名数据库顶级会议之一的VLDB投稿论文列表,论文涵盖:测试、机器学习、数据存储、查询、图、索引、大数据领域等。