# DDL建表高阶语法

# 1 Hive Views 视图

## 1.1 概念

Hive中的视图（view）是一种虚拟表，只保存定义，不实际存储数据。

通常从真实的物理表查询中创建生成视图，也可以从已经存在的视图上创建新视图。

创建视图时，将冻结视图的架构，如果删除或更改基础表，则视图将失败。

视图是用来简化操作的，不缓冲记录，也没有提高查询性能。

**修改基础表的数据，视图也会随之变化**

![%E8%A7%86%E5%9B%BE%E6%A6%82%E5%BF%B5.png](attachment:%E8%A7%86%E5%9B%BE%E6%A6%82%E5%BF%B5.png)

## 1.2 相关语法

![%E8%A7%86%E5%9B%BE%E8%AF%AD%E6%B3%95.png](attachment:%E8%A7%86%E5%9B%BE%E8%AF%AD%E6%B3%95.png)

## 1.3 视图的好处

- 将真实表中特定的列数据提供给用户，保护数据隐式


![%E8%A7%86%E5%9B%BE%E7%9A%84%E5%A5%BD%E5%A4%841.png](attachment:%E8%A7%86%E5%9B%BE%E7%9A%84%E5%A5%BD%E5%A4%841.png)

- 降低查询的复杂度，优化查询语句

![%E8%A7%86%E5%9B%BE%E7%9A%84%E5%A5%BD%E5%A4%842.png](attachment:%E8%A7%86%E5%9B%BE%E7%9A%84%E5%A5%BD%E5%A4%842.png)

# 2 Hive3.0新特性：Materialized Views 物化视图

## 2.1 概念

物化视图（Materialized View）是一个包括查询结果的数据库对像，可以用于预先计算并保存表连接或聚集等耗时较多的操作的结果。在执行查询时，就可以避免进行这些耗时的操作，而从快速的得到结果。

使用物化视图的目的就是通过预计算，提高查询性能，当然需要占用一定的存储空间。

![%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E6%A6%82%E5%BF%B5.png](attachment:%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E6%A6%82%E5%BF%B5.png)

- Hive3.0开始尝试引入物化视图，并提供对于物化视图的查询自动重写机制（基于Apache Calcite实现）。
- Hive的物化视图还提供了物化视图存储选择机制，可以本地存储在Hive，也可以通过用户自定义storage handlers存储在其他系统（如Druid）。
- Hive引入物化视图的目的就是为了优化数据查询访问的效率,相当于从数据预处理的角度优化数据访问。
- Hive从3.0丢弃了index索引的语法支持，推荐使用物化视图和列式存储文件格式来加快查询的速度。

## 2.2 物化视图、视图的区别

- 视图是虚拟的，逻辑存在的，只有定义没有存储数据。
- 物化视图是真实的，物理存在的，里面存储着预计算的数据。
- 物化视图能够缓存数据，在创建物化视图的时候就把数据缓存起来了，Hive把物化视图当成一张“表”，将数据缓存。而视图只是创建一个虚表，只有表结构，没有数据，实际查询的时候再去改写SQL去访问实际的数据表。
- **视图的目的是简化降低查询的复杂度，而物化视图的目的是提高查询性能。**

## 2.3 语法

- 物化视图创建后，select查询执行数据自动落地，“自动”也即在query的执行期间，任何用户对该物化视图是不可见的,执行完毕之后物化视图可用；
- 默认情况下，创建好的物化视图可被用于查询优化器optimizer查询重写，在物化视图创建期间可以通过DISABLE REWRITE参数设置禁止使用。

![%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E8%AF%AD%E6%B3%951.png](attachment:%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E8%AF%AD%E6%B3%951.png)

- 默认SerDe和storage format为hive.materializedview.serde、 hive.materializedview.fileformat；
- 物化视图支持将数据存储在外部系统（如druid），如下述语法所示：

![%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E8%AF%AD%E6%B3%952.png](attachment:%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E8%AF%AD%E6%B3%952.png)

- 目前支持物化视图的drop和show操作，后续会增加其他操作

![%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E8%AF%AD%E6%B3%953.png](attachment:%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E8%AF%AD%E6%B3%953.png)

- 当数据源变更（新数据插入inserted、数据修改modified），物化视图也需要更新以保持数据一致性，目前需要用户主动触发rebuild重构。

![%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E8%AF%AD%E6%B3%954.png](attachment:%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E8%AF%AD%E6%B3%954.png)

## 2.4 基于物化视图的查询重写

- 物化视图创建后即可用于相关查询的加速，即：用户提交查询query，若该query经过重写后可以命中已经存在的物化视图，则直接通过物化视图查询数据返回结果，以实现查询加速。
- 是否重写查询使用物化视图可以通过全局参数控制，默认为true： hive.materializedview.rewriting=true;
- 用户可选择性的控制指定的物化视图查询重写机制，语法如下：

![%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E6%9F%A5%E8%AF%A2%E9%87%8D%E5%86%99.png](attachment:%E7%89%A9%E5%8C%96%E8%A7%86%E5%9B%BE%E6%9F%A5%E8%AF%A2%E9%87%8D%E5%86%99.png)

## 2.5 基于物化视图的查询重写案例

![%E6%9F%A5%E8%AF%A2%E9%87%8D%E5%86%99%E6%A1%88%E4%BE%8B%E4%BB%A3%E7%A0%811.png](attachment:%E6%9F%A5%E8%AF%A2%E9%87%8D%E5%86%99%E6%A1%88%E4%BE%8B%E4%BB%A3%E7%A0%811.png)

![%E6%9F%A5%E8%AF%A2%E9%87%8D%E5%86%99%E6%A1%88%E4%BE%8B%E4%BB%A3%E7%A0%812.png](attachment:%E6%9F%A5%E8%AF%A2%E9%87%8D%E5%86%99%E6%A1%88%E4%BE%8B%E4%BB%A3%E7%A0%812.png)

![%E6%9F%A5%E8%AF%A2%E9%87%8D%E5%86%99%E6%A1%88%E4%BE%8B%E4%BB%A3%E7%A0%813.png](attachment:%E6%9F%A5%E8%AF%A2%E9%87%8D%E5%86%99%E6%A1%88%E4%BE%8B%E4%BB%A3%E7%A0%813.png)