# OLTP场景


OLTP场景主要是为了应对高并发要求.pg天生为OLTP场景设计,在单机情景下,PG的性能指标可以随TPS维持双曲线甚至对数曲线上升,到顶峰之后不再下降.同时支持分区操作,可以进一步优化插入和简单查询性能;也可以使用主备模式做按业务区分的读写分离,使用主备模式做高可用.

除此之外pg可以直接查询数据库的自身状态,以便于在需要时进行优化.

## 单机PG的极限


项目|限制
---|---
最大单个数据库大小|不限	
最大数据单表大小|32 TB
单条记录最大|1.6 TB
单字段最大允许|1 GB
单表允许最大记录数|不限
单表最大字段数|250 - 1600 (取决于字段类型)
单表最大索引数|不限



## 自我检测

类似linux中所有资源都是文件,pg中所有的数据都保存在表里.因此pg可以通过sql语句直接查询自身状态.比较常见的检查项包括:

+ 数据库容量
+ 表容量
+ 最大连接数
+ 当前连接数
+ 执行时间最长的查询

In [1]:
-- connection: postgres://postgres:postgres@localhost:5432/test

In [2]:
-- autocommit: true

switched autocommit mode to True

### 数据库容量

查看数据库的使用容量情况可以使用如下语句:

In [3]:
SELECT
    d.datname AS NAME,
    pg_catalog.pg_get_userbyid ( d.datdba ) AS OWNER,
CASE
    WHEN pg_catalog.has_database_privilege ( d.datname, 'CONNECT' ) THEN
        pg_catalog.pg_size_pretty ( pg_catalog.pg_database_size ( d.datname ) ) ELSE'No Access' 
END AS SIZE 
FROM
    pg_catalog.pg_database d 
ORDER BY
CASE
    WHEN pg_catalog.has_database_privilege ( d.datname, 'CONNECT' ) THEN
        pg_catalog.pg_database_size ( d.datname ) ELSE NULL 
END DESC 
    LIMIT 20;

4 row(s) returned.


name,owner,size
test,postgres,7717 kB
postgres,postgres,7601 kB
template1,postgres,7545 kB
template0,postgres,7545 kB


### 所有表容量

In [16]:
SELECT
table_name,
pg_size_pretty(table_size) AS table_size,
pg_size_pretty(indexes_size) AS indexes_size,
pg_size_pretty(total_size) AS total_size
FROM (
SELECT
table_name,
pg_table_size(table_name) AS table_size,
pg_indexes_size(table_name) AS indexes_size,
pg_total_relation_size(table_name) AS total_size
FROM (
SELECT ('"' || table_schema || '"."' || table_name || '"') AS table_name
FROM information_schema.tables
) AS all_tables
ORDER BY total_size DESC
) AS pretty_sizes
limit 10

10 row(s) returned.


table_name,table_size,indexes_size,total_size
"""pg_catalog"".""pg_depend""",480 kB,696 kB,1176 kB
"""pg_catalog"".""pg_proc""",648 kB,344 kB,992 kB
"""pg_catalog"".""pg_rewrite""",584 kB,32 kB,616 kB
"""pg_catalog"".""pg_attribute""",424 kB,192 kB,616 kB
"""pg_catalog"".""pg_description""",360 kB,184 kB,544 kB
"""pg_catalog"".""pg_collation""",216 kB,80 kB,296 kB
"""pg_catalog"".""pg_statistic""",232 kB,16 kB,248 kB
"""pg_catalog"".""pg_class""",128 kB,120 kB,248 kB
"""pg_catalog"".""pg_operator""",152 kB,88 kB,240 kB
"""pg_catalog"".""pg_amop""",88 kB,112 kB,200 kB


### 单表容量

In [5]:
select pg_size_pretty(pg_relation_size('test'))

1 row(s) returned.


pg_size_pretty
8192 bytes


### 最大连接数

In [6]:
show max_connections

1 row(s) returned.


max_connections
100


### 当前连接数

In [7]:
select count(1) from pg_stat_activity

1 row(s) returned.


count
6


### 查看当前的事务id是否接近临界值

In [8]:
select max(age(datfrozenxid)) from pg_database

1 row(s) returned.


max
56


### 查询按照最老的事务ID排序查看大于1G而且是排名前20的表

In [9]:
SELECT relname, age(relfrozenxid) as xid_age, pg_size_pretty(pg_table_size(oid)) as table_size FROM pg_class WHERE relkind = 'r' and pg_table_size(oid) > 1073741824
ORDER BY age(relfrozenxid) DESC LIMIT 20;

0 row(s) returned.


### 查看耗时查询

## 优化

### 删除无效连接

连接中状态为`idle`的为闲置连接,在必要的时候可以删除

In [10]:
SELECT pg_terminate_backend(pid) FROM pg_stat_activity WHERE state='idle';

0 row(s) returned.


### 回收空间

pg中delete操作并不会直接将数据删除回收数据占用的空间,而是将其标识为删除状态,因此你会发现执行了delete操作后表的大小基本没变.

pg中使用命令`vacuum`来回收,主要作用是回收已经不需要的记录占据的空间.定期vacuum是一个重要的工作.

vacuum的效果：

1. 释放,再利用 更新/删除的行所占据的磁盘空间.
1. 更新POSTGRESQL查询计划中使用的统计数据.PG在做查询处理的时候,为了是查询速度提高,会根据统计数据来确定执行计划.如果不及时更新的话,查询的效果可能不如预期.
1. 防止因事务ID的重置而使非常老的数据丢失.PG中每一个事务都会产生一个事务ID,但这个数字是有上限的.当事务ID达到最大值后,会重新从最小值开始循环.这样如果不及时把以前的数据释放掉的话,原来的老数据会因为事务ID的丢失而丢失掉.

通常`VACUUM`有两种

1. `VACUUM` vacuum就是进行扫除,找到那些旧的'死'数据,把它们所知的行标记为可用状态.但是它不进行空间合并.一般OLTP场景需要定时做这个操作,它不会阻塞其他sql语句执行.
2. `VACUUM FULL` 除了vacuum,还进行空间合并,因此它会锁表,但执行完后性能可以得到优化,并且会释放空间.这个比较适合离线的olap场景,定期做数据下沉.

In [11]:
VACUUM test

### EXPLAIN命令查看语句执行计划

我们在写一个sql语句的时候最好使用`EXPLAIN`命令预估一下其性能消耗.`EXPLAIN (ANALYSE)`会列出执行计划并实际执行以对比.而`EXPLAIN`则只会列出执行计划

In [13]:
EXPLAIN
SELECT *
FROM "test"
WHERE a::numeric >2

2 row(s) returned.


QUERY PLAN
Seq Scan on test (cost=0.00..1.07 rows=1 width=1032)
Filter: ((a)::numeric > '2'::numeric)


In [12]:
EXPLAIN (ANALYSE)
SELECT *
FROM "test"
WHERE a::numeric >2

5 row(s) returned.


QUERY PLAN
Seq Scan on test (cost=0.00..1.07 rows=1 width=1032) (actual time=0.006..0.008 rows=2 loops=1)
Filter: ((a)::numeric > '2'::numeric)
Rows Removed by Filter: 2
Planning Time: 0.058 ms
Execution Time: 0.018 ms


## 锁

OLTP场景中我们通常除了插入操作还会有删除,更新这些操作,锁就是在高并发情景下保证数据一致性的工具.pg下默认是不需要显式的使用锁的,但pg页支持表级,行级和页级锁.他们可以用于手动的控制并发访问

关于pg的锁可以看[官方文档中相关的内容](http://www.postgres.cn/docs/10/explicit-locking.html)


### 查询被锁的情况

查询表是否被锁可以使用如下命令

+ 填入可能锁表了的表以获取oid

In [14]:
select oid from pg_class where relname='test'

1 row(s) returned.


oid
40961


+ 用上面查出来的oid确认是否由pid被锁

In [15]:
select pid from pg_locks where relation='40961'

0 row(s) returned.


### 释放锁

如果查询到了结果,表示该表被锁则需要释放锁定.

```sql
select pg_cancel_backend(上面查到的pid)
```

## 主备高可用方案