Skip to content

Latest commit

 

History

History
98 lines (60 loc) · 3.26 KB

2018-05-30-postgresql-greenplum-solution-note.md

File metadata and controls

98 lines (60 loc) · 3.26 KB
layout category tags title
post
database
product
database
solution
PostgreSQL&Greenplum Solution Practice Note

PostgreSQL&Greenplum解决方案实践


I.PostgreSQL

1.PostgreSQL10(OLTP Solution)

2.PgBouncer数据库连接池

pgbouncer -d /etc/pgbouncer/pgbouncer.ini

psql -h 10.110.64.101 -p 6432 -U ir_user -d irview_iadt

3.PostgreSQL新特性

  • Parallel Query In PostgreSQL

  • 多核并行,单条SQL可以利用多个CPU并行计算。处理大查询非常高效

  • 向量计算,使用CPU的向量计算指令,减少函数回调,大幅提升大量数据处理的性能

  • JIT,动态编译,在处理大量的条件过滤或表达式时,性能提升非常的明显

  • 列存储,更容易和JIT,向量计算结合,同时在处理按列统计时,效果非常好。

    需安装插件(imcs, cstore)

  • 算子复用,一些聚合操作,中间步骤复用算子,减少运算量。效果提升也比较明

  • GPU,利用GPU的计算能力,例如在十多个大表的JOIN时,效果提升20倍以上

    需安装插件(pg_strom)

  • FPGA,利用FPGA的计算能力,效果与GPU类似。

    需安装插件

  • MPP插件,例如Citus插件,,可以把PG数据库变成分布式数据库。

    需安装插件(citus)

  • 流式计算,将计算分摊到每分每秒,解决集中式计算的运力需求。就好像春运一样,需要大量运力,而流计算不需要大量运力,因为把春运抹平了。

    需安装插件(pipelinedb)

  • 时序插件,对应时序处理很有效。

    需安装插件(timescale)

  • R、Python组件,用户可以编写R或Python的计算逻辑,在数据库中直接运行用户编写的代码,将数据和计算整合在一起,提升效率。

    安装语言插件(plpython, plr)

  • MADLib,机器学习库。通过函数接口进行调用,也是进军OLAP的信号。

    需安装插件(madlib)

4.PostgreSQL-XL

Postgres-XL is a horizontally scalable open source SQL database cluster, flexible enough to handle varying database workloads:

- OLTP write-intensive workloads
- Business Intelligence requiring MPP parallelism
- Operational data store
- Key-value store
- GIS Geospatial
- Mixed-workload environments
- Multi-tenant provider hosted environments

5.CitusDB分布式

PostgreSQL vs Greenplums

II.Greenplum(OLAP Solution)

Greenplum5