Greenplum 内核升级至PostgreSQL 9.6

2019年9月4日Greenplum 6.0于北京全球首发PostgreSQL 内核升级至9.5之后,Greenplum内核研发团队历时两个月完成内核 9.6 的升级。PostgreSQL 9.6 是 PostgreSQL 的一个重要里程碑,包含很多重量级特性,此次升级,大大加强了 Greenplum 的总体能力,为Greenplum的持续稳定创新奠定全新基础。


yydzero=# select version();
version
PostgreSQL 9.6beta4 (Greenplum Database 7.0.0-alpha.0+dev.5169.g38d88155520 build dev) on x86_64-apple-darwin18.2.0, compiled by Apple LLVM version 10.0.0 (clang-1000.11.45.5), 64-bit compiled on Nov 7 2019 21:52:38 (with assert checking)
(1 row)


PostgreSQL 9.6 包含2,953个提交,新引入约17万行代码。简要列出主要亮点特性:


  • 查询优化器增强:PostgreSQL 9.6 对优化器进行了重要重构,以支持并行执行等新特性。其中最主要的修改是对优化器上层算子(聚集、排序、分组等)使用 Path,这样可以根据不同的算子路径的cost选择最佳路径。
  • 并行执行:PostgreSQL 9.6 开始支持并行执行以提高单个查询的性能,这将大大提升单个 Greenplum 查询的性能,对并发较低,低延迟要求高的场景非常有用。根据CPU cores 的不同,期待OLAP性能有数倍提升(假设20个core,40个超线程,一台主机4个primary,假设一计算密集型查询有2个slices,在启用并行执行后,可以充分利用全部cpu 20 个core 的算力,性能可有5倍提升:20*2 / 4 / 2)。目前这一特性默认是disabled,很快会enable此特性,期待 TPC-H 性能测试结果 😉
  • 多阶段聚集:Greenplum 很早就支持了多阶段聚集特性,PostgreSQL 9.6也开始支持多阶段聚集。此次升级对这个特性进行了合并,对用户的主要影响是 EXPLAIN 的输出发生了变化。
  • 多核性能提升:PostgreSQL 9.6 包含对多核的重要优化,可以明显提升查询总体性能;此外sorting也进行了多项优化。
  • 同步复制支持多个副本
  • 全文检索支持 phrase 查询
  • FDW 支持 join、sort 下推,支持 UPDATE、DELETE



有关 PostgreSQL 9.6 的更多更新,请参加官方文档


感谢 PostgreSQL 社区!感谢 Greenplum 团队!




关于 Greenplum


Greenplum 是全球领先的开源大数据平台,是能够提供包含实时处理、弹性扩容、弹性计算、混合负载、云原生和集成数据分析等强大功能的大数据引擎。


Greenplum 基于MPP(大规模并行处理)架构构建,具有良好的弹性和线性扩展能力,并内置并行存储、并行通讯、并行计算和优化技术。同时,Greenplum还兼容 SQL 标准,具备强大、高效、安全的PB级结构化、半结构化和非结构化数据存储、处理和实时分析能力,可部署于企业裸机、容器、私有云和公有云中。值得一提的是,作为OLAP型的大数据平台, Greenplum同时还能够支持涵盖OLTP型业务的混合负载,从而帮助客户真正打通业务-数据-洞见-业务的闭环。


目前,Greenplum 已经为国内外各行各业客户所广泛使用,支撑着全球各大行业的核心生产系统,其涉及领域涵盖金融、保险、证券、通信、航空、物流、零售、媒体、政府、医疗、制造、能源等。


Greenplum社区期待您的参与!QQ:99194625, 微信:gp_assistant

关注微信公众号

VMware 中国研发中心