【青梅快讯】Greenplum 最新版本6.20.3已正式发布

自Greenplum 6.0正式版发布以来,一直保持每月一个小版本的迭代速率,持续为用户提供新功能和修复补丁,目前的最新版 6.20.3 已于2022年4月8日发布。此外,Greenplum众多商业组件也在不断迭代,致力于为用户提供更加完善的产品功能和更加舒适的用户体验。现在让我们通过本文概览一下Greenplum内核及其重要组件的最新资讯。

内核更新

Greenplum 内核基于 PostgreSQL ,并针对大数据场景和用户需求开发了众多优秀特性并作了极致优化。随着Greenplum 版本更新至 6.20,内核部分主要更新内容如下

该模块为Greenplum数据库实现了一个并行的array_agg( )聚合函数。

资源组在按百分比分配CPU资源方面,将包括一个新模式。之前支持弹性模式,若系统有空余资源,可动态分配。现在,除了现有的弹性模式,还支持强制模式,严格按照配置供给资源。有效满足了客户更丰富的场景需求。

用户可以使用它在Greenplum数据库主节点上创建一种特殊的cursor,并按需要或并行地直接从Greenplum segement 上检索查询结果。Greenplum将这种cursor称为并行检索cursor。

greenplum_fdw(Beta) greenplum_fdw模块是一个外部数据包装器(FDW),用户可以使用它在一个或多个Greenplum Database version 6.20+集群上运行查询。Greenplum Database greenplum_fdw模块是PostgreSQL postgres_fdw模块的MPP扩展。通过新的greenplum_fdw (Beta)模块和gp_parallel_retrieve_cursor (Beta) 模块,可访问存储在一个或多个外部Greenplum数据库集群中的数据,可以达到并行按需获取,可以实现跨集群cluster的并行和按需检索数据。

  • Greenplum 6.20.0 引入了新的 contrib 模块gp_array_agg。
  • 查询优化器(GPORCA)现在支持对包含堆分区和AO分区的分区表进行位图扫描。
  • 查询优化器(GPORCA)支持为有序聚合生成查询计划,从而提高查询性能。
  • GPDB 支持平台更加丰富,添加了对Redhat RHEL8版本的支持。
  • 安全方面的改进和提升
  • Resource Group
  • gp_parallel_retrieve_cursor(Beta) 并行检索cursor模块
  • Greenplum 新增了对pg_trgm和btree_gin两个插件的默认支持
  1. pg_trgm提供了基于三元组搜索的文本相似度计算函数,以及相应的索引运算符。
  1. btree_gin为常用数据类型实现了 GIN 索引运算符类。
  • GP2GP 功能

greenplum_fdw(Beta) greenplum_fdw模块是一个外部数据包装器(FDW),用户可以使用它在一个或多个Greenplum Database version 6.20+集群上运行查询。Greenplum Database greenplum_fdw模块是PostgreSQL postgres_fdw模块的MPP扩展。通过新的greenplum_fdw (Beta)模块和gp_parallel_retrieve_cursor (Beta) 模块,可访问存储在一个或多个外部Greenplum数据库集群中的数据,可以达到并行按需获取,可以实现跨集群cluster的并行和按需检索数据。

主要组件

Greenplum拥有丰富的生态组件来帮助用户更好的使用Greenplum,主要组件更新内容如下:

1、GPCC

GPCC(Greenplum Command Center)是Greenplum的商业版组件之一。作为Greenplum原生的图形化运维管理平台,GPCC基于全新的界面和用户体验,陆续推出了实时查询监控,历史数据收集,工作负载管理,邮件告警等功能,得到了众多商业用户的广泛应用和认可。GPCC将于近期发布最新版本6.7。

可支持的平台包括:

  • Tanzu Greenplum Database 6.x.
  • Red Hat Enterprise Linux 6.x 和 7.x
  • CentOS 6.x 和 7.x
  • Ubuntu 18.04

GPCC近期更新的主要功能包括:

  • 集成 GPSS S3 数据导入

Greenplum Streaming Server (GPSS) 可以帮助用户把数据从外部数据源导入到 Greenplum Database. 最近,随着GPSS 新增了对 S3 数据源的支持,用户也可以通过 GPCC 来进行 S3 数据源的导入,并通过 GPCC 对数据导入作业进行实时查看和管理。

2、GPText

作为Greenplum生态系统的一部分,GPText无缝集成了Greenplum海量数据并行处理能力以及Apache Solr企业级文本检索能力,为用户提供了一套易于使用、功能完备的文本检索、分析方案,得到了顶尖投资银行和政府部门等众多国际商业用户的肯定。

GPText不断迭代,致力于为用户提供更加成熟的功能。GPText最新版本为3.9版本,于2022年2月7日发布。

可兼容的平台包括:

  • RedHat Enterprise Linux 5.2,6.x,7.x,和8.x
  • GPtext可以运行在Greenplum 4.3.6及更高版本上

近期GPText更新的主要内容包括:

GPText支持Greenplum大版本升级

  • 在此之前,用户如果将原有的Greenplum 5 集群升级到Greenplum 6,需要重新安装GPText并重做所有的文本索引。而这将花费大量的维护时间和手动操作。
  • GPText 3.9.1 发布后,用户可以通过简单的配置让gpupgrade在 GPDB5 升级到Greenplum 6的同时,将已有的GPText升级到支持Greenplum 6 的版本。所有的用户数据将得到保留并可以直接在Greenplum 6集群上使用。

现Greenplum团队正全力冲刺Greenplum 7版本的研发工作,希望能为大家提供更受用户欢迎的功能。

欢迎通过release note获取Greenplum及其组件更多更新内容:

  • Greenplum v6.20 Release Note:https://gpdb.docs.pivotal.io/6-20/main/index.html
  • GPCC v6.6 Release Note:https://docs.vmware.com/en/VMware-Tanzu-Greenplum-Command-Center/6.6/tanzu-greenplum-command-center/GUID-welcome.html
  • GPText v3.9 Release Note:https://docs.vmware.com/en/VMware-Tanzu-Greenplum-Text/3.9/tanzu-greenplum-text/GUID-relnotes-GPText_390_README.html
  • GPSS v1.7 Release Note:https://greenplum.docs.pivotal.io/streaming-server/1-7/intro.html

关注微信公众号

VMware 中国研发中心

Greenplum官方技术交流群

扫码添加小助手即可入群,添加时请备注 “GP网站”