VMware Greenplum 7.1.0 正式发布!

VMware Greenplum 7.1.0 于2024年2月9日正式发布,其中包含一些新功能以及问题的修复。

新功能以及特性变化

  • pgvector 更新到0.5.1
  • ip4r 更新到2.4.2
  • 引入 tablefunc模块,提供可以返回表的函数
  • 引入新的插件 pg_buffercache,提供5种访问集群共享缓冲区(shared buffer)度量的视图,包括gp_buffercache, gp_buffercache_summary, gp_buffercache_usage_counts, gp_buffercache_summary_aggregated, and gp_buffercache_usage_counts_aggregated.
  • 为gp_toolkit管理模式增加名为 gp_move_orphaned_files 的用户定义函数,该函数可以把gp_check_orphaned_files视图发现的孤儿文件移动到指定目录下。
  • Greenplum 软件包实用程序 gppkg 引入了一个新选项,用于指定要迁移到 VMware Greenplum 的另一个minor版本的软件包名称,而不是迁移所有软件包。
  • gp_toolkit 管理模式现在包含一些有助于分区表维护的对象:一个新视图 gp_partitions,以及几个新的用户定义函数,包括:pg_partition_rank()、pg_partition_range_from()、pg_partition_range_to()、pg_partition_bound_value()、pg_partition_isdefault() 、pg_partition_lowest_child() 和 pg_partition_highest_child()。
  • VMware Greenplum 引入了一个新实用工具 pg_filedump,可以读取 VMware Greenplum 数据文件的格式化内容,包括表、索引和控制文件。
  • 对查询优化器进行了微调,以增强包含多个 DQA(Distinct Qualified Aggregate)和标准聚合的查询的性能。这种改进可节省大量 IO,从而提高处理速度。此优化可能不适用于某些专门查询,例如标准聚合中存在来自不同 DQA 源的多个列的场景,或者 DQA 中存在过滤器时。
  • 新的 gp_postmaster_address_family 服务器配置参数告诉节点在初始化集群时要使用哪种类型的 IP 地址。
  • Greenplum 的 Python 数据科学包现在包含 catboost 库,这是一个用于决策树梯度提升的高性能开源库。
  • VMware Greenplum 现在支持使用输入配置文件 (gprecoverseg -i) 时的segment差异恢复。可以在传递给 gprecoverseg -i 的恢复配置文件中的条目前面添加 I、D 或 F,以指示segment恢复的类型。
  • EXPLAIN ANALYZE 使用 BUFFERS 关键字可以显示缓冲区使用情况和 I/O 计时。
  • gpstate 实用程序现在使用 -e 选项跟踪数据同步以进行差异恢复。
  • 除了堆表,VMware Greenplum 还支持追加优化表的 TABLESAMPLE 子句。支持 BERNOULLI 和 SYSTEM 采样方法。
  • VMware Greenplum 现在支持所有表的 SYSTEM_ROWS 和 SYSTEM_TIME 采样方法,分别通过新的 tsm_system_rows 和 tsm_system_time 模块提供。
  • gppkg 实用程序选项 -f 现在可以帮助删除文件不完整或丢失的软件包。
  • PgBouncer 连接池程序 1.21.0 现已随 VMware Greenplum 7.1.0 一起发布,其中包括对加密 LDAP 密码的支持。有关更多详细信息,请参阅使用 PgBouncer 连接池。
  • 新的 gprecoverseg 选项 max-rate 可以限制完整segment恢复的最大传输带宽速率。
  • gpmovemirrors 工具支持磁盘空间检查,因此如果目标主机没有足够的空间来容纳新镜像,该工具将会报错失败。
  • Autovacuum 会删除所有未由创建它们的后端删除的孤立临时表。
  • 可以使用服务器配置参数 log_directory 手动配置 VMware Greenplum 日志的位置。 gpsupport 工具还支持从此服务器配置参数设置的目录收集日志。
  • 系统视图 gp_stat_progress_dtx_recovery 显示分布式事务 (DTX) 恢复过程的进度,这可以帮助监视崩溃后coordinator节点恢复的状态。
  • 新的 gp_autotstats_lock_wait 服务器配置参数允许用户控制自动统计信息收集触发的 ANALYZE 命令在无法获取表锁时是否会阻塞。
  • 新的 Optimizer_enable_right_outer_join 服务器配置参数允许用户控制 GPORCA 是否生成右外连接。在观察到与右外连接相关的性能不佳的情况下,可以选择禁止使用它们。
  • VMware Greenplum 7.1 现在支持 VMware Greenplum Virtual Appliance,支持在vSphere 上轻松部署 VMware Greenplum。
  • PostgresML 扩展现在包括用于监督学习的 pgml.train 和 pgml.predict 函数。
  • 可以在 Greenplum 集群外部配置一台或多台主机作为 PL/Container 工作负载的远程容器主机,从而减少 Greenplum 主机的计算负载。
  • 可以使用资源组来管理和限制 PL/Container 运行时的总 CPU 资源。
  • 可以从 VMware Tanzu Network 下载适用于VMware Greenplum 7 PL/Container R的映像。
  • VACUUM 命令现在包含 SKIP_DATABASE_STATS 和 ONLY_DATABASE_STATS 子句。

7.1.0 还解决了一些问题,请参考release notes获取详细信息。VMware Greenplum研发团队正在开发7.2.0,预计2024年5月发布。

关注微信公众号

VMware 中国研发中心