选择 Greenplum 的理由
快速创建和部署复杂模型,大量数百节点集群为全球2000强企业生产系统提供服务,被广泛应用于网络安全,预测性维护,风险管理,欺诈检测等领域

线性拓展能力

强大的灵活性

从 BI 到 AI

开源且持续投入

大规模并行处理架构
支持多种数据源和数据格式
支持各种数据源,包括 Hadoop、HIVE、HBase、 S3、Gemfire、各种数据库和文件等,不需要移动数据,避免了数据加载的复杂性,和其带来的数据不一致的问题。不管是结构化、半结构化( XML、JSON、KV )还是非结构化, 譬如文本数据、GIS 数据、图数据等。


多态数据存储
Greenplum 的存储支持堆表,以及面向行存或列存的追加表。用户可以创建基于任意存储类型的分区表,同时可以灵活配置表和分区的压缩类型、压缩级别和存储块大小等参数。
集成数据库分析处理数据科学
Greenplum采用可扩展数据库分析开源库Apache MADlib处理数据科学。MADlib 提供 SQL 接口进行数据分析,大大降低了数据分析的⻔槛;MADlib 内建于数据库内,使用 MPP 的优势,提高了分析的效率;MADlib可以在全量数据,而不是抽样数据上进行分析,提高了精度。 可以使用多种语言实现用户自定义函数和聚集,包括 PL/Python、PL/R、 PL/Java、PL/Perl、PL/PGSQL 和 C 等。


查询优化的创新
Greenplum提供的查询优化器是业界第一个开源的基于代价的查询优化器,专为大数据负载而设计。它可以将交互式和批处理模式分析扩展到 PB 级的大型数据集,而不会降低查询性能和吞吐量。
近期活动
Greenplum中文社区定期举办线上、线下的技术沙龙、培训、行业会议

【直播】Greenplum开发与升级经验分享会
活动时间:2023年2月22日 19:30 – 20:15
活动方式:线上直播
2月22日,Greenplum中文社区与示说社区合作,举办了2023年首场线上直播活动。本次直播包含两个话题,首先第一个话题,由VMware 研发工程师 苏学斌,为我们分享用 GreenplumPython 管理和分析非关系型数据,第二个话题由 VMware 大中华区售后技术顾问 陈淼,为我们介绍 Greenplum 大版本升级实施方法。

【直播】Greenplum技术分享& 新版本前瞻
活动时间:2022年12月9日 19:30 – 20:15
活动方式:线上直播
12月9日,Greenplum 与示说社区合作,举办线上直播活动。本次直播分为两个部分,第一部分技术分享由VMware资深平台架构师 李巍带来GPDB on PowerFlex的相关介绍以及案例分享;第二部分话题由VMware Greenplum 数据库产品经理 王雯带来 Greenplum 6 server 的新特性介绍以及关于Greenplum 7 server的新版本展望。