选择 Greenplum 的理由
快速创建和部署复杂模型,大量数百节点集群为全球2000强企业生产系统提供服务,被广泛应用于网络安全,预测性维护,风险管理,欺诈检测等领域

线性拓展能力

强大的灵活性

从 BI 到 AI

开源且持续投入

大规模并行处理架构
支持多种数据源和数据格式
支持各种数据源,包括 Hadoop、HIVE、HBase、 S3、Gemfire、各种数据库和文件等,不需要移动数据,避免了数据加载的复杂性,和其带来的数据不一致的问题。不管是结构化、半结构化( XML、JSON、KV )还是非结构化, 譬如文本数据、GIS 数据、图数据等。


多态数据存储
Greenplum 的存储支持堆表,以及面向行存或列存的追加表。用户可以创建基于任意存储类型的分区表,同时可以灵活配置表和分区的压缩类型、压缩级别和存储块大小等参数。
集成数据库分析处理数据科学
Greenplum采用可扩展数据库分析开源库Apache MADlib处理数据科学。MADlib 提供 SQL 接口进行数据分析,大大降低了数据分析的⻔槛;MADlib 内建于数据库内,使用 MPP 的优势,提高了分析的效率;MADlib可以在全量数据,而不是抽样数据上进行分析,提高了精度。 可以使用多种语言实现用户自定义函数和聚集,包括 PL/Python、PL/R、 PL/Java、PL/Perl、PL/PGSQL 和 C 等。


查询优化的创新
Greenplum提供的查询优化器是业界第一个开源的基于代价的查询优化器,专为大数据负载而设计。它可以将交互式和批处理模式分析扩展到 PB 级的大型数据集,而不会降低查询性能和吞吐量。
近期活动
Greenplum中文社区定期举办线上、线下的技术沙龙、培训、行业会议

【直播】 用Greenplum技术生态构建智慧城市
活动时间:2022年5月26日; 20:00 – 21:00
活动方式:线上直播
5月26日,Greenplum将举办今年第三场直播活动。与示说社区合作,本次直播将通过智慧城市的业务场景解决方案,讲解Greenplum超融合一体化的技术实战:大数据、Gis引擎、机器学习/深度学习引擎、检索引擎、知识图谱、PLPython相关技术的详细使用方法。

【直播】 Greenplum 在运营商领域的HTAP实践
活动时间:2022年4月29日; 20:00 – 21:00
活动方式:线上直播
4月29日,Greenplum将举办今年第二场直播活动。与示说社区合作,本次直播将对某运营商案例进行详细分析,着重介绍客户选型的考虑,测试的过程及生产运维过程中遇到的一些问题及建议,希望能给大家带来一些启发。该案例主要业务为运营商的分析业务,兼有部分TP的需求。欢迎大家预约参加!