greenplumcn

作者所有博文

Greenplum 5数据加载最佳实践之Kettle

Greenplum 作为分布式大数据计算平台,除了可以高速并行执行分析查询,还以高速的数据加载著称。Greenplum 用户麦煜遥将在本文详细介绍如何使用开源的ETL工具kettle和gpload实现向Greenplum 高速加载数据。

阅读更多 »

Greenplum建模最佳实践之拉链表

拉链表是一种数据模型,主要是针对数据仓库设计中表存储数据的方式而定义的;顾名思义,所谓拉链表,就是记录历史,记录一个事务从开始一直到当前状态的所有变化的信息。
拉链表可以避免按每一天存储所有记录造成的海量存储问题,同时也是处理缓慢变化数据(SCD2)的一种常见方式。

阅读更多 »

Greenplum 5升级经验谈(上)

从2018年7月开始,我和同事一起陆续完成了Greenplum 5的版本测试和公司十几套Greenplum生产集群的升级工作。在这一年多的升级工作中使我真真实实的对Greenplum数据库的使用和运行以及上层应用、平台有了一个更加深入的学习和了解,虽然辛苦但是收获颇丰。因此借此文梳理下Greenplum 5的升级过程,希望能够加深自己的一些认知,也希望对大家能有所帮助。

阅读更多 »

云栖大会 | Greenplum 6.0内核优化解读和7.0展望

9月25日,云栖大会在杭州阿里巴巴云栖小镇正式拉开序幕。在此次云栖大会上,《下一代云数据分析专场》是此次云栖大会最火爆的专场之一,会场站满了参会人员,门口排队入场的人员人头攒动。Greenplum研发总监,中文社区发起人姚延栋也在此专场发表了演讲《全新的Greenplum 6.0内核优化解读和7.0展望》,并得到了一众好评…

阅读更多 »

PPT | Greenplum在金融行业的应用场景分享

在业务要求,监管规范和成本效益等众多严格约束之下,金融业的大规模数据管理平台从选无可选的主机,小型机到现在的丰富Hadoop 生态和MPP 平台一路演进过来。在众多的应用场景中,哪些是最适合Greenplum一展身手的;成功的应用在选型时是依据哪些原则做出的选择;哪些容易招致忽视的因素导致了应用效果的损失?且听分享者结合现实案例一一道来…

阅读更多 »

PPT | Greenplum: 大数据分析的最佳选择

经过十多年发展,大数据处理和分析面临着诸多机遇和挑战。本报告首先回顾数据处理和分析历史,阐述数据处理系统发展的原动力。然后阐述分析 Hadoop 和 MPP 数据库两种技术栈的发展现状,并指出MPP数据库是大数据处理技术的更佳选择。

阅读更多 »

2020 Greenplum Summit

Click and Get More Information!

《Data Warehousing with Greenplum》

.side-bar{font-family:helvetica;color:#6CB21B;font-size:15px;text-align:left;} .side-bar a{ color:#11567F; } .side-bar h5{ display:none; }

关注微信公众号

VMware 中国研发中心

Greenplum官方技术交流群

扫码添加小助手即可入群,添加时请备注 “GP网站”