2020 Greenplum 峰会 第一期回顾

2020 Greenplum峰会已经完成了两期,精彩仍在继续。对于中国的Greenplumer们,时差可能是参会听讲最大的敌人!不用担心,所有的视频录像都可以在VMWare Learning Zone 上获取。此外,我们还将持续为大家推送相关文章,总结回顾活动的精华内容。今天让我们先来回顾第一期的内容吧!​

Greenplum具有令人耳目一新的价值主张:以更低的成本提供更多功能

对于那些希望摆脱Oracle,Teradata和Snowflake等专有系统的人来说,“花更少来获得更多”的口号毫无疑问具有很大的吸引力。数据库市场也开始涌现许多的新进入者,Jacque在演讲中提到,市场上用于解决小众用例而量身定制的工具正在激增,在某些特定的场景下发挥着它们各自的作用。但是对于一个可以处理各种企业场景的平台而言,Greenplum的“花的更少,得的更多”是与众不同的。

从Postgres上继承来的特性,并行处理,Python和R的扩展以及联合查询等功能让Greenplum越来越强大。加上对许多不同基础设施目标的支持,很容易看出为什么Greenplum如此蓬勃发展。

在本地部署Greenplum是启动现代分析之旅最简单的方法

想提高分析能力,你应该从哪里开始呢?在本地部署Greenplum可能是合乎逻辑的起点。Divya Bhargov在演讲中指出,vSphere上的Greenplum通过虚拟机模板化和易于置备简化了操作任务。你的大多数数据都将在本地运行,因此这是提高分析能力的一个合理的起点。另外,我们改进了三种常见的硬件配置,以帮助你更便捷的调整环境。

在Kubernetes上使用Greenplum来满足按需和临时使用案例

如今很多开源项目都在探索Kubernetes,Greenplum也是如此。Oz Basarir在演讲中指出,Greenplum团队发现Kubernetes是部署Greenplum和相关组件非常快速(可重复)的一种方法。Oz在演讲中举了一个真实的例子:数据科学家的自助服务集群。有想要执行的实验?快速启动Greenplum集群。进行实验,然后在完成后将群集撤走。这为你的分析工作流程注入了有效的敏捷性。

对在Kubernetes上部署Greenplum感兴趣?通过链接下载评测版。

相关内容:Jason Vigil在演讲中,展示了使用Greenplum for Kubernetes执行常见的缩放命令是多么容易。

在公共云中部署Greenplum更节省成本

许多Greenplum用户将其足迹扩展到公共云的探索中,以实现更高的速度,弹性和可扩展性。这么做还有一个优势:节省成本。Jon Roberts在演讲中解释了Greenplum团队如何利用Greenplum本地化实施的灵活性来最大程度地减少公共云中的费用。用可预计的成本,来按需付费。但是,许多措施仍然需要被采取来减少公共云费用。
按照计算或存储的用量来按需计费和弹性扩展是公有云众所周知的优势。但是,你还可以利用以下其他更高级的优势:

  • 自动容错。公共云在IaaS层具有自我修复功能。Greenplum持续监视群集的运行状况,并自动从故障驱动器中复制数据,并根据需要更换节点以实现容错能力,而无需任何用户或DBA干预。这为您节省了基础架构和运营成本。
  • 自动备份。备份对于一个数据库安全至关重要,但是备份有时会成本很高。公共云“快照”功能是一种非常实惠的选择。

准备在公共云中尝试Greenplum吗?在AWSAzureGoogle Cloud市场中查看Greenplum templates。

在公共云中构建经济高效的灾难恢复解决方案

执行可靠的灾难恢复策略似乎对于很多企业来说是一件雄心勃勃的事情,可能很多情况下,只有大型企业才能做到这一点。公共云提供了一种低成本,有效的解决方案。Jin Lim在演讲中谈到了这一点,并深入进行了分析介绍。核心思路其实很简单。如果你已经在公共云上,请定期对主要Greenplum群集进行快照,将这些快照放置在对象存储中。当灾难发生时,请按需启动Greenplum集群,复制最新快照,然后将其还原,便一切恢复正常啦!在本地运行?没问题!思路一样。你只需要使用数据传输设备即可将数据库的完整副本上传到所选的云中。你也可以按照相同的过程进行增量备份。一旦数据在对象存储中可用,就可以像在公共云场景中一样创建一个新的Greenplum集群。

Greenplum和云提供商为你的数据安全保驾护航,但这似乎还不够

任何企业数据库都将在系统中纳入有用的安全性规定。Greenplum中有身份验证和基于角色的访问控制,以控制谁有权访问以及登录后它们可以执行的操作。那如何保护数据库中的所有数据呢?VMware,AWS,Azure和Google在静止和传输过程中均具有数据加密功能。但是正如SecuPi的George Billman在演讲中 提到的那样,许多公司都要求采取更积极的数据安全措施。George为这些公司提供了四点计划:

  • 在将敏感数据放入云之前,先对其进行匿名处理。一个重要的问题在于谁来掌握了对数据进行匿名或解密的钥匙。
  • 使用访问控制参数(例如时间,地理位置或业务状态)实施更细粒度的数据访问策略。
  • 根据用户角色和上述访问控制参数实时生成“虚拟视图”。这种方法可以缩短“数据存储时间”,并降低静态视图编码的成本。
  • 监视用户活动以实时访问数据。这是在威胁显现之前就采取主动措施来抵御威胁。

如果您有独特的数据安全要求,或想超越即将出台的数据隐私法规——可以前往Greenplum合作伙伴SecuPi(https://www.secupi.com/)看一看。

2020 Greenplum峰会精彩还在继续,我们将持续为大家带来2020 Greenplum峰会的精华内容回顾,欢迎大家的关注。

下一场活动:

  • 9月23日:AI,神经网络,和分析的未来 点击注册

分享本博文:

2020 Greenplum峰会

点击了解更多信息

《Data Warehousing with Greenplum》

Greenplum官方书籍《Data Warehousing with Greenplum》。阅读它,以了解如何充分利用Greenplum的功能。

关注微信公众号

Greenplum中文社区

Greenplum官方微信群

扫码加入我们的技术讨论,请备注“网站”