GreenplumPython 1.0 开源版正式发布啦!

VMware Greenplum 团队近日正式发布了 GreenplumPython 1.0 开源版。在 GreenplumPython 支持下,用户可以使用 Python 作为编程语言与 Greenplum 数据库进行交互,无需额外写 SQL。

Image

具体来说,GreenplumPython 提供了与 pandas 库类似的 DataFrame API,它具有如下特点: 

  • 对于 Python 用户,特别是 pandas 用户来说比较熟悉,容易上手; 
  • 能够方便地对各种数据进行复杂的分析,包括统计和机器学习等; 
  • 包含了常用的 Greenplum 最佳实践,可以方便地写出正确高效的查询。 

在实现上,所有对 DataFrame 的操作都会被翻译成 SQL 语句,然后发送到 Greenplum 集群去执行。
因此,所有的计算都在集群内部完成。除了 Greenplum,PostgreSQL 理论上也可以用作 GreenplumPython 的后端,用于存储数据和执行计算。

我们非常希望大家能够尝试 GreenplumPython 并给予一些反馈。如果您对此感兴趣,可以使用

pip3 install --user greenplum-python

来安装 GreenplumPython,并通过

import greenplumpython as gp

使用它的各种功能。

更多信息

欢迎访问并阅读 GreenplumPython 文档,了解更多相关信息。谢谢!

关注微信公众号

VMware 中国研发中心