Greenplum Summit 2019 在纽约隆重举行

Postgres Conf 2019 于3月18日-22日在纽约时代广场希尔顿酒店盛大开幕。Pivotal作为钻石赞助商,与PostgresConf 2019合作举办了Greenplum Summit——专注于Greenplum数据库相关内容的全天活动。会议内容涵盖了各类客户案例研究,全新的开发技能教程,并分享了基于Postgres数据分析的新兴最佳实践。演讲嘉宾包括了来自Pivotal、摩根斯坦利、Baker Hughes等各大公司的数据库专家。

Greenplum Summit内容简介

Pivotal Greenplum:基于Postgres、多云,专为分析和AI而打造——Keaton Adam

来自Pivotal咨询数据工程师Keaton Adam 拥有超过20年的行业经验,在本次培训中概述了Pivotal Greenplum,这是一个专门用于快速和规模分析数据的平台,提供客户需要的灵活性,用于集成各种数据集,使用最新的可用容器技术保护和隔离工作负载。使用MADlib,GPText和PostGIS等集成工具以及一系列众所周知的过程语言来执行高级分析,所有这些都是通过熟悉的工具和功能实现的。Postgres架构师,管理员和最终用户将迅速采用这些工具和功能,以便为他们所服务的组织带来强大的分析和洞察力。

大规模并行Postgres数据库Greenplum的现状和未来——Ivan Novick

Ivan一直致力于大数据、数据库和企业系统。Greenplum数据库处于大规模大数据和分析用例全球研发的最前沿。在本次会议中,他概述了Greenplum Database Version 6中的新功能和强大功能,并总结正在进行的工程工作,包括Postgres合并、后Hadoop世界中的分析、GPU加速、高并发混合工作负载、Apache Kafka集成、弹性、灾难恢复和备份以及大规模可管理性。

使用Apache MADlib和MADlib Flow在Greenplum上进行AI——Frank McQuilan&Sridhar Paladugu

Frank McQuillan是Pivotal的产品管理总监,专注于大数据集的分析和机器学习。Sridhar Paladugu在Pivotal,他与客户就数据的所有事情进行合作,包括Spring,java,PCF,Gemfire以及最重要的Greenplum。他目前的重点是在Greenplum和容器上的Postrges上扩展机器学习和AI。他是项目负责人和即将推出的工具MADlib Flow的开发人员。

培训简介

(1) 高级分析和机器学习在企业计算中的重要性正在迅速增长。关键企业数据通常以关系形式存在,并且在系统之间复制数据以执行分析操作是低效的。

(2) 除了利用丰富的Postgres分析(如窗口函数)之外,Greenplum还通过成熟的Apache MADlib开源项目提供机器学习、图形分析、统计和数据转换。这些功能都与Postgres兼容,但专为大规模并行用例而设计。

(3) 在部署到生产时,现代企业AI部署是机器学习解决方案的生态系统,紧密集成反馈循环,触发底层算法的自动更新,从而创建闭环机器学习系统。 MADlib Flow专为集装箱部署AI管道而设计,用于Kubernetes,其中Cloud Foundry与Postgres在低延迟预测中发挥关键作用。

(4) 在本次会议中,演讲者概述Greenplum和MADlib Flow上的Apache MADlib。主题包括可扩展性结果、路线图以及持续学习新威胁签名的实时金融交易欺诈预防系统示例。

Postgres和Greenplum的数据科学现代接口——Scott Hajek

Scott Hajek是Pivotal的高级数据科学家。今天的数据科学家希望使用具有良好抽象和接口的工具,纯SQL不是数据科学的最佳接口,但基于SQL的系统的功能和规模可能是有益的。本讲座为Postgres和Greenplum引入了一个吸引数据科学家的现代界面。

关注微信公众号

VMware 中国研发中心