新一代数据分析及实时数仓平台Greenplum,助力企业数字化转型

9月28日,《Greenplum走进深圳》大会顺利举行,会议提供了线上、线下双渠道的参与方式,精彩的演讲内容获得了与会人员的一致好评。今天为大家推送的内容整理自Greenplum资深平台架构师牛云飞演讲的《新一代数据分析及实时数仓平台Greenplum介绍》。

随着企业的发展,分析也在变化,从单纯面向过去,逐步演进到全视角数据分析。数据逐步成为企业核心资产,数据的衍生价值也越来越大,企业都在努力从流程驱动型企业转型成为数据驱动型企业。

在分析1.0阶段,随着信息化建设的深入,企业积累了大量业务数据,用户洗完更了解一段周期内的企业经营情况。因此这一阶段企业以看到过去的描述型分析为主。整合业务数据、累计历史、通过报表、查询等形式,对业务历史数据进行统计分析。这一阶段,需要解答的业务问题是

  1. 业务以及发生了什么?
  2. 业务为什么会发生

在分析2.0阶段,企业不仅仅要对已经发生的业务进行评估,还需要对业务进行前瞻性预测。因此这一阶段企业以面向未来的预测型分析为主。需要建立数据科学团队,针对海量数据进行探索、研究,从数据中发现新的业务洞察。这一阶段,需要解答的业务问题是

  1. 已经发生了什么?
  2. 为什么会发生
  3. 将要发生什么?

在分析3.0阶段,企业希望提高分析的时效性,嵌入业务流程自动化、智能化驱动业务。因此,这一阶段企业以决定现在的运营型分析为主。监控业务,实时反映当前业务状况,进而,利用预测型分析的成果,驱动业务向我们希望的方向发生。这一阶段,需要解答的业务问题是:

  1. 已经发生了什么?
  2. 为什么会发生?
  3. 将要发生什么?
  4. 正在发生什么?
  5. 如何驱动业务发生?

    为满足分析2.0或3.0阶段的需求,很多企业采用多种技术路线,建立多个异构数据平台,管理混合数据生态,提供多样化的分析能力。这一思路为数据平台建设带来了如下挑战:
  • 数据分散在多个异构平台,缺乏统一的企业级视图
  • 数据冗余存储,一数多源,存在二义性
  • 平台间数据共享、交换频繁,数据流网状
  • 技术路线复杂,增加了开发和运维工作量

全视角数据分析需要现代化数据平台。数据平台需要面向混合数据生态,基于多元化寄出设施,提供多样化分析能力。而Greenplum作为新一代数据分析及实时数仓平台,能够针对不同形态、不同时效性的数据具备高效的采集能力和海量数据管理能力。同时,还能通过标准SQL语言,集成各类企业数据源(如:Hadoop、对象存储等),保证数据访问准确、完整、及时并使用方便。

Greenplum提供的服务既包括复杂的分析查询,也包括简单高并发的点查询,更有HTAP类型的分析。此外,还可以使用文本检索、机器学习等技术提供数据服务,具备多样化的计算能力。

现代化的数据平台需要应用于不同的分析场景,有些场景CPU敏感,有些强调IO能力,有些则需要按需搭建、弹性伸缩,Greenplum可以适用于不同基础设施要求。

戳下面链接观看完整演讲视频,深入了解新一代数据分析及实时数仓平台Greenplum。

https://www.bilibili.com/video/BV1Zr4y127Zk?spm_id_from=333.999.0.0

关注微信公众号

VMware 中国研发中心