PPT | 百亿级别数仓及报表明细高并发服务架构选型

架构的简洁可以避免很多不必要的麻烦,同时可以节省很多资源。数仓的选型从Hadoop、Hive、Impala到以Greenplum为代表的 MPPDB。数仓解决了海量数据的存储和计算,但对于数据报表及明细高并发服务,又该如何选择?

话题大纲:

  • Greenplum与Hadoop Hive的数仓特点
  • Greenplum与Hadoop的集成
  • 海量报表明细传统提供方式与新选择

下载链接:

https://cn.greenplum.org/wp-content/uploads/2020/08/百亿级别数仓及报表明细高并发服务架构选型v1.0.pdf

演讲视频:

https://v.qq.com/x/page/f3001mgjdew.html

嘉宾介绍:

石敦斌,招商金科数据库工程师。熟悉PostgreSQL,MySQL、Neo4j数据库及Greenplum, 专注于开源数据库与大数据、数仓、时序数据物联网等应用场景,积极参与Greenplum开源社区的建设。

关于Greenplum

Greenplum 是全球领先的开源大数据平台,是能够提供包含实时处理、弹性扩容、弹性计算、混合负载、云原生和集成数据分析等强大功能的大数据引擎。 Greenplum 基于MPP(大规模并行处理)架构构建,具有良好的弹性和线性扩展能力,并内置并行存储、并行通讯、并行计算和优化技术。同时,Greenplum还兼容 SQL 标准,具备强大、高效、安全的PB级结构化、半结构化和非结构化数据存储、处理和实时分析能力,可部署于企业裸机、容器、私有云和公有云中。值得一提的是,作为OLAP型的大数据平台, Greenplum同时还能够支持涵盖OLTP型业务的混合负载,从而帮助客户真正打通业务-数据-洞见-业务的闭环。 目前,Greenplum 已经为国内外各行各业客户所广泛使用,支撑着全球各大行业的核心生产系统,其涉及领域涵盖金融、保险、证券、通信、航空、物流、零售、媒体、政府、医疗、制造、能源等。 如果你对分布式数据库内核感兴趣,希望成为贡献者或commiter,可以从这儿开始!Greenplum社区期待您的参与!

关注微信公众号

VMware 中国研发中心