全世界首个开源、多云数据平台,专为高级分析而打造

Pivotal Greenplum是全球首个基于开源Greenplum数据库的全功能、多云、大规模并行处理(MPP)数据平台,兼具高级分析功能与传统BI。Pivotal Greenplum可针对多结构化数据提供全面的综合分析。Pivotal Greenplum由世界上最先进的基于成本的查询优化器提供支持,可以针对海量数据提供无与伦比的分析查询性能。



多云部署

在您需要的任意位置运行分析

Greenplum可以部署到所有主流公有云和私有云平台以及本地数据中心,因此它能够为您的企业提供更大的选择余地和灵活性。



集成分析

部署一个平台,满足所有分析需求

Greenplum提供一个可横向扩展的环境,可同时支持新一代高级分析和传统工作负载,从而消除了分析孤岛。



行业领先的性能

支持最庞大、最复杂的工作负载

Greenplum具有专为大规模数据工作负载而设计的基于成本的独特查询优化器,可对PB级的大型数据集执行交互式和批处理模式的分析,而不会降低查询性能和吞吐量。



开源创新

受益于强大开源社区带来的创新

Pivotal Greenplum基于PostgreSQL和Greenplum数据库,可让用户更好地控制所部署的软件,减少供应商锁定,产品方向也更加开放。

“无论我们设想怎样的使用案例,无论我们想用什么方法来更好地理解用户,Greenplum都能帮我们实现。”

John Conley, Conversant的数据仓库副总裁

使用场景


数据科学和高级分析

从早期的数据科学实验到大型分析模型的运行,部署一个平台即可满足您的所有分析工作负载。所有操作在一个极具可扩展性的高度并发环境中实施,进而简化步骤,实现更好的分析能力。

数据科学家和分析师,能够使用机器学习、地理空间或图领域最受欢迎的分析库,解决网络安全、物联网、风险管理、欺诈管理等复杂的数据问题。

灵活迁移到多云环境

根据您选择的条件和时限,将您的分析工作负载迁移到您选择的云平台。

在Amazon Web Services (AWS)、Microsoft Azure、Google Cloud Platform (GCP)或私有云中实例化和关闭新项目。根据易用度、性能和总体拥有成本(TCO)为每个项目和工作负载自由选择最合适的云平台。真正的多云平台(在每个环境中都是相同的软件),使您能够在任意位置运行分析。

企业数据仓库的现代化和重构

为遗留的企业数据仓库(EDW)重新构建平台,将昂贵、僵化的本地数据库替换成强大、高效且有效节约成本的云数据库。

使用唯一的开源多云分析平台(GPDB)完成现代化改造,提供企业需要的完整数据仓库功能集。发挥MPP系统的强大功能和成熟技术,降低应用迁移的成本和复杂性。

新一代数据平台


白皮书
Pivotal Greenplum 5:新一代数据平台

使用Pivotal Greenplum,您将通过一个稳健的数据平台获得灵活的部署选项、功能强大的SQL和编程分析库以及与不同数据来源/管道的无缝集成,而且该平台拥有最出色的性能和最低的整体成本。

Get the White Paper

电子书
Greenplum的数据仓库:开源大规模并行数据分析

探索Greenplum处理数据分析和数据驱动型决策的方法:首先介绍Greenplum的无共享架构,然后了解数据组织与存储、数据加载、运行查询以及在数据库中执行分析。

立即获取电子书

架构




能力


多云和本地灵活部署

功能强大、不受限于基础架构的全软件平台,可在您需要的任意位置运行

在领先的公有云中运行:Amazon Web Services (AWS)、Microsoft Azure、Google Cloud Platform (GCP),采用“自带使用授权”(BYOL)和按小时计费的机制

在私有云中运行:VMware vSphere和OpenStack

(用专用硬件)在本地运行:Dell EMC DCA设备、Dell EMC Blueprints、惠普和思科认证的配置以及客户提供的硬件

集成分析

在可横向扩展、具有丰富SQL分析平台执行高级分析和传统分析

开箱即用的数据库内算法,可交付新型分析模型

支持Apache MADlib(一个大规模并行数据库内算法、机器学习算法、图和统计算法库)

基于开源PostGIS的地理空间分析

通过Greenplum的GPText功能实现基于Solr的文本分析

广泛支持R和Python分析库

借助Greenplum-Spark Connector支持Spark

大规模并行的高并发架构

采用无共享架构,可实现数据和查询的自动并行处理

PB级并行加载(基于MPP散点/聚集流技术)

稳健、开源且基于成本的查询优化器(GPORCA),专为解决高级分析需求而开发,可以创建查询计划,以出色的性能针对大量数据执行复杂联结

世界一流的工作负载管理器(WLM),用于监控和管理查询和资源队列

灵活的存储和分析处理

多态数据存储、处理和行业领先的压缩技术提供了最佳的性能和存储效率

对表进行多个级别的灵活分区

针对大容量的批处理作业、低延迟的交互作业进行了优化,可处理具有高吞吐量的微批量作业

采用可扩展性框架,可自定义分析和数据库功能

与云数据存储库和数据湖无缝集成

通过外部表可以访问Pivotal Greenplum之外的数据源所存储的数据,就像数据存储在常规数据库表中一样(可从外部表读取或写入数据)

可读取或写入的Amazon S3外部表,因为Amazon S3外部表是受驻留在Amazon S3外的数据支持的Greenplum数据库表

具有异构Hadoop环境的外部表

通过联机分析处理(OLAP)扩展提供全面的SQL支持

集成了内存数据网格和对象存储,可对结构化数据执行后期处理

丰富的可用性和业务连续性功能集

支持业务连续性功能,如高可用性、智能故障检测、快速的在线差别恢复、完全备份、增量备份和灾难恢复

强大的安全和身份验证功能集,可满足企业的各种策略和监管要求

可在数据库保持在线状态且完全可用时添加服务器

性能监控框架支持硬件和软件问题的分离

Greenplum Command Center提供一个集监控、管理和工作负载管理于一体的统一框架

基于开源项目

唯一一个与开源PostgreSQL和Greenplum数据库开源项目保持一致的大型数据分析平台

Pivotal Greenplum的所有主要贡献均来自Greenplum数据库项目,且共享相同的数据库核心,包括MPP架构、所有分析接口和安全功能

您可以在greenplum.org社区网站查看所有创新

开始使用Greenplum

在greenplum.org上查看Pivotal Greenplum的下载资源和教程。

下载资源和教程




在AWS上运行Greenplum

在公有云中运行Greenplum Analytics

在AWS上运行Greenplum

联系我们

谢谢您的关注!

我们会很快回复您。