대규모 엔터프라이즈 분석을 위해 병렬화된 Greenplum (Postgres)

개선된 트랜잭션 처리 기능과 스트리밍 수집을 지원하는 Greenplum은 기존의 비즈니스 인텔리전스부터 딥 러닝에 이르기까지 폭 넓은 범위의 분석 및 운영 환경 전반에서 워크로드를 처리합니다. Greenplum은 온프레미스, 퍼블릭 및 프라이빗 클라우드, 그리고 쿠버네티스(Kubernetes)와 같은 최신 컨테이너 형식 환경 등 어디에서든 작동하므로 설치, 운영 및 업그레이드가 간편합니다.

BI부터 AI까지의 분석

더 많은 워크로드를 하나의 환경에 통합

Greenplum은 스트리밍 수집과 같은 운영 워크로드와 분석을 융합할 수 있는 통합 스케일아웃 환경을 제공함으로써 데이터 사일로를 완화합니다. 우수한 확장성과 동시성을 바탕으로 포인트 쿼리와 빠른 데이터 수집, 데이터 사이언스 탐색, 장시간 보고 쿼리를 수행합니다.

장소에 구애 받지 않는 배포

퍼블릭/프라이빗 클라우드, 쿠버네티스(Kubernetes), 온프레미스에서 분석 실행

Greenplum은 모든 주요 퍼블릭/프라이빗 클라우드 플랫폼과 온프레미스에 설치할 수 있으며 쿠버네티스(Kubernetes)와 같은 컨테이너 오케스트레이션 시스템과도 설치가 가능하므로 고객 기업의 유연성을 높이고 선택의 폭을 넓혀줍니다. Greenplum 인스턴스를 한꺼번에 쉽게 배포하고 관리할 수 있습니다.

오픈 소스 혁신 기술

사전 통합된 구성요소로 간편해진 사용방식

Pivotal Greenplum은 PostgreSQL과 Greenplum Database 프로젝트를 기반으로 합니다. 이는 지리공간 분석을 위한 PostGIS나 문서 추출, 검색, 자연어 처리를 위한 GPText(Apache Tika 및 Apache Solr 기반) 등 선택적 용례별 익스텐션을 제공합니다. 이런 기능들이 사전 통합되어 오픈 소스에 대한 “와일드-웨스트” DIY 방식이 아닌 일관된 환경을 보장할 수 있습니다. 사용자들은 값 비싼 전용 데이터베이스에 의존하는 대신, 활발한 개발자 커뮤니티를 통해 데이터를 이용할 수 있습니다.

엔터프라이즈 데이터 사이언스

데이터 사이언스 운영 방식을 정비하고 워크로드를 간소화

Apache MADlib가 실험부터 대량 배포까지 데이터 사이언스를 담당합니다. Apache MADlib는 Postgres 데이터베이스 제품군을 위한 인클러스터 머신 러닝 기능의 오픈 소스 라이브러리입니다. MADlib는 Greenplum과 함께 멀티노드, 멀티 GPU 및 딥 러닝 기능을 제공합니다. 또, 모델 버저닝과 같은 자동화 친화적 기능과 더불어, REST API를 통해 모델을 트레이닝부터 생산 단계까지 적용할 수 있는 기능을 제공합니다. 사용자들은 분석 모델을 연결하거나 리코딩(Re-coding)해야 하는 수고를 덜 수 있습니다.

“어떤 용례를 원하든 사용자를 더 정확히 이해하기 위해 어떤 수단을 취하든, Greenplum에서는 다 가능합니다.”

John Conley, Conversant 데이터 웨어하우징 부사장

Architecture




기능


쿠버네티스(Kubernetes)를 이용한 반복 자동 배포

Greenplum for Kubernetes는 다수의 StatefulSet를 애플리케이션별 오퍼레이터 하나로 대체하는데, 이 오퍼레이터는 쿠버네티스(Kubernetes)가 설치되어 있는 곳에 자동화 계층을 제공하므로 배포와 운영이 한결 수월해집니다. PKS(Pivotal Container Service)에 배포된 Greenplum은 Cloud Foundry 애플리케이션에 상태 기반 데이터 영속성을 제공할 수 있습니다.

클라우드에 구애 받지 않는 유연한 배포

Greenplum은 Amazon Web Services(AWS), Microsoft Azure, Google Cloud Platform(GCP) 등 주요 퍼블릭 클라우드 마켓플레이스에서 BYOL(Bring Your Own License)과 시간 단위 이용 모델을 통해 구매할 수 있습니다. 또, VMware vSphere와 OpenStack 프라이빗 클라우드용 제품도 출시되어 있습니다. 무엇보다, 모든 클라우드에서 Greenplum 버전과 도구를 동일하게 지원하므로 일관된 경험을 보장합니다.

어플라이언스와 같은 환경에서의 효용성과 성능

GBB(Greenplum Building BlocksB)는 온프레미스 환경에서 Pivotal Greenplum을 실행할 수 있는 가장 효과적인 수단입니다. Pivotal 인증을 받았고 Dell 하드웨어 구성용 블루프린트를 지원하므로 전용 어플라이언스를 대체할 수 있습니다. 사용자들은 HP와 Cisco 인증을 받은 구성뿐만 아니라 자체 상용 하드웨어에도 Greenplum을 설치할 수 있습니다.

비즈니스 인텔리전스부터 인공지능(AI)까지 분석

머신 러닝, 딥 러닝, 그래프, 텍스트 및 통계 방식을 스케일아웃 MPP 데이터베이스 하나에서 모두 지원합니다. Greenplum의 GPText에서는 오픈 소스 PostGIS 기반 지리공간 분석과 Apache Solr 기반 텍스트 분석을 지원합니다. 또, R과 Python 분석 라이브러리, Keras, Tensorflow까지 폭 넓게 지원합니다.

스트리밍 데이터와 클라우드 데이터를 간편하게 처리

Greenplum은 Kafka 에코시스템과 통합이 가능하며 Confluent의 인증을 받았습니다. 지연 쓰기 기능이 개선되어 스트리밍 사용 사례에서 이벤트를 빠르게 처리합니다. Amazon S3 객체를 즉시 쿼리할 수 있어 클라우드 데이터를 보다 효율적으로 통합할 수 있습니다.

가동시간 극대화 및 데이터 무결성 보호

Greenplum은 고가용성, 지능형 결함 검출, 빠른 온라인 차등 복원, 그리고 전체/증분 백업과 재해 복구를 위한 기능을 갖추고 있습니다. 보안과 인증 기능은 기업 정책과 규제 요건을 충족합니다.

업계 최고의 성능

Greenplum은 대용량의 데이터 워크로드를 처리하도록 설계된 고유의 비용 기반 쿼리 옵티마이저를 이용해 대화형 분석과 배치 모드 분석을 페타바이트 수준의 대용량 데이터세트로 확장할 수 있으며, 쿼리 성능과 처리속도를 저해하지 않습니다.

오픈 소스 프로젝트 기반

특정 벤더에 의존할 필요가 없습니다. Greenplum Database 오픈 소스 프로젝트는 PostgreSQL 커뮤니티와 100% 연계되어 있습니다. 주요 Pivotal Greenplum 공여물은 Greenplum Database 프로젝트에 모두 속해 있으며 동일한 데이터베이스 코어를 공유하는데, 여기에는 MPP 아키텍처, 분석 인터페이스 및 보안 기능이 포함됩니다.

대량 병렬화 및 고도의 동시성을 갖춘 아키텍처

Greenplum은 무공유 형식(shared-nothing) 아키텍처를 갖춘 것이 특징 중 하나인데 이 아키텍처는 데이터와 쿼리의 병렬 처리, 그리고 페타바이스 수준의 데이터 수집을 자동화합니다. 오픈 소스와 비용 기반의 쿼리 옵티마이저(GPORCA)는 첨단 분석을 처리하도록 특수 개발되었으며, 대량의 데이터에서 획기적인 성능으로 콤플렉스 조인(Complex Join)을 실행하는 쿼리 플랜을 생성합니다.

활용 사례

엔터프라이즈 분석 및 AI

Apache MADlib에서는 다계층 퍼셉트론이나 컨볼루션 신경망과 같은 고급 알고리즘을 지원하므로, 사용자는 음성 인식, 이미지 인식, 기계 번역 및 컴퓨터 비전에서 첨단 용법을 경험할 수 있습니다. 또, REST API를 선택적으로 지원하므로 한 가지 언어(SQL)로 트레이닝과 테스트 및 배포를 수행할 수 있어 모델을 대량 생산 단계에 적용할 때 오류가 줄어듭니다.

쿠버네티스(Kubernetes), 클라우드, 온프레미스에 자유롭게 배포

이용약관에 따라 분석 워크로드를 원하는 시간에 자신이 선택한 플랫폼으로 옮길 수 있습니다. GBB를 이용해서 쿠버네티스(Kubernetes), AWS, Microsoft Azure, GCP, 프라이빗 클라우드, 온프레미스 등 어디로든 배포할 수 있습니다. 사용 편리성, 성능, TCO(총소유비용) 등을 고려해 각 프로젝트와 워크로드에 맞는 최적의 플랫폼을 자유롭게 선택할 수 있습니다

엔터프라이즈 데이터 웨어하우스 현대화 및 리플랫포밍(Replatforming)

구형 EDW(엔터프라이즈 데이터 웨어하우스)를 리플랫포밍하여 값 비싼 전용 데이터베이스를 대체할 수 있습니다. 오픈 소스 기반의 멀티 클라우드 분석 플랫폼 하나로 시스템을 현대화해 기업 내부에서 필요로 하는 데이터 웨어하우스 기능을 모두 지원할 수 있습니다. MPP 시스템의 성능과 입증된 기술을 결합하여 애플리케이션 마이그레이션에 따른 비용과 복잡성을 완화할 수 있습니다.

Let us tell you more.

Contact us about Pivotal Greenplum.

관심을 가져 주셔서 감사합니다.

빠른 시일 내에 연락을 드리겠습니다.

Disclaimer
This website contains statements which are intended to outline the general direction of certain of Pivotal's offerings. It is intended for information purposes only and may not be incorporated into any contract. Any information regarding the pre-release of Pivotal offerings, future updates or other planned modifications is subject to ongoing evaluation by Pivotal and is subject to change. All software releases are on an “if and when available” basis and are subject to change. This information is provided without warranty or any kind, express or implied, and is not a commitment to deliver any material, code, or functionality, and should not be relied upon in making purchasing decisions regarding Pivotal's offerings. Any purchasing decisions should only be based on features currently available. The development, release, and timing of any features or functionality described for Pivotal's offerings on this website remain at the sole discretion of Pivotal. Pivotal has no obligation to update forward-looking information on this website.

문의