읽기 예상 시간: 5분

데이터 과학: 비즈니스에 데이터 중심 접근 방식 적용하기

데이터 과학은 단순히 인사이트를 전달만 하는 것이 아닙니다. 해당 데이터에 적합한 모델을 적용함으로써 기업이 대량의 데이터에서 패턴을 인식해 예측하고, 궁극적으로는 비즈니스 결과에 영향을 미칠 수 있게 합니다. 다르게 말하자면 데이터 과학은 기업이 고객에 더 나은 서비스를 제공하고, 좀더 경쟁력있는 제품을 개발하고, 운영 효율을 높이기 위해 필요한 식견을 제공합니다.


데이터 과학이란?

데이터 과학은 기계 학습, 데이터마이닝, 예측 분석, 딥러닝, 인지 컴퓨팅 등의 기술을 사용해 엉망진창인 거대한 분량의 데이터에 숨겨진 패턴과 인사이트를 발견하는 프로세스를 의미합니다. 기존의 비즈니스 인텔리전스 및 관련 접근 방식과는 달리 데이터 과학은 구조적 데이터에 국한되지 않고, 깔끔한 행과 표로 정리할 필요가 없으며, 소규모 데이터 집합으로 제한되지도 않습니다. 오히려 데이터 과학은 텍스트 기반 데이터, 기계 데이터, 센서 데이터, 소셜 미디어 데이터처럼 절반 수준으로 구조화되어 있거나 전혀 구조화되지 않은 대량의 데이터에도 적용할 수 있습니다. 이처럼 제한이 적은 접근 방식으로 데이터를 분석할 수 있으므로 조직들은 데이터 과학을 통해 예전에는 미처 제기할 수조차 없었던 질문들에 대한 해답을 찾을 수 있게 되었고, 경쟁 우위를 차지할 수 있는 잠재적인 돌파구가 될 인사이트를 얻게 됩니다.


왜 데이터 과학인가?

빅데이터의 가치 제시

Hadoop, 클라우드 기반 스토리지처럼 현대적인 데이터 관리 접근 방식은 그 어느 때보다 대량의 데이터 저장에 적합합니다. 그러나 빅데이터 저장 그 자체에는 어떠한 가치도 제공하지 못합니다. 데이터 과학을 접목시켜 실행 가능한 인사이트를 밝혀내야 빅데이터의 가치가 드러납니다.

예측 가능하므로 자동 관리 가능

데이터 과학을 통해 이벤트가 발생하기 전에 가능성을 예측함으로써 기업은 자동으로 선행적 조치에 들어가게 되고, 사건 발생후 이벤트에 대응하는 것보다 최적화된 결과를 얻을 수 있습니다.

지속적인 학습

데이터 과학은 일회성 이벤트가 아닙니다. 데이터 과학 중심의 인사이트를 현실에 적용할 경우 그 결과는 예측 가능한 모델과 알고리즘 시스템으로 피드백됩니다. 그 결과 지속적으로 개선되는 자체 학습 시스템이 구현되는 것입니다.

모든 산업에 적용되는 데이터 과학

데이터 과학은 사실상 모든 산업 전반에 적용됩니다. 농부는 데이터 과학을 사용해 최적 모종 시기를 결정할 수 있습니다. 소매업체는 데이터 과학을 사용해 고객에게 맞춤형 제안을 할 수 있습니다. 산업체는 데이터 과학을 사용해 장비 고장을 막을 수 있습니다. 데이터 과학은 금융 서비스, 보험, 헬스케어 및 에너지 산업을 망라한 모든 산업 분야를 변형시키고 있습니다.



“규범적 분석론에 따른 결과를 받는 대부분의 조직들은 데이터 과학을 통해 인사이트를 얻고 있습니다. 분별있는 조직일수록 기계 학습을 탐색하고 실시간 및 근실시간 배포를 계산 중입니다.“

Michele Goetz
수석 애널리스트, Forrester Research
예측 가능 분석을 사용할 8가지 방법 8 Smart Ways To Use Prescriptive Analytics, InformationWeek 2016년 6월 기사)에서 발췌



[데이터 과학] 고려 시
염두에 두십시오.

데이터 과학은 대량의 데이터에서 가치를 추출해 핵심 가치를 지닌 인사이트를 엮어낼 수 있어야 합니다. 그러나 데이터 과학 개발 현황은 아직 하찮은 수준입니다. 여러분의 회사가 전진하기로 결정했다면 우선 아래 질문들에 대답할 수 있는지 확인하십시오.


데이터 과학 재능을 보유한 인력에 비용을 지불할 준비가 되어 있습니까?

통계, 분석, 수학 기술을 모두 보유하고 있는 데이터 과학자들은 매우 드물기 때문에 수요가 많습니다. 데이터 과학 업무를 시작하는 기업들은 최상급 데이터 과학 인력에 프리미엄을 지불할 준비가 되어 있어야 합니다.

데이터 과학팀은 어떻게 구성할 계획입니까?

일부 기업의 경우 데이터 과학자들은 전체 조직을 지원하는 집중화된 공유 서비스의 일부입니다. 또 다른 기업에서 데이터 과학자들은 비즈니스 단위로 파견되어 있습니다. 양쪽 접근 방식에 각각 장단점이 있습니다. 여러분 조직의 구조와 문화에 어떤 접근 방식이 더 적합한지 고려하십시오.

데이터 과학 작업의 규모를 조정할 수 있습니까?

모든 조건이 동일하다면 데이터량이 많을수록 데이터 과학의 결과물도 우수해집니다. 기업 내외에서 분석할 데이터량이 충분하다는 것은 좋은 소식입니다. 하지만 거대한 분량의 데이터에 데이터 과학 알고리즘과 모델을 적용하는 것은 분명 난제입니다. 어떠한 크기의 데이터 과학도 운영할 수 있는 기술이 필요합니다.

어떤 데이터 과학 운영 전략을 가지고 계십니까?

데이터 과학에서 추론한 인사이트는 운영에 적용되지 않으면 아무런 가치도 없습니다. 이경우 업무 결과가 영향력을 가지길 원하는 데이터 과학자들은 확실히 의기소침해집니다. 예측 모델과 다른 데이터 과학 결과물을 실제 비즈니스 과제 해결에 적용시킬 계획이 있는지 확인하십시오.

데이터 사용은 어떻게 관리할 계획입니까?

데이터 과학 덕분에 뭔가 가능하다는 사실은 여러분이 그것을 해야된다는 의미가 아닙니다. 데이터 과학을 도입한 기업들은 구속력없는 윤리적 기준과 구속력 있는 법률적 기준을 근거로 데이터 사용 방법에 대한 기본 규칙도 개발해야 합니다.



차이점 비교: 데이터 과학 vs 기존의 비즈니스 인텔리전스
데이터 과학 접근 방식
기존의 비즈니스 인텔리전스 (BI) 접근 방식
탐구적. 데이터 과학은 분야를 망라하고 참가자들에게 탐구/분석할 것을 격려합니다. 데이터 과학은 반복적인 실험이 필요한 분야입니다. 선결적. 기존의 BI 시스템은 매우 구조적이며 모델화되어 있어서 높은 가치의 예정 질문에 대해 대답을 제시합니다.
유연적. 데이터 과학을 지원하는 플랫폼들은 다양한 유형의 소스 시스템에서 수집된 새로운 데이터를 쉽고 빠르게 추가하는데 능숙합니다. 고정적. 신규 데이터 추가나 질문 제기 등, 기존의 BI 시스템을 변경시키는 것은 복잡하고 시간 소모적입니다.
확장 가능. 데이터 과학을 지원하는 플랫폼은 데이터 스토리지와 연산 측면에서 모두 확장성이 높아야 합니다. 데이터 과학 알고리즘과 모델은 일부 샘플이 아닌 모든 데이터에 대해 실행했을 때 가장 효과적입니다. 확장 불가능. 비즈니스 인텔리전스를 지원하는 기존의 데이터 웨어하우스 애플리케이션들은 주로 빅데이터 스토리지 요구나 프로세스 요구를 충족시킬 확장 능력이 없었습니다.
미래지향적. 데이터 과학을 통해 앞으로 일어날 가능성이 있는 이벤트를 예측할 수 있습니다. 과거지향적. 기존의 BI 대시보드, 보고서, 기타 출력 세부 사항은 이미 존재했습니다.
실행 가능. 애플리케이션을 통해 결과적으로 제시되는 인사이트를 구현했을 때 사용자는 비즈니스 결과를 가져올 조치를 취할 수 있습니다. 실행 불가능. 일반적으로 기존의 BI 보고서와 시각 자료는 인사이트를 제시하긴 하지만 이어질 최선책을 제시하지 못합니다.



데이터 과학을 실행에 옮긴 Pivotal과 고객들

부정 감지

실시간 트랜잭션 데이터에 예측 모델을 적용해 부정행위를 식별하고 중단시킵니다.

고객 세분화

행동, 트랜잭션, 사회적 요인, 기타 데이터 분석을 기반으로 매우 세밀하게 고객을 세분화합니다.

고객 이탈

고객이 제품이나 서비스를 그대로 두고 중단하려는 듯한 패턴을 식별합니다.

예측 유지 관리

자동차, 산업 장비, 기타 기계류의 부품 고장 가능성을 예측하므로 예방 조치를 취할 수 있습니다.

정서 분석

이메일 컨텐츠와 소셜 미디어 업데이트와 같은 텍스트 기반 데이터를 분석해 사용자와 고객의 정서 관련 지식을 수집합니다.

사이버 보안

IT나 기타 네트워크에 대해 잠재적으로 악의적인 공격이나 기타 온라인 위협을 식별해 예방 조치를 취할 수 있습니다.

추천 엔진

과거 구매 행위와 기타 데이터 분석을 기반으로 사용자에게 대상 제품, 서비스, 조치 항목들을 제시합니다.

수요 예측

미리 제품 및 부품 수요를 예측해 재고 수준을 최적으로 유지합니다.



데이터 과학의 팔정도 – 4개 단계 & 4개 차별화 요인
1 단계: 문제 정립
목표와 관련되어 있으면서 관계자에게는 두통거리가 되는 문제를 분명하게 정의합니다.
2 단계: 데이터 단계
사용 가능한 모든 데이터의 규모, 다양성, 속도를 완전히 사용하기는 적절한 기능 집합을 빌드합니다.
3 단계: 모델링 단계
언제, 어디서, 무엇을? 에 대한 해답을 제시하는 단계에서 왜, 만약에?로 시작되는 질문에 대답할 단계로 변경됩니다.
4 단계: 애플리케이션
모델을 의사 결정 프로세스와 조치에 통합하는 프레임워크를 생성합니다.
4개의 차별화 요인

4개의 차별화 요인은 각각 왼쪽의 데이터 과학 수명 주기 4단계에 모두 적용됩니다.

반복적 접근 방식

Agile 방식으로 각 단계를 수행하고 해당 분야 전문가와 SME들과 팀을 구성하고 필요하면 반복 수행합니다.

창의적

모든 단계에서 혁신을 도모할 기회를 잡습니다.

서술 구축

관계자에게 명확하게 인사이트를 전달할 수 있도록 사실에 기반한 서술을 작성합니다.

기술 선택

현행 문제를 해결하기 위해 적절한 플랫폼과 도구 집합을 선택합니다.



Pivotal의 데이터 과학

Pivotal의 데이터 과학자들과 전체 산업분야의 고객들이 함께 구성된 팀은 가장 절박하게 당면한 문제들을 해결하고 시장 기회를 적시에 이용합니다.

Pivotal 데이터 과학을 사용하는 동안 팀은 보통

기존의 분석 성능과 데이터 소스를 평가합니다

높은 비즈니스 가치를 지닌 실행 가능한 사용 사례를 정합니다

반복적으로 분석 모델을 개발, 전개, 개선합니다

예측된 인사이트를 비즈니스 로직과 스마트 애플리케이션에 추가해 운용 가능하게 만듭니다

또한 Pivotal 데이터 과학자들은 고용 기간 중에 고객이 자사의 Agile 데이터 과학 기술을 학습하고 개발하는 것을 돕습니다. 그러므로 지속적으로 새로운 사용 사례를 제시할 수 있습니다.



Pivotal 적용 사례
Synchrony Financial은 Pivotal 데이터 과학자들의 도움을 받아 자사 모바일 앱용으로 고객이 구입하고 전달받을 가능성이 있는 제안을 예측하는 "차선책 제안" 기능을 개발했습니다.
Comcast는 Pivotal 데이터 과학자들과 협업을 통해 승인되지 않은 파일 공유와 같이 네트워크 상에서 벌어지는 의심스러운 행위를 식별하고 중단시킬 수 있는 알고리즘을 개발했습니다.
Pivotal의 데이터 과학 적용의 일부로 Fiat Chrysler는 자동차 제조업체로서 고객 이탈을 줄이고 충성도를 높이기 위해 고객 정서 분석 기능을 개발하고 있습니다.



Pivotal Greenplum
Powerful and interactive analytics on large volumes of data


데이트 과학 관련 추가 리소스 보기

전체 리소스 보기

시작 with Data Science
The Last Mile: Operationalizing Data Science

다운로드

Using Data Science for Cybersecurity

Watch Now

Meet our Data Science Advocates

자세한 정보

Read Next
스마트 애플리케이션