5分間で読める記事

データサイエンス:データ駆動のアプローチをビジネスに

データサイエンスとは、単に情報を提供することではありません。適切なデータに適切なモデルを適用することで、企業は大量のデータの中にあるパターンを特定し、予測に役立て、最終的にはビジネス成果に影響を及ぼすことができます。言い換えると、データサイエンスは顧客により良いサービスを提供するために必要な先見性を与え、より説得力のある製品を開発することを可能にし、経営効率を向上させます。


データサイエンスとは

データサイエンスとは、機械学習、データマイニング、予測分析、ディープラーニング、コグニティブコンピューティングといった手法を用いて、大量の雑多なデータの中に隠されたパターンや知見を明らかにするプロセスを意味します。従来のビジネスインテリジェンスやそれに関連するアプローチとは異なり、データサイエンスは構造化されたデータにとらわれることなく、データをきちんとした列や表に整理する必要がないほか、小さなデータセットに限定されることもありません。それどころか、データサイエンス手法は、テキストベースのデータ、マシンデータ、センサーデータ、ソーシャルメディアデータなど、大量の半構造化データや未構造化データに対して大規模に適用できます。このように、制約の少ないデータ分析アプローチにより、組織は尋ねようともしなかった質問への回答を見つけ、競争力を高めるブレークスルーとなり得る知見を得ることができます。


データサイエンスが重要である理由

ビッグデータの価値を解き放つ

Hadoopやクラウドベースのストレージといった最新のデータ管理手法を使用すると、大量のデータをかつてないほど経済的に保存できます。しかしビッグデータを保存するだけでは、価値を提供することはできません。データサイエンスを適用して、アクション可能な知見を明らかにすることで、ビッグデータの価値を解き放つことが可能になります。

予測してプロアクティブに行動する

データサイエンスによって物事が発生する可能性を事前に予測することで、企業は後から対処するのではなく、プロアクティブに措置を講じて結果を最大限に高められます。

継続的学習

データサイエンスは一度限りのイベントではありません。データサイエンスから得られた知見を行動に移すとき、その行動の結果は予測モデルやアルゴリズムのシステムにフィードバックされます。つまり、継続的な改善が可能な自己学習システムなのです。

すべての産業で使えるデータサイエンス

データサイエンスは、事実上すべての産業に用途があります。農業業者は、データサイエンスを使用して、苗を植える最適な時期を見極めます。小売業者は、顧客に合わせて売り方をパーソナライズします。工業会社は、データサイエンスを用いて機器の故障を防止します。金融サービスや保険から、医療、エネルギーまで、あらゆる産業がデータサイエンスによって変革されつつあります。



「予測的分析によって結果を出している組織のほとんどは、データサイエンス活動を通じて知見を得ています。より成熟した組織は、機械学習を試したり、リアルタイムまたは準リアルタイムデプロイメントの評価を行ったりしています。」

Michele Goetz
主席アナリスト, Forrester Research
InformationWeek(2016年6月)の記事、 「8 Smart Ways To Use Prescriptive Analytics(8つの賢い予測分析活用法)」 から引用



データサイエンスを検討する際の 考慮事項

データサイエンスは、大量のデータから価値を引き出すことで、革新的な知見を得ることを可能にします。しかしデータサイエンスプラクティスの構築は、一朝一夕にはいきません。あなたの企業でデータサイエンスの導入を検討している場合、次の質問への回答を事前に把握しておいてください。


データサイエンス関連の人件費を負担する準備はできているか

統計、分析、数学といったさまざまなスキルを持つデータサイエンティストは希少で、引く手あまたな状態です。データサイエンスプラクティスを始めようとする企業は、有能なデータサイエンティストに割高な給与を支払う心づもりをしておく必要があります。

データサイエンスチームをどのように組織するか

一部の企業では、データサイエンス部門は集中型の共有サービス部門として組織全体をサポートしています。一方で、データサイエンティストが各事業部門に組み込まれている企業もあります。いずれの場合も一長一短があるため、あなたの組織の構造や文化により適したアプローチを検討してください。

データサイエンスの作業負荷を拡大/縮小できるか

全ての条件が同じだとすると、データが多ければ多いほど、データサイエンスの結果がより正確になります。ありがたいことに、企業の中にも外にも、分析すべきデータは豊富にあります。しかし、大量のデータに対してデータサイエンスのアルゴリズムやモデルを実行することは簡単ではありません。大規模にデータサイエンスを運用するには、テクノロジーとスキルが必要です。

データサイエンスを運用する上で、どのような戦略を立てているか

データサイエンスを通じて知見を得ても、それを実用化しなければ価値はありません。実用化されないとなれば、自らの仕事でインパクトをもたらしたいデータサイエンティストのやる気を必ずや削ぐことになるでしょう。予測モデルや他のデータサイエンス結果を、実際のビジネス課題の解決に利用する計画があるかどうか確認してください。

データの使用をどのように管理するか

データサイエンスのおかげで何かが可能になったからといって、それを必ずしなければならないという意味にはなりません。データサイエンスに乗り出す企業は、倫理的(法的拘束力なし)基準および法的(拘束力あり)基準の両方に基づいて、データの使用方法に関する基本原則を策定する必要もあります。



大きな違い:データサイエンスと従来のビジネスインテリジェンスとの比較
データサイエンスのアプローチ
従来のビジネスインテリジェンス(BI)のアプローチ
探索的。 データサイエンスでは、実行者は方向性を定めずにデータを探索することが奨励される。データサイエンスは、実験が必要な反復的なプロセスである。 事前定義。 従来のBIシステムは高度に構造化され、モデル化されており、高価値な、事前定義された質問に対して回答を提供する。
柔軟性。 データサイエンスを支えるプラットフォームは、さまざまなタイプのソースシステムからすばやく簡単に新しいデータを追加できる。 柔軟性に欠ける。 既存のBIシステムに新しいデータソースを追加したり、新しい質問を加えたりといった変更を施すことは、複雑で時間がかかる。
拡張性。 データサイエンスを支えるプラットフォームは、データストレージと計算力の両方の観点から、非常に拡張性が高いものである必要がある。データサイエンスのアルゴリズムとモデルは、サンプルではなく、すべてのデータにわたって実行される場合に最も効果を発揮する。 拡張性がない。 ビジネスインテリジェンスを支える従来のデータウェアハウスアプライアンスは、たいていの場合、規模の拡大が不可能で、ストレージ需要の増大や、ビッグデータの処理上のニーズに対応できない。
先見性。 データサイエンスを使用すると、企業は将来何が起きるかを予測することができる。 回顧的。 従来のBIダッシュボード、レポート、その他は、すでに起こった事柄の詳細を示す。
アクション可能性。 結果として得られた知見をアプリケーションを通じて実用化することで、ユーザーは業績を向上させる行動を取ることができる。 アクション不可能。 従来のBIレポートやビジュアライゼーションは知見を提供するが、概してネクストベストアクションを示すものではない。



Pivotalと顧客のデータサイエンス実施例

不正行為の検知

予測モデルをリアルタイムのトランザクションデータに適用することで、不正行為を特定し、阻止できます。

顧客のセグメント化

行動、トランザクション、ソーシャル、その他のデータ分析に基づいて、顧客を詳細にセグメント化できます。

顧客離れ対策

顧客が製品やサービスから離れていきそうであることを示すパターンを特定し、それを阻止するための措置を講じることができます。

予測的なメンテナンス

車、工業機器、その他の機械でパーツ故障の可能性を予測することで、予防措置を講じることができます。

センチメント分析

電子メールの内容やソーシャルメディアの最新記事といったテキストベースのデータを分析して、ユーザーや顧客の感情を探ることができます。

サイバーセキュリティ

ITやその他のネットワークへの悪意ある攻撃やオンライン脅威である可能性があるアクセスを特定し、防御措置を取ることができます。

レコメンデーションエンジン

過去の購買行動やその他のデータの分析に基づいて、ターゲットとすべき製品、サービス、および行動項目を提案します。

需要予測

製品やパーツへの需要を事前に予測し、最適な在庫レベルを維持できます。



データサイエンスの8つの道 - 4つのフェーズと4つの差別化要素
フェーズ1: 問題の定式化
利害関係者の目標や痛点に関連する問題を定式化します。
フェーズ2: データステップ
利用可能なすべてのデータの量、多様性、および速度を最大限に活用して適切なフィーチャセットを構築します。
フェーズ3: モデリングステップ
ここで、「何を」、「どこで」、「いつ」に対する回答から、「なぜ」、「もしも」に対する回答へと移行します。
フェーズ4: アプリケーション
モデルを意思決定プロセスや行動に統合するための枠組みを作成します。
4つの差別化要素

4つの差別化要素はそれぞれ、左のデータサイエンスライフサイクルの4つのフェーズすべてに適用されます。

反復アプローチ

各フェーズをアジャイル的に実行し、各業務分野の専門家と連携して、必要に応じて反復します。

クリエイティブ

すべてのフェーズで革新の機会を生かします。

物語の構築

利害関係者に知見を明確に伝えるため、事実ベースの物語を作成します。

テクノロジーの選択

当面の問題を解決するために適切なプラットフォームと適切なツールセットを選択します。



Pivotalのデータサイエンス

Pivotalのデータサイエンティストチームは、あらゆる産業のクライアントと協働しながら、クライアントにとって最も差し迫ったビジネス課題を解決し、市場機会を適時に生かすお手伝いをしています。

Pivotalのデータサイエンスチームは通常、次のような流れで作業を行います。

既存の分析機能やデータソースにアクセスします

高いビジネス価値を持つ、実行可能なユースケースを特定します

分析モデルを反復的に開発し、進化させ、磨きをかけます

予測的知見をビジネスロジックやスマートアプリケーションに組み込むことで、知見の運用化を図ります

Pivotalのデータサイエンティストはまた、作業の過程で、クライアントが自らアジャイルデータサイエンスのスキルを学び、構築できるようお手伝いすることで、その後発生する新しいユースケースに自分で対処できるようにします。



Pivotalがもたらす転機
Pivotalデータサイエンティストの助けを得て、シンクロニー・ファイナンシャル社は、顧客の購買傾向を予測し、ターゲットを絞った商品を提供する「next best offer」機能を自社のモバイルアプリ向けに開発しました。
コムキャスト社は、Pivotalのデータサイエンティストと協働しながら、未承認のファイル共有など、ネットワーク上の疑わしいアクティビティを特定、阻止することを可能にするアルゴリズムを開発しました。
Pivotalとのデータサイエンスサービス契約の一環として、フィアットクライスラー社は、顧客離れを防止して顧客忠誠度を高めるため、顧客感情分析機能を開発しています。



Pivotal Data Science
結果の予測を助け、さらには結果に変化をもたらす


Pivotal Greenplum
大量のデータに対する強力でインタラクティブな分析


Pivotal HDB
Hadoopプラットフォームから更なる価値を引き出す


データサイエンス関連の資料をお探しですか?

全ての資料を表示

始める スピーカー: Data Science
The Last Mile: Operationalizing Data Science

ダウンロード

Using Data Science for Cybersecurity

ビデオを見る

Meet our Data Science Advocates

詳細を見る

Read Next
スマートアプリケーション