第4回『「データサイエンティンスト」って何?』
第3回のコラムでは「ビッグデータ」について、いったい何なのか、なぜ騒がれているのか、そして実際のビッグデータ活用の事例をご紹介させていただきました。今回は、「ビッグデータ」とともに話題になっている「データサイエンティンスト」って何?いないと情報活用は 成功しない?について紹介をしたいと思います。
データサイエンティストとは、いったいどのような人物なのでしょうか。
「ビッグデータ」と同様にさまざまな定義があるようですが、7月に発足した「一般社団法人データサイエンティスト協会」(URL: http://www.datascientist.or.jp/ )では、「ビジネス上の課題に対して、データ活用を通じて意思決定を行い、ビジネスの成果/改善につなげることのできる人材(組織)」を想定しているとの記載があります。また、関係する主な領域として「ビジネス/問題解決」、「データサイエンス/分析」、「IT/エンジニアリング」の3種類を挙げています。
これは、データサイエンティストの定義の1つですが、その他の定義においても共通点が多いように思います。簡単に整理すると、「ビジネスとデータ分析とITのスキルを持ち、ビジネスの課題に対して、データ活用を通じた意思決定や具体的な行動を起こすことでビジネスの成果につなげられる人、もしくは組織」ということになります。
問題はそのような人材が実際に存在し得るのかということですが、実際にはそのようなスーパーマンの存在が難しいために、あえて1人の人物ではなくそれぞれのスキルを持った人のチーム(組織)との言い回しになっているようです。
それでは、これまでも企業でデータ活用が推進されてきたにもかかわらず、なぜ「データサイエンティスト」の人物像や必要性が議論されてこなかったのでしょうか。
まず、その理由の1つがBIツールを利用したデータ活用の範囲が単純なレポート作成やOLAP分析(集計軸や分類、集計項目を任意に変更した集計処理)などの集計、検索を中心とした単純な分析が多く、現場部門の担当者自身がどのような分析をすることで、どのような打ち手があるか、また、打ち手に対してどのようなデータをどう分析すればよいかが想定できたこと。言い換えれば、データが理解できる形(フォーマット)で可視化できると現場担当者や経営者が、どのような意思決定を行い、どのような具体的なアクションを起こすかが判断できたこと。そして、ある程度分析の定型化ができたため、ITスキルをもった情報システム部門が、実際に利用する現場部門に対してある程度のトレーニングの実施することで、現場活用が行えたこと。などが挙げられます。
一方で、以前から高度な分析を行うデータマイニングでは、経営企画やマーケティング部門などの特定の部門で、専門の担当者が分析を行うということが行われています。
どちらかというと、現場部門や情報システム部門とは離れた部署でのことということで「データサイエンス/分析」の必要性が言われてこなかったのではないかと思われます。
今、なぜ「データサイエンティスト」の重要性が言われるようになってきたのでしょうか。
1つは、企業内の情報活用、データ活用が進み、次の一手ということでさらに高度な分析が求められるようになってきたことが挙げられます。
- 過去の実績から、未来を予測する。(時系列予測)
- 売上実績から、どのような(属性の)人がこの製品を買っているのか。(相関分析)
- POSデータからどのような製品の組み合わせで売れているのか。(併売分析)
など、これらは数値を単純に集計しただけでは見えてきません。そのために、従来のITと現場(ビジネス)以外のスキルとして「データサイエンス/分析」のスキルが求められるようになってきたのだと推測されます。
もう1つは、「ビッグデータ」が現実にビジネスに活用されるようになってきたため、
1.単純に可視化するだけでは新たな気づきが得られない
2.データ量が多いため、可視化して人間が判断するということができず、新たな考え方や仕組みが必要となってきた
ことも理由に挙げられます。
そして、なによりも未知の(新たな)発見により新たな価値を生む可能性があり、企業にとって他社の持たない新たな価値や、それによる競争優位性への期待感の高まりが、「データサイエンティスト」待望論につながっているのではないでしょうか。
本当に今すぐ、すべての企業で「データサイエンティスト」は必要なのでしょうか。
従来の情報活用、データ活用の範囲であれば、新たな「データサイエンティスト」は不可欠な存在ではないと考えます。もちろん、企業にとって他の企業に先駆けた次の一手のための、高度なデータ分析も今後必要になっていきますが、まずは、企業の基盤として、ビジネスに活かすための情報活用、データ活用の仕組みを構築し、それを継続的、発展的に利用できる環境づくりが重要だと考えます。
その上で、次に「データサイエンス/分析」の視点が必要になってくるのではないでしょうか。また、総務省の事業として行われている日本企業でのクラウド、ビックデータ活用人材の育成関連の資料として「ビッグデータの利活用における新たな人材像に関する調査研究報告書」(URL:http://www.soumu.go.jp/main_content/000229604.pdf )が公開されています。
この中で、「ビッグデータに関する活動動向や人材ニーズなどに関する(中略)調査を進める中で、当初想定していた人材像とは異なるイメージが浮かび上がってきた。この人材イメージは、海外の事例でみられるようなデータアナリストやデータサイエンティストとも異なるインフルエンサー的人材像(実践的なリーダー役)であると判断された。(中略)また、この人材は、今後、拡大するビッグデータを利活用する組織において、最も重要な役割を担うことが判断された。」との記載があります。
実際に、弊社の導入事例で発表いただいた企業の多くでは、このインフルエンサー的人材像に該当される方がほとんどの場合、見受けられます。ビッグデータを含む情報活用においては、「インフルエンサー」役の人材が、そして今後「データサイエンティスト」的な人材が新たな価値創造や競争優位性の向上に大きな役割を果たすことは間違いなさそうです。