データサイエンス、データ活用を推進するために必要なこと

本記事はデータサイエンスの第一人者 中西崇文氏からの寄稿記事です。
著者プロフィール▼

最近では、データサイエンス、データ活用の推進の重要性が浸透してきたように思えます。しかしながら、具体的にデータサイエンス、データ活用を推進しようと思ってもなかなかうまく進まないこともあるでしょう。少し前にはPoC(Proof of Concept)死、PoC疲れといった、概念実証止まりでなかなかビジネスに活用できないという状況を表す言葉が注目されたこともあります。

本稿では、データサイエンスをビジネスで浸透させるために気をつけたいことについて、挙げていきたく思います。

自社で解決すべき課題は一体なんなのかを定める

データサイエンス、データ活用を推進するにあたり、どうしても自社にあるデータをすぐに触ろうとする方がいらっしゃるかと思います。自社にどのようなデータが蓄積されているかを把握することは非常に重要です。ただし、その前に自社で解決すべき課題を把握するというのが重要となります。データサイエンス、データ活用をむやみに取り入れても、役に立つシーンで導入できていなかったら意味がありません。やはり、自社で解決すべき課題に集中してデータサイエンス、データ活用を行うべきです。

PoC死、PoC疲れといった状況に陥るケースはほとんど自社で解決すべき課題に集中していないのが原因だったりします。データサイエンス、データ活用、AI、DX、…。導入、推進しなければならないものはキーワードとしてはたくさんあります。これらを導入、推進しなければいけないということで、他者の事例を集めてきて、それを真似て進めていくのが一番危険なのです。これらのキーワードは魔法ではなく、やはり自社で解決すべき課題にしっかりマッチした形で進めることが非常に重要なのです。

まずは、自社で解決すべき課題を挙げ、その中でデータサイエンス、データ活用によって分析、可視化出来そうなものを選択していくという作業が重要です。自社で解決すべき課題ではないものにデータサイエンス、データ活用をしたとしてもコストがかかっていくだけです。はデータサイエンス、データ活用によってコストはかかるが、取り組んだ自社で解決すべき課題によって効率化が図られたお陰で利益をもたらすというストーリーを目指さないと意味がないのです。

挙げた自社で解決すべき課題をよりシンプルな課題にブレイクダウンする

上記で挙げた自社で解決すべき課題をそのままデータサイエンス、データ分析に 反映させることは難しいことが多いです。自社で解決すべき課題を明確な数値目標が定められそうなシンプルな課題にブレイクダウンする必要があります。これは、自社で解決すべき課題を自社で取得しているデータ、もしくはこれから取得可能となるデータと結びつけるという作業に近いです。データサイエンス、データ分析で全て解決できるわけではありません。課題を小さくブレイクダウンして、シンプルでかつ明確な課題に磨き上げることが重要です。

スモールスタートでも構わない

以前にビッグデータという言葉が流行したこともあり、大量のデータが取得できないと、データサイエンス、データ分析の推進ができないのではないかと思われている方がいらっしゃるかもしれません。その価値観は一旦捨てていただいても構いません。

中には、データ数は少なくても、分析するのに非常に有益なケースはたくさんあります。まずは、その課題についてデータという観点からスモールスタートでも構わないので観察するということが非常に重要かと思います。うまくいくコツはスモールスタートでだんだん規模を大きくしていくということです。

データの前処理はどういう問題を解くかによって決まる

よく聞かれる声としては、「自社ではデータを収集しているが、データが使える状況になっていないので、まずデータを整理しないとデータサイエンス、データ活用が推進できない」という声です。

また、「一般的なデータの前処理手法について教えてください」という声もよく聞かれます。この質問が一番困ります。なぜなら、どういう課題に着目して、どのような課題を解決するためにデータ活用するかが決まっていないと、どのようにデータの前処理をするかが決まらないからです。

データをどのように集約しておけば、データ分析で使いやすくなるかは、どのような課題を解くかに依存します。そのため、これまで示してきた課題を明確にして、自社のデータを見直すことで初めて前処理手法が決まります。

データを取得し続ける仕掛けを考える

データサイエンス、データ分析を取り組むとなると、どうしても、どういう統計手法か、機械学習手法か、などの分析手法に目が行ってしまいがちですが、重要なのは、データを取得し続けることです。

データを取得し続けるためには、データを入力しやすい仕掛けをつくることです。もちろん人が入力する場合はユーザインタフェースを考えることも一つです。人が介在しなくてもデータが生成されるように、センサーを用いることも一つです。社内のデータを一括に扱うことができるようにするためにDXを推進することも一つです。

これらは全て、データを取得し続けるために仕掛けづくりだと考えていただいた方が、考えがすっきりするのではないでしょうか。データが途切れてしまえばデータ分析の精度も下がっていきます。社内でどのようにすれば有効なデータを取得し続けることができるかを広い視野で考えてみましょう。

データ分析で当たり前の結果が出ることを恐れない

データサイエンス、データ分析を取り組んでいて、よく言われる声として、「データを収集してデータ分析を行ったが、これまで知っていた当たり前の結果しか出なくて使えないと思った」というものです。がっかりするかもしれませんが、当たり前の結果が出るというところがスタートラインだと思っていただきたいです。

当たり前の結果が出ること、それはデータ分析がうまくいっている証拠です。何年もかけてわかってきた勘やコツをデータ分析では数日で明らかにすることができるのです。これ自体がすごいことではないでしょうか。

当たり前の結果から、もう少し何を深めてみたいのか、例えば時系列変化を見せたいのか、顧客のクラスタを分けて分析したいのか、色々あるかと思います。当たり前の結果から、何をもう少し絞りたいのかをぜひ深めてみてください。

データサイエンス、データ分析を続ける

データサイエンス、データ分析で一度結果を出してみて考察して終わりになってないでしょうか。継続的にデータを取得し続けて、分析し続けることが重要なのです。現在では、データサイエンスの重要性が浸透してきて、取り組む組織も増えていますが、これがブームだけで終わらないことを祈っています。

データサイエンス、データ分析は、継続することによって、自社にインサイトを与え続けます。自身はそのインサイトを基づき、随時意思決定をすることができるわけです。社内のサイクルの中にデータサイエンス、データ分析が自然にある姿が重要となります。

データサイエンス、データ分析は、魔法ではありません。しかしながら、自社の課題に着目して、それにリンクして導入、推進することができれば、必ず、メリット、利益を生み出します。これまで述べた事項を守りながら、よいデータサイエンス、データ分析の導入、推進をしていただければと思います。

この記事を書いた人

中西崇文
中西崇文
武蔵野大学 データサイエンス学部
データサイエンス学科長 准教授
国際大学グローバル・コミュニケーション・センター主任研究員
デジタルハリウッド大学大学院客員教授
データサイエンティスト、博士(工学)

1978年、三重県伊勢市生まれ。

2006年3月、筑波大学大学院システム情報工学研究科にて博士(工学)の学位取得。2006年より情報通信研究機構にてナレッジクラスタシステムの研究開発等に従事。2014年4月より国際大学グローバル・コミュニケーション・センター准教授・主任研究員、テキストマイニング、データマイニング手法の研究開発に従事。2018年4月、武蔵野大学工学部 数理工学科 准教授。2019年4月より現職。

現在、機械学習などをはじめとする人工知能技術をコアとしたシステムの研究開発やそれらのビジネス、サービスの立ち上げを目的とした企業連携研究プロジェクトを多数推進中。

総務省「AIネットワーク社会推進会議」構成員、経済産業省 「流通・物流分野における情報の利活用に関する研究会」委員、総務省「ICTインテリジェント化影響評価検討会議」構成員、等歴任。

専門は、データマイニング、ビッグデータ分析システム、統合データベース、感性情報処理、メディアコンテンツ分析など。

著書に『スマートデータ・イノベーション』(翔泳社)、「シンギュラリティは怖くない:ちょっと落ちついて人工知能について考えよう」(草思社)などがある。