こんなデータサイエンティストは重宝される

”データサイエンティストの仕事はデータを学習させ、良いモデルを作り、予測精度を上げることだ!”そう思っている人が多いかもしれませんが、これだけでは年収の低い残念データサイエンティストです。今は高い年収をもらっていたとしてもいずれツールの発達により駆逐対象となるでしょう。

今回は「こんなデータサイエンティストは重宝される!」をテーマに価値のあるデータサイエンティストとはなんなのかを説明します。

 

データに基づいた仮説立案、検証ができる

非常に重要ですが、機械学習モデルを作成する前にデータ分析を行うことは必須となります。

なぜならば機械学習を使って何を予測したいのか?予測した結果をどう使うのか?をあらかじめ決めなければならないからです。

”今期〇〇商品の売上を30%向上させたい”という会社としての目標が決まっていたとして、データサイエンティストは何を考えるべきでしょうか?

データを分析して現状を知ることが必要になるはずです。これを達成するには仮説の立案とその仮説をデータから検証します。

【仮説例】

  • お客さんはテレビCMを見て○○を知る
  • ○○を買っている人は××も合わせて買う確率が高い
  • 〇〇は女性に人気がある

【検証例】

  • ○○商品をどこで知ったのか調べる
  • ○○商品を買ってくれている客層はなにかを調べる
  • 〇〇商品を買ってくれる人は他商品も合わせて買っていないかを調べる

仮説立案と検証を繰り返し行うことで初めて、○○商品に対する事実を知ることができ、売上向上のための施策を打つことができます。この作業を行なわないと感覚を頼りに闇雲に施策を打つことになり、効率的とは言えません。

商品に対する事実を知ったところで、次に機械学習をどう使うかを考えます。

  • ○○商品を買ってくれる確率の高い人を予測し、積極的に営業に足を運ばせる
  • 〇〇商品の日ごとの販売個数を予測い、在庫調整や人員配置を決める
  • 顧客をグルーピングし、グループの特徴ごとにアプローチを変える

例としてはこのような感じです。データから仮説検証を行うマインドセットを持ったデータサイエンティストを目指しましょう。

 

何かしらのバックグラウンドを持っている

データはどの業界にもあり、どの会社にも必ずと言っていいほど存在します。

つまり、データサイエンティストはどの業界でもデータがあれば活躍できる場があるということです。

転職によりデータサイエンティストになった人は、同業界であれば重宝されます。

理由はデータに関する背景知識を持っているからです。

ここで言う背景知識の具体的な例を紹介します。

  • 例) データの欠損の意味がわかる
    とある製造データで欠損がある場合、その欠損に大きな意味がある場合があります。製品検査の結果、NGとなったためデータが欠損していたり、最初に機械が安定的に動くまではデータを取得しないなど、様々な理由があると思います。この辺のルールとして明記されていない隠しルールや現場感をわかっているのは製造現場で働いたことのある経験者だけです。また分析を行う上ではこの欠損の意味を知ることは非常に重要です。

背景知識がないままデータ分析を行うと、上っ面の知識だけで分析を行うことになり、より深い考察ができない場合があります。

もちろん自身の経験や知見で解決できることができれば素晴らしいですが、そうでない場合は同僚や知人にすぐに意見を聞きに行けるコミュケーション力、そして人脈力でカバーする必要があります。

 

データインフラ、システムに詳しい

データのインフラに詳しい人は機械学習の運用面で能力を発揮することができるのではないでしょうか。

実際にデータサイエンティストが予測モデルを作ってハイ終わり!では活用されませんし、価値を出すことができません。

作ったモデルを複数人で使える形にしてこそ、真価が発揮されるのです。

これを実現するには作成したモデルを使える形にするためのデプロイという作業が必要になります。

データをどのようなフローで取得して、どのシステムで予測して、結果をどこに出力するのか、メンテナンスはどうするのかといったインフラへの接続、設計が必要になります。

データサイエンティストが実際に手を動かしてインフラ整備を行う場面は少ないかもしれませんが、AIプロジェクトの最終ゴールの一つは自動化して使えるようにすることです重要です。

データ全体の流れを適切に把握できると、価値の高いデータサイエンティストと言えるでしょう。

 

まとめ

その他にもデータサイエンティストとして持っておくマインドセットはたくさんあります。

  • 英語ができる(論文読込みや海外事例の探索)
  • 常に最新の動向に目を向けている
  • 泥臭い作業もやってのける(データ加工など)
  • プレゼンが上手い

正直、挙げだしたらキリがないです。

みなさんも、ぜひ求められるデータサイエンティストになってください!
(私も頑張ります!)

コメント

タイトルとURLをコピーしました