どうも~!今日も元気に緩く仕事をしています。
今回はちょっといつもとテイストを変えて、データサイエンスをやっていてお客様が良く求めてくるものを紹介します。
AIで100%の識別したいんだよね
まず最初に、AI、特に機械学習の予測精度は一般的な人間の予測精度を超えることは可能ですが、その道のプロフェッショナルの予測精度を超えることは難しいと言われています。
例えば、どんなに優れたAIだとしてもとある設備の故障確率を100%の精度で予測することはできませんし、明日の売上をほとんど誤差なく当てることはできません。
しかし、AIについて仕組みや特徴がわかっていない人は高精度を狙いがちです。
超高性能のサーバを用いてディープラーニングで時間をかけて高精度を狙うことは決して悪いことではないのですが、そこに費やすコストが計り知れません。
AI導入のメリットは予測に加えてその予測結果を活用して業務フローを一部自動化するなどの運用面の改善の方が利益を得やすい場合がほとんどです。
こういったお客様との認識の違いがあることを前提としてミーティングする必要があります。
このデータ使える?
機械学習にある程度理解があり、テーマも何となく決まっているお客様はデータを見てもらいたがります。
データサイエンティストとしてはデータをいただけるのであればそれはこの上ない幸せなのですが、忘れてはいけないことは会社は慈善活動ではないということです。
データを提供するのは大した手間ではないですが、それを読み込んで中身を見ることは非常に手間がかかる作業となります。
そして、お客様は簡単に”このデータで予測してほしいんだけど、使える?”と聞いてくるのです。
えっ!?中身を見るだけでなくモデリングもちょろっとやってほしいってか!?カーッ!たまんねぇな!!!
正直、ここまでくるとお金をもらわないと採算が合いません。
なぜなら、お客様のデータはだいたいの場合分析用途ではないので、データ入力ミス、謎項目、変に結合がしてしまっていてデータがめちゃくちゃといったことが日常茶飯事なのです。
モデリングをするためにはある程度データをそろえないと、そもそもどれくらい使えそうなデータかすら判断が難しい場合があります。
ちなみに私は無能なのでもらえるデータはなんでももらってしまい、空いてる時間に勝手にクレンジングや傾向分析などをしてしまいます。
もちろん、経験を積むためです!暇だからではないです!
工数管理が厳しい会社だと、受注してお金をもらうまでデータを見ないという固い意志を持ったデータサイエンティストもいます。
本来はそうあるべきなのです。それが企業としての活動ですから。
こうするとどうなるの?この場合は?
こちらが出した分析結果に対して積極的に色々聞いてくる前向きなお客さんです。
データサイエンティストとしては、データを通してお客様と仲良くなれた気がして嬉しい限りなのですが注意が必要です。
それ、スコープ範囲外だけど、やる?どうする?
次から次へと来るお客様からの要求、スケジュール的にも能力的にも余裕があるならやってもOKなのですが過度に答えようとするのはNGです。自分を追い詰めることになるのです。気を付けましょう
この案件、精度でないと厳しいのですが…
よくわかります。
少なくとも現行の手法と比較して良い精度が出ないとAI導入をするメリットも薄れてしまいますよね。
しかしここが難しいところで、通常、AI導入プロジェクトは精度が確約できないのです。
お客様にもそこは理解してもらった上で契約を結びます。でないと、精度が出るまで延々とモデリングを繰り返す地獄の日々に…
気を付けましょう。
以上!
コメント