マスクド・アナライズの道場破り!リアルデータサイエンティスト・中山心太編

第1回 データサイエンティストの育成とチーム組成

この記事を読むのに必要な時間:およそ 4.5 分

2018年10月30日データサイエンティスト養成読本 ビジネス活用編の発売を記念して,⁠仕事ではじめる機械学習」の共著者としてもおなじみの中山心太氏(ところてん)に,データ分析業界に突如として現れたイキリデータサイエンティストのマスクド・アナライズ氏(マスクド)がデータ分析者の未来について聞きました。

マスクド:中山さんの経歴についてはじめにお伺いして良いでしょうか。

ところてん:私の経歴はいろいろと転々としていて,もともとは情報セキュリティの研究者をやっていました。そこからクラウド部門に移動しました。その後ソーシャルゲーム会社に転職し,技術支援部門的なところでインフラや集計等を行っているうちに,データ分析の仕事をメインに行うようになりました。リリース前のゲームのパラメータ設計を担当するうちに,企画そのものをやり始め,最終的にはゲームディレクターとして働いていました。

そのあとはECのマーケティング会社に入り,機械学習や商品設計などを行っていました。最近は独立して自社サービスを開発する傍ら,外部の会社で機械学習顧問やゲームディレクター,コンサルタントとして働いています。

私はデータサイエンティストというよりも,コンサルティングから入って,シナリオを出して,そこからデータ分析を始めるという働き方をしています。そのため,サイエンティストというよりは,ビジネスや企画寄りのタイプです。

※)中山氏の詳細なプロフィールなどは,次の記事を参照してください。オポチュニティがあるなら締切までに勉強すればよい ─ チャンスを引き寄せるアピールと仕事術」⁠

ところてん:そういえばマスクドアナライズさんは,この業界にどういう入り方をされたんですか?

マスクド:私はデータサイエンティストというわけではなく,AIなどを手がけるITベンチャーで働いています。元々はIT業界にいて,いろいろあって今の会社に所属しました。職種的には営業とか広報とかコンサルタントみたいな感じです。いろいろなお客様からデータ利活用の相談を受ける中で思ったことや,他のメンバーの仕事ぶりや悩みから,Twitterで情報発信するようになりました。

ところてん:データ分析に興味・関心がいったのはどういうところがきっかけでしょうか。

マスクド:前職で営業活動において効率的にどのお客さんにアプローチすれば売上が上げるかという業務をしていました。闇雲にあたるのではなくて,どのお客さんに当たればいいのかという業務です。今の会社に転職したときは,ビッグデータがブームで,徐々にデータ分析などの依頼が増えてきた頃でした。ちょうど社長がそういったツールや事業を考えてたんです。会社がまだ設立間もないときに見付けて,たまたま入社できた形ですね。

画像

高度な分析がしたければ大きい企業に行きなさい!

マスクド:こういう仕事をしているとよく聞かれるのは,学生さんから「学生のときに何をやった方がいいですか」という質問です。

ところてん:ありますね。

たとえば,私の場合はちゃんとSQLの書き方を身に付けたのって,会社に入ってからなんです。学生の頃にSQLの勉強をしてみたんですが,テストデータで勉強しても何も面白くないんですよね。これとこれをjoinしてこれが出てきます,とか言われてそれがなんの意味あるんだって。

でも実際に会社に入ってからSQLをさわり始めると,生データと業務プロセスを通じてデータ構造を理解できたため,何のためにこの処理をやってるのかすごい勢いで理解が進みました。今,データサイエンスをやってる学生さんって何のためにこれやってんの? っていうのが割と多いんじゃないかなって気はしていますね。

そのため,学会や企業が提供するサンプルデータセットで遊ぶだけでなく,インターンやアルバイトで企業に入ってみて,現実の汚いデータや,運用のための仕組みを一度見てみると,何のために勉強しているのかが,スッとつながるのではないかと思います。

実際に企業に入った新卒を見ていて,これは良くないなって思ったのは,研究室ですごい高度な分析を勉強していたから,それをそのまま会社でも使いたいです,というタイプです。会社に入って難しい分析を何ヵ月やっても結果が出ない,みたいな。

マスクド:アカデミック出身者がハマる罠という感じがします。

ところてん:データサイエンスは,アカデミアと非常にビジネスが近い業界という認識になっていることを鵜呑みにして,最先端の分析をやろうとしてしまう例は非常に多いですね。たとえば,最新の手法で0.1%改善しますって言ったときに,じゃあその0.1%ってビジネスで言うといくらだよっていう話なんです。もともとの売上規模が1千億だったら,0.1%って1億円なわけでそれってめちゃくちゃものすごい価値があるので,意味があります。1億円のビジネスだったら0.1%っていくらかって話です。10万ですよね。これはやる価値がありません。高度な分析でパフォーマンス出したいなら大きい会社行くのをお勧めします。

とはいえ,大きい会社ほどデータ分析に対する理解が薄かったり,会社の壁が厚かったりするので,入社したからといって高度な分析がいきなりできるわけではないのが難しいところですが。

マスクド:大きい会社というか古い会社はそうだと思いますね。

ところてん:大きい規模で高度な分析が実現できれば,それは良いと思います。高度な手法が試してみたい学生は,1千億の売上がある企業をリストアップしたらいいんですよ。そうすれば,自分が研究している最先端のアルゴリズムで0.1%改善できますって言ったらそこの会社だったら価値が出ます。逆に売り上げが1億円の会社でそういう人が入ってきても価値を出せないんです。

今データサイエンスやってる人たちが考えなくてはいけないのは,データサイエンスはレバレッジが非常に効くがゆえに,レバレッジの元手となる売上が小さい会社では役に立たない,というところですね。

マスクド:小さい会社からもオファーは来るんですけども,PoC(実証実験)でも数百万円かかるので,試して効果があるかは重要だと思います。やっぱりクライアントは一部上場クラスのような規模感が目安になりますね。メーカーさんでも半導体みたいな利益率が高く歩留まりが悪い製品などは,挑戦する価値があると思います。一方でこのように考えると,データサイエンティストが活躍できる場は結構狭いような感じがしますね。

ところてん:そうですね,人材にかかるコストとなおかつ莫大なマシンリソース,それを投入しても売上が伸びる状況じゃないとデータサイエンスはなかなか役に立ちません。

しかし,データサイエンス以外の業務までできると全然話が変わってくると思います。私の場合は企画屋さんとして仕事をさせてもらってるケースもあって,そもそもの企画時点からレバレッジを効かせてビジネスを進めて,最後にデータサイエンスで修正していくというやり方を今やらせてもらっています。

途中から入ってデータサイエンスで売上伸ばしてくださいって案件はつらいですね。月商がこれぐらいで,何%伸びても,うーんっていうところですね。

画像

マスクド:ほかに,学生さんがやっておきたいことっていうのはありますか。

ところてん:先ほど言ったように,インターンに行きなさいとは言いたいけど,インターンで労働力を搾取されるのもなぁってあるんですよ。インターンに行くと,現場の汚いデータをいっぱい見せてもらえるんですね。ただ純粋な労働力として見られてしまうので,それって労働力のダンピングだよねって思うところもあって,だいぶ心苦しいなって。

また,プログラミングや基礎技術のラインを越えていないと,インターンに行ってもデータサイエンスは勉強できないと思います。インターンに行ってもプログラミングの基礎を勉強して終わりました,みたいなことになってしまいます。腕に自信がある人はいいですが,そうじゃない人が応募すると,結構ツライことになるんじゃないですかね。

著者プロフィール

中山心太(なかやましんた)

株式会社NextInt 代表取締役

電気通信大学大学院博士前期課程修了後,NTT情報流通プラットフォーム研究所(現ソフトウェアイノベーションセンタ,セキュアプラットフォーム研究所)にて情報セキュリティ・ビッグデータ関連の研究開発に従事。その後,統計分析,機械学習によるウェブサービスやソーシャルゲーム,ECサービスのデータ分析,基盤開発,アーキテクチャ設計などを担当。2017年に株式会社NextIntを創業し,現在は機械学習に関するコンサルティングや,ゲームディレクター,グループウェア開発を行っている。


マスクド・アナライズ

AI(人工知能)・IoT・機械学習・データ分析などを節操なしに手掛ける"自称"AIベンチャーで働くマスクマン。 ただのデータサイエンティストではありません,イキリデータサイエンティストです。「データサイエンス界の東京スポーツ」を目指して,Twitterを中心に日々活動しております。

Twitter:@maskedanl


高屋卓也(たかやたくや)

書籍編集者。2013年より現職。担当作に『データサイエンティスト養成読本』シリーズなど。

コメント

コメントの記入