時代遅れの採用選考プロセスを嫌うデータサイエンティスト、コロナ禍の影響も?

次の記事

新Google Pixel、Chromecastの発表は米国時間9月30日

著者紹介:Tianhui Michael Li(ティエンフイ・マイケル・リー)氏は、学術界から産業界への博士やポスドクの移行を支援する8週間のフェローシップで知られる、The Data Incubator(データ・インキュベーター)の創設者である。それ以前はFoursquare(フォースクエア)でマネタイゼーション・データサイエンスの責任者を務め、Google(グーグル)やAndreessen Horowitz(アンドレセン・ホロウィッツ)、J.P.Morgan(ジェイ・ピー・モルガン)、D.E.Shaw(ディー・イー・ショー)における勤務経験も有する。

ーーー

2020年は世界が大きく変わった年である。その変化は、企業のデータサイエンス職の採用選考方法にも現れている。さまざまなことが変わったが、その中でも目立って大きく変わったことが1つある。筆者が創設したデータ・インキュベーターは、データサイエンスフェローシップを実施しており、毎年数百人のデータサイエンス職採用者を送り出している。我々が調査したところ、こうした採用者は今では珍しくなった時代遅れの採用選考プロセスを嫌い、全体の80%を占める標準的な採用プロセスを実施している企業を選択していることが明らかになった。大企業(つまりは最も変化に慎重な企業)ほど、こうした時代遅れのやり方に固執する傾向がある。現在こうした大企業は、データサイエンティストの獲得競争においてかなり不利な立場に置かれている。

振り返ると、データサイエンス関連職の採用活動はソフトウェアエンジニアリングから発展してきた。ソフトウェアエンジニアリングの面接といえば、かなり手強いパズルのような難問が特徴だ。例えば、「ボーイング747の機体にはゴルフボールが何個入るか?」とか「ホワイトボード上でクイックソートのアルゴリズムを実行せよ」といった類の問題だ。応募者は数週間、数か月をかけてこうした問題を解く勉強をする。求人関連ウェブサイトのGlassdoorは、そうした問題の対策用に1つのセクションをまるごと割いている。データサイエンス職の採用選考では、従来のコーディングの難問を補足する形で、例えば、「2個のサイコロを振ったときに出た目の合計が3で割り切れる確率は?」といった統計問題も出題されてきた。しかし企業は長い年月をかけて、こうした難問はあまり効果的でないと認識するようになり、出題を控えるようになっている。

その代わりに、プロジェクトベースのデータ評価を採用選考に取り入れる方法に注目している。これは、データサイエンス職の応募者に、企業が提供した実世界のデータを分析させるものだ。こうしたプロジェクトベースの評価は、1つの正解が存在するわけではなく、たいてい自由形式で回答し、説明することが求められる。面接を受ける人は通常、コードと評価結果を提出する。このやり方には形式と内容の両面において、多くの利点がある。

第1に、データ評価の対象となる環境の方がはるかに現実的だ。パズル形式の難問では、応募者が無意味に問題に苦しんだり、ホワイトボード上でぎこちなくコードを書いたりすることになる。また、こうしたパズル形式の問題はグーグル検索ですぐに正解がわかるため、インターネットの使用は禁止される。実際の仕事で、ホワイトボード上にコードを書いたり、誰かが肩越しに覗いている状態で暗算を実行したりするといったことはあり得ない。業務中にインターネットアクセスを禁止されるなど理解しがたい。データ評価では、応募者が使い慣れたIDEまたはコーディング環境を使って、より現実的なペースで評価作業を実行できる。

「自宅で行う課題なら、実際の仕事における応募者のパフォーマンスをパズル形式の面接問題よりも現実的にシミュレートできる」と、エンジニアリングマネージャーで「How Smart Machines Think(スマートマシンはこうして思考する)」の著者でもあるSean Gerrish(ショーン・ジェリッシュ)氏はいう。

第2に、データ評価は内容もより現実的だ。パズル形式の難問は一筋縄では解けないように、あるいはよく知られたアルゴリズムの知識をテストするために意図的に考えられたものだ。実世界では、こうしたアルゴリズムを手で書くことは絶対にないし(通常はインターネット上で入手可能な無償のソリューションを使う)、仕事で遭遇する問題にパズルのようなトリッキーなものは滅多にない。データプロジェクトでは、応募者に実際に扱う可能性のあるデータを与え、評価結果の社内における共有方法と同様に成果物を構造化するため、実際のジョブスキルに近い能力をテストできる。

業界経験が長く「Data Teams(データチーム)」の著者でもあるJesse Anderson(ジェシー・アンダーソン)氏は、データ評価による選考を強く推奨している。同氏は次のように指摘する。「これは、応募者と企業の双方に有益な方法だ。面接を受ける側は、実際の仕事に近い作業を体験できる。マネージャーは、志願者の作業と能力を、実際の仕事に即して詳しく判定できる」。プロジェクトベースの評価には、書面によるコミュニケーション力を評価できるという利点もある。これは新型コロナウイルスでリモートワークが増えた今、ますます重要なスキルとなっている。

最後に、書面による技術プロジェクトワークは、従来の雇用プロセスに存在する先入観の多い側面を和らげることで、偏見を排除するのに役立つ。同じ履歴書を提出しても、ヒスパニック系やアフリカ系の米国人は白人に比べて面接の連絡をもらえることが少ない。これに対応するため、人種的マイノリティーの応募者は自身の履歴書を故意に「白人化(履歴書で白人を装うこと)」している。対面式の面接も、こうした問題のある直感に基づいて行われることが多い。仕事のパフォーマンスにより近い評価を重視することで、面接担当者は、偏見のある「直感」に頼るのではなく、実際の資質や能力の判定に集中できる。#BLMや#MeTooに単なるハッシュタグ以上の意味を感じている企業は、自社の採用プロセスをどのように微調整すればより広範な平等を実現できるのかを検討しているようだ。

データ評価の詳細な形式はさまざまだ。データ・インキュベーターで行った調査によると、60%を超える会社が自宅に持ち帰って行うデータ評価を課題として与えていることが判明した。こうしたデータ評価は実際の仕事の環境をシミュレートするには一番の方法だ。応募者は、通常数日間に及ぶリモートワークを体験できるからだ。また、約20%の会社が、応募者が面接プロセスの一部としてデータ分析を行う面接データプロジェクトが必要だと答えている。こうした面接時に行うデータプロジェクトでは、応募者が制限時間というプレッシャーを受けるものの、終わるまでデータ評価作業に延々と取り組むプレッシャーから解放される。「課題を自宅に持ち帰って取り組むには多くの時間が必要だ」と経験豊富なデータサイエンティストで「The Data Science Handbook(データサイエンス・ハンドブック)」の著者でもあるField Cady(フィールド・キャディ)氏は説明する。「これは応募者にとってかなり負担のかかる作業である。また、家庭での責任があるため、夜の時間の多くを課題に費やすことができない応募者には不公平となる可能性がある」。

企業側が自社で作成したデータプロジェクトを課題として出さずに済むように、賢明な応募者は、自身のスキルを見せるために事前にポートフォリオプロジェクトを構築している。企業側も自社のカスタムプロジェクトの代わりに、応募者が事前に用意したプロジェクトを課題として受け入れるところが増えている。

古いパズル形式の難問を面接時に使用する企業はなくなりつつある。こうした古いやり方に固執している20%の企業の大半は、通常変化に適応するのが遅い有名大企業だ。こうした大企業は、時代遅れの採用プロセスは単に古くさいだけでなく、応募者を遠ざけることになることを認識する必要がある。最近のオンライン会議で、出席したパネリストの1人にデータサイエンス関連職として新規採用された人がいたが、彼はその会社の選考過程があまりにお粗末だったため入社を断ったと話してくれた。

採用プロセスが時代遅れになっている組織が果たして強いチームを形成できるのだろうか。データ・インキュベーターのデータサイエンスフェローシップを終えようとしている博士号取得者の多くがこのような気持ちを抱いている。新しい現実を受け入れることができない企業は、最高の人材を獲得するための競争に敗れている。

関連記事:自動化によりデータサイエンスは不要になるだろうか?

カテゴリー:人工知能・AI

タグ:データサイエンス コラム

原文へ

(翻訳:Dragonfly)