即答せよ! このシステムは問題に答える顔を見て人間であることを確認する

次の記事

ロボットに虐待やいたずら対策を実装するより人間のマナー向上が先…その深遠な理由

ボットとの戦いに終りはない。しかし、誰もが密かに想像しているスカイネットのようなシナリオでは終わらないことを望みたい。ちなみに、今重要なのはスパムを退治することで、組織的殺人を防ぐことではない。それでも、機会はますます賢くなり、単純な顔認識だけでは人間の識別に十分ではないこともある。今や機械は顔を作ることもできる —— しかし、質問に答えるときの顔を作るのは不得意のようだ。

ジョージア工科大学の研究者らは、CAPTCHAタイプのシステムに取り組んでいる。そして人間がありとあらゆる質問にすばやく自信を持って答えられるのに対して、最先端の人工顔アニメーションと音声生成システムを使っても、それらしい返答をコンピューターが生成するのは難しいという事実に着目した。

人間とロボットを区別するテストにはこの種の方法を用いたものがいくつもある。文字や動物や道路標識を認識することから、なんらかのGoogleサービスにログイン中かどうかまで様々だ。しかし理想的には、人間には簡単でロボットには難しいものがいい。

人間には必ず顔がある。しかし、そこそこリアルな顔をレンダリングして修正するのはコンピューターにとって膨大な仕事だ(JPEGに騙されないシステムが前提)。

また、人間は単純な質問に答えるのも得意で、無意味な質問ならなおさらだ。しかしコンピューターは、「犬と猫どっちが好き?」といった質問にもっともらしく答えるのために無駄な時間を消費する。人間であるわれわれは、この質問に正しい答えがないことを知っていて、直ちに答えることができる。コンピューターは問題を理解するためにあらゆる物事を評価して、答えを再確認したうえで解答する顔をレンダリングしなくてはならない。それには時間がかかる。

ジョージア工科大学のErkam Uzun、Wenke Leeらがたどり着いた答えはこれだ。まずログインしようとしているひとをカメラに収め —— これはCAPTCHAでカメラを使うことが許されているとい前提で、それはそれで別の問題がある —— 質問を投げかける。もちろんそこには第二の錯乱要素 —— 歪んだ文字などなど —— もあるかもしれないが、重要なのはコンテンツで、質問は人間がすぐに答えられるくらい簡単であると同時にコンピューターには難題でなくてはならない。

テストの結果、人間は平均して1秒以内に解答したのに対して、最高水準のコンピューターは最短でも6秒、たいていはもっとかかった。これは、システムを破るには何が必要かを知っている強力顔レンダリングエンジンを、スパマーが持っていた場合の話だ。認証システムはタイミングだけではなく、声や顔をユーザーの記録と照らし合わせて確認している。

「私たちはアタッカーのやってきそうなことを知って問題に取り組んだ。画像の質を高めることは一つの可能性だが、まったく新しいゲームを作りたかった」とジョージア工科大学の研究者、Simon Pak Ho Chungは言った。

これは日頃ウェブで見かける単純なCAPTCHAよりずっと複雑なシステムだが、この研究によってソーシャルネットワークなどのログインのセキュリティーを高めることが期待できる。スパマーやハッカーたちが、日々新しいコンピューターや新しい機能を手に入れる今、われわれ人間も得られる限りの助力を必要としている。

[原文へ]

(翻訳:Nob Takahashi / facebook