Googleの通報で児童ポルノ犯が逮捕さる、それが通信のプライバシー侵犯でないわけ

次の記事

クラウドストレージの利用状況が詳細に分かるUnclouded(重複ファイルも見つけてくれる)

【抄訳】

Googleが、ヒューストンに住む容疑者のGmailアカウントに見つけた違法な画像を当局に通報したため、男が児童ポルノ保有の嫌疑で逮捕された一件は、それでGoogleを批判する者は一人もいないと思われるが、手がかりがあくまでも私信の中から見つけられたものであるだけに、そこで使われた方法について疑念を抱(いだ)く者がいるかもしれない。Googleは、違法行為を見つけるためにメールを自発的にスキャンしていたのか? GoogleはユーザのGmailアカウントにあったデータに関して当局に通報することにより、サービスプロバイダとしての役割を逸脱したのではないか? セキュリティ企業のSophosも、事件の直後にまさにこの疑問を、同社のブログNaked Security上で投じた。

しかしそれらの疑問は、この逮捕の実現のためにGoogleが用いた技術を、よく理解していないために生じているようだ。

今日では、多くの人がすでに知っているように、Googleはその無料のサービスを支える広告の適切化(個人化)のために、ユーザのメール中のキーワードやフレーズを、人が介入しない自動化ソフトでスキャンしている。人間がユーザのメールを読んでいる、ということはない。

またGoogleの技術者たち…つまり人間…がこの男のメールアカウントの中身を読んで、違法画像が共有されていることを見つけたのではない。さらにGoogleは、窃盗などの犯罪的行為を見つけることを目的としてユーザのアカウントを…自動化ソフト等で…スキャンしていることもない。

今回のケース、および逮捕に結びついた技術は、児童ポルノの発見だけを目的とする、きわめて専門的限定的なアクション、ならびに技術だった。

児童ポルノはMicrosoftやGoogleのような大手インターネット企業にとって大きな問題であるため、両社は数年前から共同で対策に取り組んできた。とりわけ、ネット上でシェアされている画像の中に、そういう違法画像を見つける技術は、最初、Microsoftが開発したものだ。

PhotoDNAで児童虐待画像を自動的に発見

Microsoftの”PhotoDNA”は、コンピュータのプログラムによって自動的に(人の目を介さずに)、特定のタイプの違法画像を見つける技術だ。それがもしも人間の仕事だったら、想像しただけでもつらい!

PhotoDNAはまず、画像をふつうのB&W形式に変換し、サイズを一定化する。Microsoftは、ネット上の児童虐待と戦うためにGoogleとの協力関係を強めている、と昨年発表している。そのときにこのような、技術に関する説明もあった。

次はそのB&Wの画像を下図のように複数の矩形に分割し、それぞれの矩形画像の陰影の特徴を数値化する(微分係数によりハッシュ値を求める)。このような数値の集合が、その画像ファイルの“PhotoDNAシグネチャ ”と呼ばれる。他の画像と比較するときは、各画像のユニークなシグネチャを比較する。

PhotoDNAcreatesimage_Page

Microsoftはこの技術をBingやOutlook.com、およびそのクラウドストレージサービスで使用して、児童虐待画像の発見と再配布防止に役立てている。

【中略】

Totheviewerseyetwoi_Page

Google独自の画像ハッシュ技術

しかしながら、今回のヒューストンの逮捕の一件では、PhotoDNAは関わっていない。ただし、それと似たものが使われた。

Googleにも、同社独自のハッシュ技術がある。2008年以降それは、ネット上の性的虐待の画像を見つけるために利用されてきた。GoogleもMicrosoftもそのほかのテクノロジ企業も、このような技術を共有してこの種の違法行為と戦っている。今回の逮捕でPhotoDNAの出番がなくても、このようなハッシュ技術により、虐待画像を自動的に発見する努力が、各所で行われているのだ。

【後略】

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))