AOL

AOL、大量の個人データを堂々と公開

次の記事

政府をバッチリ監視、WashingtonWatch

Update: 米国太平洋時間の日曜午後7時頃、下記のAOLサイトは停止された。しかしデータへの直接のリンクは今も生きている。

AOLは昨年司法省が「匿名化された」サーチデータの提供をを要求した件で起きた大騒ぎに気が付かなかったとでもいうのだろうか? MicrosoftとGoogleがあれほど苦労したというのに? そうとでも考えないとAOLが65万人のユーザーの2000万件に上るウェブ検索履歴のデータを公開することにした理由の説明がつかない。

公開されたデータには、これらのユーザーの今年中の3ヶ月にわたるすべての検索履歴に加えて、ユーザーが検索結果をクリックしたかどうか、その検索結果の内容、結果表示ページのどこに表示されていたかが含まれる。データは439 MBの圧縮ファイルとしてダウンロードされ、解凍すると2GBを少し超えるサイズとなる。データはここにある (これはファイルそのものへの直接リンク)。形式はタブ区切りの10個のテキストファイルだ。

このバカさかげんには腰が抜けるばかりだ。 AOLはユーザーの個人的きわまる情報を同意なしに公開したのだ。AOLのユーザー名はランダムな数字のIDに置き換えられているとはいえ、多くの場合、ひとりのユーザーの全サーチ活動を分析すれば、それが誰で、何をしていたのかということは簡単にわかってしまう。 データには個人名、住所、社会保険番号、その他、人が検索ボックスに入力しそうなあらゆる情報が含まれる。

もっとも深刻な問題は多くの人々がネットワークにどんな情報が載っているか知りたくて自分や友人や家族の名前で検索をかけてみたがあることだ。このような「エゴ」サーチとポルノ関連のサーチが組み合わされた場合、たいへん深刻なプライバシー侵害になる。個人データと”エクスタシー(麻薬) 買う)”などという検索結果が組み合わされれば犯罪の証拠だ。住所や社会保障番号などは他人になりすまそうとする試みのかっこうのターゲットだ。こんな可能性は上げていけばきりがない。

マーケティング関係者はさまざまな利用の可能性に夢中になっている。ユーザーの一部はAOLのボイコットを呼びかけているし、他の連中はひたすら憤慨している

User 491577の検索は”florida cna pca lakeland tampa”、”emt school training florida”, “low calorie meals”、”infant seat”、”fisher price roller blades”だった。User 39509の検索結果には 数百の”ford 352″”と”oklahoma disciplined pastors”、”oklahoma disciplined doctors”、”home loans”、それに加えて個人が識別可能で、かつここでは公表を控えた違法な内容が含まれる。User 545605の検索結果には、”shore hills park mays landing nj”、”frank william sindoni md”, “ceramic ashtrays”、”transfer money to china”、”capital gains on sale of house”が含まれる。他のデータに比べればこれらのサンプルはまだしも安全な方だ。 私は最悪の例は避けた。特定の人物の氏名、電話番号、違法薬物、その他である。これらの検索を行ったユーザーの一部については、法執行機関、雇い主、友人などによって身元が特定されることは疑いない。

AOL はこのページやデータを早急に削除するものと思う。しかしこの記事を書いている時点で、すでに809回ダウンロードされている。私が話した相手の中にはもうこのデータのためのウェブインタフェースを作り始めたものがいた。もし読者がAOLユーザーだったらまことにお気の毒というしかない。

Microsoftが以前リサーチ関係者に似たような資料の提供を申し出たことがあるが、重大な差があった。そのデータはユーザーに関連づけられたものではなかったことに注意。AOLが公開したのとたいへんよく似たデータをExciteが公開したことがあったが、これは1999のことである。

[原文へ]