AOL、大量の個人データを堂々と公開
by Michael Arrington on 2006年8月7日

Update: 米国太平洋時間の日曜午後7時頃、下記のAOLサイトは停止された。しかしデータへの直接のリンクは今も生きている。

AOLは昨年司法省が「匿名化された」サーチデータの提供をを要求した件で起きた大騒ぎに気が付かなかったとでもいうのだろうか? MicrosoftとGoogleがあれほど苦労したというのに? そうとでも考えないとAOLが65万人のユーザーの2000万件に上るウェブ検索履歴のデータを公開することにした理由の説明がつかない。

公開されたデータには、これらのユーザーの今年中の3ヶ月にわたるすべての検索履歴に加えて、ユーザーが検索結果をクリックしたかどうか、その検索結果の内容、結果表示ページのどこに表示されていたかが含まれる。データは439 MBの圧縮ファイルとしてダウンロードされ、解凍すると2GBを少し超えるサイズとなる。データはここにある (これはファイルそのものへの直接リンク)。形式はタブ区切りの10個のテキストファイルだ。

このバカさかげんには腰が抜けるばかりだ。 AOLはユーザーの個人的きわまる情報を同意なしに公開したのだ。AOLのユーザー名はランダムな数字のIDに置き換えられているとはいえ、多くの場合、ひとりのユーザーの全サーチ活動を分析すれば、それが誰で、何をしていたのかということは簡単にわかってしまう。 データには個人名、住所、社会保険番号、その他、人が検索ボックスに入力しそうなあらゆる情報が含まれる。

もっとも深刻な問題は多くの人々がネットワークにどんな情報が載っているか知りたくて自分や友人や家族の名前で検索をかけてみたがあることだ。このような「エゴ」サーチとポルノ関連のサーチが組み合わされた場合、たいへん深刻なプライバシー侵害になる。個人データと”エクスタシー(麻薬) 買う)”などという検索結果が組み合わされれば犯罪の証拠だ。住所や社会保障番号などは他人になりすまそうとする試みのかっこうのターゲットだ。こんな可能性は上げていけばきりがない。

マーケティング関係者はさまざまな利用の可能性に夢中になっている。ユーザーの一部はAOLのボイコットを呼びかけているし、他の連中はひたすら憤慨している

User 491577の検索は”florida cna pca lakeland tampa”、”emt school training florida”, “low calorie meals”、”infant seat”、”fisher price roller blades”だった。User 39509の検索結果には 数百の”ford 352″”と”oklahoma disciplined pastors”、”oklahoma disciplined doctors”、”home loans”、それに加えて個人が識別可能で、かつここでは公表を控えた違法な内容が含まれる。User 545605の検索結果には、”shore hills park mays landing nj”、”frank william sindoni md”, “ceramic ashtrays”、”transfer money to china”、”capital gains on sale of house”が含まれる。他のデータに比べればこれらのサンプルはまだしも安全な方だ。 私は最悪の例は避けた。特定の人物の氏名、電話番号、違法薬物、その他である。これらの検索を行ったユーザーの一部については、法執行機関、雇い主、友人などによって身元が特定されることは疑いない。

AOL はこのページやデータを早急に削除するものと思う。しかしこの記事を書いている時点で、すでに809回ダウンロードされている。私が話した相手の中にはもうこのデータのためのウェブインタフェースを作り始めたものがいた。もし読者がAOLユーザーだったらまことにお気の毒というしかない。

Microsoftが以前リサーチ関係者に似たような資料の提供を申し出たことがあるが、重大な差があった。そのデータはユーザーに関連づけられたものではなかったことに注意。AOLが公開したのとたいへんよく似たデータをExciteが公開したことがあったが、これは1999のことである。

[原文へ]

  • http://jp.techcrunch.com/archives/aol-this-was-a-screw-up/ TechCrunch Japanese アーカイブ » AOL、”完全なる失態”と平謝り

    [...] ユーザー65万人の検索データ公開に協力していたと昨日ココで報じた件でAOLは正式に謝罪した。 [...]

  • http://jp.techcrunch.com/archives/aol-data-first-web-interfaces-up/ TechCrunch Japanese アーカイブ » AOL データ、最初のウェブインタフェース出現

    [...] AOLによって先週公開された2000万のサーチクエリーに対し、誰かがシンプルなウェブインタフェースを作るのは時間の問題だった (関連記事参照「AOL、大量の個人データを堂々と公開」 「AOL、”完全なる失態”と平謝り」)。 [...]

  • http://jp.techcrunch.com/archives/first-person-identified-from-aol-data-thelma-arnold/ TechCrunch Japanese アーカイブ » Thelma Arnoldさん、AOLデータから特定された最初の人

    [...] 日曜、AOL が故意に個人情報を公開したというニュースが飛び込んできた。2000万件もの部分的に匿名化された検索フレーズのファイルが公開された。月曜にはAOLは謝罪したが、その晩遅くにはこのデータを検索するための最初のウェブインタフェースが公開された。今日(米国時間8/8)、このデータから最初の人物がはっきり特定された。ジョージア州Lilburnに住む62歳の寡婦でThelma Arnoldさんという。 [...]

  • ty
  • http://jp.techcrunch.com/archives/heads-roll-at-aol/ TechCrunch Japanese アーカイブ » AOLでくび続出

    [...] 最近起こったサーチエンジンデータの大失態の後 AOLで解雇者がごろごろと続出している。(関連記事はここ, ここ, ここそれにここ)。 [...]

  • http://jp.techcrunch.com/archives/suit-filed-against-aol-seeks-to-block-search-history-storage/ TechCrunch Japanese アーカイブ » AOL提訴される、検索結果の保存中止を要求

    [...] AOLに対する集団訴訟が今日(米国時間9/25)カリフォルニア州で提起された。理由は、先月、数千人分の検索結果を公開した件。この訴訟では、影響を受けたユーザー1人あたり$1000、カリフォルニア在住のユーザーにはさらに$4000の損害を求めている。プライバシーって安いんだ! [...]

  • http://jp.techcrunch.com/archives/google-blacklist-contained-confidential-information/ TechCrunch Japanese アーカイブ » Googleのブラックリスト、秘密情報を漏洩

    [...] 月曜日、インターネットセキュリティー企業Finjanは議論を呼んでできたGoogleのフィッシング詐欺対策ブラックリストが秘密のはずのユーザー名や個人のパスワードを含んでいたことを発表する予定。下にスクリーンショットで例を挙げた。クリックすると拡大表示される。Googleの現在のフィッシング詐欺対策ブラックリストはここに。パスワード等による保護はいっさいされていない。このリストを研究してきたMichael Suttonによると、 このブラックリストはGoogle Toolbar for Firefoxの一部であるGoogle Safe Browsing for Firefox extensionに用いられているという。Googleはまだ公にこの問題を認めていない。ただし問題のあるデータはこっそり削除された。しかしGoogleはFinjanへのメールで問題を認めてはいる。(このメールはFinjanから私のもとへ転送されている)。その後、Googleは秘密のデータを削除している。これは2006年8月にAOLが検索データを公開した事件に比べればさほど深刻な問題ではない。しかしこの問題に関してGoogleからの公式のコメントがぜひとも必要である。また、関係先個人に対してGoogleが接触して〔注意を促す〕ことも確約される必要がある。[原文へ] Google [...]

  • http://ordering.wordpress.com/2007/09/09/aolgoogle-conflict-one-story-at-a-time-this-is-c2a9-material/ AOl&Google Conflict – one story at a time, this is © material! « The New Order of Websites on Internet

    [...] TechCrunch Japanese アーカイブ » AOL Proudly Releases Massive Amounts of Private Data Says: August 7th, 2006 at 6:08 am […] マーケティング関係者はさまざまな利用の可能性に夢中になっている。ユーザーの一部はAOLのボイコットを呼びかけているし、他の連中はひたすら憤慨して いる。 User 491577の検索は”florida cna pca lakeland tampa”、”emt school training florida”, “low calorie meals”、”infant seat”、”fisher price roller blades”だった。User 39509の検索結果には 数百の”ford 352″”と”oklahoma disciplined pastors”、”oklahoma disciplined doctors”、”home loans”、それに加えて個人が識別可能で、かつここでは公表を控えた違法な内容が含まれる。User 545605の検索結果には、”shore hills park mays landing nj”、”frank william sindoni md”, “ceramic ashtrays”、”transfer money to china”、”capital gains on sale of house”が含まれる。他のデータに比べればこれらのサンプルはまだしも安全な方だ。 私は最悪の例は避けた。特定の人物の氏名、電話番号、違法薬物、その他である。これらの検索を行ったユーザーの一部については、法執行機関、雇い主、友人 などによって身元が特定されることは疑いない。 […] [...]

  • http://blog.unfindable.net/?p=378 AOLが検索ログを公開 | inquisitor

    [...] AOL、大量の個人データを堂々と公開(TechCrunch) [...]