Googleが公開した「COVID-19コミュニティモビリティレポート」のプライバシー保護の評価と問題点

次の記事

プログラミングなしで業務自動化を実現するTonkeanが約26億円調達

Google(グーグル)は、同社が世界中の人々についてどれだけ多くのことを知っているかを、より明確に世界に垣間見せている。新型コロナウイルスの危機を契機に、パンデミック発生時における公共の利益に資するよう、ユーザーのロケーションおよび行動履歴の永続的追跡システムを再構成しているのだ。

Googleはこのほど「COVID-19 Community Mobility Reports」(COVID-19コミュニティモビリティレポート)を公開するとブログで発表した。このレポートは同社がマッピングし追跡している詳細なロケーションデータを社内で分析したもので、広告ターゲットの絞り込み、製品開発に利用される他、広範な商業戦略として世界中の人々の移動の変化を集計して提示する。

新型コロナウイルスのパンデミック発生により、世界各国では政府の対応を知らせるツールとデータを大至急用意する必要に迫られている。例えばEUの欧州委員会では、匿名化され集計されたロケーションデータを各電気通信事業者に依頼して入手し、新型コロナウイルスの感染拡大モデルを構築している。

今回のGoogleのデータ公開は、社会政策用ユーティリティと同様の考え方をちらつかせながら、世界中のユーザーから取得したデータから人の移動の変化について公開スナップショットを提供して注目を集めるという意図があるものと思われる。

政策立案者向けのユーティリティという面では、今回のGoogleの提案の効果はかなりあいまいだ。このレポートは政府と公衆衛生当局者向けに「生活に必要な訪問や外出の変化を把握して、推奨営業時間の設定や宅配サービスの提供状況の通知に利用していただく」ものであるという。

同レポートでは「同様に、交通の中心地に向かう人が減少していないことから、バスや電車の便を増やして、どうしても移動する人が間隔を開けて座れるようにする必要があるかもしれない。最終的には、人が移動しているかどうかだけでなく、行き先の傾向も把握することで、担当者が、公衆衛生を保護し、コミュニティの不可欠なニーズを満たすためのガイダンスを策定できるようする」と述べられている。

Googleが公開しているロケーションデータも同様にはっきりしないものだ。プライバシーの侵害を避ける必要があるからだ。同社によると同データには「Google製品で日常的に使用している世界クラスの匿名化テクノロジー」を使用しているという。

Googleは次のように述べている。「今回公開のレポートでは、差分プライバシーを使用している。これはデータセットに人工的なノイズを加えて、個人を特定することなく高品質の結果が得られるようにするものだ。ロケーション履歴の設定をオン(デフォルト設定ではオフ)にしているユーザーから取得したデータセットを集計および匿名化したものを元に、さまざまなインサイトを提供している」。

「Googleマップでは、特定のタイプの場所の混雑具合を示す匿名化された集計データを使用して、その地域の商業施設が最も混雑する時間帯を特定している。公衆衛生当局者の話によると、これと同じタイプの匿名化された集計データが新型コロナウイルスの感染を抑える上で重要な決定を下すのに役立つという」。Googleはこのように指摘し、Googleマップの既存の機能が新型コロナウイルス感染対策のために利用できることをほのめかした。

このレポートは、国または州ごとに用意されていて(当初は131カ国をカバー)さらに地域ごとのレポートも利用可能だ。レポートではコミュニティの動向が、新型コロナウイルス発生前の基準値平均と比較してどのように変わったかを分析している。

例えば米国全土を対象とする3月29日のレポートでは、娯楽関連施設の活動は新型コロナウイルス発生前に比べて47%低下しており、食料品店やドラッグストアへの来店は22%、公園やビーチへの外出は19%低下しているという(Googleのデータより)。

同日のカリフォルニア州を対象とするレポートでは、公園やビーチへの外出は大きく落ち込んでおり(地域の基準値より38%低い)、娯楽関連施設(50%低下)と食料品店やドラッグストア(24%低下)への外出も米国全土と比較して若干低下の度合いが大きい。

Googleによると上記レポートでは「集計の上、匿名化されたデータを使って地域別に、大分類された場所(娯楽関連施設、食料品店やドラッグストア、公園、公共交通機関、職場、住宅)における時系列の動向をグラフ化している」とのことだ。この動向は数週間単位で、48~72時間前の最新情報と一緒に表示される。

また、訪問の絶対数はプライバシー保護の観点から公開していないという。また「プライバシー保護のため、個人の場所、連絡先、移動先といった個人識別情報は、どの時点でも公開していない」とGoogleはいう。

ヨーロッパ諸国で新型コロナウイルスによる打撃が依然として最も大きいイタリアのレポートでは、全住民に対するロックダウン後の変化が示されている。娯楽関連施設の活動はGoogleの基準値と比べて97%、食料品店やドラッグストアへの来店は85%、公園やビーチへの外出は90%、それぞれ低下しているとのこと。

同じレポートから、公共交通機関の活動は87%、職場での活動は63%それぞれ低下しており、逆に住宅での活動は約4分の1(24%)増大していることがわかる。これは多くのイタリア人が通勤せずに自宅待機しているためだ。

イタリアと同様、新型コロナウイルスによって大打撃を被っているスペインでも状況は同じだ。ただ、フランスのデータには、自宅待機命令の影響がそれほど顕著に現れていないようだ。住宅地域での活動の増加は18%に過ぎず、職場での活動の低下も56%に留まっている(これはおそらく、フランスでは、確認されている感染者と死者の数は国全体で増え続けているものの、パンデミックの影響が比較的小さいためと思われる)。

政策立案者は新型コロナウイルス対策を知らせるためのデータとツールを用意するのに懸命になっているものの、プライバシー専門家と市民的自由の保護運動家たちは、こうしたデータを利用する手法が個人の権利に与える影響を懸念する声を上げると同時に、こうした追跡機能の広範な利用に疑問を呈している。

Wolfie Christl @WolfieChristl · 12時間
返信先: @WolfieChristl
Googleのデータの精度が低くなる理由はたくさんある。例えば測定方法、場所の座標へのマッピング、場所の分類など……。

いずれにしても、政府や研究者が今後もGoogleから非個人的な分析結果を取得する必要があるなら、少なくとも、すべてにおいて100%の透明性が確保されていなければならない。

Wolfie Christl @WolfieChristl
その通り。この免責条項の適用範囲は極めて広い。ほとんど宣伝活動でしかない。

これとは別に、Googleは同社のさまざまな二次的データ利用に対し責任を負う必要がある。Google/Alphabetのパワーはあまりに強大で、複数レベルでの対応を早急に実施する必要がある。

経済的なクラッシュを引き起こすロックダウンから西側諸国を救済する潜在的な解決策として、アプリの利用を叫ぶ声がどんどん強まっている。接触者追跡もそうした分野の1つだ。接触者追跡を行うと、中国で起こったように、モバイル端末がロックダウンを強制するツールとなる可能性がある。

「大規模な個人データの収集はすぐに大規模な監視につながる」と簡潔な言葉で警告するのは、ロンドンのインペリアル・カレッジ、コンピュータプライバシーグループに籍を置く3人の研究者たちだ。この3人は、新型コロナウイルス接触者追跡アプリに関するプライバシー上の懸念を、アプリ開発者が検討すべき8つの質問としてまとめている。

Googleが新型コロナウイルス対策としてモバイル端末ロケーションデータを公開したことについて、同グループのリーダーであるYves-Alexandre de Montjoye(イヴ-アレキサンドル・ドゥ・モンジョワイエ)氏は、同ロケーションデータ公開に際してプライバシー上のリスクを軽減するためにGoogleが行った手順を概ね評価する見解を示している。ただし外部の研究者が、Googleの主張するプライバシー保護の堅牢性を評価しやすくするために、使用された技術的プロセスの詳細情報も公開するようGoogleに要求している。

Googleが公開したロケーションデータの技術的側面について、ドゥ・モンジョワイエ氏は次のように語った。「このデータは集計されており、特定の日付セットに正規化されていて、人数が少なすぎる場合はしきい値によってふるいにかけられる。その上、データを差分プライバシーにするために(Googleによれば)ノイズが追加されている。従って純粋に匿名化という観点からすると、悪くない。この3点はプライバシー上のリスク軽減に使用できる主要な3つの手段だ。Googleのデータはいずれの点もよく処理されていると思う」。

「ただし、特に現在のように多くの人がデータを使用している状況では、より詳細な情報を公開して欲しかったというのが私の感想だ。しきい値によるふるいのかけ方、差分プライバシーの適用方法など、こちらで推測するしかない点がいろいろとあるからだ」。同氏はGoogleがどのくらいのノイズをデータに追加したのかという点についても疑問を呈している。「差分プライバシーを適用した方法がもう少し詳細にわかると良いのだが。特に現在のような状況では、透明性が高いに越したことはない」。

Googleのモバイル端末データの公開は、欧州委員会が新型コロナウイルス感染症追跡のため電気通信事業者にメタデータを要求したのと目的は同じだと思えるかもしれないが、データソースの違いによって重大な違いが生じている可能性があると、ドゥ・モンジョワイエ氏は指摘する。

ドゥ・モンジョワイエ氏は次のように述べている。「この2つのデータには常にトレードオフの関係がある。電気通信事業者のデータは基本的に粒度が粗くなる。GPSは携帯電話の場合より、空間的に非常に精度が高く、1日あたり、1人あたりのデータポイント数も断然多くなる。その一方で、電気通信事業者のデータは対象範囲が広い。GPSデータ収集の対象となるのはスマートフォンだけではない緯度の情報がオンになっているユーザーだけでもない。国内にいるユーザー(スマートフォン以外のユーザーも含む)すべてが対象になる」。

同氏は、地域の通信事業者を使った方が解決できる可能性の高い国特有の問題もあるとも指摘する(欧州委員会はEU加盟国あたり1社の通信事業者に、匿名化された集計メタデータを提供させる意向であると語った)。

ロケーションデータはそもそも本当に匿名化できるのかという今問題となっている点について、データ再特定化の専門家であるドゥ・モンジョワイエ氏は「どちらともいえない」と答え、元のロケーションデータを「匿名化するのは相当に難しい」と指摘する。

「このデータを処理して集計結果を匿名化できるかと聞かれたら、おそらくできると答えるだろう。要するに条件次第だ。ただ、元のデータは残っている。たいてい集計データが生成されるまでのプロセスでプライバシー上のリスクが発生しないように、さまざまな制御が適切に行われているかどうかという点が問題になる」(同氏)。

Googleの位置情報の提供についてはもっと大きな問題がある。そもそもユーザーを追跡することについて法的な同意が得られているのかという点だ。

Googleは位置情報の追跡はオプトイン方式に基づいている(つまりユーザー側の許可がなければ追跡できない)と主張しているものの、同社は2019年に、フランスのデータ監視機関により、ユーザーデータの使い方が不透明であるとして5,700万ドルの罰金を課せられた

関連記事:Googleに罰金5700万ドル命令、仏データ保護当局

その後、2020年初めに、欧州におけるGoogleのプライバシー規制を主導しているアイルランドのデータ保護委員会(DPC)は、Googleの位置情報追跡活動の正式な調査を行うことを認めた。これは、Googleが広告ターゲティングの目的でウェブユーザーの位置情報を追跡し続けるため巧妙な戦術を使用しているとするEUの消費者団体からの2018年の苦情を受けたものだ。

「懸案事項の中から提起された問題は、Googleの位置情報の処理の合法性とその処理を取り巻く透明性に関連している」と、DPCは2月の調査発表の声明の中で伝えている。

法的に問われ続けている人々の追跡についての同意に関して、Googleは「ユーザーはオプトインを選択しており、設定で位置情報の履歴をクリアにすることもできる」ことを同社のブログで繰り返し伝えているという弁明をする可能性が高い。(実際の記述例 「位置情報履歴をオンにしているユーザーは、Googleアカウントからいつでも設定をオフにすることができ、いつでもタイムラインから位置情報履歴データを直接削除することができる」)

Googleは今後もこの危機の間、新型コロナウイルスのモビリティポルノレポートの提供を継続していくと明記しているが、さらに同社は 「新型コロナウイルスに取り組んでいる選りすぐりの疫学者が、パンデミックをより明確に把握し感染予測に役立てられるよう、既存の匿名化されたデータセットを更新し、協力している 」と述べている。

また「この種のデータは研究者による疫病の流行予測や、都市や交通インフラの計画、人々の移動性、紛争や自然災害への対応の把握に活用されてきた」と付け加えている。

画像クレジット: 写真 Omar Marques / SOPA Images / LightRocket via Getty Images / Getty Images

新型コロナウイルス 関連アップデート

[原文へ]

(翻訳:Dragonfly)