attributor

ネタ元リンク抜きでも一発!Attributorの違法コピー追跡サービス新登場

次の記事

Mozes、音声機能追加でウェブのプレゼンス拡大

attributor-logo.png記事、楽曲、写真、動画は否応なしにコピーされウェブに広まり放題。世界中のメディア企業は分かっちゃいるんだけどただ手をこまねいて眺めているだけで、YouTubeの自社コンテンツも全部どう手を打っていいか分からない状態だ。(グーグルの自己監視に任せるべきか、それともゆるやかな業界ガイドラインを作ってサイトに遵守を期待すべきか、など)

そこで生まれたのが加州レッドウッドシティの新会社Attributorだ。ここはウェブで違法コピーあるところどこでも追いかけてゆく会社だ。出版・メディア企業が自コンテンツを追跡し、対応を自分で決められるよう応援している。2005年創業。Sigma Partners、Selby Ventures、Draper Richards、First Round Capital、Amicからこれまでに$10M(1000万ドル)の資金を調達。そのエンタープライズ版サービスがロイターとAPで約6ヶ月の試験運用を終え、本日(米国時間11/4)公開となった。

エンタープライズ版の利用料は年間数万ドルから数十万ドル(ブロガーや小さなパブリッシャー向けに提供する機能限定のセルフサービス版は月額利用料が6ドルか7ドルで済む。そちらは2008年スタート)。 CEOのJim Brockが先週、NYミッドタウンの高級ホテルWaldorf AstoriaロビーでこのAttributorのデモを見せてくれた。

Attributorでは既に1日1億件のウェブページをインデックスしている(現在までに累計150億件)。キーワードのインデックスではなく、Attributorではもっとコンテンツを大きな塊で見る。今はまだテキストしか扱えなくて、画像はベータ。動画マッチングは年明け早々にもベータ移行の予定という。

Attributorでは顧客パブリッシャーの全コンテンツを取り込んで、それにマッチするサイトを探し出し、過剰な転載サイト(例えば記事の半分以上がコピー、とか)と軽度の転載サイトに二分。どのサイトにネタ元リンクがあって、どこがないかも一目で分かる。「ほとんどの場合、彼らが欲しいのはそれだけなんです。—リンクですよ」とBrock。

下にあるのは顧客サイドから見たダッシュボードビューの典型例だが、ここではPeople.comのコンテンツを(フィードを基に)分析している。マッチした26万5000件のうち、10万3000件はネタ元のPeople.comにリンクを返していないサイトだった。

attributordashboard.png

Attributorでは、どのサイトがトラフィック最大で、どれが広告入りで、ウェブ中に広まった自コンテンツから一番儲けてる広告ネットワークがどこかまで把握できる。People.comを過剰コピーしたサイトを例にとると、うち5万5000件が広告入りだ。「これ、ある程度までいくと請求エンジンになっちゃいますね」とBrockは言う。

(この追跡サービスで最も困りそうな分野、TechCrunch転載サイトの実数、転載先スクリーンショット集は「続きを読む」で)

だが、Attributorのデータは違法コピーのサイトを1件1件懲らしめに回るのに使うより、グーグルや各広告ネットワークにメディア企業が交渉する足がかりに使うべき、というのが彼の考えだ。「僕が仮に大手コンテンツ・プロデューサーだとして、僕の作ったコンテンツにグーグルのアドセンスを出しているページが全部特定できるんなら、…その時点で交渉相手はグーグルになりますかね」(Brock)。グーグルにアドセンス掲載先から違法サイトを除外してもらうよう頼むこともできるし、もっと得策なのは自コンテンツ関連の広告収入の一部を自分たちにも分けてくれるよう交渉を持ちかけることだろう。

attributor-lyrics.png結局は、リンクの問題に尽きる。リンクはウェブの通貨だ。作り手への帰属(訳注:attribution、社名の由来)を示す方法なのだ。そもそもメディア企業は自コンテンツをコピーする相手にライセンス料を取立てに回ったり、無断転載を訴えるより、コピーしたみんなからリンクをもらうだけで今よりずっと台所事情は良くなるのだ。リンクをお願いする方が軋轢はずっと少なくて済む。リンクひとつ飛ばすのにコストはかからない。だが、こうしたリンクを張ることでオリジナルのソースにもトラフィックが生まれ、検索カルマの順位(検索ランク)も上がるのである。

となると注目は、ウェブの楽曲歌詞だろうか。「歌詞」はネットでも指折りの人気検索タームである。本日公開となった報告書(PDFはこちら)を見ても、Attributorがビルボードヒットチャートの上位14曲の歌詞のソースを検索してみたところコピーは1524件で、そのほとんどは歌詞専門サイトやソーシャルネットワーク、ブログとある。レーベルとわざわざ手間暇かけてライセンス契約を結んだサイトは唯一Yahoo Musicだけだ。なのにグーグル検索でこれら14曲を検索にかけると、Yahoo Musicより他のサイトの方がランクは上なのである。これはヤフー検索の81%でも結果は同じだ。そしてこれら違法コピーのサイトのうち57%にはリングトーン、コンサートチケットなどの広告が出ている(そのほとんどがアドセンス)。上の写真はRihannaの曲『Umbrella』だが、その歌詞をグーグルで検索してみるだけで歌詞専門サイトにいかにアドセンスが浸透しているか分かるはずだ。

歌詞だけではない。『Epicurious』誌に掲載となったレシピ215点を評価した別の調査では、Attributorが発見したコピー3.959件(訳注:3959件のタイポ?)のうちネタ元のEpicuriousにリンクを返していなかったサイトは65%で、その56%は広告入りだった。 しかもコピーサイトの過半数は、これまたネタ元のEpicuriousより検索ランクが高いという結果。

さっそく僕もAttributorに頼んで自分が書いたTechCrunch記事の転載先を調べてもらった。ひとつはグーグルのOpenSocialプロジェクトの初期の報道(コードネームMaka-Maka)で、Attributorが当ブログのフィードを監視し始めたのは6月だが、それ以降の記事では15番目に被コピー数の多いエントリということだ。被コピー数最多はHuluの記事で、計572回コピーされていた。

Maka-Makaの記事では、Attributorが見つけたコピーは243件で、うち200件は記事本文の80%以上を丸写し、である。ネタ元のオリジナル記事にリンクを返してくれたのは40%未満(ブタ野郎め!)で、79%は広告を出していた。

記事1本でこれである。違法転載先にはリンクはしないけど(転載したやつは自分が何者かぐらい分かってるだろう、吐け~)、何枚かスクリーンショットで出しておこう(ハイライトした部分がTechCrunchと重複する部分だよ。少なくとも1件のサイトではフィード全文を転載し、そこにアドセンスの広告を入れ、執筆者の署名は消している。ネタ元のTechCrunchにもリンクを張っていなかった):

just-a-random-blog-maka-maka.png

human-capital-maka-maka.png

webuy-maka-maka.png

Crunchbase: Attributor

[原文へ]

(翻訳:satomi)