ネタ元リンク抜きでも一発!Attributorの違法コピー追跡サービス新登場
by Erick Schonfeld on 2007年11月6日

attributor-logo.png記事、楽曲、写真、動画は否応なしにコピーされウェブに広まり放題。世界中のメディア企業は分かっちゃいるんだけどただ手をこまねいて眺めているだけで、YouTubeの自社コンテンツも全部どう手を打っていいか分からない状態だ。(グーグルの自己監視に任せるべきか、それともゆるやかな業界ガイドラインを作ってサイトに遵守を期待すべきか、など)

そこで生まれたのが加州レッドウッドシティの新会社Attributorだ。ここはウェブで違法コピーあるところどこでも追いかけてゆく会社だ。出版・メディア企業が自コンテンツを追跡し、対応を自分で決められるよう応援している。2005年創業。Sigma Partners、Selby Ventures、Draper Richards、First Round Capital、Amicからこれまでに$10M(1000万ドル)の資金を調達。そのエンタープライズ版サービスがロイターとAPで約6ヶ月の試験運用を終え、本日(米国時間11/4)公開となった。

エンタープライズ版の利用料は年間数万ドルから数十万ドル(ブロガーや小さなパブリッシャー向けに提供する機能限定のセルフサービス版は月額利用料が6ドルか7ドルで済む。そちらは2008年スタート)。 CEOのJim Brockが先週、NYミッドタウンの高級ホテルWaldorf AstoriaロビーでこのAttributorのデモを見せてくれた。

Attributorでは既に1日1億件のウェブページをインデックスしている(現在までに累計150億件)。キーワードのインデックスではなく、Attributorではもっとコンテンツを大きな塊で見る。今はまだテキストしか扱えなくて、画像はベータ。動画マッチングは年明け早々にもベータ移行の予定という。

Attributorでは顧客パブリッシャーの全コンテンツを取り込んで、それにマッチするサイトを探し出し、過剰な転載サイト(例えば記事の半分以上がコピー、とか)と軽度の転載サイトに二分。どのサイトにネタ元リンクがあって、どこがないかも一目で分かる。「ほとんどの場合、彼らが欲しいのはそれだけなんです。—リンクですよ」とBrock。

下にあるのは顧客サイドから見たダッシュボードビューの典型例だが、ここではPeople.comのコンテンツを(フィードを基に)分析している。マッチした26万5000件のうち、10万3000件はネタ元のPeople.comにリンクを返していないサイトだった。

attributordashboard.png

Attributorでは、どのサイトがトラフィック最大で、どれが広告入りで、ウェブ中に広まった自コンテンツから一番儲けてる広告ネットワークがどこかまで把握できる。People.comを過剰コピーしたサイトを例にとると、うち5万5000件が広告入りだ。「これ、ある程度までいくと請求エンジンになっちゃいますね」とBrockは言う。

(この追跡サービスで最も困りそうな分野、TechCrunch転載サイトの実数、転載先スクリーンショット集は「続きを読む」で)

だが、Attributorのデータは違法コピーのサイトを1件1件懲らしめに回るのに使うより、グーグルや各広告ネットワークにメディア企業が交渉する足がかりに使うべき、というのが彼の考えだ。「僕が仮に大手コンテンツ・プロデューサーだとして、僕の作ったコンテンツにグーグルのアドセンスを出しているページが全部特定できるんなら、…その時点で交渉相手はグーグルになりますかね」(Brock)。グーグルにアドセンス掲載先から違法サイトを除外してもらうよう頼むこともできるし、もっと得策なのは自コンテンツ関連の広告収入の一部を自分たちにも分けてくれるよう交渉を持ちかけることだろう。

attributor-lyrics.png結局は、リンクの問題に尽きる。リンクはウェブの通貨だ。作り手への帰属(訳注:attribution、社名の由来)を示す方法なのだ。そもそもメディア企業は自コンテンツをコピーする相手にライセンス料を取立てに回ったり、無断転載を訴えるより、コピーしたみんなからリンクをもらうだけで今よりずっと台所事情は良くなるのだ。リンクをお願いする方が軋轢はずっと少なくて済む。リンクひとつ飛ばすのにコストはかからない。だが、こうしたリンクを張ることでオリジナルのソースにもトラフィックが生まれ、検索カルマの順位(検索ランク)も上がるのである。

となると注目は、ウェブの楽曲歌詞だろうか。「歌詞」はネットでも指折りの人気検索タームである。本日公開となった報告書(PDFはこちら)を見ても、Attributorがビルボードヒットチャートの上位14曲の歌詞のソースを検索してみたところコピーは1524件で、そのほとんどは歌詞専門サイトやソーシャルネットワーク、ブログとある。レーベルとわざわざ手間暇かけてライセンス契約を結んだサイトは唯一Yahoo Musicだけだ。なのにグーグル検索でこれら14曲を検索にかけると、Yahoo Musicより他のサイトの方がランクは上なのである。これはヤフー検索の81%でも結果は同じだ。そしてこれら違法コピーのサイトのうち57%にはリングトーン、コンサートチケットなどの広告が出ている(そのほとんどがアドセンス)。上の写真はRihannaの曲『Umbrella』だが、その歌詞をグーグルで検索してみるだけで歌詞専門サイトにいかにアドセンスが浸透しているか分かるはずだ。

歌詞だけではない。『Epicurious』誌に掲載となったレシピ215点を評価した別の調査では、Attributorが発見したコピー3.959件(訳注:3959件のタイポ?)のうちネタ元のEpicuriousにリンクを返していなかったサイトは65%で、その56%は広告入りだった。 しかもコピーサイトの過半数は、これまたネタ元のEpicuriousより検索ランクが高いという結果。

さっそく僕もAttributorに頼んで自分が書いたTechCrunch記事の転載先を調べてもらった。ひとつはグーグルのOpenSocialプロジェクトの初期の報道(コードネームMaka-Maka)で、Attributorが当ブログのフィードを監視し始めたのは6月だが、それ以降の記事では15番目に被コピー数の多いエントリということだ。被コピー数最多はHuluの記事で、計572回コピーされていた。

Maka-Makaの記事では、Attributorが見つけたコピーは243件で、うち200件は記事本文の80%以上を丸写し、である。ネタ元のオリジナル記事にリンクを返してくれたのは40%未満(ブタ野郎め!)で、79%は広告を出していた。

記事1本でこれである。違法転載先にはリンクはしないけど(転載したやつは自分が何者かぐらい分かってるだろう、吐け~)、何枚かスクリーンショットで出しておこう(ハイライトした部分がTechCrunchと重複する部分だよ。少なくとも1件のサイトではフィード全文を転載し、そこにアドセンスの広告を入れ、執筆者の署名は消している。ネタ元のTechCrunchにもリンクを張っていなかった):

just-a-random-blog-maka-maka.png

human-capital-maka-maka.png

webuy-maka-maka.png

Crunchbase: Attributor

[原文へ]

(翻訳:satomi)

  • http://jp.techcrunch.com/archives/attack-of-the-splogse28094one-of-our-posts-copied-152-times-without-attribution/ TechCrunch Japanese アーカイブ » スプログ攻撃~ここの記事はリンク抜きで152回転載されている

    [...] スプログの問題がひどいのは分かっていたが、実際どこまでひどいのか、その実態はうちも今週Attributorの記事をまとめるまで分からなかった。Attributorは自分の書いたものを誰が転載しているかウェブ中トラックできる新会社だ。調べてみて初めてTechCrunchの某記事が572回も転載されていた実態が分かった(全部悪質なわけではないけどね)。 [...]

  • http://jp.techcrunch.com/archives/condenet-goes-beyond-being-a-copyright-cop-approaches-infringement-as-a-business-opportunty/ TechCrunch Japanese アーカイブ » CondeNet、転載取締りの枠を超え、転載サイトと共存共栄の道を探る

    [...] CondéNetはAttributor(関連エントリ)に顧客登録した一番最近のメディア会社である。このAttributorを使って自社が所有するEpicurious.com、Style.com、Men.Style.com、Concierge.comといったサイトからソースもリンクも明記せず、一番たくさん文章を盗用している不届き者が誰か一望しようと考えている。 [...]

  • http://ikhr.jp/blog/2008/07/isbn978-4-7981-1407-1/ あしおとのあしあと» ブログアーカイブ » 『検索にガンガンヒットさせるSEOの教科書』

    [...] 「リンクはウェブの通貨」と述べている記事を読んで感心したことがありますが、上のような意味において、「SEOはウェブの法」と述べることができるかと思います。なぜなら、スパムと見なされたサイトは罰則として検索結果から排除されるからです。一般のウェブサイトにとって、大半のアクセスは検索エンジン経由でもたらされますから、重い「前科」が付くことは「社会的な死」につながってしまいます。 [...]

  • http://jp.techcrunch.com/archives/20090202fairshare-helps-bloggers-track-their-content-across-the-web-grab-an-invite-here/ FairShareはブロガーのコンテンツがどこで再利用されているかを見つける;非公開ベータへの招待あり

    [...] 多くの点でFairShareは、Attributorの簡略化だ(後者はメディア大企業がWeb上で横行している著作権侵犯を見つける手助けをする大企業向けのWebサービスだ)。どちらのサービスも巨大で頻繁に更新される同じインデクスを使うが、それは350億ページを調べた結果だと自称している。しかしAttributorが、Financial TimesやCondéNetのような大企業に向いた分析オプションを提供しているのに対し、FairShareはどちらかというと基本機能だけで、ユーザのコンテンツが利用されている記事のリストを、コピーされた語数、オリジナルの量に対するコピーの比率、その利用がユーザが指定したライセンスルールに違反してないか、といった情報とともに表示するだけだ。 [...]