過去数百年の言葉の盛衰が分かるGoogle Books Ngram Viewer(英語の本のみ)

次の記事

AITIAのアニメオーバラップAR「もしもカメラ」が東芝REGZA携帯に載る

言葉は訪れ、言葉は去る。52億冊の本の5000億語を集めたGoogleのデータベースのおかげで、数百年前から今日までの、文学書やそのほかの本に現れる言葉のはやり廃(すた)りを、時系列の折れ線グラフで見ることができる。そのデータベースは、Google LabsのGoogle Books Ngram Viewerというプロジェクトで、誰もが見ることができる。何か、言葉をタイプしてみよう(複数ならカンマで区切る)。すると、その言葉の年代別の出現頻度の推移が、グラフで表示される。

もちろん、ぼくがタイプしたのは“twitter”だ。この言葉の、これまでの盛衰はどうなっているのか。上の図が、そのグラフだが、1750年ごろからよく使われるようになり、ほぼ1世紀前の1900年ごろにピークを迎える。そしてその後はひたすら下降線をたどり、2000年代に入ってからまた盛り返している。上のグラフは平滑化されているが、実際にこの言葉がまったく新しい意味をまとって復権したのはTwitterが創業された2006年だ(平滑化されていないグラフはこれ)。でも、その前の2003年ごろにも、小さな立ち上がりがある。それは何だろう? たぶんそのころ、Jack Dorseyがこの言葉をどこかで見つけて、頭に刻み込んだのだろうな。

このNgram Viewerは大文字小文字を区別する。“Twitter”という固有名詞で検索すると、21世紀に入ってからの立ち上がりがもっと急だ。なぜか2008年までのデータしかないので、その後の2年については想像するしかない。対象は英語の本だけだが、「フィクション」や「アメリカ英語」などに限定もできるし、英語の本の中のドイツ語やフランス語、スペイン語、ロシア語なども調べられる。調べる期間(年代)も指定でき、また各年代の、その言葉が現れる本をGoogle Booksの書籍検索で見つけることもできる*。〔*: たとえば、19世紀末に”twitter”がどんな意味/文脈で使われていたか、その実例を見ることができる。〕

言葉の盛衰を見ると、人びとが心の中で思い描く”世界の重心”の変化も分かる。たとえば、複数の都市名: “Paris, London, New York, Boston, Rome”で検索してみよう。それぞれの都市への関心のピークや下降がよく分かる。うーん、アメリカのイメージは、20世紀末以降落ち目だなぁ(ニューヨークの登場頻度で見るかぎり)。

[原文へ]
[jpTechCrunch最新記事サムネイル集]
[米TechCrunch最新記事サムネイル集]
(翻訳:iwatani(a.k.a. hiwa))