Twitterは560文字制限!? 同じ文字数に込められる情報量の違い
2010 BLOG
世の中ではTwitterが流行に流行っているようですが、先日ちょっと面白い記事に続けて出会いました。
[参考] On Off and Beyond: 日本語のTwitterと英語のTwitterは別メディアであることについて
別に、「国民性が・・・・」とか言うつもりはなく。単に1文字にこめられる情報量が違うので、同じ140文字でも、詰め込めるアイデアの量が全く違う。なので、メディアとして似て非なるよね、という話。….(略) 英語のTweetになれちゃってると、日本語のTweetは内容が濃すぎて重い!逆に、日本語のTweetに慣れてしまうと、英語のTweetは軽すぎてつまらないんじゃないかと。
[参考] In Chinese, Twitter Actually Means “Blog” – Thomas Crampton
Therein lies the point: Since there is greater meaning conveyed by a single Chinese character than a letter in the Roman alphabet, Twitter becomes a mini-Blog. … In other words, 114 characters of Twitter in Chinese translate into 430 characters in English. This is well beyond the limit of a Tweet. (強調は原文より)
それぞれ、日本語と英語、中国語と英語の比較ですが、内容はほぼ同じ。英語に比べて、日本語や中国語のような表意文字には一文字にたくさんの意味を込められる、したがって同じ140文字の制限でもその中で語られる内容量は大きく異なる、ということです。「日本語では余裕をもって書けた内容が、英語だと文字数を気にしないと書けない… というのは、自分の英作文能力のせいだけではないはず!!」 英語でTweetしたことのある日本のTwitterユーザーなら、だれもが実感として感じていることなのではないでしょうか。
二つ目の記事の中では、中国語の114文字のTweetを英語に翻訳すると430文字になったという実例が挙げられています。なんと四倍弱。果たして、そんなに差があるものなのか、日本語の場合はどれくらいの差になるのか、他の言語では… ??? Twitterユーザーの端くれとして、興味が膨らみます。
そこで実際に全く同一内容の文章を世界各国語に翻訳したらどれくらいの文字数になるのかというのを数えてみました。「同一内容」と「世界各国後に翻訳されている」といえば….. ハリーポッター?? いえ、最古のそして人類史上最大のベストセラーがありました。聖書です。ここでは簡単に創世記の第一章
1節 まだ何もない時、神様は天と地をお造りになりました。
〜 31節 神様はでき上がった世界を隅から隅まで見渡しましたが、どこから見ても非の打ちどこ ろがありません。 こうして六日目も終わりました。
に含まれる文字数を比較しました。Public Domainのデータが簡単に入手できる点も聖書のいいところです。今回はBible Gatewayのデータを使いました。
結果は以下の通り。
[UPDATE 2010.2.16] @masuiさんのご指摘を受け、グラフのY軸を0からに変更しました。ご指摘ありがとうございます。
予想通り、中国語が一番文字数が少なく、日本語、韓国語(ハングル)がつづきます。大きく差をあけてロシア語、イタリア語、英語などのヨーロッパ系の言語が続きます (英語に関してはたくさんの版が存在したので、そのうち5つの平均をとっています)。一番文字数が少ない中国語と英語などのヨーロッパの言語との間では約4倍、日本語/韓国語とは約2.6倍の開きがあることが分かりました。上の記事の「4倍弱」という結果がここで再現されています。
また、On Off and Beyond: 日本語のTwitterと英語のTwitterは別メディアであることについて の
なお、ドイツ語だと、同じことを書くのに英語より余計に文字が必要らしく、ってことは、ドイツ語のTweetは英語よりさらに軽くなってるってことでしょうか。
との記述も今回の結果に合致しました(その差はわずかですが)。
この結果をそのまま受け入れるならば、中国語の140文字には英語 約560文字程度の情報量を込められるということになります。英語で560文字というと、例えばNewYork Timesのこの記事くらいですね。Twitterのいわゆる「つぶやき」という言葉に込められたイメージとはかなり違ってきます。
もし私が言語学に詳しければ、インド・ヨーロッパ語族の系統と東アジアの漢字文化圏のについて一席ぶつところなんですが… 分析はこの辺にしておきましょう。あくまで今回の結果は目安でしかありません。同じ内容とはいえ、書き方によっては文字数は当然増減するわけですし (たとえば、口語体か文語体かなど)、ここでの数字はそれほど大事ではありません。たとえば、日本とアメリカでのTwitterの使われ方を比較する際の一つの視点としてとらえていただけるとうれしいです。
Twitterという一件シンプルに見えるメディアでも、言語によってこれだけ使い勝手が違うことだけははっきりしました。シンプルなればこそ、こうした違いが使い方の多様性につながるとも言えるでしょう。これからも言語に由来するTwitter文化圏の差異には注目していきたいと思っています。
Twitterに興味をお持ちの方はこちらの記事もご覧ください.
N Building.app – iPhone meets Architecture
Featured Articles