Mine and Visualize me! – “Mining the Social Web”

2011 BLOG

今度のTwitterを題材にしたワークショップのネタ探しにと、先週の Strata カンファレンスでも紹介されていた O’Reillyの新刊 Mining the Social Webのサンプル(GitHubで公開されています)をごちょごちょいじっております. これがまた面白い! サンプル・コードも非常に実践的で使えます。さっそく、CouchDBなど、新しいツールをいろいろ試しているところです。

せっかくなのでサンプルコードの一つを紹介.

自分のメールボックスの中身をPython + CouchDBを使って解析しているサンプルです(GitHub上のmailboxes__… .pyというファイルがそれです)。ここではこの二年間、一日に私が直接やりとりしたメールの数をグラフにしています。数はたいしたことないのですが、その増減の仕方が面白いです(少なくとも自分にとっては).

ちょうど、二年前というと会社を始めた時期に相当します。このグラフを見るだけで、「2009年の夏は忙しかったよな」「去年の3月は死ぬかと思った…」といった思い出が走馬灯のように…. :-)  
少し拡大してみると、毎月4回ほどの山が周期的に来ていることがわかります. 谷にあたるのは週末でしょうね.

コードを少し書き換えると、「よくメールを書く時間帯」「最も頻繁にメールをやり取りしている相手」(これは間違いなく澤井くんとAlexだろうな w) といったデータも簡単に得られます.

ネットワーク上だけでなく自分のPCのハードディスク上にも大量の自分に関するデータが眠っていることを再確認しました. こうした「埋蔵データ」を掘り起こすツールがもっともっと出てきてもよいのではないでしょうか。

そんなことを思いながらワークショップの準備中……..

参考) PCのディスク内の画像を検索するDeep for Mac (Mac Storeでも販売中)

Deep for Mac

追記 —
Chrome extension – Graph Your Inbox
Graph Your Inbox余談ですが、オライリーのebookはすばらしいですね。PDFだけでなく、mobi形式でも提供してくれるので、kindleでストレスなく読めます。PDFで紹介されるサンプルコードに、GitHub上の最新版へのリンクが貼ってあるところなどは新鮮な感じがしました。



Mining the social web
Mining The Social Web