はてなダイアリーのタグ分析
最近ニコニコ研究会のデータ分析が話題になったりしましたが、グラフとか図を出すとなんか分析できた気になりますよね。というわけで、ちょいと自分の日記の様子が気になっていたのでグラフ化する簡単なツールを作ってみました。
追記
バグ修正。投稿した時刻を保存する設定にしている場合に上手くタグを取得できない問題を修正しました。
やってることはとても単純ではてなダイアリーのログファイルを見てタグをどれくらいの頻度で付けているかグラフ表示するだけです。たくさん日記を書いている人は使ってみるとちょっと面白いかもしれません。
下のグラフはここの日記で使用したタグの使用回数&割合です。日記タグを付けた記事が512個あるってことですね。ブログのタイトル通り正しく「日記」してることがわかりますw
月ごとのタグ使用回数。
月ごとの累積タグ使用回数。
年ごと、日ごとのデータも出します。コマンドラインでオプションを指定するとある区間のデータを抽出することもできます。
僕としては案外「研究」タグを使っていたことにびっくり。そんだけ2007年度は大変だったってことでしょうw
使い方
日記の管理画面(http://d.hatena.ne.jp/ユーザー名/port)でデータをダウンロードしてhatena_tool.exeにドロップするとデータをはき出します。
細かくデータをいじってグラフを作りたい場合はcsvファイルをエクセルに突っ込んだりすると良いと思います。
注意
>|| ||<で囲んだ部分は考慮したのですが、preタグのことを忘れてました。preタグで囲んだ中に*[hoge]で始まる行があるとタグとして認識しちゃいます。まぁ、ざっくり数えるもんだと思ってください。