僕はブログ村の株ブログ/インデックス投資カテゴリーに参加しています。そこの新着記事の内容を2ヶ月間観測しました。単に僕が興味があったからです。この目的のためにプログラムを書いて2ヶ月間毎朝実行してデータを収集して来ましたが、目的を達成したのでもうしません。
何がしたかったのか
インデックス投資カテゴリーの新着記事に出てくるということは、そのブログが記事を更新したことを意味します。ブログの更新を継続するのは本当に大変なことだと身を持って分かっているので、どれぐらいのブロガーがどれぐらいの頻度でブログを更新しているのか調べてみようと思ったのです。
観測方法
ブログ村の株ブログ/インデックス投資カテゴリーのHTMLを読み込んで昨日更新された記事一覧を抽出します。そして次の方法で得点を計算します。
- 当日に記事を更新すると1点付与します。
- 当日に2記事以上更新した場合、2記事目からは0.1点付与します。
- この得点はその日のものとして管理されます。
- 記事の更新の有無に関わらず、その日より前の得点を0.01点ずつ減らします。
たとえばAというブログが5日連続で1記事更新したとします。ブログAにはその5日間について毎日1点ずつ付与されますが、翌日以降は0.01点ずつ減らされるので、今日は次の得点データを保持していることになります。
0.96、0.97、0.98、0.99、1.00
で、ブログAの現在の得点はこれの合計となります。ここで更新をやめて5日経過すると上記データは次のように変わります。
0.91、0.92、0.93、0.94、0.95
更新すれば新たに1点付与されますが、保持している更新日ごとの得点は毎日0.01点ずつ減るので、更新の間が空けば空くほど得点は減っていきます。
観測開始後すぐにダメだと気づく
このプログラムを書くのにもそれなりの工数はかかります。で、観測を始めて数日してすぐにダメなことに気づきました。毎日更新しているはずのブログの得点が低いのです。そうです。僕も頻繁に手動更新していますが、ブログ村は記事の更新を正しく認識できないことが多々あるのです。その場合ブロガーが手動更新させれば(Pingを打てば)いいのですが、そんなことをしていないブロガーの場合更新された記録が残りません。よって、この記事に出てくるデータも不正確です。雰囲気しか分かりません。
ブログ一覧の様子
プログラムの画面キャプチャーです。データが不正確なのでブログ名は伏せています。
これは上位です。総得点は削減していない、付与点の合計です。
次は下位です。
145位のブログは総得点が1なので観測期間に更新されたとブログ村が認識したのは1回で、それから51日経過したので0.51点削減されて現在の得点が0.49点、ということになります。
グラフで見る
横軸が順位、縦軸が得点です。
順位が下がると急速に得点が少なくなります。更新頻度が相対的に高いブログは少ないことを示しています。
だからどうした
わざわざプログラムを書いて2ヶ月間毎日実行してデータを収集し、このグラフを得てそれで何かいいことはあったの?そう思われる方も多いことでしょう。これは僕がやってみたいと思ったことをやっただけで、僕は結果が得られたので満足しています。
もうこのプログラムを実行することはありません。これをネタに記事を書くこともありません。