Hatena::Grouprubyist

Rubyで遊ぶよ

 | 

2009-03-10

ブログから最もリンクされているメディアサイトを調べてみる

02:25

この記事がおもしろかったので、「日本語ブログから最もリンクされているメディアサイト」を調べてみる。

まず、日本語ブログをランダムに取得しないといけないのだけど、それは gooブログ検索で「。」を検索した結果のフィードから、各ブログの RSS を Yahoo Pipes で取得することにした。

解析はこのスクリプトを5分おきに走らせている。

結果はこれ。

一応2009年3月10日開始ということにして (もし不具合があったらリセットするかも)、まあ1週間ぐらいたったら意味のある結果が見えてくるかも。


一応統計にはメディアサイトだけじゃなくて全部のリンク (画像リンクは除外) が含まれているので、ブログ界からブログへのリンクの数とメディアサイトへのリンクの数も比べてみたい。

フィードの「続きを読む」というリンクは除外したいけど、いい方法がないなあ。

goo ブログ検索はスパムブログが引っ掛かりすぎてだめだ。一度リセットして Google でやってみる。

今までの結果はここに置いた。

トップ rd.yahoo.co.jp という URL にリンクしたスパムブログが多すぎて多すぎて。。

トラックバック - http://rubyist.g.hatena.ne.jp/edvakf/20090310
 |