--.--
--
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

01.17
Sat
Googleがウェブページの重要度の決定の指標の1つとして使っているというPageRankを単純化して
Pythonで書いてみます。PageRankについてはwikipediaとかこの辺(Google の秘密 - PageRank 徹底解説)参照。

ようするに、ウェブページのリンク関係から被リンク数の多いウェブページの重要度を高くしてスコアを出すというものです。

wikipediaの例でやってみます




$ python rank.py
{1: 0.3035143769968052, 2: 0.16613418530351443, 3: 0.14057507987220452,
4: 0.1054313099041534, 5: 0.17891373801916938, 6: 0.04472843450479236,
7: 0.06070287539936105}

各ノード(文書)に初期値を与え、愚直に出て行くリンクの数で割ったものを足し合わせてるだけです。

グラフが強連結でなかったりするとおかしくなりますし、どれくらいで収束するのかもわからないので繰り返す回数を
与えてます。
スポンサーサイト

comment 0 trackback 0
トラックバックURL
http://telracsmoratori.blog.fc2.com/tb.php/207-99ddf521
トラックバック
コメント
管理者にだけ表示を許可する
 
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。