RSS Viewerで単語測定してみたけれど

kakasi で単語を取り出してみたけれど、精度はかなりいまいち。見出しは特殊な略語を使ってるし、要約部分は口語が多いので、どちらも共に機械測定が苦手とする部分か。でも、見出し部分の略語は意外といけるかも...
何をしようとしているかというと、RSSのトピックを自動で選別してくれるプログラムを作ろうとしているのです。過去のクリック履歴から推測して興味のありそうな記事を優先的に表示するような。