語の頻度情報を利用した情報検索に関する研究

http://www.naklab.dnj.ynu.ac.jp/~junkie/soturon/soturon.html

タームのマッチングに基づく基本的な情報検索では、対応し切れない検索要求文が存在する。そこで、検索要求文を概念に基づいて拡張する必要が生じてくる。本研究ではタームを文章で特徴づけし、それによってタームとタームの類似度からなる概念ベースを構築した。この概念ベースを文章検索の検索要求文の拡張に用いて検索を行なったところ、拡張しないものと比べて5記事以上を正解として抽出する場合に適合率、再現率共に改善されることが確認された。

どこか、PHP4とデータベースと chasen が使える無料サーバ無いですか... s31.xrea.com には chasen が入ってない(;´д⊂) 入ってるみたいな記事見つけたんだけどなぁ