茶筌とMUSASHIで純和風テキストマイニング

日本語の自然文も、茶筌を使えば単語単位にバラバラに分割できる。しかし、ただそれだけで満足していても仕事のツールにはならないので、今回は、以前紹介したMUSASHIと組み合わせて、簡単なテキスト・マイニングを行ってみよう。例題は、「テキストの中に表れる名詞だけを抽出してその出現回数を数え、多い順に上位20位まで表示するHTMLドキュメントを作成する」としよう。

【コラム】Yet Another 仕事のツール 第46回 茶筌とMUSASHIで純和風テキストマイニング (MYCOM PC WEB)

そういえばMUSASHI使ってないな