文章要約プログラムを書いてみよう！

テキストマイニング

http://www.seman.cs.uec.ac.jp/~shin/blog/archives/cat_eieiioieaonsse.html このプログラムが文章の要約にどんなアルゴリズムを使っているのか。これを書くのにどんな作業が必要なのか。流れをおおざっぱに書き出すと、以下のようになる。１．コーパス…

2004-06-25

TermExtract をとりあえず動かしてみるまで

テキストマイニング

専門用語（キーワード）自動抽出用Perlモジュール http://gensen.dl.itc.u-tokyo.ac.jp/termextract.html とあるレンタルサーバにて（多分 redhat9.2）。 make とか使えないので、 TermExtract/TermExtract フォルダを cgi と同じディレクトリに置く。サンプ…

2004-05-25

"musashi"を使ってテキストマイニング（musashi_text）

テキストマイニング

2003年7月、"musashi"という名のデータマイニング・ソフトがオープンソース・ライセンスにてリリースされました。これを使ってエンド・ユーザが使い易いソフトウエアを仕立てることができないかと考えたのがこのプロジェクトの始まりです。 textmainingほほ…

2004-05-24

GETA の研究

テキストマイニング

インストールとりあえずそのままやってみた。debian-woody-testing 特に問題ないと思われ。 libwam データベース(WAM)の作成と低レベルな検索 WAM データベースみたいなもの handle データベース名みたいなもの freqfile データ定義ファイル handle=my-inbox…