人力タグ付けはGoogleを超えるか?

# ahirunoaru 『コメントの目的が違うのかもしれませんが、検索対象にコメントを含めていただけると検索性が高まって助かります。』

はてな各サービスの機能変更、お知らせなど - はてなブックマーク日記 - コメント機能など、新機能の追加について

これ!


思うんだけど、「ソーシャルブックマーク」あるいは「タギング」の何がすばらしいかというと「タグは類義語の揺れ」や「検索キー」を「外部から修正するための仕組み」であるということ。
Googleで検索する場合言葉は完全一致でないといけない。例えば「SBM」で検索しても「ソーシャルブックマークサービス」は検索してくれない。いい加減な人が書くとページ中に両方の言葉が載っている場合もあるのだけど、ちゃんとした企業や人なら「統語」という作業をやっているのでどちらか一方の単語しかページ上には載らない=どちらかのキーでしか検索できない。
で、その統語が世界中で統一されているとまだ良いのだけれど、所詮は一企業、一個人、つまり1サイト単位でしか行われていない。


はてなブックマークの何が良くないかというと、この「揺れを勝手に修正できない」という点で、他の、いわゆるSBMだと、この「揺れ」を「見ている人が修正できる」のである。Googleも当然その点には気づいていて、検索結果の中に「このページにリンクされている単語の中に検索単語が含まれています」といった検索結果が出てくるのもそれだと思う。
はてなブックマークにもコメント機能がついたし、検索にコメント欄を含めることができれば、タグのように使うことも可能だと思う。
ただソーシャルブックマークサービスが明確に「タグ付け」という名前を与え欄を別にしていることで、「ユーザーの意識」を方向付け、精度を高めている。また「タグ付けをみんなでやる(他人のつけたタグも検索できる)」ことで、情報の量が一人でやるのとは比べものにならないほど広がっていく訳だ。

Forksonomyの有効性を考えると、ここに入れるべきなのはいわゆる「ジャンル」になるような言葉じゃなくて、「キーワード」に近いもの……そう、未来の自分がこの記事を検索するときに指定するであろう「検索キーワード」を指定すべきだろう。例えば、先日の「ジャストシステムvs松下特許事件」の記事であれば、「特許」なんてヌルいタグ付けだけじゃ役に立たない。ここは「一太郎」「花子」くらいにブレイクダウンした言葉を選ばないと。

タグってぇのは、ジャンルのことじゃないよね? ただのにっき(2005-02-11)

という指摘もあるけれど、「後から検索するために」は、「特許」でタグ=ラベルが付いていた方がうれしい場合もあるし「ジャストシステム」「JustSystem」「Just System」で、この記事が検索できたりとかした方がうれしい場合もある。
逆に本文中の単語は本文に任せてもいいと思う。

しかし、MMは実際のところ情報を2段階で構造化するシステムなのですけどねー。
『メモの種別』と『ジャンル』。

あの種別をもうちょっと文字数多めにして(複数指定は不可のままで)、ジャンルのほうをただ氏の言うようなタグっぽくしてもいいのでは。。とか。

世界開放系/entry

僕は「タイトル+ジャンル(キーワード、タグ)+対象ページの内容+他人のコメント」で検索できれば良いかな、と。スコアリング→ http://d.hatena.ne.jp/nazoking/20050212#1108197491
レベルは「何を基準に」考えているかでバラバラになり、統一できないと思う(はてなダイアリーキーワードツリー廃止の歴史とか)。
だからジャンル=タグには、いろんなレベルが放り込まれるのはしかたないと思う。まあ、意識させるのも大切だとは思うけど。

機械で重要語を探す方法、カテゴリ分けする方法を探しているのだけれど、やっぱり人力にはかなわないのだな。