アフィリエイトサイトはデータマイニングさせてください

羽室氏はMUSASHIの開発理念のひとつとして「リレーショナルデータベース(RDB)関連技術は使わない」ことを掲げるが、その主な理由には「データの消失」が問題になりやすいことがあるという。RDBでは、あらかじめ必要なデータ項目を洗い出し、必要とされるデータだけを保存する。例えばスーパーのレジを考えると、顧客が実際に購入した商品の情報はDBに登録されるが、「一度レジに持ってきたが購入をキャンセルした」商品の情報は残らない。つまり、知識発見のための大切な素材になり得る履歴的な情報が、RDBでは不要な情報として切り捨てられてしまう可能性が高い、というのだ。

【レポート】生みの親が語る"MUSASHI"、そしてマイニングの今後 (1) データマイニングとMUSASHI (MYCOM PC WEB)

アフィリエイトのデーターってすごく不完全だなぁ、と思う。必要なのは

  • どこからやってきた顧客が
  • どのページで紹介したた、どの商品をクリックして
  • 最終的にどの商品を買ったか
  • 他にどのような商品をチェックしたか

ってのを分析すれば面白いデータがどんどん出てくるはずなのに、楽天なんかは「どの店でいくら売れた」までしか出してくれないし(商品名さえ分からない)、アマゾンも入り口と最終購買商品の関係がわからない。
複雑な分析をしなくても、「どんな呼び込み文句(検索語句)」が「どんな商品を買うのに有効か」という事さえ分かれば…