引用

http://www.hotwired.co.jp/news/news/culture/story/20030925208.html
この記事とはあんまり関係ないのだけれど、この記事を読んで思ったことは
多くのblog的WEBページで、ある記事を話題にするとき一部を引用することは多い。とくにCMSを使っている場合、引用部分をblockquoteで囲っていることは多いだろう。つまり、WEBページから元の記事の部分を抜き出すのは比較的容易ではないか。抜き出した引用は前後のURLから別々のBlog上の引用の元記事をIDとして特定することもできるのではないか。すると、おなじIDのものを集めて、引用をつなぎ合わせ元記事を復元することはできないだろうか。重複文章から前後などは分かるだろうし。
現在は純粋に技術的興味だ。