Amazonの書籍全文検索の文字データは手動取り込み

Amazon の書籍内容全文検索が話題になってましたて、スラッシュドットでも

>12万冊以上、総ページ数は3,300万
の書籍が既に電子化されてるってことですよね。
検索サービスを始めたことより、それに耐えるデータが既に有ることのほうが驚きでした。

当然、出版社側が編集作業用のデータを提供してるんでしょうけど……