「ノイズとクラゲ」を除外するバーティカル検索エンジン

etizen2

TOBYOプロジェクトは「ネット上のすべての闘病体験を可視化し検索可能にする」ことをめざしている。徐々に可視化作業は進んでおり、すでに約800疾患、1万8千件の闘病体験ドキュメントを整理分類し、近々、そのうち1万4千件が検索可能になる予定だ。ネット上の闘病ドキュメントはおよそ3万件程度存在すると推定しているが、これは毎年約4千件から5千件づつ増加していると見ている。

ネット上の闘病ドキュメントのほとんどは、主に個人サイトとブログを通じて配信されているが、最近、Twitter、YouTuve、Googleブックスなどで配信されるケースも増えてきている。今後、TOBYOはこれらの情報も収録していく予定だ。そこでとりあえず、Googleブックスの闘病記について収録を開始した。Googleブックスの闘病関係書籍は約6百数十点登録されているが、そのうち本文をプレビューできるのは110点ほどである。そのほとんどは自費出版本であり、メジャー出版社から出されている書籍のほとんどはプレビュー不可となっている。これは著作権をめぐる出版元とGoogleの調整がまだ決着していないためだが、長い目で見れば、いずれリアル本の闘病記のほとんどをネットで閲覧できるようになるだろう。Googleブックスの収録状況を見ていると、書籍のみならず、雑誌に掲載された闘病体験記事などもスキャンしているようだ。 続きを読む