PDR:患者ディスクールの分析視点

PDR

「最近ある医薬品業界のマーケティング担当者が、次のように指摘した。あらゆる患者の経験が、今やデータの川となって流れ出しているが、これを賢く蓄積すれば、患者の健康状態に関する詳細なポートレートを描き出すことができ、さらに他の患者のデータの川と合流させることにより、疾患の全体像と患者集団全体に関する知識の深い貯水池としてまとめあげることができる。」(「ビジョンから決断へ ファーマ2020」, PwCジャパン)

花も終わり、ひところに比べると、新宿御苑を訪れる人並みも落ち着いてきた。今日の昼、御苑を歩いていると何組かの幼稚園児が遠足に来ていたが、あちこちに設営され始めたテントが目をひいた。毎年恒例のことだが、首相主催の観桜会が週末に開催されるらしい。

4月も半ば過ぎとなったが、今月はずっとテキストマイニング運用準備に取り組んできた。主にデータベースや形態素解析エンジンのチューニングをやったわけだが、結果として解析プロセスに要する時間は、従来の半分以下に短縮することができた。これで、闘病ブログ4万サイト、500万ページ、30億ワードのドキュメント・データすべてを、テキストマイニング処理する準備が整った。

これからリリースするサービスは、PDR(Patient Document Research)とPDS(Patient Document Sampler)の二つだが、一応、今の時点では、患者リスニングツール「dimensions」のカスタム・サービスという位置づけを想定している。特にPDRだが、dimensionsが固有名詞と名詞を抽出・集計し、個々の患者体験に出現する薬品名や検査・治療法名などをトラッキングするツールであるのに対し、新たに形容詞・形容動詞と動詞・サ変名詞を抽出することになる。

続きを読む