登场者プロフィール
岸田和明
文学研究科 図書館?情報学専攻岸田和明
文学研究科 図書館?情報学専攻
2020/12/21
情报検索の技术的な向上のための研究をこれまで进めてきました。今では,インターネットのサーチエンジンで手軽に情报を検索できますが,それ以前は,検索のためには,図书馆に行かなくてはなりませんでした。もともと,コンピュータの登场以前に図书馆で资料を探すために使われていた仕组みをコンピュータに移すことによって,情报検索システムが実现されたという歴史的な経纬があります。この点で,情报検索は図书馆情报学の中核のひとつであり,その技术向上は重要な研究课题となっています。
情报検索の研究が大きく変化したのは,1990年代前半です。インターネット上の情报资源を効果的かつ効率的に探し出すためには,高度な情报検索の技术が要求されます。このため,データベース管理や自然言语処理の専门家などが加わって,学际的な研究プロジェクトが进められるようになりました。それまでの図书馆情报学分野における情报検索の対象は,「情报」そのものではなく,図书や论文などの「図书馆资料」でした。つまり,情报そのものではなく,それを含んだパッケージである资料に対する検索が探究されていたのです。それが1990年代以降,大きく様変わりしました。
现在では,コンピュータの発达により,资料の「中身」を取り扱えるようになっています。つまり,资料は文章の连続から构成されるテキストであり,そのテキストデータを直接解析できるようになったわけです。この结果,テキストから情报を「掘り出す」ためのテキストマイニングという技术に注目が集まるようになりました。これには情报検索や自然言语処理の技术を活用します。その中で,私は,文书や単语を类似したクラスタ(まとまり)に自动分类する问题に取り组んでいます。例えば,日々,大量のツイートが投稿されていますが,これらを自动分类することにより,世の中で何が话题になっているかを知ることができます。さらには,ある特定のトピックに绞り込んで,それに関する意见や考え方を抽出することも可能です。テキストデータの解析には,そのほかにもさまざまな応用が考えられ,その技术向上により,多くの恩恵がもたらされると考えています。
(2020/12/21)