考察:「多義語管理」

by ご近所のきよきよ



 日本語処理で多義語から特定の意味を抽出することは重要なテーマになります。カテゴリーを唯一の意味で設定する方法を考えてみました。それは同じ意味の単語をand条件で羅列するのが良いのではないかという案の結実しました。軽い技術で結構深い意味合いがあるアイデアです。and条件に日本語だけではなく英語とかフランス語なんかの単語と相同性を示して定義できます。

 「問う」という単語には、「ask」とか「visit」とかの異なる意味があります。そこで、「問う」という単語のカテゴリーを「問う:質問:ask」、「問う:訪問:visit」などなどと定義して、それらのカテゴリー配下の単語として辞書にもつのです。もちろん 「問う:質問:ask」、「問う:訪問:visit」の総合カテゴリーは「問う」です。

 鍵と鍵穴システムでは、文脈が「問う」、「質問」、「訪問」などであるかを文章の流れを解析していくのです。それはテキストマイニングの技術でしょう。あるいは、ロボットの置かれた状況認識によって、現在のフレームを選択し、その記述からカテゴリーを得ていくのでしょう。

 とにかく、複数の単語をand条件で結んでカテゴリーを定義していくというのがエレガントな技術だと思えます。




おわり