考察:「オントロジーをどうするか?(2)」

by ご近所のきよきよ



 文章を解析したとき、その文章の内容に一致する知識ベース内の事象がすべてヒットして、俺だ俺だと発火するとします。もし、その知識ベース内のデータは視点識別子も返すようになっていれば、文章の視点を文脈から推定して、それで発火データをフィルツタしていくと、正しい意味を視点識別子に関して得られることになります。

 知識ベースが格と属性と名詞、動詞とから成りますから(基本的にオントロジー記号主体に単語が発火する)、入力文章がオントロジーでサポートされれば、それに関係する知識ベースのデータが発火されますから、意味候補(同じ意味体系のコーパス)は全部発火します。後は視点でフィルターすれば、求める意味データのみを取り出せます。2つの文章が同じ意味なら、同じようになる視点で、共通の知識ベースのデータ(コーパス)が発火しているはずです。指定の視点で発火しているものが無かったら、意味は異なるということです。


 そこで、この一連の作業をするには、俺俺と手を挙げるために入力データ(意味記号)と保持しているコーパスとのマッチング処理を自動で行うという内容検索(キーでなく、キーに保存された記号からキーを推測する検索)が必須です。これが高速に行われなくてはなりません。

 ところで、この内容検索は文字列(バイナリー)のマッチングをするだけですから、ハートウェアではCPU並の命令セットは不要です。簡単な回路で文字マッチングは実現出来ます。すなわち、メモリを少しだけインテリジェントにするだけです。USBメモリなんて結構安いですから、内容検索ができるフラッシュメモリなんてのを作っても安くできるでしょう。そうすれば、超平行処理で内容検索できる環境ができます。視点毎に内容検索機構付きインテリジェントフラッシュメモリを用意する事も夢ではなくなります。こうしたものは、人工知能の基盤デバイスになるでしょう。作りたいですね。


 コーパスとか動画像とかをとにかくため込む機構と、それから抽象化を行い、意味記号を定義していく機構が必要です。その上に立って、視点によって意味を整理する、機構が必要で、この視点と意味記号のセットが意味理解の基盤になります。文章を入力すると、マッチする視点と意味記号のオブジェクトを全て発火します。これは内容検索で自動的、自律的に行う事です。そして、適当な視点のものを、意味理解の候補セットとします。必要ならば、それを知識フレームに確保します。

 そして、視点とは鍵と鍵穴システムの鍵穴に相当しますから、オントロジーシステムをそのように設計しますと自然言語処理と整合性が保てます。さらに知識ベースの表現を、データエンティティと関連記述エンティティのネットワークでやろうと昔提唱しました。データエンティティを視点とか視点に登録されているコーパスとかイメージにして、関係を連想とか包含関係とか近似関係とかを表現して、視点を繋ぐと、いうふうにすれば知識ベースにも埋め込めます。そして、ヒットが起きたときに発火するものを、ヒットしたデータエンティティに関連づけられているもの全てとすれば、意味の相同性と相違性の判別が簡単にできるようになるというものです。


 このようにして、意味理解は実現出来るはずです。




おわり