考察:「知識ベースのひとつの構造」

by ご近所のきよきよ


 

 自然言語の解析中に保持するデータはネットワークになっています。解析の最終結果のフレームもネットワークを構成するシステムになります。それは殆どが曖昧性処理の為ですが、知識ベース内のデータも曖昧性を持った物です。一つの事柄も複数のデータのどれかと関係が深いということまでは言えても、確実にこうだとは言えない。だから、知識ベースもネットワークになるのです。その中でデータの関係は確信度をつけて関連づけられるものです。関連にはそのカテゴリー記号に加えて属性と確信度がついてまわるのです。何事も確実でないという知識ベースの利用は、利用に当たって全体の枠組みの中で様々なデータの突き合わせをやって行く事になります。弛緩法です。


 知識ベースを構成するオブジェクトの種類は、データエンティティと関連記述エンティティの2つです。関連記述エンティティはデータエンティティの一種ですが、特別にデータエンティティの連想関係を定義できる点が特異です。

 データエンティティはそこから複数の関連記述エンティティにポイントします。そして、様々なデータを記述します。

 関連記述エンティティは2つのデータエンティティをポイントし、2つのデータエンティティの関係を記述します。2つのデータエンティティは入力と出力の有向グラフで表現され、向きが違えば、ことなる関連記述エンティティを起こす事にします。


 知識ベースのインプリメントはRDBでいいでしょう。エンティティの識別子(ポインタに利用)はキーで、エンティティのデータはXMLで一つのRDBフィールドに収めるようにすると良いでしょう。


 このような構造にすると、実に柔軟な知識ベースができます。しかも自然言語処理など、曖昧性管理が重要な技術を強力にサポート出来る物になります。



 

おわり