考察:「曖昧性処理と学習機構」

by ご近所のきよきよ


 

 曖昧性処理はキー・データ対のインバースインデクシングの問題だと思うのです。不完全行列の逆行列を求めるみたいにですね。何を言いたいかと言いますと、例えば1つの事象というものがあるとします。これを表現するには視点とか表現上の制約とかにより、無数の表現事象を生成してしまいます。他の事象についても表現が無数に生まれます。この表現はダブることがあります。そんなとき、そのダブった表現は、曖昧性を持つことになります。・・・というようなことを言いたいのです。1事象は世界に一つだけで、曖昧性は無いのですが、1表現(言葉かも知れません)は複数の事象を包含してしまうということです。


 ロボットが生きていくとき、どんどんと新しい事象を体験していきます。従って、体験が多くなるほどに曖昧性表現が無数に増えていくことになります。あらかじめ曖昧性を定義してプログラムを組んでおくことは不可能なのです。そこで、曖昧性処理には学習機構が必須ということになります。自律的に曖昧性を無くしていく知識を獲得していく機構を作り込んでおかねばなりません。つまり、曖昧性と真正面に挑んで行くには学習機構を考えていかねばならないということです。


 学習の基データはコーパスであり、コーパスはオントロジー意味記号と意味記号の関係で表現されているものとしなくてはなりません。プログラムは手がかりが無いところに作っていくことはできませんからそこはプリミティブな生得的な素データセットとそれを扱える素プロセス群が存在を前提とすべきです。関係は2項関係でしょう。ある条件の下、1つの事象はもう一つの事象とどんな関係にあるかという表現で全て記述していくものです。コーパスから共通のパターンを発見し(2項関係ですからパターン発見は比較的単純です。簡単なマッチングをバックグラウンドで年中やっていればよい)、抽象パターンとしてカテゴリーというかコンセプトを創っていく。カテゴリーにはそうして、事象のカテゴリーと表現のカテゴリーとが生まれるでしょう。事象のカテゴリーには曖昧性はないですが、表現のカテゴリーには曖昧性がある。

 曖昧性は事象カテゴリーと表現カテゴリーの対応関係が1対nであることから生ずるわけで、これを解決するには、

(1)文脈による方法(表現の固まりが創る条件を評価していく)

(2)デフォルト値を管理する方法(プライミング)

があります。プライミングも文脈管理の一手法ですから全ては文脈処理で解決していくことになりますが、オンデマンドで関係を知識と照合し評価するのが狭義の文脈しょりで、あらかじめ文脈を知識としてもって、知識中のある意味記号とか意味の関係とかの情報で、全体の文脈を予想してしまうのがプライミングということです。


 図形の特徴としては、プリミティブな図形とその分布(2項関係)というのと、ストローク情報もあるでしょう。またテンプレートマッチングも平行して行えるべきであることから、イメージデータ(崩し図形・文字も)も持つべきでしょう。ストロークは図形や文字を筆記するときにも必要になります。


 カテゴリーの枠組みは局所的に入れ子になっています。入れ子の中の同格のカテゴリーとか、入れ子の上下関係などの関係をもって、プライミングは制御されます。つまり、プライミングは知識構造そのものが情報源としてあり、特別なプライミングデータというものを設置しなくても良いのです。カテゴリーを局所局所に組織化できると良い。それがデータベースとよく似ています。データエンティティがあって、その要素を指すインデクスセットエンティティが無数にある・・・。そんなイメージの知識構造にしておけば実現できるわけです。

 そのインデクスは曖昧性を解決できるようにきめ細かに制御されているべきなのですが、それは事象が曖昧性がないことによって実現できることが保証されています。


 

おわり